Skip to main content

LN ucb_298-299

Page 1


Srednje vrednosti

Ko množico podatkov grupiramo in grafično predstavimo, se vprašamo tudi, ali obstaja neka tipična vrednost, s katero bi opisali celotno množico podatkov naenkrat. Taki tipični vrednosti rečemo parameter. V nadaljevanju bomo spoznali dva pomembna statistična parametra: srednjo vrednost in razpršenost.

Srednjih vrednosti je več vrst. Oglejmo si jih s primerom podjetja, kjer je 19 zaposlenih. Na čelu je direktor s 3 svetovalci, pravnikom in tajnico, ostali so uslužbenci, od katerih so 4 s posebnimi pooblastili.

Direktor zasluži 7900 € na mesec, svetovalci 5200 €, pravnik 4000 €, pooblaščeni uslužbenci 1900 €, tajnica 1600 € in ostali uslužbenci 1200 €. Zanima nas, kako bi dobili tipično vrednost plače v tem podjetju.

Vsi skupaj na mesec zaslužijo

1 ∙ 7900 + 3 ∙ 5200 + 1 ∙ 4000 + 4 ∙ 1900 + 1 ∙ 1600 + 9 ∙ 1200 = 47 500.

Če to vsoto delimo s številom vseh zaposlenih, dobimo aritmetično sredino, ki je torej enaka 47 500 : 19 = 2500. Čeprav lahko mirno rečemo, da je to srednja vrednost mesečne plače v podjetju, se postavi vprašanje pravilnosti te trditve, saj 2500 € ni najbolj tipična vrednost za plačo v podjetju, kjer skoraj polovica zaposlenih zasluži 1200 € na mesec. Zato poskusimo na drug način.

Vse plače razvrstimo po velikosti od najmanjše do največje in pogledamo tisto, ki leži na sredini tega zaporedja (polovica zaposlenih zasluži več, druga polovica pa manj). Tako dobimo naslednjo »tipično vrednost« 1600 €, ki ji rečemo mediana.

Poglejmo še tretje merilo za določanje srednje vrednosti. Poiščimo tisto plačo, ki jo dobi največ uslužbencev, oz. vrednost spremenljivke, ki se najpogosteje pojavlja in jo imenujemo modus. V našem primeru je izračunani modus 1200 € in kar dobro predstavlja povprečno vrednost plače v podjetju.

Spoznali boste:

Ű tri srednje vrednosti,

Ű kako določimo posamezno srednjo vrednost,

Ű diagram kvartilov.

Povprečje ali aritmetična sredina x je količnik vsote vseh vrednosti statistične spremenljivke in števila teh vrednosti. Če so vse vrednosti različne, aritmetično sredino izračunamo po formuli:

Če se vrednosti statistične spremenljivke ponavljajo (k1 vrednosti x1 itd.), je formula nekoliko bolj zapletena (tehtana aritmetična sredina):

DELOVNA RAZLIČICA DELOVNA RAZLIČICA

Grška črka Σ (sigma) predstavlja matematični znak za seštevanje.

Aritmetično sredino lahko izračunamo le za številske spremenljivke. Če bi jo kdo skušal izračunati z neštevilskimi podatki, ga moramo spomniti na staro šalo: Če en gost jé zelje, drugi pa meso, jesta v povprečju segedin golaž.

V splošnem vsak od naštetih parametrov nekaj pove o povprečni plači, vsak pa ima tudi svoje pomanjkljivosti, zato bi bilo najbolje vsakokrat izračunati vse tri.

Iz primera se lahko naučimo predvsem to, da je srednja vrednost zelo odvisna od problema in podatkov. Zavedati se moramo tudi, da srednja vrednost ni nujno ena od vrednosti iz množice podatkov.

Pri grupiranih podatkih za vrednosti statistične spremenljivke vzamemo sredine frekvenčnih razredov.

Modus M (gostiščnica) je vrednost podatka, ki se v množici vseh vrednosti najpogosteje ponavlja.

Lahko se zgodi, da je modusov več ali pa jih sploh ni. Za grupirane podatke namesto modusa poiščemo modalni razred, to je tisti razred, ki ima največjo frekvenčno gostoto oz. mu ustreza ploščinsko največji pravokotnik v histogramu.

Mediano m (središčnico) bomo računali po Langfordovi metodi:

• Če je podatkov liho število, je mediana srednji podatek.

Z vključitvijo (ali izključitvijo) mediane dosežemo, da je v obeh polovicah liho število podatkov.

• Če je podatkov sodo število, je mediana aritmetična sredina srednjih dveh podatkov.

• V obeh primerih je prvi kvartil Q1 mediana leve polovice, tretji kvartil Q3 pa mediana desne polovice podatkov.

Oba kvartila in mediano (pri čemer lahko mediano štejemo za drugi kvartil) ter minimalno in maksimalno vrednost množice podatkov grafično predstavimo z diagramom kvartilov oz. škatlo z brki.

To je pravokotnik med dvema daljicama nad številskim trakom, na katerem so označeni minimalna in maksimalna vrednost podatkov ter vsi trije kvartili.

Pomembnost diagrama kvartilov je v tem, da vsak od štirih intervalov (od xmin do Q1, od Q1 do m, od m do Q3 in od Q3 do xmax) vsebuje četrtino podatkov iz diagrama, zato lahko sklepamo, kako so porazdeljeni podatki. Lepo se da opaziti tudi asimetrija podatkov.

Tudi pri aritmetični sredini številskih spremenljivk lahko pride do vrednosti, ki jih moramo razumno brati. V časopisu smo npr. lahko prebrali, da bi morale ženske v Sloveniji v povprečju roditi po 2,3 otroka, če bi hoteli, da bi bila rodnost enaka smrtnosti oz. da število prebivalcev ne bi več padalo.

Statistična šala: Trije statistiki se odpravijo na lov. Na gozdni jasi zagledajo prekrasnega jelena. Pomeri prvi in ustreli en meter v levo, ustreli drugi in tudi zgreši – natanko en meter na desno; ko to vidi tretji statistik, odvrže puško in začne skakati od veselja ter vpiti: »Pa smo ga, pa smo ga!«

Podobno kot nam kvartili razdelijo množico podatkov na štiri enake dele, nam centili razdelijo množico podatkov na sto enakih delov. Uporaba centilov je smiselna le pri množicah z res veliko podatki. xmax Q3 m = Q2 Q1 xmin

Računanje aritmetične sredine, mediane, modusa in kvartilov ima resnični pomen le pri veliki množici podatkov, česar si v učbeniku ne moremo privoščiti. V glavnem se vse statistične raziskave delajo z ustrezno programsko opremo, ne pa s svinčnikom na papirju.

Turn static files into dynamic content formats.

Create a flipbook