Skip to main content

LN ucb_286-287

Page 1


Urejanje in grupiranje

podatkov

Podatki, pridobljeni v posamezni raziskavi, so največkrat neurejeni in nepregledni, zato jih moramo urediti oz. narediti pregledne. Če jih ni veliko, jih uredimo po velikosti, drugače jih združujemo v skupine. Kako ravnati z njim, je precej odvisno od samih podatkov; ali so diskretni ali zvezni.

Število diskretnih statističnih enot iste vrednosti imenujemo frekvenca f ali tudi absolutna frekvenca te statistične spremenljivke.

Vsota vseh absolutnih frekvenc mora biti vedno 100 % oziroma 1.

Kadar je diskretnih podatkov zelo veliko ali so podatki zvezni, jih združujemo v skupine ali frekvenčne razrede.

Celoten razpon podatkov zajamemo z določenim številom frekvenčnih razredov, ki so ponavadi enako široki, ni pa nujno. Podatek z največjo vrednostjo označimo z xmax, podatek z najnižjo vrednostjo pa xmin. Če so podatki zvezni, so frekvenčni razredi kar intervali na abscisni osi.

Širina k-tega frekvenčnega razreda dk je razlika med zgornjo zk in spodnjo sk mejo razreda: dk = zk – sk.

Če so razredi enako široki, določimo njihovo širino tako, da celoten razpon podatkov xmax – xmin delimo z ustreznim naravnim številom (odvisno od primera).

Pomemben podatek je tudi sredina frekvenčnega razreda: xk = zk + sk 2 .

DELOVNA RAZLIČICA

Spoznali boste:

Ű kaj je (absolutna) frekvenca,

Ű kaj je frekvenčni razred,

Ű kaj je relativna frekvenca,

Ű kaj je kumulativna frekvenca.

Iz tako zapisanih podatkov ni bilo mogoče razbrati nobene zakonitosti, zato so jih uvrstili v skupine po 10 let.

0–9 II

10–19 II

20–29 IIII

30–39 IIII

40–49 I

50–59 III

60–69 III

70–79

80–89 I

120–130 I

V preglednici sta bila tudi dva podatka, ki sta pomembno odstopala od ostalih. V enem primeru je bil ponesrečenec res star 87 let (med vožnjo ga je zadela kap), v drugem primeru pa je prišlo do napake pri vnašanju (lahko bi bil podatek 12, 27 ali 127). Oba primera so izločili kot mejna primera ali osamelca.

Prejšnjo preglednico so preoblikovali v histogram s številkami in slika je postala še jasnejša.

DELOVNA RAZLIČICA

V histogramu s številkami so podatki bolje urejeni kot prej, saj se pri posameznih deseticah natančno vidijo enice. Tako podatek 7 v tretji vrstici predstavlja starost 37, v četrti pa 47. Podatki so urejeni tudi po velikosti.

Poglejmo si primer iz mestne četrti Brdo, kjer se je v kratkem obdobju zgodilo več nezgod s hudimi poškodbami ponesrečencev. Policija je želela ugotoviti vzroke nesreč in je naročila posebno raziskavo pri neodvisni organizaciji. Raziskovalci so najprej zbrali podatke o vseh nesrečah v zadnjih dveh letih in naredili spisek starosti ponesrečencev, ki je vseboval kar 86 primerov.

Podatke iz histograma s številkami ponavadi predstavimo še s preglednico, ki ji rečemo frekvenčna porazdelitev. Vsaki vrednosti ali vsaki skupini vrednosti pripišemo število posameznih enot s to vrednostjo ali frekvenco.

Turn static files into dynamic content formats.

Create a flipbook