Page 1

ESTADÍSTICA L’Estadística és la ciència que avalua les característiques d’una població de forma numèrica. Amb aquestes dades, podem fer prediccions sobre el comportament de la població en moments futurs. Aquesta ciència es pot aplicar en moltes àrees de la vida com la medicina, l’economia, la política, la sociologia….

1.El treball estadístic i les seves fases Un treball d’estadística complert, comença per l’elecció del tema que ens interessa estudiar. Els temes poden ser molt diversos, des d’un estudi sobre el nombre de fills que tenen les parelles, com les intencions de vot dels habitants d’una població en època d’eleccions, o sobre l’ús que fem d’internet, xarxes socials, jocs… Un cop decidit el tema hem de dividir el nostre treball estadístic en diferents fases: 1. Determinació de les característiques que cal estudiar de la població que ens interessa. 2. Elaboració del procediment d’estudi. Confecció d’enquestes i determinació de la mostra. 3. Recull de dades. 4. Presentació resumida de les dades en forma de taules, gràfics o paràmetres estadístics. 5. Interpretació i presa de decisions en funció dels resultats.

2. Població i mostra. Una població és un conjunt d’elements dels quals estudiarem alguna cosa. Exemples: *Alumnes de la classe, dels quals n’estudiarem l’alçada *Habitants d’una població i els preguntarem sobre la intenció de vot en les properes eleccions. *Arbres d’un bosc, i estudiarem la seva espècie. Podem fer estudis on la població sigui molt nombrosa, en aquest cas, tindrem més dades a recopilar, i el nostre estudi serà molt més fiable. Una mostra és un conjunt reduït de elements de la població que estudiem, i que representarà a tota la població. Ens interessa que aquest petit grup escollit per a l’estudi, sigui prou variat i representatiu, si per exemple vull fer un estudi sobre les intencions de vot d’una població, he de procurar agafar homes i dones, gent jove i gran, i de tots els barris per no condicionar el tipus escollit, i que l’estudi no sigui esbiaixat.


3.Variables estadístiques Una variable estadística és la característica que volem estudiar d’una població. Exemple: *L’alçada *Les hores que dedica a Internet *El partit polític que votarà *etc... Veiem que en funció del què volem estudiar, tenim variables de dos tipus: • Variable quantitativa els valors que pren són nombres • Variable qualitativa els valors que pren són no numèrics Exemples: *Quantitativa: edat, alçada, nombre de fills….. *Qualitativa: Mitjà de transport que fa servir, color del seu cotxe, si té ascensor o no a casa….

Tipus de variables quantitatives: poden ser quantitatives discretes o quantitatives contínues. Les quantitatives discretes són aquelles que prenen valors aïllats, és a dir, que donats dos valors determinats no admet valors intermedis, per exemple “nombre de germans dels alumnes d’una classe”. En canvi, les quantitatives contínues són aquelles que entre dos valors determinats sempre en podem trobar un altre d’intermedi, per exemple “l’alçada dels alumnes d’una classe”. Les variables quantitatives que presentin molts valors diferents les agruparem en intervals. Per exemple si estudiem les alçades d’un grup de persones, podem tenir molt valors diferents (1,56,1,67,1,90,1,70….) així que agruparem els valors semblants en intervals semioberts, per exemple l’interval [1,56-1,60) inclouria totes les alçades des de 1,56 inclosa fins a 1,60 sense incloure-la.


4. Taules estadístiques. Un cop tenim totes les dades recollides, hem de començar a tractar-les matemàticament, és a dir a organitzar-les per poder fer un estudi acurat. Aquestes dades s’agrupen en una taula estadística en diferents columnes: Columna Variable estadística És la columna xi, en ella escriurem els diferents valors que pren la variable estadística. Quan són numèrics s’escriuen de menor a major. Columna Marca de classe Només es fa quan les dades estan agrupades en intervals i serà la columna xi. La marca de classe és la mitjana aritmètica dels dos extrems de l’interval. 1,56 + 1,60 Exemple: la marca de classe de l’interval [1,56-1,60) és = 1,58 2 Columnes Freqüència absoluta i Freqüència absoluta acumulada Són les columna fi i Fi. A la columna fi escriurem el nombre de vegades que es repeteix o es presenta cada valor de la variable. A la columna Fi escriurem la suma de cada fi amb les fi anteriors a ella. La suma de totes les fi ens dóna el total d’individus que formen la mostra o població de l’estudi, es representa per N:

∑f

N=

i

Columnes Freqüència relativa i Freqüència relativa acumulada Són les columnes hi i Hi. La freqüència relativa és la relació entre la freqüència absoluta i el total de dades: f hi = i N La suma de totes les freqüències relatives és 1:

∑h

i

=1

La freq. relativa acumulada (columna Hi) és la suma de cada hi amb les hi anteriors a ella. Columna de tants per cent Podem obtenir el percentatge que correspon a cada valor de la variable multiplicant les hi per cent. % = hi · 100 La columna dels tant per cent també pot rebre el nom de freqüència relativa en percentatge. La suma de tots el percentatges ha de ser 100.


EXEMPLE 1: hem preguntat a 10 persones el nombre de germans que tenen i les respostes han estat les següents 0, 1, 1, 0, 0, 1, 2, 3, 1 i 1. Resol les següents qüestions: a) Quina és la població d’aquest estudi estadístic? b) Quina és la variable estadística? De quin tipus és? c) Fes la taula estadística corresponent a aquest estudi RESOLUCIÓ: a) La població és un grup de 10 persones b) La variable és “nombre de germans”, és de tipus quantitativa discreta c) Taula estadística: xi (Nombre de germans) 0 1 2 3

fi (persones)

Fi (persones)

3 5 1 1

3 8 (3+5) 9 (1+8) 10 (1+9) = N

∑f

i

Hi (tant per ú acumulat) 0,3 0,8 0,9 1

hi (tant per ú fi / N) 3/10= 0,3 5/10 =0,5 1/10 =0,1 1/10=0,1

∑h

=N= 10

i

=1

% (hi ·100) 30% 50% 10% 10% 100 %

EXEMPLE 2: les altures d’un grup de nens i nenes, en cm, són: 130 128 141 139 137 126 135 136 134 131 143 140 129 128 137 136 142 138 144 136 Resol les següents qüestions: a) Quina és la població d’aquest estudi estadístic? b) Quina és la variable estadística? De quin tipus és? c) Fes la taula estadística corresponent a aquest estudi

RESOLUCIÓ: a) La població és un grup de 20 nens i nenes b) La variable és “alçada en cm”, és de tipus quantitativa contínua c) Taula estadística: caldrà agrupar els valors de la variable en intervals de 5 cm d’amplitud Interval (alçada en cm) [125,130) [130,135) [135,140) [140,145)

xi (marca de classe, cm) 127,5 132,5 137,5 142,5

fi (nens)

Fi (nens)

4 3 8 5

4 7 15 20 = N

∑f

i

=N= 20

hi (tant per ú fi / N) 4/20= 0,2 3/20 =0,15 8/20 =0,4 5/20=0,25

∑h

i

=1

Hi (tant per ú acumulat) 0,2 0,35 0,75 1

% (hi ·100) 20% 15% 40% 25% 100 %


5. Gràfics estadístics. Per mostrar i interpretar les dades d’un estudi estadístic s’utilitzen els gràfics estadístics. N’hi ha de diferents tipus: Diagrama de sectors Dividim un cercle en tants sectors com valors tingui la variable, l’amplitud de cada sector ha de ser proporcional a la freqüència de cada valor. Amplitud del sector (graus)=

%(de x i )·360º = %·3,6 100

Aquest diagrama és pot fer servir per variables tant qualitatives com quantitatives. Diagrama de barres A l’eix d’abscisses representem els valors de la variable i a l’eix d’ordenades les freqüències absolutes. Sobre cada valor de la variable aixequem una barra de la mateixa altura que la freqüència corresponent. Aquest gràfic es pot fer servir per variables qualitatives i quantitatives discretes, no s’usa per a quantitatives contínues.


Polígon de freqüències Un cop tenim les dades representades en un diagrama de barres, unint els punts més alts de cada barra amb un segment obtenim el polígon de freqüències: fi (persones)

xi (germans) 0 1 2 3 4 Histograma S’utilitza per a variables agrupades en intervals, normalment seran variables quantitatives contínues. A l’eix d’abscisses es representen els intervals i al d’ordenades les freqüències absolutes. Sobre cada interval aixequem un rectangle de la mateixa altura que la freqüència absoluta. També podem dibuixar l’histograma de freqüències acumulades, en aquest cas a l’eix d’ordenades representarem les freqüències absolutes acumulades. fi (persones)

Temps en minuts Pictogrames És la manera d’expressar les dades amb un símbol o dibuix que les representi. Si tenim moltes dades podem repetir el dibuix, o bé fer el mateix dibuix en major o menor grandària segons la freqüència absoluta que tingui cada valor de la variable.

Milions d’habitants


6. Paràmetres estadístics 6.1 Paràmetres de centralització. Els paràmetres de centralització són la moda, la mitjana i la mediana. En cas de les variables qualitatives només podrem calcular la moda. Moda. La moda és el valor xi de la variable estadística de major freqüència absoluta, és a dir el valor que més es repeteix. Es representa per Mo. Pot passar que n’hi hagi més d’una. Mediana. La mediana és el valor xi de la variable estadística que ocupa el lloc central quan els valors s’ordenen de petit a gran (sense agrupar les dades repetides). És a dir, és el valor tal que hi ha el mateix nombre d’elements de la població que tenen un valor menor que els que tenen un valor major que ell. Es representa per Me. En cas que la sèrie estadística tingués un nombre parell de dades, aleshores prenem com a mediana la semisuma dels valors centrals (punt mig).

Mitjana (mitjana aritmètica). La mitjana és el valor que agafaria la variable si tots els seus valors es repartissin equitativament entre tots els individus de la població. Es representa per X . ∑ xi ·fi X= N EXEMPLE 3: Calcula els paràmetres de centralització a partir de la següent taula estadística: xi (Nombre de germans) 0 1 2 3

fi (persones) 3 5 1 1

∑f

i

=N= 10

RESOLUCIÓ: Hem de calcular la moda, la mediana i la mitjana. Per calcular la Mo només cal observar la columna de les freqüències absolutes fi, per calcular la Me haurem de fer la columna de f. absolutes acumulades Fi i per calcular la X haurem de fer la columna xi · fi:


xi (Nombre de germans) 0 1 2 3

fi (persones)

Fi (persones)

xi · fi

3 5 1 1

3 8 9 10

0 (0·3) 5 (1·5) 2 (2·1) 3 (3·1)

∑f

i

∑ x ·f =10

=N= 10

i

i

Moda: Mo = 1 germà (és la xi que té la fr. absoluta més gran) Mediana: Me = 1 germà (és la xi que té la fr. absoluta acumulada que conté els dos valors centrals de les dades) ∑ xi ·fi = 10 = 1 germà Mitjana: X = N 10 EXEMPLE 4: Calcula els paràmetres de centralització a partir de la següent taula estadística: Interval (alçada en cm) [125,130) [130,135) [135,140) [140,145)

xi (marca de classe, cm) 127,5 132,5 137,5 142,5

fi (nens)

Fi (nens)

xi · fi

4 3 8 5

4 7 15 20 = N

510 (127,5·4) 397,5 (132,5·3) 1100 (137,5·8) 712,5 (142,5·5)

∑f

i

=N= 20

∑ x ·f =2720 i

i

Moda: Mo = 137,5 cm o [135,140) (és la xi que té la fr. absoluta més gran) Mediana: Me = 137,5 cm o [135,140) (és la xi que té la fr. absoluta acumulada que conté els dos valors centrals de les dades) ∑ xi ·fi = 2720 = 136 cm Mitjana: X = 20 N


6.2 Paràmetres de dispersió. Els paràmetres de dispersió ens permeten conèixer com s’agrupen les dades al voltant dels paràmetres de dispersió. Ens informen sobre si les dades són poc o molt disperses i també ens permeten saber si la mitjana és representativa de la població. Els que estudiarem són el rang, la desviació mitjana, la desviació típica i el coeficient de variació.

Rang o recorregut = R:

R= valor més gran de xi – valor més petit de xi Desviació mitjana = d

d=

∑f·x i

i

−X

N

Desviació típica o estàndard = s (o σ )

s=

(

∑ fi· xi − X

)

2

N

Coeficient de variació = CV CV = quocient entre la desviació típica i mitjana =

s X

ESTADÍSTICA  

Continguts teòrics sobre Estadística

Advertisement