
4 minute read
Reflexionem: La correlació significa causa-efecte? 4
Un mal ús de l’estadística
Imagina un titular de premsa com el que veus en el marge, i imagina també que en l’article corresponent s’al·ludix a un estudi estadístic del qual es deduïx una alta correlació entre el sou mitjà dels obrers durant una sèrie d’anys i la despesa en begudes alcohòliques en els mateixos anys. Podem, fins i tot, imaginar que aquest «estudi» s’aplica a un segment molt concret de la població (per exemple, els immigrants).
La manipulació que subjau en aquest suposat estudi és evident: es pretén donar la falsa idea que la millora dels sous es malgasta en begudes alcohòliques. La realitat és una altra: amb el pas del temps, i la inflació, pugen els sous així com els preus de tot (també els de les begudes alcohòliques).
A pesar d’exemples com aquest, per fortuna, l’ús que en general es fa de les estadístiques és veraç i constructiu.
Un bon ús del disseny estadístic
No Ho Oblides
Un bon estudi estadístic requerix moltes cauteles i afinar tant en el disseny de l’experiència com en la interpretació dels resultats obtinguts..
En les ciències experimentals i en les ciències socials es recorre amb freqüència a l’estadística en general i a la correlació en particular. Per exemple:
Per estudiar l’eficàcia d’un adob, se seleccionen diverses parcel·les amb característiques molt similars: tipus de terra, hores de reg, tipus de llavor, moment de la plantació, hores de sol… D’aquesta manera es podran relacionar les dues variables: quantitat d’adob-nivell de producció sense que el resultat es veja pertorbat per aquelles altres variables que estem controlant.
Alguns exemples divertits de correlació
Vegem uns curiosos exemples en els quals hi ha una indubtable correlació entre dues variables i, no obstant això, la possible relació causa-efecte és molt discutible.
• És fàcil demostrar que els xiquets amb peus grans lligen millor que els que tenen peus xicotets. Influïx la grandària del peu en la capacitat per a la lectura?
Individus: 200 xiquets presos a l’atzar en un col·legi. Variables: x → grandària del peu; y → nivell de lectura.
• S’ha constatat que, als pobles d’una certa comarca, com més nius de cigonya hi ha a les teulades, més naixements de xiquets es produïxen. Tenen, per tant, rea a veure les cigonyes amb els naixements?
Individus: 43 pobles d’una certa comarca. Variables: x → nombre de cigonyes en les teulades; y → nombre de naixements a l’any.
• Un estudi va demostrar que en els anys en què més rogatives o processons hi havia per a demanar pluges, menys plovia. Serà que als sants els irriten les rogatives?
Individus: cada un dels últims 30 anys. Variables: x → nre. de rogatives demanant pluja al llarg de l’any; y → L/m2 de pluja recollits en l’any.
En el primer cas hi ha una variable intermèdia, l’edat, que es relaciona amb les altres dues, clar! En el segon, la variable intermèdia és la grandària dels pobles I en el tercer, la relació causa-efecte és la contrària: a menys pluja, més rogatives nota en M nota en F
Distribucions bidimensionals amb calculadora 5
Al llarg d’aquesta unitat hem pretés que et familiaritzes amb la idea de correlació: per a què servix, on s’usa, com s’interpreta, etc. I, també, que sigues capaç de ferte a la idea del valor que pot prendre la correlació entre dues variables donades mitjançant un núvol de punts o una taula de valors. Aquesta destresa és el símptoma que domines amb desimboltura aquesta teoria. No obstant això, el valor de la correlació també es pot trobar amb la calculadora. Potser t’abellisca aprendre a fer-ho per comprovar algun dels exercicis resolts «a ull».
Posem la calculadora en menú «Distribució bidimensional» de la manera següent: menú → 6:Estadística → 2: y = a+bx (Distribució bidimensional).
Ara anem introduint valors en el caseller corresponent.
Vegem, per exemple com s’introduïxen els 10 parells de valors de la primera distribució que hem vist en aquesta unitat (mira-la en el marge).
En primer lloc, s’introduïx la dada corresponent al primer element de la variable x (Nota en Matemàtiques), que és just on està ombrejat.
Després d’escriure la dada, es prem la tecla = perquè s’inserisca en el seu lloc. A continuació, s’introduïx la segona dada, i així fins al dècim. Després, amb ajuda dels cursors, ens situem en el primer element de la variable y (Nota en Física) i fem el mateix amb les altres deu dades.
Una vegada completada la taula, per obtindre la correlació entre les dues variables, premem i seleccionem 4:Càlc regressió. Apareix en la pantalla el valor de r. En aquest cas, hem obtingut r = 0,876356092 ≈ 0,88.
La pantalla ens dona també els valors a i b, que són, respectivament, l’ordenada en l’origen i el pendent de la recta de regressió (observa el núvol de punts amb la seua corresponent recta de regressió en el marge).
Trobem ara amb la calculadora, en aquest altre exemple de la pàgina 271, la correlació dels llançaments a cistella amb les distàncies des de les quals es llança (veure taula en el marge).
Introduïm els 8 parells de dades i procedim de la mateixa forma que en l’exemple anterior per obtindre la correlació: r = –0,941583818 ≈ –0,94
En aquest cas, la recta de regressió és y = 10,9 – 1,5x.
Pensa I Practica
➜
1 Ajuda’t de la calculadora per comprovar si està bé la correlació corresponent a cada núvol de punts de l’exemple de la pàgina 274. Fes el mateix amb les correlacions de l’exercici 1 de la mateixa pàgina.
2 Calcula el coeficient de correlació entre la longitud d’un raïl de via de tren i la temperatura de l’exemple de la pàgina 276. Comprova que la recta de regressió és, aproximadament, y = 0,12x