
4 minute read
Reflexionem: La correlació significa causa-efecte? 4
Un mal ús de l’estadística
Imagina un titular de premsa com el que veus en el marge, i imagina també que a l’article corresponent s’al·ludeix a un estudi estadístic del qual es dedueix una alta correlació entre el sou mitjà dels obrers durant una sèrie d’anys i la despesa en begudes alcohòliques en els mateixos anys. Podem, fins i tot, imaginar que aquest «estudi» s’aplica a un segment molt concret de la població (per exemple, els immigrants).
La manipulació que subjau en aquest suposat estudi és evident: es pretén donar la falsa idea que la millora dels sous es malgasta en begudes alcohòliques. La realitat és una altra: amb el pas del temps, i la inflació, s’apugen els sous així com els preus de tot (també els de les begudes alcohòliques).
A pesar d’exemples com aquest, per fortuna, l’ús que en general es fa de les estadístiques és veraç i constructiu.
Un bon ús del disseny estadístic
No Ho Oblidis
Un bon estudi estadístic requereix moltes cauteles i afinar tant en el disseny de l’experiència com en la interpretació dels resultats obtenguts.
En les ciències experimentals i en les ciències socials es recorre amb freqüència a l’estadística en general i a la correlació en particular. Per exemple:
Per estudiar l’eficàcia d’un fertilitzant, se seleccionen diverses parcel·les amb característiques molt similars: tipus de terra, hores de reg, tipus de llavor, moment de la plantació, hores de sol… D’aquesta manera es podran relacionar les dues variables: quantitat de fertilitzant-nivell de producció sense que el resultat es vegi pertorbat per aquelles altres variables que estam controlant.
Alguns exemples divertits de correlació
Vegem uns curiosos exemples en els quals hi ha una indubtable correlació entre dues variables i, no obstant això, la possible relació causa-efecte és molt discutible.
• És fàcil demostrar que els al·lots amb peus grans llegeixen millor que els que tenen peus petits. Influeix la grandària del peu en la capacitat per a la lectura?
Individus: 200 al·lots agafats a l’atzar en un col·legi. Variables: x → grandària del peu; y → nivell de lectura.
• S’ha constatat que, als pobles d’una certa comarca, com més nius de cigonya hi ha a les teulades, més naixements d’infants es produeixen. Tenen, per tant, res a veure les cigonyes amb els naixements?
Individus: 43 pobles d’una certa comarca. Variables: x → nombre de cigonyes a les teulades; y → nombre de naixements a l’any.
• Un estudi va demostrar que en els anys en què més rogatives o processons hi havia per demanar pluges, menys plovia. Serà que als sants els irriten les rogatives?
Individus: cada un dels darrers 30 anys. Variables: x → nre. de rogatives demanant pluja al llarg de l’any; y → L/m2 de pluja recollits a l’any.
En el primer cas hi ha una variable intermèdia, l’edat , que es relaciona amb les altres dues, clar! En el segon, la variable intermèdia és la grandària dels pobles. I en el tercer, la relació causa-efecte és la contrària: com menys pluja, més rogatives estudiants nota en M nota en F
Distribucions bidimensionals amb calculadora 5
Al llarg d’aquesta unitat hem pretès que et familiaritzis amb la idea de correlació: per a què serveix, on s’usa, com s’interpreta, etc. I, també, que siguis capaç de fer-te a la idea del valor que pot prendre la correlació entre dues variables donades mitjançant un núvol de punts o una taula de valors. Aquesta destresa és el símptoma que domines amb agilitat aquesta teoria. No obstant això, el valor de la correlació també es pot trobar amb la calculadora. Potser et faci ganes aprendre a fer-ho per comprovar algun dels exercicis resolts «a ull».
Posam la calculadora en menú «Distribució bidimensional» de la manera següent: menú → 6:Estadística → 2: y = a+bx (Distribució bidimensional).
Ara anam introduint valors al caseller corresponent.
Vegem, per exemple com s’introdueixen els 10 parells de valors de la primera distribució que hem vist en aquesta unitat (mira-la en el marge).
En primer lloc, s’introdueix la dada corresponent al primer element de la variable x (Nota en Matemàtiques), que és just on està ombrejat.
Després d’escriure la dada, es pitja la tecla = perquè s’insereixi al seu lloc. A continuació, s’introdueix la segona dada, i així fins a la desena. Després, amb ajuda dels cursors, ens situam en el primer element de la variable y (Nota en Física) i feim el mateix amb les altres deu dades.
Una vegada completada la taula, per obtenir la correlació entre les dues variables, pitjam i seleccionam 4:Càlc regressió. Apareix a la pantalla el valor de r. En aquest cas, hem obtengut r = 0,876356092 ≈ 0,88.
La pantalla ens dona també els valors a i b, que són, respectivament, l’ordenada en l’origen i el pendent de la recta de regressió (observa el núvol de punts amb la seva corresponent recta de regressió en el marge).
Trobam ara amb la calculadora, en aquest altre exemple de la pàgina 271, la correlació dels llançaments a cistella amb les distàncies des de les quals es llança (vegeu la taula en el marge).
Introduïm els 8 parells de dades i procedim de la mateixa forma que en l’exemple anterior per obtenir la correlació: r = –0,941583818 ≈ –0,94
En aquest cas, la recta de regressió és y = 10,9 – 1,5x.
Pensa I Practica
➜
1 Ajuda’t de la calculadora per comprovar si està bé la correlació corresponent a cada núvol de punts de l’exemple de la pàgina 274. Fes el mateix amb les correlacions de l’exercici 1 de la mateixa pàgina.
2 Calcula el coeficient de correlació entre la longitud d’un raïl de via de tren i la temperatura de l’exemple de la pàgina 276. Comprova que la recta de regressió és, aproximadament, y = 0,12x