3 minute read

Nuntius Hausnartu: korrelazioak kausa-efektu esan nahi du?

Estatistikaren erabilera okerra

Pentsa ezazu prentsan alboan ikusten duzun titular hori agertu dela, eta imajinatu lerroburu horrekin batera ageri den artikuluan azterketa estatistiko bat aipatzen dela, eta hortik ondorioztatzen dela korrelazio handia dagoela langileek zenbait urtez izan duten batezbesteko soldataren eta urte horietan edari alkoholdunetan egindako gastuaren artean. Are gehiago, «azterketa» hori biztanleriaren segmentu oso zehatz bati aplikatzen zaiola ere pentsatu genezake (adibidez, etorkinei).

Sasi-azterketa horren azpian dagoen manipulazioa agerikoa da: soldaten hobekuntzak edari alkoholdunetan gastu handiagoa dakarren ideia faltsua ematen du. Errealitatea bestelakoa da: denborak aurrera egin ahala, eta inflazioarekin batera, soldatak igo egiten dira, baina baita gauza guztien prezioak ere (tartean edari alkoholdunenak).

Horrelako adibideak gorabehera, zorionez, estatistikari buruz egiten den erabilera, oro har, egiazkoa eta eraikitzailea da.

Diseinu estatistikoaren erabilera ona

EZ AHAZTU

Azterketa estatistiko on batek zuhurtzia handia eskatzen du, eta zehatz eta zorrotz jokatzea bai esperientzia diseinatzean, bai lortutako emaitzak interpretatzean.

Zientzia Esperimentaletan eta Gizarte Zientzietan sarritan jotzen da estatistikara, oro har, eta korrelaziora, bereziki. Adibidez:

Ongarri baten eraginkortasuna aztertzeko, hainbat lursail hautatu dira, antzeko ezaugarriak dituztenak guztiak ere: lur-mota, ureztatze-orduak, hazi-mota, landaketa-unea, eguzki-orduak... Horrela, bi aldagaiak erlazionatu ahal izango dira, ongarrikopurua/ekoizpen-maila, kontrolatzen ari garen beste aldagaiek emaitza nahastu gabe.

Korrelazioaren adibide dibertigarri batzuk

Orain ikusiko ditugun adibide bitxi hauetan, bi aldagairen artean korrelazioa dagoela ukaezina den arren, egon litekeen kausa-efektu erlazioa oso eztabaidagarria da.

• Erraz frogatzeko modukoa da oin handiak dituzten haurrek hobeto irakurtzen dutela oin txikiak dituztenek baino. Beraz, oinaren tamainak ba al du eraginik irakurtzeko gaitasunean?

Indibiduoak: ikastetxe batean ausaz hartutako 200 haur. Aldagaiak: x → oinaren tamaina; y → irakurketa-maila.

• Eskualde jakin bateko herrietan egiaztatu ahal izan denez, teilatuetan zenbat eta zikoina-habia gehiago izan, orduan eta haur gehiago jaiotzen dira. Beraz, zikoinek badute zerikusirik jaiotzekin?

Indibiduoak: eskualde jakin bateko 43 herri. Aldagaiak: x → teilatuetako zikoina-kopurua; y → urtean jaiotako haur-kopurua.

• Ikerketa batek frogatu zuen euri gutxiago egiten zuela euriteak eskatzeko erregute edo prozesio gehien zegoen urteetan. Gorroto ote diete santuek errogatibei?

Indibiduoak: azken 30 urteetako bakoitza. Aldagaiak: x → urtean zehar euria eskatzeko egindako errogatiben kopurua; y → urtean jasotako L/m2 euri.

Lehenengo kasuan, ageri zaizkigun bi aldagaiekin erlazionatzen den tarteko aldagai bat dago, jakina: adina! Bigarrenean, tarteko aldagaia herrien tamaina da. Eta hirugarrenean, kausa-efektu erlazioa kontrakoa da: zenbat eta euri gutxiago, orduan eta errogatiba gehiago ikasleak M-ko nota F-ko nota

Banaketa bidimentsionalak kalkulagailuarekin 5

Unitate honetan, gure helburuetako bat izan da ohitu zaitezela korrelazioa erabiltzen: zertarako balio duen, non erabiltzen den, nola interpretatzen den, etab. Eta, era berean, puntu-hodei baten edo balio-taula baten bidez emandako bi aldagairen arteko korrelazioak har dezakeen balioa estimatzeko gai izatea. Trebetasun hori lortu baduzu, teoria aise menderatzen duzun sintoma da. Dena dela, korrelazioaren balioa kalkulagailuarekin ere lortu daiteke. Eta agian nola egiten den ikasi nahi duzu, «begiz» ebatzitako ariketaren bat egiaztatzeko.

Kalkulagailuan «Banaketa bidimensionala» menua ezarri behar dugu, honela: menua → 6:Estatistika → 2: y = a+bx (Banaketa bidimentsionala).

Hori eginda, balioak sartuko ditugu, dagozkien laukietan.

Ikus dezagun, esaterako, nola sartu behar diren unitate honetako lehenengo banaketan ikusi genituen 10 balio-pareak (alboan dituzu).

Aurrena, x aldagaiaren (Matematikako nota) lehenengo elementuari dagokion datua sartu behar da, justu ilunduta dagoen tokian.

Datua idatzi ondoren, = tekla sakatuko dugu, bere tokian txertatu dadin. Ondoren, bigarren datua sartuko dugu, eta horrela jarraituko dugu, hamargarrenera arte. Gero, kurtsoreen laguntzaz, y aldagaiaren (Fisikako nota) lehenengo elementura joango gara, eta beste horrenbeste egingo dugu beste hamar datuekin.

Taula osatu dugunean, bi aldagaien arteko korrelazioa lortzeko, sakatu eta 4:Kalk erregresioa hautatuko dugu. Pantailan r-ren balioa agertuko zaigu. Kasu honetan, r = 0,876356092 ≈ 0,88.

Pantailan a eta b-ren balioak ere agertuko zaizkigu, hau da, ordenatua jatorrian eta erregresio-zuzenaren malda, hurrenez hurren (aztertu alboan ageri diren puntu-hodeia eta hodeiari dagokion erregresio-zuzena).

Lortu dezagun orain kalkulagailuarekin, 271. orrialdeko beste adibide honetan, zer korrelazio dagoen saskibaloi partidu batean saskiratze-kopuruaren eta jaurtitzeko distantziaren artean (ikusi alboan ageri den taula).

8 datu-pareak sartu eta aurreko adibidean egin dugun bezala jokatuta, korrelazioa lortuko dugu: r = –0,941583818 ≈ –0,94

Kasu honetan, erregresio-zuzena y = 10,9 – 1,5x da.

PENTSATU ETA PRAKTIKATU

1 Erabili kalkulagailuaren laguntza 274. orrialdeko adibidean ageri diren puntu-hodeietako bakoitzari dagokion korrelazioa ondo dagoen aztertzeko. Egin gauza bera orrialde horretako 1. ariketako korrelazioekin ere.

2 Kalkulatu, 276. orrialdeko adibidearen kasuan, zein den trenbideko errail baten luzeraren eta tenperaturaren artean dagoen korrelazio-koefizientea. Egiaztatu erregresio-zuzena dela, gutxi gorabehera, y = 0,12x

This article is from: