9789147097371

Page 1

Elisabet Borg Joakim Westerlund

Statistik fรถr beteendevetare Faktabok

Tredje upplagan


Elisabet Borg Joakim Westerlund

Statistik fรถr beteendevetare Faktabok

Tredje upplagan


Innehåll Förord............................................................................ 6

1. Introduktion ....................................................9 Kvantitativ metod ............................................... 11 Variabler och skaltyper....................................... 29 Sammanfattning ................................................. 37 Övningsuppgifter................................................ 39

2. Grafisk redovisning: tabeller och diagram  .41 Tabeller för kvalitativa variabler ....................... 42 Diagram för kvalitativa variabler...................... 45 Tabeller för kvantitativa variabler..................... 48 Diagram för kvantitativa variabler.................... 53 Tredimensionella diagram................................. 61 Sammanfattning ................................................. 61 Övningsuppgifter................................................ 63

3. Centralmått...................................................67 Typvärde .............................................................. 68 Median ................................................................. 71 Aritmetiskt medelvärde ..................................... 72 Jämförelser mellan typvärde, median och aritmetiskt medelvärde ................................... 80 Geometriskt och harmoniskt medelvärde ....... 80 Sammanfattning ................................................. 81 Övningsuppgifter................................................ 82

4. Spridningsmått .............................................84 Variationsbredd................................................... 85 Percentiler, kvartiler och kvartilavvikelse........ 85 Varians och standardavvikelse.......................... 87 Variationskoefficienten ...................................... 95 Sammanfattning ................................................. 96 Övningsuppgifter................................................ 97

5. Normalfördelning och z-poäng ....................99 z-poäng ................................................................ 99 Normalfördelning.............................................102 Sannolikheter för normalfördelade händelser.........................................................106 Avvikelser från normalfördelningen..............107 Lite sannolikhetslära ........................................113 Oddset för en händelse ....................................116 Binomialfördelningen ......................................119 Sammanfattning ...............................................123 Övningsuppgifter..............................................125

6. Korrelation ..................................................129 Grafisk redovisning av samband ....................132 Pearsons produkt­moment­korrelations­ koefficient .......................................................136 Är korrelationen stor eller liten?.....................144 Andra korrelationskoefficienter......................149

Korrelationskoefficienten vid ”restriction of range”...........................................................158 Partiell korrelation............................................161 Sammanfattning ...............................................168 Övningsuppgifter .............................................169

7. Introduktion till inferentiell statistik .........174 Logiken bakom all hypotesprövning .............175 Exempel på hypotesprövningens logik – Fia med knuff .................................................177 Samplingsfördelningar av medelvärden ........180 Hur samplingsfördelningar kan användas för hypotesprövning ......................................183 Hypotesprövning av enskilt stickprovs­medel­värde, känd populationsstandard­ avvikelse ..........................................................186 Typ I- och typ II-fel ..........................................188 Sammanfattning ...............................................191 Övningsuppgifter..............................................192

8. Hypotesprövning av medelvärden: z- och t-test ................................................194 z-test: ett stickprovs­medel­värde......................194 t-test: ett stickprovs­medel­värde  ......................204 t-test för oberoende mätningar.......................210 t-test för beroende mätningar .........................218 Effektstyrka........................................................224 Sammanfattning ...............................................227 Övningsuppgifter..............................................228

9. Hypotesprövning av korrelationer .............234 Korrelationskoefficienten ................................234 Fördjupa din förståelse av tabell 4 ..................239 Skillnaden mellan två korrelationer...............239 Medelvärden av korrelationer.........................242 Andra korrelationskoefficienter......................243 Kortfattat om reliabilitet och validitet hos mätinstrument ...............................................243 Sammanfattning ...............................................245 Övningsuppgifter..............................................246

10. Konfidensintervall ......................................248 Konfidensintervall för populationsmedelvärdet, μ................................................249 Konfidensintervall för proportioner ..............252 Konfidensintervall för populations­variansen, σ2....................................................254 Konfidensintervall för populations­korrelationen, ρ ..............................................255 Hypotesprövning med konfidensintervall.....255 Sammanfattning ...............................................261 Övningsuppgifter..............................................262


Innehåll

11. Introduktion till variansanalys...................264 Skalnivåer...........................................................265 Varianter av variansanalys...............................266 Variansanalys och experimentell metod .......269 Sammanfattning ...............................................270 Övningsuppgifter .............................................271

Pearsons produktmomentkorrelations­koefficient och regressionslinjen .................371 Datatransformering ..........................................371 Sammanfattning ...............................................375 Övningsuppgifter..............................................376

12. Envägs oberoende variansanalys ..............273

16. Chi-två och andra icke-parametriska test för hypotesprövning............................380

Beräkningar vid envägs oberoende ANOVA ..........................................................274 Den linjära modellen .......................................289 Antaganden bakom envägs oberoende ANOVA ..........................................................290 Hur envägs oberoende ANOVA egentligen fungerar...........................................................293 Multipla jämförelser .........................................296 Sammanfattning ...............................................302 Övningsexempel ...............................................302

Chi-två, χ2...........................................................381 Två oberoende stickprov .................................390 Två beroende stickprov – parvisa jämförelser.............................................................393 Jämförelser av tre eller fler oberoende stickprov..........................................................395 Beroende mätningar med tre eller fler ­jämförelser  ......................................................397 Sammanfattning ...............................................399 Övningsuppgifter..............................................400

13. Beroende ANOVA ........................................305

17. Multipel regressions­analys........................406

Ett räkneexempel på beroende ANOVA........306 Antaganden bakom envägs beroende ANOVA ..........................................................312 Hur envägs beroende ANOVA egentligen fungerar...........................................................314 Den fullständiga sammanfattningstabellen  .317 Matchning .........................................................319 Sammanfattning ...............................................321 Övningsuppgifter..............................................322

Ett exempel på multipel regression ................411 Logistisk regression ..........................................421 Sammanfattning ...............................................425 Övningsuppgifter .............................................426

14. Flervägs anova ..........................................324 Fördelar med flervägs ANOVA ......................330 Ett räkneexempel på en 2 × 2 oberoende ­ANOVA  ..........................................................330 Hur tvåvägs oberoende ANOVA egentligen fungerar...........................................................342 Post hoc-test jämfört med test av enkla effekter.............................................................343 Mixed ANOVA .................................................345 Kovariansanalys (ANCOVA) ..........................349 Sammanfattning ...............................................354 Övningsuppgifter..............................................355

15. Enkel regressionsanalys ............................359 Skalnivåer ..........................................................360 Linjära och icke-linjära samband ...................361 Den linjära regressionslinjen...........................361 Anpassa en linje till data..................................363 Att predicera......................................................365 Hypotesprövning av koefficienterna ..............367 F-test av regressionssambandet ......................369 Lite mer om formlerna ....................................369

4

18. Faktoranalys ...............................................431 Ett exempel på faktoranalys ............................433 Att tänka på när man gör faktoranalys ..........443 Sammanfattning ...............................................444 Övningsuppgifter..............................................445

19. Powerberäkningar ......................................447 Vad är power? ...................................................448 Effektstyrka ........................................................451 Powerberäkningar.............................................453 Powerberäkningar med dataprogram ............461 Sammanfattning ...............................................461 Övningsuppgifter .............................................462

20. Redovisning av forskningsresultat ............464 Tabeller och figurer...........................................464 Allmänt om redovisning av signifikans­ prövningar ......................................................465 t-test ...................................................................466 Korrelationer .....................................................467 Variansanalys ....................................................468 Enkel regression................................................470 Icke-parametriska metoder .............................471 Övningsuppgifter..............................................472

21. Statistiska fallgropar..................................473 Ett statistiskt samband behöver inte innebära ett kausalsamband .........................473 Extremvärden ....................................................474


Innehåll

Stor skillnad mellan hypotesprövande resultat och post hoc-fynd ............................476 Massignifikansproblemet ................................479 Konsekvenserna av ett litet respektive stort stickprov .........................................................483 Restriction of range-problemet ......................484 Resultat på gruppnivå kan inte utan vidare ­generaliseras till individnivå ........................485 Regressionsfelslutet ..........................................486 Sammanfattning ...............................................490 Övningsuppgifter .............................................491

Appendix A – Facit till övningarna ...................493 Appendix B – Formelsamling ...........................524

Appendix C – Statistiska tabeller.....................534 Tabell 1. Z-tabellen.......................................534 Tabell 2. Z-tabellen (för hypotesprövning)............................................................535 Tabell 3. T-fördelningar...............................536 Tabell 4. Korrelationstabellen......................538 Tabell 5. Chi-två-fördelningar.....................540 Tabell 6. F-tabellen.......................................542 Tabell 7. Power-tabellen...............................545

Appendix D – Referenser och rekommenderad extralitteratur ...................................546 Register .............................................................548

5


Förord Tanken med den här statistikboken är att den ska fungera som en introduktion i statistik som täcker in det mesta som en beteendevetare/vårdvetare behöver kunna på grundnivå. Ambitionen har varit att boken ska vara lättläst och stimulerande. Vår erfarenhet är att statistik inte går att lära sig utan praktiska erfarenheter. Därför har vi sett till att alltid exemplifiera de teoretiska resonemangen och att avsluta varje kapitel med många övningsexempel. Vår förhoppning har redan från början varit att boken ska hjälpa läsaren att inse att statistik varken behöver vara svårt eller tråkigt och att statistik kan vara ett mycket värdefullt verktyg vid forskning och utredningsarbete. Samtidigt vill vi påpeka att statistiken i sig själv inte kan rädda en dåligt upplagd undersökning. Av den anledningen har vi, trots att boken främst är en statistikbok, lagt in ett par avsnitt av mer metodologisk karaktär. Sedan den första upplagan kom ut har boken också rönt mycken uppskattning från studenterna. Nyligen sade en student efter avslutad kurs att ”det är utan tvekan den bästa mattebok jag någonsin har läst”. Som läroboksförfattare blir man också glad när det dimper ner spontana tackmejl från både kända och okända studenter. En psykologistudent tyckte exempelvis att statistik som ämne var ”föga medryckande” och att den kurslitteratur de hade såg ut som en formelsamling. Men som av en slump hade hon ”ramlat på” Statistik för beteendevetare på biblioteket och skrev: ”Jag vill bara säga att det är en fantastisk bok! Det är till och med lite roligt att plugga statistik. Faktiskt. Så, jag vill bara skriva ett mail för att tacka för insatsen ni har gjort i författarvärlden inom genren facklitteratur!”

Bokens utformning När statistiska begrepp dyker upp första gången står de kursiverade. För att underlätta läsning av engelsk litteratur i statistik anger vi även deras engelska motsvarigheter, utom i sådana fall när de engelska och svenska orden i stort sett är desamma. Varje kapitel innehåller ett antal exempel. Dessa är numrerade med kapitelnummer och löpnummer samt markerade med färgad bakgrund, så att de ska vara lätta att hitta när man bläddrar i ­boken. 6


Förord

De statistiska formlerna är också numrerade med kapitelnummer och löpnummer angivet i marginalen. Ett urval av dessa presenteras i formelsamlingen i Appendix B. I de flesta kapitlen finns även ett antal överkurs- eller fördjupningsavsnitt. Dessa är markerade med grafisk signal vid början och slut och är satta i mindre grad. Innehållet i dessa är sådant som vi bedömt bör finnas med för att göra texten mer fullständig men går också att hoppa över. Hur dessa överkurs- eller fördjupningsavsnitt ska användas i undervisningen lämnar vi åt den enskilde läraren att avgöra. Varje kapitel avslutas med en sammanfattning och ett antal övningar. Precis som exemplen i boken innehåller övningsuppgifterna, om inte annat anges, påhittade data. I slutet av boken finns appendix med facit, formler, och tabeller.

Skillnader mot tidigare upplagor För att verkligen göra Statistik för beteendevetare till den enda bok i statistik som behövs på grundnivå har vi lagt till några nya avsnitt. Några av de viktigare nyheterna är ett helt nytt kapitel om multipel regressionsanalys och ett kapitel om faktoranalys. Vi har också lagt till avsnitt om skewness och kurtosis, om sannolikhetsberäkningar, odds och oddskvoter, och ett kort avsnitt om bino­ mial­fördel­ningen. Vi har ändrat om lite i kapitlen om variansanalys, utökat avsnittet om mixad ANOVA och lagt till ett avsnitt om kovariansanalys. Slutligen har vi tagit bort avsnittet med kortare repetition av grundläggande matematik. Det avsnittet fanns tidigare som ett appendix men finns nu istället i Övningsboken.

Tackord För eventuella fel och brister i boken tar vi på oss det fulla ansvaret1. De fördelar som boken kan tänkas ha är dock inte enbart vår egen förtjänst. Vi är evigt tacksamma för de råd och synpunkter som en stor mängd studenter gett oss. Förutom dessa studenter

Vi har skrivit boken gemensamt, dock har Elisabet haft huvudansvaret för kapitel 2, 4, 8, 9, 10, 15, 16 och 19 medan Joakim haft huvudansvaret för kapitel 3, 6, 7, 11, 12, 13, 18 och 21. 1

7


Förord

vill vi dessutom tacka professor Åke Hellström – som vi känt länge och som vi båda beundrar stort, och universitetslektor Daniel Sjödin – en ny bekantskap, för deras engagerade och noggranna granskning av manuskriptet till denna bok. Stockholm den 19 juni 2012 Elisabet Borg   Joakim Westerlund

8


1. Introduktion När man berättar att man undervisar i statistik får man ofta kommentaren: ”Statistik, jaha, hm … Ja, det finns ju tre sorters osanning – he, he – lögn, förbannad lögn och statistik …”. Antingen kan man då artigt skratta med eller också kan man säga att det är just därför som alla borde lära sig åtminstone något mer än det mest elementära i ämnet. För visst är det så att statistik kan användas för att luras. Det finns gott om exempel på statistiska diagram där skillnader eller trender fåtts att se mycket större och starkare ut än de egentligen är. Men statistik kan också vara ett oerhört viktigt redskap som låter oss lyfta lite på den slöja som ibland skymmer verkligheten för oss.

9


1. Introduktion

Hansson (2003) berättar i sin bok ”Konsten att vara vetenskaplig” att man så sent som under mitten av 1800-talet allmänt ansåg att lunginflammation (som så många andra åkommor) berodde på obalans i kroppsvätskorna som utgjordes av blod, svart galla, gul galla och slem. Att bota lunginflammation måste därför handla om att rätta till denna obalans, ansåg läkarkåren, och om detta rådde allmän enighet. Det som man inte var eniga om var vilket som var det bästa sättet att rätta till denna obalans. Genom förnuftsmässiga resonemang och klinisk erfarenhet, samt genom att stödja sig på gamla auktoriteter, kom vissa av dessa lärda män fram till att åderlåtning måste vara den bästa metoden. Genom andra förnuftsmässiga resonemang, och annan klinisk erfarenhet, och genom att stödja sig på andra auktoriteter, kom dock andra av dessa lärda män fram till att det måste vara kräkterapi som gör susen. Hade det nu inte varit för den österrikiske läkaren Jospeh Dietl, hade de stridande parterna kunnat fortsätta att käbbla och slå varandra i huvudet med Aristoteles gamla luntor. Joseph Dietl gjorde nämligen år 1849 något väldigt revolutionerande, en systematisk empirisk undersökning av saken. Han hade en grupp patienter med lunginflammation som fick åderlåtning. Dödligheten i denna grupp var 20,4%. Han hade också en grupp patienter med lunginflammation som behandlades med kräkterapi. I denna grupp var dödligheten 20,7%. Så här långt såg det alltså ut som dött lopp mellan åderlåtning och kräkterapi. Men Dietl hade också med en tredje grupp lunginflammationspatienter i sin undersökning, en grupp som inte fick någon specifik behandling överhuvudtaget, bara allmän omvårdnad. I denna grupp var dödligheten 7,4%. Joseph Dietls undersökning mottogs mycket negativt och han blev till och med av med sitt arbete. Man kan tänka sig att de lärda herrarna ansåg att det var förmätet av Dietl att ifrågasätta deras kloka slutsatser med något så simpelt som vanligt räknande. I dag ser det dock annorlunda ut och forskarna anser allmänt att det finns få metoder som är så effektiva för att ta reda på hur saker och ting fungerar, som systematiska empiriska undersökningar kombinerade med statistiska analyser. Fast vad är egentligen statistik? Enligt Nationalencyklopedin är statistik bland annat ”vetenskapen om hur data med inslag av slumpmässig variation eller osäkerhet ska insamlas, utvärderas och presenteras”. Vad för slags data? Vad då slumpmässig variation? Hur ska data insamlas? Hur 10


1. Introduktion

kan man lita på utvärderingen? På vilket sätt ska data presenteras för att det ska bli så begripligt som möjligt? Innan vi går in på dessa saker bör vi dock känna till något om grunderna för kvantitativ vetenskaplig metod. Visserligen är detta en statistikbok och visserligen förutsätts att de studenter som läser denna bok också läser någon metodbok, men trots detta tror vi att det kan vara på sin plats med ett mycket komprimerat avsnitt om kvantitativ vetenskaplig metod.

Kvantitativ metod Inom psykologi, medicin, pedagogik och många andra vetenskaper finns det två huvudsakliga grupper av metoder att samla in och bearbeta data med: kvalitativa och kvantitativa metoder. Skillnaden mellan kvalitativa och kvantitativa metoder beskrivs på följande sätt av Svensson (2004): Principiellt är distinktionen mellan kvalitativa och kvantitativa metoder enklast att förstå som att kvantitativa metoder dels är metoder för insamling av siffermässiga data eller kvantifiering av data till siffror, dels är matematiska och/ eller statistiska beräkningar som bearbetningsmetoder. Kvalitativa metoder är på ett motsvarande sätt insamling av data som representerar en kvalitet i ett sammanhang, i stor utsträckning i form av språkliga enheter. Dessa data bearbetas framför allt språkligt beskrivande och kategoriserande. (sidan 68)

För den som är intresserad av en introduktion till kvalitativa metoder rekommenderas Langemar (2008).

Undersökningsdesign När man gör en undersökning som man sedan analyserar med hjälp av någon kvantitativ metod har man i grund och botten tre olika alternativ att välja mellan. Man kan göra ett experiment, ett kvasi-experiment eller ett icke-experiment. Här låter det som om det finns något slags hierarki där experiment tydligen i någon bemärkelse är den bästa undersökningsmetoden. Detta är en helt riktig slutsats. Experiment är den bästa undersökningsmetoden när det gäller att kunna komma fram till slutsatser om orsak och 11


1. Introduktion

verkan. Sådana slutsatser kan sägas vara det yttersta målet för nästan all forskning som använder sig av kvantitativa metoder. Vi vill kunna säga om Magnecyl minskar graden av huvudvärk. Vi vill kunna säga om människor kan påverkas av bilder som visas så snabbt att de inte medvetet hinner uppfatta dem. Vi vill kunna säga om överdriven alkoholkonsumtion leder till skador på levern. Vi vill helt enkelt kunna uttala oss om orsak och verkan – och då är experiment den bästa undersökningsmetoden. Man har tänkt så här: ”Hur ska vi lägga upp en undersökning så att vi så mycket som möjligt ska kunna lita på att resultatet säger oss något om orsak och verkan?” – och så har man kommit fram till den experimentella metoden. Föga överraskande är därför ett kvasi-experiment ett experiment med vissa brister som gör att man inte lika säkert kan uttala sig om orsak och verkan, och ett icke-experiment är en undersökningsmetod som leder till ännu osäkrare uttalanden om orsak och verkan. Vi ska nu titta närmare på dessa tre typer av undersökningsmetoder.

Experiment Ett (äkta) experiment kännetecknas av två saker, kontroll och randomisering. Det är forskaren som har kontrollen över eventuella orsaker genom att exempelvis variera tonhöjden, bildinnehållet, färgen, alko­hol­mäng­den, könet på en brottsling som beskrivs i en text ­eller vad det nu är för något man vill undersöka effekterna av. Denna sak som forskaren varierar/manipulerar och som man vill se effekterna av (vår eventuella orsak), kallas oberoende variabel och brukar förkortas OV. Den sak som man vill se effekterna på, till exempel upplevd ljudstyrka, hudkonduktans, hjärtfrekvens, levervärden och utdömd strafflängd, kallas beroende variabel (på vilken vi eventuellt kan få en verkan) och brukar förkortas BV. Experimentet går ut på att ta reda på om OV påverkar BV. I vissa vetenskaper, som till exempel fysik, räcker det med att man har kontroll över OV för att man ska kunna prata om ett experiment. Men i psykologi, medicin, pedagogik och andra vetenskaper, framförallt där människor är undersökningsobjekten, behövs även något som kallas randomisering. Randomisering innebär att 12


1. Introduktion

man låter slumpen avgöra vilken betingelse var och en av undersökningsdeltagarna ska hamna i. Så det är alltså slumpen som avgör vem som ska få Magnecyl och vem som ska få sockerpiller, det är slumpen som avgör vem som ska få se positiva och vem som ska få se negativa bilder, det är slumpen som får avgöra vem som ska få utdöma straff till en fiktiv manlig brottsling och vem som ska få utdöma straff till en fiktiv kvinnlig brottsling. Det är inte så att folk själva väljer vilken betingelse de ska hamna i och det är inte heller forskaren som efter tycke och smak fördelar folk till olika betingelser. Risken med att inte låta slumpen sköta fördelningen av individer till betingelser är att man kan få någon systematisk skillnad mellan grupperna som inte har med den oberoende variabeln att göra men som kommer att påverka den beroende variabeln, mer om detta i Bakomliggande-variabel-problemet. Det allra enklaste experiment man kan göra innefattar två grupper, en experimentgrupp och en kontrollgrupp. Man randomiserar undersökningsdeltagarna till dessa grupper och sedan behandlar man deltagarna i de två grupperna exakt likadant i alla avseenden utom ett, OV. Exempelvis ger man alla i grupperna ett piller som har samma färg, form, lukt och vikt etcetera. I pillret som personerna i experimentgruppen får ingår den aktiva substans man är intresserad av att utvärdera (till exempel acetylsalisylsyra) men i pillret som personerna i kontrollgruppen får saknas denna substans. För att just förekomsten av acetylsalisylsyra verkligen ska vara det enda som skiljer grupperna åt, och inte till exempel olika förväntningar, är det viktigt att man använder sig av en så kallad dubbel-blind-design, det vill säga att varken undersökningsdeltagare eller undersökningsledare vid undersökningstillfället vet vem som har hamnat i vilken betingelse. Exempel 1:1 Vi vill ta reda på om könet hos en fiktiv brottsling påverkar det straff som tilldöms och vi börjar med att författa en liten berättelse som handlar om Martin som går in på Konsum, slår expediten i huvudet med en flaska för att sedan plocka åt sig alla pengarna i kassan och springa därifrån. Lyckligtvis fångas Martin kort därefter av polisen. Under vår berättelse, på samma sida, uppmanas undersökningsdeltagaren att med en siffra, 0–24, ange hur många månaders fängelse han/hon anser att Martin ska dömas till.

13


1. Introduktion

Sedan författar vi en till beskrivning med tillhörande uppgift om straffdömning, som i alla avseenden utom ett är identisk med den ovannämnda. Den enda skillnaden mellan den ovannämnda texten och den nya texten är att vi i stället för Martin har skrivit Martina. Vi kopierar upp Martintexten i 20 exemplar och Martinatexten i 20 exemplar. Sedan blandar vi våra papper ordentligt och delar ut texterna till 40 undersökningsdeltagare (utan att titta på vem som får vilken version) som vi samlat i en stor skrivsal (så de kan sitta långt ifrån varandra utan möjlighet att kunna se varandras texter). Om det sedan visar sig att de två grupperna skiljer sig åt när det gäller genomsnittligt tilldömt straff finns bara två möjliga förklaringar: 1) Slumpen åstadkom denna skillnad. Av en slump råkade vi exempelvis få lite strängare undersökningsdeltagare i den ena gruppen än i den andra, eller så kanske vi råkade få många fler brottsoffer i den ena gruppen än den andra. Sannolikheten för att en skillnad som den vi funnit ska uppkomma av en slump kan vi beräkna med inferentiell statistik (se kapitel 7). Om sannolikheten visar sig vara liten tror vi inte på slumphypotesen, utan föredrar i stället förklaring 2) att skillnaden beror på att den ena berättelsen handlade om en man (Martin) och den andra om en kvinna (Martina).

Experiment kan göras på olika sätt, man kan ha en enfaktoriell eller en flerfaktoriell design (en eller flera OV), man kan göra ett laboratorieexperiment eller ett fältexperiment och man kan ha en mellanindividsdesign (olika personer för varje försöksbetingelse) eller en inomindividsdesign (samma individer deltar i alla försöksbetingelser). (En inomindividdesign blir dock egentligen inget äkta experiment, eftersom individerna inte randomiseras till de olika betingelserna). Experimentet med Martin och Martina är ett exempel på en enfaktoriell mellanindividsdesign. Längre fram i boken kommer vi att återkomma till några av dessa undersökningsdesigner. Ibland, särskilt i kliniska sammanhang, kallas experiment för ”Randomized control trials”, vilket brukar förkortas ”RCTs”.

Kvasi-experiment Ett kvasi-experiment kännetecknas av att man har kontroll över OV, men inte kan randomisera individer till betingelser. Att man 14


1. Introduktion

inte kan randomisera får till följd att det kan finnas en annan, bakomliggande variabel, snarare än OV, som leder till effekter på BV. Säg exempelvis att vi vill jämföra undervisningsmetoderna A och B. Vi har redan en indelning i två grupper, en förmiddagsgrupp och en eftermiddagsgrupp. Grupperna har inte bildats genom randomisering, istället har eleverna själva fått bestämma om de vill tillhöra förmiddagsgruppen eller eftermiddagsgruppen. Vi undervisar förmiddagsgruppen med metod A och eftermiddagsgruppen med metod B och efter en månad får alla eleverna göra en tenta. Sedan jämför vi grupperna på tentan och ser att de som blivit undervisade med metod A i genomsnitt har fått en betydligt högre poäng på tentan än de som blivit undervisade med metod B. Skillnaden är så stor att den rimligtvis inte kan bero på en slump. Men behöver detta betyda att det var OV (typ av undervisningsmetod) som gav upphov till skillnaderna i BV (tentapoäng)? Nej, en ­mycket möjlig alternativ förklaring kan vara att grupperna redan från början skiljde sig åt i fråga om någon bakomliggande variabel. Att vissa elever valde att tillhöra eftermiddagsgruppen kanske exempelvis berodde på att de hade ett arbete vid sidan av sina studier (som de måste sköta på förmiddagen). Dessa elever har rimligen mindre tid till studier än andra och borde därför klara tentan sämre. Att grupperna redan från början kan vara olika när man gör kvasi-experiment gör att man ibland refererar till denna undersökningstyp som ”experiment med icke-ekvivalenta grupper” (medan ”riktiga” experiment kallas ”experiment med ekvivalenta grupper”). Att man trots bakomliggande variabelproblemet ändå ibland gör kvasi-experiment beror på att man inte har något alternativ. Detta illustreras av exempel 1:2 nedan. Exempel 1:2 Vi vill ta reda på om ökade öppettider på Systembolaget leder till ökad alkoholkonsumtion. Idealet vore om vi slumpmässigt kunde fördela folk till att bo i två olika städer som i alla avseenden är så lika varandra som möjligt men där man i den ena staden, men inte i den andra, fick ökade öppettider på Systembolaget. Tyvärr skulle nog knappast folk gå med på detta, så vi får nöja oss med den färdiga uppdelning av individer på städer som redan finns och göra ett kvasi-experiment i stället.

15


1. Introduktion

Det finns flera varianter på kvasi-experiment. En vanlig variant är en så kallad tidsseriedesign där man lägger till och drar ifrån den oberoende variabeln och samtidigt ser efter vad som händer med den beroende variabeln. Man kanske vill se om en sänkning av hastigheten på motorvägen leder till ett minskat antal trafikolyckor. Man börjar med att observera hur många trafikolyckor som inträffar på en viss motorväg under en viss tid, till exempel 100 dagar och med dagens hastighetsbegränsning (110 km/h). Sedan sänker man hastighetsbegränsningen till 90 km/h, väntar 100 dagar och ser hur många trafikolyckor som inträffat. Säg att vi noterar att antalet trafikolyckor sjunkit. Behöver detta bero på sänkningen av hastighetsbegränsningen? Nej, naturligtvis inte. Det skulle kunna vara en följd av en allmän minskning av antalet trafikolyckor, beroende på säkrare bilar, dyrare bensin, ökad användning av bilbälte etcetera. Så vi återställer hastighetsbegränsningen till 110, väntar 100 dagar och ser hur många trafikolyckor som nu inträffat. Säg att mängden trafikolyckor ökar tillbaka till ungefär samma nivå vi hade från början. Då måste väl ändå variationen i antalet trafikolyckor kunna sägas bero på variationen i hastighetsbegränsningen? Njaee… Det är kanske troligt, men inte helt nödvändigt. Säg att det råkade bli så att de första 100 dagarna (med 110 km/h) vi observerade inträffade på vintern/våren, att nästa 100 dagar (med 90 km/h) inträffade på sommaren och att de senaste 100 dagarna (med 110 km/h) inträffade på hösten/ vintern – ja, då skulle ju detta med årstid kunna vara en bakomliggande variabel till det observerade sambandet mellan OV och BV. För varje gång vi observerar att en förändring i OV åtföljs av en förändring i BV blir vi förstås mer och mer övertygade om att det verkligen är OV (och inget annat) som påverkar BV. Men helt säkra kan vi egentligen aldrig vara.

Icke-experiment Icke-experiment, eller korrelationsstudier som de ofta kallas, kännetecknas av att man varken har kontroll över OV eller kan randomisera individer till betingelser. Det enda vi kan göra är att observera ett eventuellt samband mellan en tänkt OV och en tänkt BV och med olika, ofta mycket sofistikerade statistiska metoder, så gott det går försöka utesluta att det i själva verket handlar om 1) ett skensamband och att 2) orsakssambandet verkligen går från 16


1. Introduktion

OV till BV och inte tvärtom. Men hur noga vi än är, kan vi aldrig nå upp till den säkerhet i slutsatsen att det verkligen var OV som påverkade BV som vi kan med ett äkta experiment. Precis som när det gäller kvasi-experiment, är förklaringen till att man använder sig av en icke-experimenell undersökningsmetod i stället för ett (äkta) experiment, helt enkelt att man inte har något annat alternativ. Vi kan inte randomisera barn till olika uppväxtförhållanden för att försöka utröna vilka faktorer som påverkar ungdomskriminalitet. Vi kan inte randomisera folk till två grupper, där den ena gruppen får röka i 30 år och den andra gruppen inte får röka under 30 år för att ta reda på om rökning ökar risken för lungcancer. Förutom de etiska problem som skulle uppstå om man försökte sig på att undersöka en del fenomen experimentellt (till exempel kriminalitet, lungcancer, självmord, depression, psykopati) så kan det också vara ekonomiska och resursmässiga anledningar till att en experimentell design inte kan komma på fråga. Icke-experiment må ha en något nedsättande benämning men innan man fnyser alltför mycket åt dem ska man veta att de allra mest avancerade statistiska metoderna har utvecklats just för att användas i samband med icke-experimentella undersökningar och att icke-experiment sannolikt är den vanligaste undersökningsmetoden inom många viktiga forskningsområden i psykologi, (till exempel personlighetspsykologi, utvecklingspsykologi samt arbets- och organisationspsykologi), men även i andra ämnesområden såsom inom vård- och hälsovetenskap. Skillnaderna mellan experiment, kvasi-experiment och ickeexperi­ment sammanfattas i tabell 1:1 nedan. Tabell 1:1 Skillnaderna mellan experiment, kvasi-experiment och ickeexperiment.

Design

Kontroll av OV

Randomisering av individer till betingelser

Experiment Kvasi-experiment Icke-experiment

Ja Ja Nej

Ja Nej Nej

Undersökningens validitet Vad är det som avgör om man kan lita på slutsatserna som dras från en viss undersökning? Jo, det är om undersökningen har god 17


1. Introduktion

eller dålig validitet. När det gäller validiteten i en undersökning (till skillnad mot exempelvis validiteten hos en mätning) skiljer man i huvudsak mellan intern och extern validitet.

Intern validitet Intern validitet handlar om med vilken säkerhet vi kan lita på slutsatsen att det verkligen var OV (och ingenting annat) som påverkade BV, det vill säga att vi kan dra slutsatser om ett orsakssamband och i vilken riktning detta går: OV

BV

Som vi sett har experiment i allmänhet en mycket god intern validitet, kvasi-experiment har en något sämre intern validitet och icke-experiment har den sämsta interna validiteten. Det finns två hot mot den interna validiteten i en undersökning, Riktningsproblemet och Bakomliggande-variabel-problemet. Riktningsproblemet

Vad kom först, hönan eller ägget? Ja, det är denna fråga som riktningsproblemet handlar om. Med en psykologisk frågeställning skulle det kunna handla om huruvida det är humöret som påverkar prestationen eller prestationen som påverkar humöret, eller så skulle det kunna handla om huruvida det är utseendet som påverkar attraktiviteten eller om det är attraktiviteten som påverkar utseendet. Om man har kontroll över OV så kan man inte ha något riktningsproblem. Om det är vi som randomiserar folk till att få magnecyl eller sockerpiller så kan magnecylen påverka huvudvärken, men huvudvärken kan knappast påverka magnecylen. Så riktningsproblemet har man alltså varken vid experiment eller kvasiexperiment. Vid icke-experiment är riktningsproblemet ett allvarligt hot då man gör en tvärsnittsstudie, det vill säga då man undersöker OV och BV vid (ungefär) samma tillfälle. Gör man däremot en longitudinell studie, och följer folk över en längre tid, kan man bemästra riktningsproblemet. Det kan knappast vara kriminalitet vid vuxen ålder som påverkar vilka uppväxtförhållanden man haft som barn.

18


1. Introduktion

Bakomliggande-variabel-problemet

Ponera att vi undersöker sambandet mellan oljeförbrukning och försäljning av varma jackor i en viss stad med ett icke-experiment. För varje vecka under ett helt år noterar vi dels hur många ku­ bikmeter olja som förbrukats, dels hur många varma jackor som sålts. Vi kommer nog att finna att det råder ett positivt samband. Veckor som det förbrukats mycket olja har det också sålts många varma jackor och veckor som det förbrukats lite olja har det sålts färre varma jackor. Vad kan detta nu bero på? Kan det möjligtvis vara så att oljeförbrukningen påverkar jackförsäljningen? Nej, knappast. Här är antagligen den bakomliggande variabeln temperatur boven i dramat. Under varma veckor förbrukas lite olja och få varma jackor säljs, men under kalla veckor förbrukas mycket olja och många varma jackor säljs. Vi har alltså ett skensamband mellan en ”OV” och en ”BV” som egentligen förklaras av en bakomliggande variabel: Bakomliggande variabel

OV

BV

till exempel Temperatur

Oljeförbrukning

Varma jackor

Ett annat exempel på det bakomliggande-variabel-problemet är det som nämnts ovan i avsnittet om kvasiexperiment då vi ville jämföra två undervisningsmetoder på en förmiddagsgrupp och en eftermiddagsgrupp. Vi kanske får en skillnad mellan gruppernas resultat på en tenta och det ser därför ut som att undervisningsmetoden påverkar tentaresultatet, men det skulle mycket väl kunna vara den bakomliggande variabeln ”Hur mycket man jobbar vid sidan av studierna” som är den bakomliggande variabeln som avgör både vilken grupp man hamnar i och hur bra det går på tentan. 19


1. Introduktion

Bakomliggande-variabel-problemet hanteras med randomisering och kan alltså endast undvikas helt med hjälp av ett (äkta) experiment. Nu finns det emellertid sofistikerade statistiska metoder (till exempel partiella korrelationer) med vars hjälp man kan pröva möjligheten att det är en viss bestämd variabel som kan sägas vara den bakomliggande variabeln till ett observerat samband. På så sätt kan man åtminstone beta av de mer uppenbara (och mätbara) möjliga bakomliggande variablerna till ett visst samband.

Extern validitet När man väl kommit fram till att undersökningen åtminstone har hyfsad intern validitet kan man gå vidare och fråga sig hur det står till med den externa validiteten. Den externa validiteten handlar om giltigheten i att göra generaliseringar från det samband mellan OV och BV som man påvisat. Det finns framför allt tre typer av generaliseringar man vill kunna göra: Generaliseringar till andra sätt att manipulera/mäta OV och BV, generaliseringar till andra miljöer än den använda och generaliseringar till andra individer än de undersökta. Vi ska nu titta närmare på dessa typer av generaliseringar. Generaliseringar till andra sätt att manipulera/mäta OV och BV

Säg att vi har en teori om att ”arousal” påverkar prestationsförmågan. Om vi nu vill göra ett experiment och pröva denna teori måste vi bestämma oss för någon speciell metod för att manipulera arousal och något speciell metod för att mäta prestationsförmåga. ”Arousal” är ett ganska diffust begrepp, som möjligen skulle kunna översättas med ”vakenhetsgrad”, och man kan tänka sig ett oräkneligt antal olika metoder för att manipulera arousal i ett experiment. Likaså är ”prestationsförmåga” ett något diffust begrepp som i princip skulle kunna mätas på oändligt många sätt. Säg att vi i vår undersökning gör så att vi manipulerar arousal genom att låta hälften av våra undersökningsdeltagare lösa problem samtidigt som de får höra på så kallat ”vitt brus” med styrkan 90 dB (hög arousal) medan den andra hälften får lösa samma problem samtidigt som de får höra på vitt brus med styrkan 30 dB (låg arousal). Säg också att vi mäter prestationsförmåga genom att räkna hur många ord som börjar på bokstaven ”k” som de kan säga under 20


1. Introduktion

en minut. Säg slutligen att vi finner att vår manipulation av OV ger påvisbara effekter på BV. Vi har gjort ett experiment och har god intern validitet och kan alltså med gott samvete påstå att det verkligen var OV (skillnaden mellan 90 och 30 dB vitt brus) som påverkade BV (antal sagda ord som börjar på ”k” under en minut). Men var det verkligen detta vi var ute efter? Nej, vi ville komma åt något mycket större, sambandet mellan ”arousal” och ”prestation”. Så frågan är i vilken utsträckning vi kan generalisera vårt samband från just de metoder för att manipulera/mäta OV och BV som vi använt oss av i vår undersökning. När det gäller OV, arousal, kan vi fråga oss om vi även skulle få en skillnad i prestation om vi använt oss av andra ljudstyrkor (till exempel 80 dB mot 40 dB). Skulle vi få en effekt även med så kallat ”skärt brus”. Funkar det med en injektion med adrenalin i stället för kraftigt oväsen? Hur är det med otäcka bilder? Prestationsångest? Kaffe? Och när det gäller BV, prestationsförmåga, kan man undra om arousal även slår på förmågan att under en minut komma på ord som börjar på ”r”. Och hur är det med ord som slutar på ”a”? Påverkas förmågan att lösa enkla matematiska problem? Hur är det med svåra matematiska problem? Bilkörning? Kan vi ge goda argument för att resultatet i vår undersökning kan generaliseras till att gälla även för andra sätt att operationalisera1 OV och BV – då stärks den externa validiteten i undersökningen. Det bästa argumentet får man genom att kunna visa, med empiriska undersökningar, att man faktiskt får samma resultat med olika operationaliseringar. Generaliseringar till andra miljöer än den använda

Bara för att vi kan visa att folk beter sig på ett visst sätt i ett psykologiskt laboratorium behöver detta inte betyda att de beter sig på exakt samma sätt hemma hos sig, eller på sin arbetsplats, eller i tunnelbanan. Och bara för att vi lyckats visa att folk beter sig på ett visst sätt en viss dag då det regnade så är det inte säkert att de beter sig på samma sätt en annan dag då det är strålande solsken. Kan vi ge goda argument för att resultatet i vår undersökning kan generaliseras till att gälla även i andra miljöer än den undersökta – då stärks den externa validiteten i undersökningen. Det Detta innebär, förenklat, proceduren att omforma mer eller mindre komplicerade begrepp till mätbara variabler (se sidan 29). 1

21


1. Introduktion

bästa argumentet får man återigen genom att kunna visa, med empiriska undersökningar, att man faktiskt får samma resultat i olika miljöer. Generaliseringar till andra individer än de undersökta

Vi kanske har lyckats visa att OV påverkar BV för psykologistudenter i Stockholm som anmält sig till försöket efter att ha läst en kortfattad försöksbeskrivning och därefter skrivit upp sig på en lista på en anslagstavla. Men skulle vi fått samma resultat om vi undersökt psykologistudenter som inte valt att skriva upp sig på listan? Skulle det funka även på psykologistudenter i Uppsala? Kanske skulle vi till och med kunna påvisa effekten på ekonomistudenter? Hur är det med förskolelärare i Ystad? Eller lastbilschaufförer i Ukraina? Skulle vi kanske till och med få samma samband mellan OV och BV om vi hade undersökt råttor i stället för människor? De möjligheter vi har att generalisera från den undersökta populationen till en annan population beror på hur pass allmängiltig den företeelse som vi undersökt kan tänkas vara. I vissa attitydundersökningar har vi antagligen mycket små möjligheter att generalisera våra resultat utanför den undersökta populationen, medan vi däremot kanske med fog skulle kunna generalisera vissa neurologiska fynd på en enda råtta till att gälla för populationen av alla människor. Kan vi ge goda argument för att resultatet i vår undersökning kan generaliseras till att gälla även i andra populationer än i den undersökta – då stärks den externa validiteten i undersökningen. Det bästa argumentet får man återigen genom att kunna visa, med empiriska undersökningar, att man faktiskt får samma resultat i olika populationer. Den allra första generaliseringen man gör är dock statistisk till sin natur, och den handlar om att generalisera från det undersökta stickprovet till den population som stickprovet dragits ifrån.

Urvalsmetoder Med population brukar man mena den, ofta mycket stora, mängd individer som man i undersökningen är intresserad att få veta någonting om. Det skulle exempelvis kunna vara så att populationen är den totala mängden av alla högskolestudenter i Sverige. Eftersom populationen är så stor har vi dock inga möjligheter att un22


1. Introduktion

dersöka samtliga individer i populationen utan vi får i stället nöja oss med en delmängd, ett stickprov, av individer som vi dragit från populationen. Vi kan dock inte välja vilka individer i populationen som ska få ingå i stickprovet på vilket sätt som helst, eftersom vi vill att stickprovet ska vara representativt för populationen. Vi kan därför inte till exempel nöja oss med att gå till psykologiska institutionen vid Stockholms Universitet och fråga de som råkar vara där en viss dag om de vill delta i vår undersökning. Det duger inte heller att vi vänder oss till studentföreningen KBBÖT (Klockan är ju Bara Barnet – en Öl Till!) för att få adresser till de som betalt årsavgiften. Om man funderar en stund kommer man att inse att alla sy­ ste­ma­tiska metoder för att välja ut stickprovet innebär en risk för snedvridning av resultatet. Lösningen är därför att välja individerna till stickprovet osystematiskt, det vill säga helt slumpmässigt. Således är slumpmässigt urval den optimala metoden för att välja individer till sitt stickprov. Men, kanske någon invänder, det är ju inte säkert att ens det slumpmässiga urvalet leder till ett representativt stickprov. Har vi otur kanske alla individerna i stickprovet råkar vara medlemmar i KBBÖT och de attityder till alkoholkonsumtion som vi får fram i vårt stickprov kommer då knappast att spegla de attityder som finns i populationen. Detta är alldeles sant. Det slumpmässiga urvalet är ingen garanti för att man ska få ett representativt stickprov. Men det fiffiga med slumpen är att man kan räkna ut hur den kan slå och det är precis detta som man har statistiken till. Med stati­ sti­kens hjälp kan man beräkna exakt hur stor sannolikheten är för att man ska ha fått ett snedvridet stickprov och att någon egenskap hos stickprovet (till exempel medelvärdet) ska avvika med ett visst antal enheter från motsvarande egenskap i populationen (se till exempel kapitel 9 om Konfidensintervall). Det finns ett antal olika sätt att skapa slumpmässiga stickprov. Vad man ska välja beror till exempel på sådana faktorer som vilken frågeställning man har, vilken undersökningsdesign man använder och vilka ekonomiska resurser som står till ens förfogande.

23


1. Introduktion

Den oändliga populationen Den population som man normalt, särskilt vid grundforskning, är intresserad av är oändligt stor och abstrakt. Ett exempel: Säg att vi vill veta det genomsnittliga antalet vita blodkroppar per kubik­ centi­meter blod som personer med en viss smittsam sjukdom har. Säg också att denna sjukdom är väldigt ovanlig och att det bara finns två personer i hela Sverige som lider av denna sjukdom. Vad är då populationen? Dessa två personer? Njaee … Det räcker knappast med att beräkna det genomsnittliga antalet vita blodkroppar för dessa två individer. Det räcker nog inte heller om vi under­söker alla personer på hela jorden som lider av denna sjukdom. För det vi är intresserade av är ju sjukdomen som sådan och inte bara just de personer som råkar ha blivit smittade av det aktuella viruset. Och populationen av alla människor som skulle kunna tänkas bli drabbade av sjukdomen är i princip oändligt stor. I denna bok, liksom i andra statistikböcker, beskrivs populationer och stickprov som mängder bestående av individer. Detta är i själva verket en förenkling. Statistik handlar om siffror och inte om människor (även om siffrorna kan användas till att dra slutsatser om människor). Så om vi exempelvis studerar intelligens skulle populationen kunna bestå av mängden av alla intelligenskvoter som vi skulle få om vi testade alla barn i åldern 9–11 år med intelligenstestet Ravens matriser. Stickprovet kommer likaså att bestå av ett antal intelligenskvoter som på något sätt (vanligen med slumpmässigt urval) dragits från denna population.

Obundet slumpmässigt urval Den urvalsmetod som man vanligen tänker på när man talar om slumpmässiga urval är så kallad obundet slumpmässigt urval (förkortas ibland OSU). Detta går i princip till så att man slumpmässigt väljer det antal individer som man behöver för undersökningen ur sin urvalsram. Detta är den faktiska förteckning som man har att tillgå och ur vilken man kan välja individerna. Den bör i så stor utsträckning som möjligt motsvara hela den population man är intresserad av. I ett obundet slumpmässigt urval har alla individer samma sannolikhet att komma med i stickprovet.

24


1. Introduktion

Systematiskt urval Ett systematiskt urval brukar vanligtvis innebära att man ur sin urvalsram väljer enheter med någon viss periodicitet, till exempel var 100:e person. Det är ofta billigare och enklare att genomföra än ett OSU och fungerar lika bra under förutsättning att man har en bra urvalsram. Enda faran med ett systematiskt urval är om urvalsramen är behäftad med någon viss okänd periodicitet som kan sammanfalla på ett olyckligt sätt med hur man väljer undersökningsdeltagarna. Till exempel om varannan individ är man och varannan individ är kvinna.

Stratifierat urval När det finns stora olikheter i viktiga bakgrundsvariabler kan stratifierat urval vara att föredra. Populationen delas då in i undergrupper, strata, med hjälp av sådana bakgrundsvariabler – stratifieringsvariabler – som är högt korrelerade med undersökningsvariablerna. Varje stratum ska vara homogent med avseende på undersökningsvariabeln. Däremot kan det vara skillnader mellan olika strata. Enskilda individer får inte förekomma i mer än ett stratum. Därefter dras stickprov slumpmässigt ur varje stratum. Här kan sannolikheten för den enskilde individen att komma med vara olika för olika strata, vilket man måste ta hänsyn till när statistiska beräkningar görs. Om man exempelvis är intresserad av att studera mobbning i lågstadieskolor kanske man misstänker att storleken på skolan kan vara en viktig bakgrundsvariabel. I så fall skulle ett OSU troligtvis göra att alltför få elever från små skolor kom med i undersökningen. Man delar därför in populationen av alla lågstadieelever i sådana som går i 1) stora, 2) mellanstora, och 3) små skolor. Därefter skulle man slumpmässigt till exempel välja 5% ur stratum 1 och 10% ur stratum 2 och 25% ur stratum 3. Uppenbarligen kommer enskilda individer att ha olika sannolikhet att komma med i stickprovet, och detta måste man hålla reda på när man utför vissa beräkningar.2 Om man exempelvis vill beräkna ett totalmedelvärde baserat på alla strata kan detta 1 L göras med formeln x = ∑ N i x i , där N är antalet individer i populationen, Ni = N i =1 antalet individer i stratum i, och L är totala antalet strata. 2

25


1. Introduktion

En fördel med metoden är att man får hög representativitet från olika undergrupper när populationen är mycket heterogen och att man kan erhålla data för dessa speciella undergrupper (strata). En nackdel är att även om tekniken är billigare än ett OSU är den fortfarande tidskrävande och därmed relativt kostsam.

Klusterurval Klusterurval innebär ytterligare en förenkling och kostnadsbesparing jämfört med stratifierat urval. Ett kluster är en redan befintlig enhet som man kan använda för att dra ett slumpmässigt stickprov ur. Också vid klusterurval blir sannolikheten för enskilda individer att komma med i urvalet olika, vilket man måste hålla reda på när man utför sina beräkningar. I exemplet med mobbning i lågstadieskolor skulle man vid ett klusterurval slumpmässigt dra till exempel 3 skolor från skolorna, sedan ett visst antal skolklasser och slutligen slumpmässigt dra ett visst antal elever ur varje klass som får ingå i undersökningen.

Bekvämlighetsurval När man ber vänner och bekanta, universitetskollegor eller psykologistudenter ställa upp som undersökningsdeltagare brukar man ibland säga att man gör ett bekvämlighetsurval. Detta kan dock låta mer nedlåtande än vad det egentligen behöver vara. Kom ihåg det som sades ovan i avsnittet om generaliseringar till andra individer än de undersökta. Gör man en survey3-undersökning över exempelvis svenskars inställning till primärvården bör man i görligaste mån välja någon av ovanstående urvalsmetoder. Om däremot det fenomen man ska undersöka är väldigt allmängiltiga (exempelvis perceptuella illusioner) har det inte någon betydelse om det råkar vara Kalle, Oskar eller Stina som ingår i undersökningen. Då är det bättre att lägga pengarna på andra saker. Hela tiden bör man förstås komma ihåg vilka hot som kan finnas mot möjligheten att generalisera från det aktuella stickprovet.

Felkällor vid urval Övertäckning innebär att urvalsramen innehåller individer som inte ska ingå i populationen. Till exempel kan personer som har En frågeformulärs-/intervjuundersökning som avser kartlägga exempelvis attityder, åsikter, vanor, intressen och liknande hos någon population. 3

26


1. Introduktion

flyttat från orten ha kvar sitt gamla telefonnummer. Undertäckning innebär på motsvarande sätt att personer som borde ingå i populationen inte finns med i urvalsramen. Till exempel att nyinflyttade inte finns med i registret. Urvalsfel kan uppstå om stickprovet inte är representativt. För slumpmässiga stickprov minskar urvalsfelet ju större stickprovet är. Bortfall är sådana personer som är utvalda till stickprovet men som man inte lyckas undersöka. Det är viktigt att försöka göra en bortfallsanalys. Detta innebär att man försöker redovisa det man vet om de personer som inte svarat. Hur många var det? Vilken könsfördelning? Var de från något visst område? Någon speciell åldersgrupp? Om de som inte har undersökts skiljer sig från dem som undersökts kan deras uteblivna svar innebära missad information som snedvrider resultatet och påverkar validiteten. Partiellt bortfall eller internt bortfall innebär att svar saknas på någon viss fråga i undersökningen. Detta kan till exempel bero på att frågan var känslig eller formulerad på ett svårbegripligt sätt. Genom att noga utarbeta och utpröva sitt frågeformulär kan man minska det partiella bortfallet.

Mätteori De tal som vi bearbetar med statistiska metoder har vi fått genom att göra mätningar. Vi har till exempel mätt ett antal individers attityd i en viss fråga, deras reaktionstid, vikt, längd, ålder, blodtryck, kroppstemperatur, hudmotstånd, intelligens eller vad det nu kan vara för något. För att undersökningen ska vara meningsfull är det av fundamental betydelse att mätinstrumentet man använt är av god kvalitet, det vill säga att man kan lita på det. Vad är det då som avgör om man kan lita på ett mätinstrument? Jo, det är mätinstrumentets reliabilitet och validitet. Vi kommer att titta närmare på dessa begrepp i kapitel 9 och vi nöjer oss här med en översiktlig beskrivning.

Reliabilitet Ponera att Jocke vill veta hur lång han är. Till sitt förfogande har han ett mycket elastiskt måttband. Han ställer sig mot väggen och försöker med måttbandet mäta sin längd. ”183 cm” avläser han. Nu tycker han detta låter väldigt lite, han trodde han var längre 27


1. Introduktion

än så. Därför gör han om proceduren: Han ställer sig mot väggen och försöker mäta sin längd en gång till. Nu avläser han ”214 cm”. Detta var underligt, nog är jag rätt lång, men såå lång är jag väl inte, tänker han och mäter sig själv en gång till. Denna gång säger måttbandet att han är 191 cm. Han gör ytterligare ett försök och nu blev det ”203 cm”. Jocke inser nu att även om han mäter en och samma sak med det här gummisnoddsmåttbandet så kommer han få olika resultat, lite hipp som happ, från gång till annan. Han drar därför slutsatsen att gummisnoddsmåttbandet har mycket låg reliabilitet. Reliabilitet handlar alltså om hur mycket slumpen kan förvränga resultatet, än hit och än dit. Jocke slänger ifrån sig gummisnoddsmåttbandet och plockar i stället fram ett gammalt hederligt stålmåttband. Han ställer sig mot väggen och avläser ”195,6 cm”. Vis av erfarenhet från mätningarna med gummisnoddsmåttbandet gör han ett nytt försök. Denna gång avläser han ”195,4 cm”. Upprepade mätningar visar att resultatet faktiskt varierar även med stålmåttbandet, dock mycket mindre än förut. Slumpen har tydligen inte samma möjlighet att påverka resultatet nu och han drar slutsatsen att stålmåttbandet är ett mätinstrument med mycket hög reliabilitet.

Validitet Nöjd med att måttbandet visade sig ha så hög reliabilitet bestämmer han sig för att passa på att använda det för att mäta lite andra saker än längd, som exempelvis vikt. Skulle han göra på det sättet skulle han ha ett mätinstrument med mycket låg validitet. I detta sammanhang vore en personvåg ett mätinstrument med hög validitet. Så validitet hos mätinstrumentet handlar alltså om att man verkligen mäter det man avser att mäta. Finns det empiriska belägg för att mätinstrumentet verkligen mäter det som det avser att mäta har mätinstrumentet god validitet, annars inte. Eftersom reliabiliteten ändå är förhållandevis lätt att uppskatta, och till och med att kvantifiera, är validiteten betydligt mer problematisk (men kanske just därför mer intressant), särskilt om det handlar om psykologiska attribut (till exempel introversion, intelligens, intolerans mot tvetydighet).

28


1. Introduktion

Variabler och skaltyper Variabler Variation gör tillvaron spännande. Om det enda väder som fanns var solsken, vindstilla och 25 grader varmt skulle ingen människa prata om vädret. Vi skulle aldrig få höra kommentarer om vilket väder någon hade på semestern. Ingen skulle någonsin behöva undra om de skulle behöva ta på en extra tröja. Frågan: ”Skiner solen idag?” är endast meningsfull om det finns en mängd tänkbara svar, det vill säga om det finns variation i svaren. Med uttrycket variabel menar vi därför en egenskap vars variation vi är intresserade av att mäta. Ofta innebär detta först att man kan behöva formulera bra definitioner och eventuellt operationalisera variabeln så att den blir mätbar. Det kan sedan även innebära att man behöver konstruera speciella mätinstrument, med allt vad det betyder. Statistiska variabler kännetecknas av en viss slumpmässig variation. Denna variation kan till exempel bero på osäkerheten hos själva mätmetoden, men också på att det finns en sann variation i den egenskap vi mäter. Om vi mäter längden av en och samma lyktstolpe flera gånger kommer vi få lite olika värden beroende på hur noggrann vår mätmetod är. Om vi istället mäter längden på en människa flera gånger kommer variationen också att bero på andra saker, exempelvis gravitationens inverkan som ju gör att vi är något kortare på kvällen än på morgonen. För en variabel som är ett resultat av ett rent slumpmässigt försök, som till exempel antal ”ögon” vid tärningskast, används ofta termen stokastisk variabel eller slumpvariabel. När man samlar in statistiska data gör man en form av mätning. Enligt några väldefinierade regler tilldelas tal till en storhet som är av intresse. För en fysiker kan denna storhet vara massan eller längden hos ett föremål, för en läkare kan det vara kroppstemperaturen hos en patient. Ett storhetsvärde, produkten av ett mätetal och en enhet, används för att beskriva en storhets storlek, till exem­pel säger man att ”längden på Elisabet är 167 cm” (egentligen 167 x 1 cm). Om en storhet är oföränderlig kallas den konstant (ett exempel på detta är ljusets hastighet i vacuum, ungefär 300 000 km/s), men om den kan anta olika värden är den en variabel och dess olika värden kallas variabelvärden. I den här boken kommer 29


1. Introduktion

vi att använda versaler för variabler, till exempel X, och gemener för variabelvärdena, till exempel x. De flesta psykologiska variabler, som exempelvis intelligenskvot eller betyg, saknar enheter. Detta har gjort S.S. Stevens’ definition av mätning, ”att tilldela tal till objekt eller händelser enligt någon regel”, särskilt användbar inom psykologin. Två något olika ämnesområden inom psykologin som hanterar mätning är psykometrin och psykofysiken. Inom samhällsvetenskaperna kallas resultatet av en mätning ofta en observation, och en uppsättning observationer av ett antal variabler är vad som utgör det totala insamlade statistiska materialet. Man brukar skilja mellan kvalitativa och kvantitativa variabler. En kvalitativ variabel är icke-numerisk, det vill säga dess olika variabelvärden utgörs vanligen av ord. Vädertyp är ett exempel på en sådan variabel, och några olika variabelvärden skulle då vara till exempel solsken, molnigt, regn, snö, etcetera. Andra exempel på kvalitativa variabler är civilstånd, yrke och sjukdomssymtom. Det är vanligt att man i statistiska program och analyser ger sifferkoder till kvalitativa variabler. När detta görs är det viktigt att man kommer ihåg att det fortfarande handlar om variabler som är till naturen icke-numeriska och att de siffror man använder bara är etiketter och inte säger något om variabelvärdenas inbördes relation. Kön är ett annat exempel på en kvalitativ variabel, vanligen med de två variabelvärdena: man respektive kvinna. Med bara två variabelvärden kallas den för en dikotom variabel och kodas ofta 0–1 eller 1–2. Kvantitativa variabler är till sin natur numeriska eftersom tilldelade numeriska mätvärden ger information om relationen mellan variabelvärdena. Ålder, kroppslängd, antal sjukdomssymptom, antal studenter i klassrummet, kroppstemperaturen hos en patient är alla exempel på kvantitativa variabler. Dessa variabler kan i sin tur vara av två slag: diskreta respektive kontinuerliga. Kännetecknande för en diskret variabel är att den bara kan anta vissa värden (oftast heltalsvärden). Så fort vi räknar antal (frekvenser) av någonting är variabeln diskret. Antal studenter i klassrummet är ett exempel (det kan inte finnas några halva studenter – även om kanske inte alla är helt närvarande). Antal sjukdomssymptom är ett annat exempel, liksom antal personer som tillfrisknade efter en

30


1. Introduktion

viss behandling, men också t.ex. antal poäng på ett visst test, och så vidare. En kontinuerlig kvantitativ variabel kan anta oändligt många värden inom ett visst intervall. Ålder, kroppslängd, och temperatur är exempel på kontinuerliga variabler. Eftersom möjligheten till variation för en kontinuerlig variabel är oändlig finns aldrig två variabelvärden som är exakt desamma. Två individer är till exempel aldrig exakt lika långa, lika tunga, lika gamla. En konsekvens av detta är att variabelvärden för kontinuerliga variabler alltid är avrundade. Rent praktiskt betyder skillnaden mellan en kontinuerlig och en diskret variabel att man måste se upp lite extra när man arbetar med diskreta variabler eftersom dessa inte kan anta alla tal på tallinjen. Det genomsnittliga antalet allergiska symtom hos personer med hösnuva kan visserligen anges med en decimal (säg 3,4 symtom), men ett sådant värde skulle inte kunna fungera som ett gränsvärde för att diagnostisera personer med hösnuva eftersom den enskilde individen antingen har eller inte har rinnande näsa, kliande ögon etcetera. VARIABEL

Kvalitativ

Kvantitativ Diskret

Kontinuerlig

Figur 1:1 Variabelegenskaper. En kvalitativ variabel har icke-numeriska data (”ord”), en kvantitativ variabel har numeriska data (”tal”) och kan vara antingen diskret (antar bara vissa värden) eller kontinuerlig (kan anta alla värden).

Skaltyp/datanivå För att en mätning ska vara möjlig krävs ett mätinstrument av något slag med någon form av gradering, en ”skala”. Beroende dels på den variabel som mäts, dels på vilka data som erhålls med den använda skalan brukar en indelning göras i ett antal olika skaltyper eller datanivåer. De vanligaste skaltyperna är nominal-, ordinal-, intervall-, och kvotskala. Dessa ger data som benämns på samma sätt. Uppdelningen grundar sig på vilken typ av matematiska 31


1. Introduktion

transformeringar som är möjliga för en viss datatyp och gjordes ursprungligen av S.S. Stevens (se Stevens, 1975). Nominalskala

Variabelvärdena på en nominalskala kan bara namnges och grupperas. Eftersom det inte är meningsfullt att tala om något inbördes förhållande mellan variabelvärdena är detta inte en skala i egentlig mening. När siffror används utgör dessa bara bekväma etiketter som inte har mer mening än vad bokstäver eller färgsymboler exempelvis skulle ha. Hit hör de kvalitativa variablerna. Exem­pel är Kön och Civilstånd. Ordinalskala

Variabelvärdena på en ordinalskala kan rangordnas utmed något kontinuum. Ett variabelvärde kan alltså vara större eller mindre än ett annat men det finns ingen matematisk information om hur mycket större eller mindre. Exempel är Placering i en tävling och Betyg (G/VG/MVG). Om skalstegen tilldelas siffervärden måste man se upp eftersom de matematiska avstånden ändå är okända. Om man tilldelar betygskalan sifferkoderna G = 1, VG = 2 och MVG = 3, så är visserligen fortfarande 3 > 2 > 1 eftersom MVG > VG > G. Men 3-2 ≠ 2-1 eftersom man inte kan säga att MVG-VG = VG-G. Vanliga så kallade kategoriskalor med exempelvis uttryck av typen aldrig, sällan, ibland, ofta, alltid, räknas också hit. Intervallskala

Förutom att variabelvärdena på en intervallskala kan rangordnas råder här lika intervaller (ekvidistans, lika steg). Minusvärden kan förekomma, men även om siffran noll kan finnas på skalan finns ingen absolut nollpunkt. Exempel är Celsius för temperatur och fysiologiska GSR-mätningar (för galvanisk hudrespons som används vid mätning av känsloreaktioner). Borg RPE-skalan (för skattning av upplevd ansträngning) räknas också hit genom sin speciella konstruktion (Borg, 1998). Detsamma gäller även många 32


1. Introduktion

andra psykologiska skalor (även om inte alla statistiker är överens om detta). På denna datanivå blir det meningsfullt att tala om differenser. Det är till exempel samma skillnad (fysikaliskt men inte nödvändigtvis psykologiskt) mellan 80° C och 90° C som mellan 10° C och 20° C. Matematiskt är det på intervalldata tillåtet att multiplicera med en konstant och dessutom addera en konstant. Genom att multiplicera antal grader Celsius med 1,8 och lägga till 32 kan man gå över till Fahrenheit, och skillnaden mellan 176° F och 194° F är också densamma som mellan 50° F och 68° F. Eftersom det inte finns någon absolut nollpunkt blir det däremot inte meningsfullt att tala om kvoter. Det innebär att 10° C inte är hälften av 20° C, vilket man kan förstå när man ser vad kvoten mellan motsvarande temperaturer i Fahrenheit blir (räkna gärna). Kvotskala 0

På en kvotskala råder ekvidistans och det finns även en absolut nollpunkt, det vill säga den totala frånvaron av det jag är intresserad av att mäta. Detta innebär att det nu blir meningsfullt att även tala om kvoter. De flesta fysikaliska skalorna är kvotskalor, såsom kilogram för massa, meter för avstånd, eller kelvin för temperatur. Jag kan till exempel säga att 20 kg är dubbelt så mycket som 10 kg, att 2 dl är dubbelt så mycket som 1 dl, eller att det är ungefär dubbelt så långt mellan Stockholm och Jönköping som mellan Halmstad och Göteborg. Den enda matematiskt tillåtna operationen när man omvandlar data mellan kvotskalor är att multiplicera med en konstant – till exempel med 3,28 för att gå från meter till engelsk fot (och en längd på 1,67 m är densamma även om den anges som 5,48 fot). Ibland är det egenskaper hos variabeln som avgör på vilken data­nivå data kan erhållas, men oftare är det begränsningar hos det använda mätinstrumentet. Vissa statistiker har en mycket sträng syn på vikten av att låta datanivån styra vilken statistisk metod man använder. Andra menar att en alltför sträng syn medför att man riskerar att förlora värdefull information från data.

33


1. Introduktion

Överkurs Psykofysisk skalning4 Inom psykologin finns ett område som kallas psykofysik, där man bland ­annat specialiserat sig på att beskriva relationen mellan den värld vi upplever med våra sinnen och den fysikaliskt mätbara. Man har då bland ­annat funnit att det är mycket sällan som den upplevda intensiteten ökar på samma sätt som den fysikaliska. Låt oss illustrera detta med två exempel: Tänk dig att du sitter skönt tillbakalutad i en fåtölj framför tv:n en januarikväll när det plötsligt blir strömavbrott. Efter en stunds fumlande lyckas du ta dig fram till middagsbordet där adventsljusstaken står kvar. Eftersom du endast är så där lagom ordentlig ligger det som tur är en tändsticksask och skräpar precis intill. Du tänder det första ljuset och det lyser upp rummet ganska bra. Du tänder ett till och det blir lite ljusare. Du tänder ytterligare ett och märker fortfarande att ljuset i rummet ökar. Men när du tänder det sista ljuset blir det inte så väldigt mycket ljusare längre. Tänk dig nu att en god vän till dig, en psykofysiker, också befinner sig i rummet – vi kan kalla honom docent Skalman. När du tänt det första ljuset ber han dig att göra en bedömning av ljusintensiteten och att kalla din upplevelse för ett tal, vilket du vill. Du hugger till med ”10” (som du tycker känns jämnt och bra). När du tänder nästa ljus ber han dig att ange ett tal som är proportionellt mot din upplevelse av den nya ljusintensiteten varvid du säger ”12,5”. För nästa ljus säger du ”14” och för det sista ”15”. Detta betyder att du upplever ljusstyrkan från 4 ljus som ungefär 1,5 gånger ljusare än den från endast ett ljus. Har du spelat bowling någon gång? Kanske vet du i alla fall på ett ungefär hur tungt ett bowlingklot är? Föreställ dig nu att du och några kamrater just har avslutat ett bowlingpass. En av kamraterna är docent Skalman som förtjust ber dig göra bedömningar av tyngden på bowlingkloten. Eftersom talet tio fungerade bra förra gången så väljer du ”10” för tyngden av det första klotet. Docent Skalman lägger i ett klot till i sin sportbag och, kanske lite förvånad, säger du nu ”30”, ytterligare ett klot och du säger ”60” och fyra klot orkar du nästan inte lyfta så med ett lätt stönande och en ilsken blick på din vän säger du nu ”100”. Du upplever nämligen tyngden av fyra lika tunga klot som ungefär 10 gånger tyngre än ett klot. Om relationen mellan dina skattningar och antalet ljus respektive antalet klot beskrivs i ett diagram, skulle denna kunna se ut som i figur 1:2 på nästa sida.

Du kan behöva läsa avsnittet om diagram (kapitel 2) innan du läser det nedanstående. 4

34


20

100

15

80

Upplevd tyngd

Upplevd ljusstyrka

1. Introduktion

10 5 0

0

1

2 Antal ljus

3

4

60 40 20 0

0

1

2 Antal klot

3

4

Figur 1:2 Upplevelsen av ljusstyrka som funktion av antalet ljus (vänster) och antalet klot (höger).

Med den enkla metod som docent Skalman använde (och som kallas för magnitudestimation) erhölls en upplevelseskala vars datakvalité närmar sig den för en kvotskala. Det finns en absolut nollpunkt (under vilken ingen upplevelse är möjlig) och – förutsatt att du klarade av att använda siffror proportionellt mot din inre upplevelse – kvoter kan bildas (tre klot var ungefär dubbelt så tungt som två klot). Den stränge statistikern säger kanske att eftersom man inte kan vara säker på att varje individ verkligen klarar av att hantera siffror på det sättet (och därom tvistar de lärde) och därför endast kan vara säker på att personens siffersvar visar att det blir ljusare för varje ljus respektive tyngre för varje klot, så måste man nöja sig med att använda dessa data som om de vore ordinaldata. Men ta en titt på sambanden i figur 1:2 och säg om du inte också tycker att det vore synd att bara kasta bort den extra information som antagandet om kvotdata ändå möjliggör. Tänk så användbart för en ingenjör som ska planera för lämplig belysning i en arbetslokal, eller för en ergonom som ska avgöra när en belastning uppnår en risknivå. (Se kapitel 15, sidan 375, IV. Potensfunktion). Inom psykologin används ofta så kallade kategoriskalor av typen Extremt svag 1 Mycket svag 2 3 Svag 4 Måttlig 5 Stark Mycket stark 6 Extremt stark 7 En sådan skala är ett exempel på en ordinalskala. Det finns ingen nollpunkt på skalan och det finns egentligen ingenting som säger någonting om avstånden mellan uttrycken. En del menar att om man ger noggranna instruktioner för att uttrycken ska användas så att de motsvarar lika stora upplevelsemässiga avstånd så får man intervalldata. Långt ifrån alla håller med om att detta fungerar. Kategoriskalor har ändå vissa klara fördelar genom att de ger en möjlighet till jämförelser av nivåer. Att veta om patientens värk efter 35


1. Introduktion

en operation är ”Mycket stark” eller ”Måttlig” kan vara mycket värdefull information. Docent Skalman visar den här skalan för två av dina kamrater och ber sedan dessa (en man och en kvinna) att bedöma hur tungt de tycker att ett bowlingklot är. Mannen ger skattningen 3 och kvinnan säger 5. Kvinnan upplever alltså att klotet är tyngre än vad mannen gör men eftersom detta endast är en ordinalskala säger hennes skattning ingenting om hur mycket tyngre hon anser att klotet är. Genom att kombinera dessa två typer av skattningsmetoder så att en harmoni erhålls mellan siffror och verbala uttryck har så kallade Kategori-Kvotskalor utvecklats (till exempel Borg CR100 skalan® eller ”centiMax”-skalan i figur 1:3 nedan, se Borg & Borg, 2001). Med en god instruktion kan data från dessa skalor behandlas som kvotdata samtidigt som fördelarna med nivåuttrycken bibehålls. Absolut maximum 120 110 100 95 90 85 80 75 70 65 60 55 50

Extremt stark – nästan ”Max”

Mycket stark

Stark

Tung

45 40 35

Rätt så stark

30 25

Måttlig

20 15 13 10 7 5 3 2 1 0

Svag

Lätt

Mycket svag Extremt svag Minimal Ingen alls

Figur 1:3 Borg CR100-skalan®, ”centiMax”-skalan. © G. Borg och E. Borg 2001; E. Borg, 2007.

Inom psykologi och medicin är det vanligt med olika typer av frågeformulär för diagnostik. De skattningsskalor som då ingår för intensitetsmätning är av varierande kvalitet och ger data som ofta ligger någonstans mellan ordinaldata och intervalldata. Ett exempel är VAS – Visuell Analog Skala – som används flitigt inom sjukvården. Den utgörs vanligen av en 1 dm lång linje med en nedre och en övre förankringspunkt, t.ex. ”Ingen alls” och ”Värsta tänkbara”. Patienten ombeds göra sin skattning genom att sätta ett streck på linjen. Ett annat vanligt exempel är s.k. Likert-skalor ofta med t.ex. 5 eller 7 kryssrutor, med eller utan etiketter. Varje användare av ett mätinstrument 36


1. Introduktion

måste naturligtvis själv ta ställning till på vilken datanivå han/hon anser att data befinner sig och använda de statistiska analysmetoder som han/hon anser lämpliga.

ᏵᏵ Sammanfattning Nedan följer en sammanfattning av några av de viktigare begreppen i kapitlet. Kvalitativ metod

Data ofta i form av språkliga enheter, bearbetningen är beskrivande och kategoriserande.

Kvantitativ metod Insamling av siffermässiga data, bearbetningen är matematisk/statistisk. Undersöknings­ design

Försöksupplägg.

Experiment

Kännetecknas av kontroll över OV och randomisering av undersökningsdeltagare till betingelser.

Kvasi-experiment

Kännetecknas av kontroll över OV men ingen randomisering av undersökningsdeltagare till betingelser.

Icke-experiment

Så kallade korrelationsstudier. Varken kontroll över OV eller randomisering av individer till betingelser.

Undersökningens validitet

I vilken utsträckning man kan lita på slutsatserna från undersökningen.

Intern validitet

Handlar om att man verkligen kan lita på att det var OV och ingenting annat som påverkade BV. Riktningsproblemet och bakomliggande-variabel-problemet måste beaktas.

Extern validitet

Handlar om giltigheten i att göra generaliseringar från det samband mellan OV och BV som påvisats. Dels till andra sätt att mäta OV och BV, dels till andra miljöer, dels till andra individer än de undersökta.

37


1. Introduktion

Urvalsmetoder

Speciellt vid större frågeformulärsundersökningar (surveyer) är det viktigt att man är noggrann med hur man slumpmässigt väljer undersökningsdeltagare till stickprovet.

Mätdata

Uppmätta variabelvärden.

Mätinstrumentets Handlar om hur pålitligt instrumentet är för reliabilitet att mäta det som det avser att mäta. Hur litet det påverkas av slumpmässiga fel. Mätinstrumentets Handlar om huruvida instrumentet verkligen validitet mäter det som det ska mäta. Dess giltighet.

38

Variabel

En mätbar egenskap vars variation kan studeras. En variabel antar ett antal variabelvärden. Mängden av uppmätta variabelvärden kallas värdemängd.

Dikotom

Kan endast anta två värden.

Kvalitativ

Icke-numerisk, till exempel en variabel vars variabelvärden uttrycks med ord.

Kvantitativ

Numerisk, till exempel en variabel vars variabelvärden uttrycks med siffror.

Diskret

Sägs om en variabel som bara kan anta vissa värden, till exempel heltalsvärden.

Kontinuerlig

Sägs om en variabel som kan anta alla värden inom ett intervall.

Nominaldata

Gäller för kvalitativa variabelvärden som endast kan grupperas.

Ordinaldata

Gäller för variabler som är uppmätta med en ordinalskala och vilkas variabelvärden endast kan rangordnas.

Intervalldata

Gäller för variabler som är uppmätta med en intervallskala och vilkas variabelvärden har lika stora steg, men ingen absolut nollpunkt.

Kvotdata

Gäller för variabler som är uppmätta med en kvotskala och vilkas variabelvärden har lika stora steg, samt en absolut nollpunkt.


1. Introduktion

፛፛ Övningsuppgifter 1.

Vid en läkarundersökning av samtliga anställda vid Sony Ericsson i Kista samlades mätdata in på nedanstående variabler: {Personnummer, Namn, Kön, Civilstånd, Antal barn, Befattning, Avdelning, Längd, Vikt, Blodtryck}. a) Vilka är kvalitativa respektive kvantitativa? b) Vilka är kontinuerliga respektive diskreta? c) Vilken datanivå kan man förvänta sig mätdata på?

2.

Ange datatyp för nedanstående variabelvärden a) x = {barn, ungdom, ung vuxen} b) y = {3; 7; 12; 18; 3; 22; 9; 5; 24} år c) Vikt = {52; 61; 57; 71; 63; 59; 58; 65} kg d) Yrke = {målare; snickare; mattläggare; elektriker; rörmokare} e) Placering = {1:a plats; 3:e plats; 8:e plats; 5:e plats; 14:e plats}

3.

Vilken datatyp har variabelvärdena i tabellen? Kön Man Kvinna

4.

Antal 32 14

Ålder (år) Inkomst (TKr) 37,4 280 46,3 208

Kroppstemperatur (T) är en kontinuerlig variabel. Vilka värden ingår i ett intervall som matematiskt beskrivs så här: a) 37 °C ≤ t b) t < 42 °C

5.

Antal mål som en fotbollsspelare kan hinna göra under en match är en diskret variabel. Vilka värden ingår i intervallet 5 ≤ antal mål < 9?

39


1. Introduktion

6.

Magister Larsson har delat ut en tenta i psykologi. Hur kan den konstrueras så att poängsättningen kan göras på a) Ordinaldatanivå? b) Kvotdatanivå?

7.

Petter kom hem och klagade över huvudvärk. Eftersom det var influensatider tog hans mamma tempen på både honom och hans två yngre systrar, Lisa och Hedvig. a) Petter hade den högsta temperaturen, därefter kom Hedvig och sist Lisa. På vilken datanivå ligger denna beskrivning? Hur kan den uttryckas matematiskt? b) På vilken datanivå har mätningarna gjorts om Petter hade 38,7 °C, Lisa 36,7 °C och Hedvig 37,2 °C? Vad kan sägas matematiskt om relationerna mellan deras kroppstemperaturer?

40


2. Grafisk redovisning: tabeller och diagram 105

Medelvärde, IQ

104 103 102 101 100

Pojkar

Flickor

Figur 2:1 Genomsnittlig IQ för 10 pojkar och 10 flickor slumpmässigt utvalda bland elever i årskurs 9 i en Stockholmsskola. Vad är problematiskt med diagrammet?

När ett statistiskt material är omfattande, är det ofta lämpligt att sammanställa det i en tabell eller ett diagram som i exemplet ovan. Dessa bör vara utformade så att de förtydligar och underlättar läsandet av texten och hjälper läsaren att förstå de slutsatser som dras. Vilken typ av tabell eller diagram man väljer är beroende av de data som redovisas och av vilket statistiskt mått som beräknats, men också av vad som är vanligt inom ämnesområdet och vilket medium det gäller. En vetenskaplig artikel kräver ett presentationssätt, en powerpoint-presentation ett annat. Statistiska tabeller brukar förses med en förklarande tabelltext ovanför tabellen. Själva tabellen består överst av ett tabellhuvud och därunder av en kropp. I huvudet skriver man normalt namnet på variabeln/variablerna och vilket statistiskt mått som beräknats. I kroppen anges aktuella värden. Vanligen förekommer inte några lodräta linjer i tabellerna. Se tabell 2:1 på nästa sida. 41


2. Grafisk redovisning: tabeller och diagram

När det gäller diagram och figurer har man vanligen större frihet. För diagram används ofta koordinatsystemet med en x-axel och en y-axel för presentation av data (se till exempel figur 2:9 i avsnittet Punktdiagram). Figurer kan också vara av mer teoretiskt slag (figur 1:1). En förklarande figurtext brukar skrivas under diagrammet/figuren.

Tabeller för kvalitativa variabler Användbara tabeller för kvalitativa variabler är olika frekvenstabeller, som envägstabeller, korstabeller, och fyrfältstabeller.

Frekvenstabeller I en frekvenstabell redovisas antalen för de olika variabelvärdena. För variabeln Kön anges antalet män och antalet kvinnor som i exempel 2:1. En tabelltext ovanför tabellen beskriver kortfattat innehållet. Exempel 2:1 Vid en viss arbetsplats fanns det, under år 2006, 374 personer anställda, 116 män och 258 kvinnor. Se tabell 2:1 nedan. Tabell 2:1 Antal anställda vid en viss arbetsplats 2006.

Kön

Antal anställda

huvud

Män Kvinnor

116 258

kropp

Totalt

374

I stället för Totalt kan man skriva Summa eller S:a

Eftersom det inte finns någon inbördes rangordning mellan variabelvärdena för en kvalitativ variabel spelar det inte någon roll om man börjar tabellen med Män (som i exemplet) eller med Kvinnor. Ibland vill man för tydlighetens skull istället ange den relativa frekvensen, det vill säga andelen angiven i procent. Detta är dock endast lämpligt om totalmängden är någorlunda stor. Att säga att 33 procent av de anställda var män om det var totalt 3 anställda skulle inte vara särskilt meningsfullt. Därför anger man ofta både den absoluta och den relativa frekvensen, som i tabell 2:2 på nästa sida. 42


2. Grafisk redovisning: tabeller och diagram

Exempel 2:2 Andelen män: 116/374 ≈ 0,31, dvs 31 % Andelen kvinnor: 258/374 ≈ 0,69, dvs 69 % Tabell 2:2 Antal män och kvinnor på en viss arbetsplats 2006 samt den relativa frekvensen (%).

Kön

Antal anställda

Könsfördelning (%)

Män Kvinnor

116 258

31 69

Totalt

374

100

Tabellerna 2:1 och 2:2 ovan är exempel på envägstabeller där en variabel redovisas. Ofta vill man sammanställa information om flera variabler i samma tabell. I en korstabell gäller att två kvalitativa variabler redovisas tillsammans. Exempel 2:3 Vid tidigare nämnda arbetsplats fanns följande yrkeskategorier (förutom vd:n och 3 avdelningschefer som alla var män): ekonomer, handläggare och sekreterare. Könsfördelningen för variabeln Befattning framgår av tabell 2:3 nedan. Tabell 2:3 Fördelningen av Kön på olika befattningar vid en viss arbetsplats.

Kön Män Kvinnor Totalt

Ekonomer

Befattning Handläggare Sekreterare

Totalt

86 65

30 169

0 24

116 258

151

199

24

374

En speciell korstabell är fyrfältstabellen där de två variablerna har vardera två variabelvärden (till exempel variabeln Kön med värdena man och kvinna, samt variabeln Svar med värdena nöjd och inte nöjd). I en fyrfältstabell finns två rader och två kolumner med sammanlagt fyra fält för frekvenser. Ofta konstrueras en fyrfälts­ tabell så att den variabel som man uppmätt värden på (den beroende variabeln, se kapitel 1 avsnittet Experiment) står som rubrik för raderna i tabellen och grupperingsvariabeln (den oberoende 43


2. Grafisk redovisning: tabeller och diagram

variabeln) står som rubrik över kolumnerna (jämför x-axeln i ett koordinatsystem, se avsnittet Diagram för kvantitativa variabler). Exempel 2:4 Företagets ekonomer tillfrågades om de var nöjda med sin lön. Ne­ dan­stående fyrfältstabell redovisar resultatet. Tabell 2:4 Antal manliga och kvinnliga ekonomer som var nöjda respektive inte nöjda med sin lön.

Kön Svar Inte nöjd Nöjd

Man

Kvinna

54

23

32

42

För att spara utrymme vill man ibland lägga in flera variabler ­eller statistiska mått i samma tabell. Det är då viktigt att man anger förklarande information i såväl tabellhuvudet som i tabelltexten. Exempel 2:5 I en undersökning av sjukfrånvaron vid en arbetsplats med totalt 374 anställda fann man år 2006 att av de 53 som var sjukskrivna under året (borta mer än 3 dagar) var 20 män och 33 kvinnor. Eftersom det var fler anställda kvinnor än män (258 kvinnor respektive 116 män) var det relativt sett högre sjukfrånvaro bland männen under året. Därför kan man vilja ange både antalet och den relativa frekvensen i tabellen (se tabell 2:5 nedan). Tabell 2:5 Antal anställda samt antal sjukskrivna män och kvinnor vid en viss arbetsplats 2006, samt andelen sjukskrivna i procent av antalet anställda.

Kön

44

Antal anställda

Antal sjukskrivna

Sjukskr. %

Män Kvinnor

116 258

20 33

17 13

Totalt

374

53

14


2. Grafisk redovisning: tabeller och diagram

Diagram för kvalitativa variabler Ibland kan det vara mer åskådligt med ett diagram. För kvalitativa variabler brukar man vanligen använda ett cirkeldiagram eller någon form av stapeldiagram. Ett diagram benämns ”figur” och beskrivs med en lämplig förklarande figurtext som (oftast) sätts under figuren.

Cirkeldiagram Ett cirkeldiagram, på engelska pie chart, består av cirkelsektorer (”tårtbitar”) vars areor är proportionella mot frekvenserna. Nuförtiden ritar man de flesta diagram med datorns hjälp. Vill man ändå handrita beräknar man gradtalen för medelpunktsvinklarna (pekar mot cirkelns mitt) genom att multiplicera de relativa fre­ kven­serna med 360 grader och använder passare och gradskiva. Exempel 2:6 Vid en attitydundersökning om ungdomars syn på alkohol fann man bland en kommuns 15-åringar att: 39% ansåg att det var ok för ungdomar att dricka alkohol i smyg; 53% att det var ok i någon vuxens sällskap; 8% att det inte alls var ok före 18 års ålder. Först beräknas medelpunktsvinklarna: Ok i smyg: 0,39 × 360 grader ≈ 140 grader Ok med vuxen: 0,53 × 360 grader ≈ 191 grader 0,08 × 360 grader ≈ 29 grader Inte ok: Sedan ritas cirkeldiagrammet . Resultatet redovisas i figur 2:2 nedan. OK i smyg OK med vuxen Inte OK

Figur 2:2 Fördelning av attityder till alkohol bland 15-åringar i kommunen.

45


2. Grafisk redovisning: tabeller och diagram

Stapeldiagram och stolpdiagram Om man har många variabelvärden blir dock cirkeldiagrammet svårt att tolka och ett stapeldiagram kan vara att föredra (stapel heter bar på engelska). Ett stapeldiagram har rektangulära staplar vars höjder brukar motsvara frekvenserna för de olika variabelvärdena. Man brukar låna termerna från koordinatsystemet (se avsnittet Diagram för kvantitativa variabler) och kalla den vågräta nedre delen för xaxeln och den lodräta ”linjalen” till vänster för y-axeln. Ett stolpdiagram är en enklare variant på stapeldiagram. Det består av raka streck vilkas höjder svarar mot frekvenserna. Stolpdiagram är lättare att rita för hand men statistikprogram ger vanligen stapeldiagram liknande det i figur 2:3 nedan. Exempel 2:7 Vid den ovan nämnda undersökningen tillfrågades 1 193 15-åringar som ansåg att det var ok att dricka alkohol, antingen i smyg e ­ ller i vuxens sällskap, om varför de drack. Följande svars­ fördelning erhölls: {Är gott, 7; Slappnar av, 21; Är kul, 173; Bli full, 312; Vara ­populär, 463; Är häftigt, 138; Bli roligare, 79}. Ett stapeldiagram över detta resultat återfinns i figur 2:3 nedan. Antal 500 450 400 350 300 250 200 150 100 50 0

Är kul

Är häftigt

Är gott

Vara populär

Slappnar av

Bli roligare

Bli full

Anledning

Figur 2:3 Varför 15-åringar i kommunen dricker alkohol (totalt tillfrågades 1193 15-åringar).

Grupperade staplar kan användas om man vill ange värden för två kvalitativa variabler i samma diagram.

46


2. Grafisk redovisning: tabeller och diagram

Exempel 2:8 Eftersom man misstänkte att det kunde finnas en könsskillnad ville man åskådliggöra resultatet uppdelat på pojkar och flickor. Ett stapeldiagram med grupperade staplar illustrerar informationen i tabell 2:6 nedan. Tabell 2:6 Antal 15-åriga pojkar och flickor som anser att det är ok att dricka alkohol och anledningen till att de dricker.

Anledning

Pojkar

Flickor

Totalt

Är gott Slappnar av Är kul Bli full Vara populär Är häftigt Blir roligare

2 7 71 218 163 118 54

5 14 102 94 300 20 25

7 21 173 312 463 138 79

Totalt

633

560

1 193

Stapeldiagrammet återfinns i figur 2:4 nedan. Antal 350 300 250 200

Pojkar

150

Flickor

100

Är kul

Är häftigt

Är gott

Slappnar av

Vara populär

Blir roligare

0

Bli full

50

Anledning

Figur 2:4 Antal pojkar respektive flickor i kommunen och anledningen till att de dricker alkohol.

Ett varningens ord är på sin plats när det gäller skalan på y-axeln. Om den inte går ner till noll kommer inte längre staplarnas areor att vara proportionella mot frekvenserna. Detta kan ge en missvisande bild av att skillnader som egentligen är ganska obetydliga skulle vara stora. Problemet illustreras av figur 2:5 på nästa sida.

47


2. Grafisk redovisning: tabeller och diagram

Exempel 2:9 För att studera kundunderlaget vid lördagsöppet på Systembolaget noterades hur många män respektive kvinnor som handlade under en slumpmässigt utvald lördag. Resultatet redovisas i figur 2:5 ne­ dan. 160 140

Antal

Antal

120 100 80 60 40 20 0

Kvinnor

Män

148 146 144 142 140 138 136 134 132 130

Kvinnor

Män

Figur 2:5 Den ganska obetydliga skillnaden i vänstra diagrammet kan verka alldeles för stor om y-axeln, som i högra diagrammet, inte går ner till noll.

Tabeller för kvantitativa variabler För att skapa frekvenstabeller för kvantitativa variabler behöver man, precis som när det gäller de kvalitativa variablerna, först räkna antalet förekomster av respektive variabelvärde. För en kvalitativ variabel, som Kön med bara två variabelvärden, är detta relativt enkelt. Man räknar antalet män och antalet kvinnor. Med en kvantitativ variabel kan det dock vara lite bökigare eftersom kvantitativa variabler ofta har betydligt fler variabelvärden. Observationer på en kvantitativ variabel brukar redovisas i storleksordning. Exempel 2:10 I en undersökning av motionsvanor hos medelålders kvinnor ville man även undersöka deras hälsa. 148 kvinnor fick därför skatta sin hälsa på en intervallskala 1–13. För enkelhetens skull använder vi bara data från de 34 första för att visa hur man gör frekvenstabellen. 9 5 5 10 4 7 6 7 8 9 4 10 2 8 4 5 7 6 3 11 9 7 6 4 7 7 6 5 5 3 9 7 6 7 etcetera

48


2. Grafisk redovisning: tabeller och diagram

Först räknar man antalet observationer av varje variabelvärde (skattning 1–13 på skalan).

Skattning (x)

Antal observationer

Frekvens (f) 0

1 2 3

| ||

1 2

4 5 6 7 8 9

|||| |||| |||| |||| ||| || ||||

4 5 5 8 2 4

|| |

2 1 0 0

10 11 12 13

etc.

Därefter tas kolumnen för avprickning bort och svaren från kvinnorna redovisas i den slutliga tabell 2:7 nedan. Tabell 2:7 Frekvensfördelning över skattningar av hälsa (n = 148).

Skattad hälsa 1 2 3 4 5 6 7 8 9 10 11 12 13

Frekvens (f ) 0 4 2 7 10 7 39 15 26 24 7 7 0 Totalt = n = 148

49


2. Grafisk redovisning: tabeller och diagram

Relativa frekvenser (f/n) kan vara intressanta bland annat om man vill jämföra data från två olika stora grupper. Ofta anges de relativa frenvenserna i procent (beräknas som f/n × 100). Kumulerade frekvenser (F) innebär att frekvenserna adderas kumulativt nedåt (eller ibland uppåt) i frekvenstabellen. Kumulerade relativa frekvenser är därmed kumulativt adderade relativa frekvenser. Se tabell 2:8 nedan. Ett fall när de senare frekvenstyperna kan vara av intresse återfinns i exempel 2:17 och 2:18 i avsnittet Frekvenspolygon och summapolygon. I en rapport redovisar man sällan en tabell som tabell 2:8 nedan, utan man väljer den/de mest relevanta frekvenserna.

Frekvenstabeller för klassindelat material När det gäller kvantitativa variabler (speciellt för kontinuerliga sådana) är det ofta praktiskt att klassindela sitt material. Det bästa är vanligen om man väljer klasser så att de blir lika breda. Tabell 2:8 Frekvenser, relativa frekvenser, kumulerade frekvenser och kumulerade relativa frekvenser för materialet i tabell 2:7 ovan.

Skattad Frekvens (f ) Relativ frekvens i hälsa procent (f/n · 100) 1 0 0 2 4 4/148 · 100 = 2,70 3 2 2/148 · 100 = 1,35 4 7 7/148 · 100 = 4,73 5 10  6,76 6 7  4,73 7 39 26,35 8 15 10,14 9 26 17,57 10 24 16,22 11 7  4,73 12 7  4,73 13 0  0,00 n = 148

50

Summa = 100%

Kumulerad frekvens (F)

Kumulerad relativ frekvens (%) 0 0,00 0 + 4 = 4 0,00 + 2,70 = 2,70 4 + 2 = 6 2,70 + 1,35 = 4,05 6 + 7 = 13 4,05 + 4,73 = 8,78 23 15,54 30 20,27 69 46,62 84 56,76 110 74,32 134 90,54 141 95,27 148 100,00 148 100,00 n = 148


2. Grafisk redovisning: tabeller och diagram

Det här kan göras på flera sätt. Ett enkelt sätt kan vara att först bestämma vilken klassbredd man vill ha. Genom att sedan ta det högsta värdet minus det lägsta värdet (variationsbredden) och dividera det med klassbredden och därefter avrunda uppåt får man en god uppskattning av antalet klasser. Därefter väljer man ett jämnt och bra värde under den lägsta observationen och skapar sina klasser genom att låta nästkommande klass börja en klassbredd ovanför, och så vidare (se exempel 2:11). Man bör dock komma ihåg att de faktiska klassgränserna hamnar mitt emellan de värden man skriver ut i sin tabell (på 159,5; 169,5; 179,5; etcetera i tabell 2:9). Klassmitten hamnar sedan i sin tur mitt emellan klassgränserna (se tabell 2:9). Ibland kan man välja att ha öppna klasser för den första och/eller sista klassen. Detta innebär att bara den ena klassgränsen är definierad. Exempel 2:11 Vid en hälsokontroll på en gymnasieskola mättes längden på 40 pojkar i årkurs 2. De uppmätta värdena var: Längd = {167; 186; 188; 181; 177; 182; 175; 202; 195; 182; 190; 189; 161; 182; 170; 195; 186; 190; 192; 177; 174; 187; 188; 184; 183; 197; 184; 181; 190; 178; 186; 180; 186; 186; 171; 188; 165; 180; 173; 169} cm Välj klassbredd, till exempel 10 cm Variationsbredden = 202 – 161 = 41 Antal klasser = 41/10 = 4,1 = 5 klasser Tabell 2:9 Kroppslängd för 40 gymnasiepojkar.

Klass Längd (cm) 160–169 170–179 180–189 190–199 200–209

Klassgränser

Klassmitt

Antal

159,5–169,5 169,5–179,5 179,5–189,5 189,5–199,5 199,5–209,5

164,5 174,5 184,5 194,5 204,5

4  8 20  7  1 S:a 40

51


2. Grafisk redovisning: tabeller och diagram

Ibland kanske man hellre än att utgå från klassbredden vill bestämma hur många klasser man ska använda sig av. Även i det fallet beräknar man först variationsbredden (högsta minus lägsta värdet). Man dividerar nu istället med det antal klasser man vill ha och avrundar det resulterande värdet till en lämplig klassbredd. Exempel 2:12 Vid utarbetandet av ett mätinstrument för diagnostik av kroniskt trötthetssyndrom undersöktes ett obundet slumpmässigt urval om 3000 personer. Testet kunde ge värden mellan 20 och 100 poäng och man tänkte sig 9 klasser för en klassindelning av resultatet. Variationsbredden = 100 – 20 = 80 Klassbredd = 80/9 = 8,9 poäng ≈ 9 poäng/klass Tabell 2:10 Testresultat för 3000 personer.

Klass Poäng 20–28 29–37 38–46 47–55 56–64 65–73 74–82 83–91 92–100

Klassgränser

Klassmitt

Frekvens

19,5–28,5 28,5–37,5 37,5–46,5 46,5–55,5 55,5–64,5 64,5–73,5 73,5–82,5 82,5–91,5 91,5–100,5

24 33 42 51 60 69 78 87 96

91 604 1147 836 218 78 18 6 2 S:a 3000

Om klassindelningen har gjorts så att observationerna är något­ sånär jämnt fördelade inom varje klass kan klassmitten sägas representera observationsvärdena för den klassen. Detta kan utnyttjas för att få en approximation av totalvärdet för respektive klass, vilket beräknas som frekvensen multiplicerad med klassmitten. För den första klassen i tabell 2:10 skulle totalvärdet alltså vara ungefär 24 × 91 = 2184 poäng. (Genom att sedan summera totalvärdena för samtliga klasser får man en totalsumma för hela materialet som man kan använda för att beräkna ett approximativt medelvärde för ett klassindelat material, se kapitel 3).

52


2. Grafisk redovisning: tabeller och diagram

Kumulerade frekvenser, relativa frekvenser och kumulerade relativa frekvenser kan naturligtvis också beräknas för det klassindelade materialet.

Diagram för kvantitativa variabler Också för kvantitativa variabler finns ett antal mycket användbara diagram. De vanligaste är punktdiagram, linjediagram, stapeldiagram och histogram.

Koordinatsystemet I de diagram vi hittills presenterat har vi redan använt oss av koordinatsystemet. Detta har två axlar placerade vinkelrätt mot varandra. Den horisontella axeln brukar benämnas x-axeln och den vertikala y-axeln. Skärningspunkten mellan axlarna kallas origo och är den punkt där skalvärdet på båda axlarna är noll. De fyra ”rutor” som bildas brukar betecknas kvadranter och numreras moturs så att första kvadranten är den där alla tal är positiva. Skalan på respektive axel kan variera för att på bästa sätt återge de data som ska presenteras. X-axelns värden kallas x-koordinater, y-axelns värden y-koordinater. Se figur 2:6 nedan. 50 40

2:a

1:a kvadranten

30

y-axeln

20

origo

10 0 –10 –20

3:e

–30

4:e

–40

Figur 2:6 Koordinatsystemet.

–50 –15

–10

–5

0

5

10

15

x-axeln

För att avsätta data i koordinatsystemet bör man lämpligen ha värdena som talpar (x, y), det vill säga ett y-värde för varje x-värde. För varje talpar avsätts sedan en markering i koordinatsystemet där en tänkt lodrät linje genom x-koordinaten skär en tänkt vågrät linje genom y-koordinaten.

53


2. Grafisk redovisning: tabeller och diagram

Exempel 2:13 Avsätt talparen (10, 18) samt –10, –40) i koordinatsystemet. Lägg en linjal (eller använd rutat papper) från värdet på x-axeln uppåt och från värdet på y-axeln inåt och markera med exempelvis ett kryss där dessa två tänkta linjer möts. 50 40 30

y-axeln

20 10 0

–10

Figur 2:7 Koordinatsystemet med talparen (10, 18) och (–10, –40) inritade (hjälplinjerna x = 10 och y = 18 ritas normalt inte ut).

–20 –30 –40 –50 –15

–10

–5

0

5

10

15

x-axeln

Ibland väljer man att inte låta den ena, den andra eller båda axlarna gå ner till noll, speciellt om mätområdet för en variabel är begränsat och ligger långt från origo. Man säger att man skär eller gör ett brott på axeln. Ska detta göras korrekt ska origo ändå vara med och ett brott markeras på axeln (se figur 2:8 nedan). 0

50

52

54

56

58

60

62

64

66

68

70

x-axeln Figur 2:8 Exempel på en bruten x-axel

Med datorernas intåg har det dock blivit alltmer accepterat att den ena eller båda axlarna börjar med en siffra annan än noll såsom till exempel för y-axeln i figur 2:9 på nästa sida.

Punktdiagram och linjediagram När värden för två variabler (x respektive y) markeras i ett koordinatsystem med någon symbol (kryss, ringar, fyrkanter etcetera) kallas den erhållna grafen ett punktdiagram. På engelska kallas detta scattergram eller scatterplot och man säger ibland att man 54


2. Grafisk redovisning: tabeller och diagram

plottar sina data. Om man har kontinuerliga variabler väljer man ­ibland att sammanbinda punkterna med en linje till ett linjediagram. Detta är speciellt vanligt om man har Tid som x-variabel. Exempel 2:14 Maxpulsen hos 5 individer med olika ålder uppmättes vid ett arbetsprov på ergometercykel (se figur 2:9 nedan). 220

maxpuls (slag/min)

210 200 190 180 170 160 150 140 0

10

20

30

40

50

60

70

80

ålder (år)

Figur 2:9 Maxpuls hos 5 individer med olika ålder.

I exempel 2:14 ser vi att y-axeln är bruten vid en pulsfrekvens på 140 slag/min. Detta gör att man slipper en massa ”luft” i diagrammet under 140, men vid en tolkning av figuren är det viktigt att komma ihåg att läsa på skalan på y-axeln. Annars kanske man felaktigt får för sig att den som har den högsta pulsen i diagrammet har mer än dubbelt så hög maxpuls som den som har den lägsta.

Stapeldiagram och histogram För att ange frekvenser kan stapeldiagram och stolpdiagram användas också för diskreta kvantitativa variabler. För klassindelat material används histogram. Dessa typer av diagram ger en bra bild av hur variabelns frekvensfördelning ser ut (hur frekvenserna är fördelade på de olika variabelvärdena). Frekvensfördelningen är av betydelse för många statistiska mått, vilket kommer att behandlas längre fram i boken.

55


2. Grafisk redovisning: tabeller och diagram

Exempel 2:15 I figur 2:10 nedan visas ett stapeldiagram över den vänstra kolumnen i tabell 2:7, frekvensfördelning för skattad hälsa. 40

Frekvens (antal)

35 30 25 20 15 10 5 0

1

2 3

4 5

6 7 8

9 10 11 12 13

Skattad hälsa

Figur 2:10 Skattad hälsa bland 148 medelålders kvinnor.

Ett histogram är ett stapeldiagram för klassindelat material. Det är därför det inte finns några mellanrum mellan rektanglarna. Där den ena klassen slutar tar den andra klassen vid. Bredden i rektanglarna bör vara lika med klassbredden och höjden densamma som frekvensen. På så sätt motsvaras frekvenserna av rektanglarnas areor. Exempel 2:16 Histogram för det klassindelade materialet i tabell 2:9 redovisas i figur 2:11 nedan. Frekvens (antal)

20 18 16 14 12 10 8

Figur 2:11 Kroppslängd för 40 gymnasiepojkar (tabell 2:9).

6 4 2 0 150

160

170

180

190

200

210

220

Längd (cm)

Precis som för punktdiagram väljer man ibland att bryta axlarna. I figur 2:11 ovan ser vi till exempel att x-axeln börjar på 150. Också här gäller det emellertid att se upp. Titta på skalan på y-axeln i det inledande diagrammet i kapitlet (figur 2:1). Prova gärna att rita 56


Statistik för beteendevetare ISBN 978-47-09737-1 © 2006, 2012 Författarna och Liber AB Projektledare: Eva Houltzén Hammarberg Redaktörer: Maria Emtell, Helena Widerström och Cecilia Björk Tengå Omslag och formgivning: Fredrik Elvander Illustrationer: Elisabet Borg Sättning: LundaText AB Upplaga 3:1 Tryck: Sahara Printing, Egypten 2012

KOPIERINGSFÖRBUD Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och elevers rätt att kopiera för undervisningsbruk enligt BONUS-avtal, är förbjuden. BONUS-avtal tecknas ­mellan upphovsrättsorganisationer och huvudman för utbildningsanordnare, t.ex. kommuner och universitet. Intrång i upphovsmannens rättigheter enligt upphovsrättslagen kan medföra straff (böter eller fängelse), skadestånd och beslag/förstöring av olovligt ­framställt material. Såväl analog som digital kopiering regleras i BONUS-avtalet. Läs mer på www.bonuspresskopia.se.

Liber AB, 205 10 Malmö tfn 040-25 86 00, fax 040-97 05 50 www.liber.se Kundservice tfn 08-690 93 30, fax 08-690 93 01


Statistik för beteendevetare Statistik för beteendevetare är en heltäckande grundbok i statistik. Författarna går steg för steg igenom hur du planerar, genomför och redovisar en statistisk undersökning: • Vilken undersökningsdesign ska jag välja? • Hur går jag till väga för att pröva min hypotes? • Vilka statistiska analyser kan jag göra? • Hur kan jag tolka och redovisa mina resultat? Boken har rönt stor uppskattning bland studenter på grund av att den på ett lättillgängligt och pedagogiskt sätt väver samman teori och praktik, med många exempel och övningar som underlättar inlärningen. Boken innehåller också mer avancerade fördjupningsavsnitt. I denna tredje upplaga har boken fått flera nya avsnitt som gör att den passar brett på utbildningar inom beteendevetenskap där man behöver en statistisk grundförståelse, till exempel för dig som läser psykologi, sociologi, kriminologi, logopedi, vårdvetenskap, medicin och hälsa. Faktaboken kompletteras av en övningsbok med dels räkneuppgifter – såväl för handräkning som för att lösa uppgifter med hjälp av något statistikprogram – dels uppgifter av mer teoretisk karaktär.

Elisabet Borg och Joakim Westerlund är universitetslektorer vid Stockholms universitet, Psykologiska institutionen. Elisabet Borg fick 2011 den pedagogiska utmärkelsen Årets lärare vid Stockholms universitet. Boken är fackgranskad av professor Åke Hellström, Stockholms universitet och universitetslektor Daniel Sjödin, Örebro universitet.

Best.nr 47-09737-1

Tryck.nr 47-09737-1-00


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.