9789147129409

Page 1

Statistik för beteendevetare

Statistik för beteendevetare Statistik för beteendevetare är en heltäckande grundbok i statistik. Författarna går steg för steg igenom hur du planerar, genomför och redovisar en statistisk undersökning: • Vilken undersökningsdesign ska jag välja? • Hur samlar jag in och beskriver mina data? • Vad innebär en hypotesprövning? • Vilka statistiska analyser kan jag göra? • Hur kan jag tolka och redovisa mina resultat? • Vilka fallgropar ska jag se upp med? Ända sedan första upplagan har boken rönt stor uppskattning bland studenter för att den på ett lättillgängligt och pedagogiskt sätt väver samman teori och praktik, med exempel och övningar som underlättar inlärningen. Boken innehåller också mer avancerade fördjupningsavsnitt.

Statistik för beteendevetare Faktabok

Elisabet Borg Joakim Westerlund

I denna fjärde upplaga har ett antal förändringar gjorts för att möta de senaste årens diskussion kring hur statistik används inom speciellt samhällsvetenskaplig forskning. Vissa förenklingar har gjorts, större fokus har lagts på betydelsen av god mätning och användandet av konfidensintervall och mått på effektstyrka, och två helt nya kapitel har lagts till. Det första om den så kallade replikeringskrisen och det andra om Bayesiansk statistik, författat av kollegan Anders Sand, forskare vid Karolinska Institutet.

Elisabet Borg Joakim Westerlund

Elisabet Borg och Joakim Westerlund är universitetslektorer och forskare vid Stockholms universitet, Psykologiska institutionen. Elisabet Borg fick 2011 den pedagogiska utmärkelsen Årets lärare vid Stockholms universitet. Boken är i tidigare upplagor fackgranskad av professor Åke Hellström, Stockholms universitet och universitetslektor Daniel Sjödin, Örebro universitet.

Faktabok

Best.nr 47-12940-9 Tryck.nr 47-12940-9

Fjärde upplagan

Stat f beteendevetare - omslag uppl 4_2.indd 1

2020-08-24 15:05


Statistik för beteendevetare ISBN 978-91-47-12940-9 © 2006, 2020 Författarna och Liber AB Förläggare: Helena Ekholm Projektledare: Cecilia Björk Tengå Redaktör: Camilla Nevby Omslag och formgivning: Fredrik Elvander Illustrationer: Elisabet Borg Sättning: LundaText AB Upplaga 4 1 Repro: Repro 8 AB, Stockholm Tryck: People Printing, Kina 2020

KOPIERINGSFÖRBUD Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och elevers begränsade rätt att kopiera för undervisningsbruk enligt BONUS-avtal, är förbjuden. BONUS-avtal tecknas mellan upphovsrättsorganisationer och huvudman för utbildningsanordnare, t.ex. kommuner och universitet. Intrång i upphovsmannens rättigheter enligt upphovsrättslagen kan medföra straff (böter eller fängelse), skadestånd och beslag/förstöring av olovligt framställt material. Såväl analog som digital kopiering regleras i BONUS-avtalet. Läs mer på www.bonuscopyright.se.

Liber AB, 113 98 Stockholm Kundservice tfn 08-690 90 00 Kundservice.liber@liber.se www.liber.se


1. Introduktion

Innehåll Förord .................................................................... 6

1. Introduktion....................................................9 Kvantitativ metod ............................................... 11 Variabler och mätning ....................................... 28 Sammanfattning ................................................. 42 Övningsuppgifter ............................................... 44

2. Grafisk redovisning: tabeller och diagram ........................................................46 Tabeller för kvalitativa variabler....................... 47 Diagram för kvalitativa variabler ..................... 50 Tabeller för kvantitativa variabler .................... 53 Diagram för kvantitativa variabler ................... 58 Tredimensionella diagram ................................ 66 Sammanfattning ................................................. 66 Övningsuppgifter ............................................... 68

3. Centralmått ..................................................72 Typvärde .............................................................. 73 Median ................................................................. 76 Aritmetiskt medelvärde ..................................... 77 Egenskaper hos det aritmetiska medelvärdet...................................................... 80 Jämförelser mellan typvärde, median och aritmetiskt medelvärde ........................... 85 Geometriskt och harmoniskt medelvärde ..... 86 Sammanfattning ................................................. 87 Övningsuppgifter ............................................... 88

4. Spridningsmått.............................................90 Variationsbredd .................................................. 91 Percentiler, kvartiler och kvartilavvikelse ....... 91 Varians och standardavvikelse ......................... 93 Variationskoefficienten, den relativa spridningen ....................................................101 Sammanfattning ...............................................102 Övningsuppgifter .............................................103

5. Normalfördelning och z-poäng och sannolikhetslära ........................................105 z-poäng ..............................................................106 Normalfördelning ............................................108 Sannolikheter för normalfördelade händelser ........................................................112 Avvikelser från normalfördelningen .............113 Lite sannolikhetslära ........................................119 Oddset för en händelse ....................................123 Binomialfördelningen......................................125 Sammanfattning ...............................................130 Övningsuppgifter .............................................131

6. Korrelation ..................................................135 Grafisk redovisning av samband ....................137 Pearsons produktmomentkorrelationskoefficient .......................................................142 Är korrelationen stor eller liten? ....................149 Andra korrelationskoefficienter .....................155 Korrelationskoefficienten vid restriction of range ...........................................................163 Partiell korrelation ...........................................166 Sammanfattning ...............................................173 Övningsuppgifter .............................................174

7. Introduktion till inferentiell statistik .........179 Logiken bakom all hypotesprövning .............180 Exempel på hypotesprövningens logik – Fia med knuff .................................................182 Samplingsfördelningar av medelvärden ........185 Hur samplingsfördelningar kan användas för hypotesprövning ......................................188 Hypotesprövning av ett enskilt stickprovsmedelvärde, känd populationsstandardavvikelse..........................................................191 Typ I- och typ II-fel..........................................194 Sammanfattning ...............................................197 Övningsuppgifter .............................................199

8. Hypotesprövning av medelvärden: z- och t-test................................................201 z-test: ett stickprovsmedelvärde .....................201 t-test: ett stickprovsmedelvärde......................213 t-test för oberoende mätningar ......................219 t-test för beroende mätningar ........................228 Oberoende t-test för differenspoäng .............235 Effektstyrka för skillnader ...............................236 Sammanfattning ...............................................240 Övningsuppgifter .............................................241

9. Hypotesprövning av korrelationer .............246 Korrelationskoefficienten ................................246 Fördjupa din förståelse av tabell 4..................252 Skillnaden mellan två korrelationer ..............252 Medelvärden av korrelationer ........................254 Andra korrelationskoefficienter .....................255 Kortfattat om reliabilitet och validitet hos mätinstrument ...............................................255 Sammanfattning ...............................................258 Övningsuppgifter .............................................259

10. Konfidensintervall ......................................260 Konfidensintervall för populationsmedelvärdet, μ ..........................................................261 Konfidensintervall för proportioner ..............267

3


Innehåll

Konfidensintervall för populationsvariansen, σ2 ...................................................269 Konfidensintervall för populationskorrelationen, ρ..............................................270 Konfidensintervall som komplement till hypotesprövning ......................................270 Hypotesprövning med konfidensintervall ....272 Sammanfattning ...............................................276 Övningsuppgifter .............................................277

11. Introduktion till variansanalys ..................279 Skalnivåer ..........................................................280 Varianter av variansanalys ..............................281 Variansanalys och experimentell metod .......285 Sammanfattning ...............................................285 Övningsuppgifter .............................................286

12. Envägs oberoende variansanalys ..............288 Beräkningar vid envägs oberoende ANOVA ..........................................................289 Den linjära modellen .......................................304 Antaganden bakom envägs oberoende ANOVA ..........................................................306 Hur envägs oberoende ANOVA egentligen fungerar ..........................................................309 Variansanalys eller t-test? ................................311 Multipla jämförelser.........................................311 Sammanfattning ...............................................316 Övningsexempel...............................................317

13. Beroende ANOVA ........................................320 Ett räkneexempel på beroende ANOVA .......321 Antaganden bakom envägs beroende ANOVA ..........................................................327 Hur envägs beroende ANOVA egentligen fungerar ..........................................................329 Matchning .........................................................334 Sammanfattning ...............................................337 Övningsuppgifter .............................................337

14. Flervägs ANOVA..........................................340 Ett räkneexempel på en 2×2 oberoende ANOVA ..........................................................346 Villkor för flervägs oberoende ANOVA ........357 Fördelar med flervägs ANOVA ......................358 Nackdelar med flervägs ANOVA ...................359 Hur tvåvägs oberoende ANOVA egentligen fungerar ..........................................................359 Post hoc-test jämfört med test av enkla effekter ............................................................361 Mixed ANOVA .................................................363 Kovariansanalys (ANCOVA)..........................367 Villkor för ANCOVA .......................................371 Sammanfattning ...............................................372

4

Övningsuppgifter .............................................373

15. Enkel regressionsanalys ............................376 Skalnivåer ..........................................................377 Linjära och icke-linjära samband ...................378 Den linjära regressionslinjen ..........................379 Anpassa en linje till data .................................382 Att predicera .....................................................384 Hypotesprövning av koefficienterna ..............386 Lite mer om formlerna ....................................387 Pearsons produktmomentkorrelationskoefficient och regressionslinjen .................389 Datatransformering .........................................389 Sammanfattning ...............................................393 Övningsuppgifter .............................................394

16. Chi-två och andra icke-parametriska test för hypotesprövning ...........................398 Chi-två, χ2 .........................................................399 Två oberoende stickprov .................................409 Två beroende stickprov – parvisa jämförelser......................................................412 Jämförelser av tre eller fler oberoende stickprov .........................................................414 Beroende mätningar med tre eller fler jämförelser......................................................417 Sammanfattning ...............................................419 Övningsuppgifter .............................................419

17. Multipel regressionsanalys .......................425 Ett exempel på multipel regression ................430 Logistisk regression..........................................441 Sammanfattning ...............................................445 Övningsuppgifter .............................................445

18. Faktoranalys...............................................450 Ett exempel på faktoranalys ............................452 Att tänka på när man gör faktoranalys ..........462 Sammanfattning ...............................................463 Övningsuppgifter .............................................464

19. Powerberäkningar......................................466 Vad är power? ...................................................468 Effektstyrka .......................................................470 Powerberäkningar ............................................472 Powerberäkningar med dataprogram............480 Sammanfattning ...............................................480 Övningsuppgifter .............................................481

20. Redovisning av forskningsresultat ...........483 Tabeller och figurer ..........................................483 Allmänt om redovisning av signifikansprövningar ......................................................484 t-test ...................................................................485


Innehåll

Korrelationer.....................................................486 Variansanalys ....................................................487 Enkel regression ...............................................489 Icke-parametriska metoder.............................491 Övningsuppgifter .............................................492

Sammanfattning ...............................................544 Övningsuppgifter .............................................545

Appendix A – Facit till övningarna ...................549 Appendix B – Formelsamling ...........................582

21. Statistiska fallgropar .................................493

Appendix C – Statistiska tabeller ....................591

Ett statistiskt samband behöver inte innebära ett kausalsamband ........................493 Extremvärden ...................................................494 Stor skillnad mellan hypotesprövande resultat och post hoc-fynd ...........................496 Massignifikansproblemet ................................499 Konsekvenserna av ett litet respektive stort stickprov .........................................................503 Restriction of range-problemet ......................505 Resultat på gruppnivå kan inte utan vidare generaliseras till individnivå ............505 Regressionsfelslutet ..........................................506 Sammanfattning ...............................................510 Övningsuppgifter .............................................512

Tabell 1. z-tabellen ...........................................591 Tabell 2. z–tabellen (för hypotesprövning) ...592 Tabell 3. t-fördelningar ....................................593 Tabell 4. Korrelationstabellen .........................595 Tabell 5. Chi-två-fördelningar ........................597 Tabell 6. F-tabellen ...........................................599 Tabell 7. Power-tabellen ..................................602 Tabell 8. z-tabellen (med densitet) .................603

Appendix D – Referenser och rekommenderad extralitteratur .......................604 Register .............................................................607

22. Replikeringskrisen .....................................514 J.W.:s berättelse 1 ..............................................514 Problemen .........................................................516 Förklaringarna ..................................................518 Paradigmskiftet.................................................523 J.W.:s berättelse 2 ..............................................525 Sammanfattning ...............................................527

23. Bayesiansk statistik...................................529 Hypoteser och hypotesprövning ....................530 Estimering .........................................................538 Vad borde vi tro? ..............................................542

5


Förord Tanken med den här statistikboken är att den ska fungera som en introduktion i statistik som täcker in det mesta som en beteendevetare/vårdvetare behöver kunna på grundnivå. Ambitionen har varit att boken ska vara lättläst och stimulerande. Vår erfarenhet är att statistik inte går att lära sig utan praktiska erfarenheter. Därför har vi sett till att alltid exemplifiera de teoretiska resonemangen och att avsluta varje kapitel med många övningsexempel. Vår förhoppning har redan från början varit att boken ska hjälpa läsaren att inse att statistik varken behöver vara svårt eller tråkigt och att statistik kan vara ett mycket värdefullt verktyg vid forskning och utredningsarbete. Samtidigt vill vi påpeka att statistiken i sig själv inte kan rädda en dåligt upplagd undersökning. Av den anledningen har vi, trots att boken främst är en statistikbok, lagt in ett par avsnitt av mer metodologisk karaktär. Sedan den första upplagan kom ut har boken också rönt mycken uppskattning från studenterna. För en tid sedan sade en student efter avslutad kurs att ”det är utan tvekan den bästa mattebok jag någonsin har läst”. Som läroboksförfattare blir man också glad när det dimper ner spontana tackmejl från både kända och okända studenter. En psykologistudent tyckte exempelvis att statistik som ämne var ”föga medryckande” och att den kurslitteratur de hade såg ut som en formelsamling. Men som av en slump hade hon ”ramlat på” Statistik för beteendevetare på biblioteket och skrev: ”Jag vill bara säga att det är en fantastisk bok! Det är till och med lite roligt att plugga statistik. Faktiskt. Så, jag vill bara skriva ett mail för att tacka för insatsen ni har gjort i författarvärlden inom genren facklitteratur!”

Bokens utformning När statistiska begrepp dyker upp första gången står de kursiverade. För att underlätta läsning av engelsk litteratur i statistik anger vi även deras engelska motsvarigheter, utom i sådana fall när de engelska och svenska orden i stort sett är desamma. Varje kapitel innehåller ett antal exempel. Dessa är numrerade med kapitelnummer och löpnummer samt markerade med färgad bakgrund, så att de ska vara lätta att hitta när man bläddrar i boken. 6


Förord

De statistiska formlerna är också numrerade med kapitelnummer och löpnummer angivet i marginalen. Ett urval av dessa presenteras i formelsamlingen i Appendix B. I de flesta kapitlen finns även ett antal överkurs- eller fördjupningsavsnitt. Dessa är markerade med grafisk signal vid början och slut och är satta i mindre grad. Innehållet i dessa är sådant som vi bedömt bör finnas med för att göra texten mer fullständig men går också att hoppa över. Hur dessa överkurs- eller fördjupningsavsnitt ska användas i undervisningen lämnar vi åt den enskilde läraren att avgöra. Varje kapitel avslutas med en sammanfattning och ett antal övningar. Precis som exemplen i boken innehåller övningsuppgifterna, om inte annat anges, påhittade data. I slutet av boken finns appendix med facit, formler, och tabeller.

Skillnader mot tidigare upplagor Eftersom vår ambition är att Statistik för beteendevetare ska vara den enda bok i statistik som behövs på grundnivå har vi gjort några viktiga förändringar. Två helt nya kapitel har lagts till för att möta de senaste årens diskussion kring användandet av statistik inom speciellt samhällsvetenskaplig forskning. Det ena handlar om den så kallade replikeringskrisen och det andra är ett introduktionskapitel till Bayesiansk statistik, skrivet av kollegan Anders Sand. Vi har även lagt till ett par ytterligare sidor i kapitel 1 som kort belyser utmaningarna med vanliga mätskalor i psykologiska test och frågeformulär, gjort en del större förändringar i kapitlet om konfidensintervall, och betonat användandet av mått på effektstyrka och konfidensintervall som standard vid redovisning av resultat. Förutom en allmän översyn av texten för att göra den mer koncis och lättläst, har vi också gjort en del förändringar i exemplen, utökat formelsamlingen i Appendix B något, och tagit bort ett kort avsnitt om hur man justerar för restriction of range från kapitel 6.

7


Förord

Tackord Vi har båda bidragit i lika stor utsträckning till bokens innehåll. För eventuella fel och brister i boken tar vi på oss det fulla ansvaret. De fördelar som boken kan tänkas ha är dock inte enbart vår egen förtjänst. Vi är evigt tacksamma för de råd och synpunkter som en stor mängd studenter gett oss. Förutom dessa studenter vill vi tacka professor Åke Hellström – som vi känt länge och som vi båda beundrar stort, och universitetslektor Daniel Sjödin – för deras engagerade och noggranna granskning av manuskriptet till tidigare upplagor. Vi vill också rikta ett varmt tack till Anders Sand vid Karolinska Institutet, framför allt för hans omfattande arbete med kapitel 23, men också för värdefulla synpunkter på övriga delar av boken. Stockholm den 22 maj 2020 Elisabet Borg

8

Joakim Westerlund


1. Introduktion När man berättar att man undervisar i statistik får man ofta kommentaren: ”Statistik, jaha, hm … Ja, det finns ju tre sorters osanning – he, he – lögn, förbannad lögn och statistik …” Antingen skrattar man då artigt med eller också säger man att det är just därför som alla borde lära sig åtminstone något mer än det mest elementära i ämnet. För visst är det så att statistik kan användas för att luras. Det finns gott om exempel på statistiska diagram där skillnader eller trender fåtts att se mycket större och starkare ut än de egentligen är. Men statistik kan också vara ett oerhört viktigt redskap som låter oss lyfta lite på den slöja som ibland skymmer verkligheten. Sven Ove Hansson (2003) berättar i sin bok Konsten att vara vetenskaplig att man fortfarande i mitten av 1800-talet allmänt ansåg att lunginflammation (som så många andra åkommor) be-

9


1. Introduktion

rodde på obalans i kroppsvätskorna, som utgjordes av blod, svart galla, gul galla och slem. Att bota lunginflammation måste därför handla om att rätta till denna obalans, ansåg läkarkåren, och om detta rådde allmän enighet. Det som man inte var eniga om var vilket som var det bästa sättet att rätta till denna obalans. Genom förnuftsmässiga resonemang och klinisk erfarenhet, samt genom att stödja sig på gamla auktoriteter, kom vissa av dessa lärda män fram till att åderlåtning måste vara den bästa metoden. Genom andra förnuftsmässiga resonemang, och annan klinisk erfarenhet, och genom att stödja sig på andra auktoriteter, kom dock andra av dessa lärda män fram till att det måste vara kräkterapi som gör susen. Hade det nu inte varit för den österrikiske läkaren Joseph Dietl, hade de stridande parterna kunnat fortsätta att käbbla och slå varandra i huvudet med Aristoteles gamla luntor. Joseph Dietl gjorde nämligen år 1849 något väldigt revolutionerande, en systematisk empirisk undersökning av saken. Han hade en grupp patienter med lunginflammation som fick åderlåtning. Dödligheten i denna grupp var 20,4 %. Han hade också en grupp patienter med lunginflammation som behandlades med kräkterapi. I denna grupp var dödligheten 20,7 %. Så här långt såg det alltså ut som dött lopp mellan åderlåtning och kräkterapi. Men Dietl hade också med en tredje grupp lunginflammationspatienter i sin undersökning, en grupp som inte fick någon specifik behandling över huvud taget, bara allmän omvårdnad. I denna grupp var dödligheten 7,4 %. Joseph Dietls undersökning mottogs mycket negativt och han blev till och med av med sitt arbete. Man kan tänka sig att de lärda herrarna ansåg att det var förmätet av Dietl att ifrågasätta deras kloka slutsatser med något så simpelt som vanligt räknande. I dag ser det dock annorlunda ut och forskarna anser allmänt att det finns få metoder som är så effektiva för att ta reda på hur saker och ting fungerar som systematiska empiriska undersökningar kombinerade med statistiska analyser. Fast vad är egentligen statistik? Enligt Nationalencyklopedin är statistik bland annat ”vetenskapen om hur data med inslag av slumpmässig variation eller osäkerhet ska insamlas, utvärderas och presenteras”. Vad för slags data? Vadå slumpmässig variation? Hur ska data insamlas? Hur kan man lita på utvärderingen? På vilket sätt ska data presenteras för att det ska bli så begripligt som möjligt? 10


1. Introduktion

Innan vi går in på det bör dock något nämnas om grunderna för kvantitativ vetenskaplig metod. Visserligen är det här en statistikbok och visserligen förutsätts att de studenter som läser denna bok också läser någon bok om forskningsmetod, men trots detta tror vi att det kan vara på sin plats med ett mycket komprimerat avsnitt om kvantitativ vetenskaplig metod.

Kvantitativ metod Inom psykologi, medicin, pedagogik och många andra vetenskaper finns det två huvudsakliga grupper av metoder att samla in och bearbeta data med: kvalitativa och kvantitativa metoder. Skillnaden mellan kvalitativa och kvantitativa metoder beskrivs på följande sätt av Lennart Svensson (2004): Principiellt är distinktionen mellan kvalitativa och kvantitativa metoder enklast att förstå som att kvantitativa metoder dels är metoder för insamling av siffermässiga data eller kvantifiering av data till siffror, dels är matematiska och/eller statistiska beräkningar som bearbetningsmetoder. Kvalitativa metoder är på ett motsvarande sätt insamling av data som representerar en kvalitet i ett sammanhang, i stor utsträckning i form av språkliga enheter. Dessa data bearbetas framför allt språkligt beskrivande och kategoriserande. (s. 68)

Kvantitativa metoder handlar alltså mycket om att mäta väl och att räkna rätt. För den som är intresserad av en introduktion till kvalitativa metoder rekommenderas specifik litteratur för det området.

Frågeställning och undersökningsdesign All forskning handlar om att öka vår kunskap om världen. Vi vill kanske veta hur många olika däggdjursarter det finns i Amazonas, vad som är ett normalt blodtryck för friska människor, eller hur många saker en människa normalt kan hålla i korttidsminnet. Vi svarar på den här typen av frågeställningar genom att bedriva vad som brukar kallas deskriptiv eller explorativ forskning. Vi går ut i världen och tittar på våra undersökningsvariabler för att ta reda på hur de ser ut (mer om variabler nedan i avsnittet ”Variabler och mätning”). Men ofta har vi ett behov av att mer på djupet för11


1. Introduktion

stå hur saker och ting fungerar. Vi vill veta vad som händer med däggdjuren om vi avverkar stora delar av regnskogen i Amazonas, hur vi ska konstruera en medicin som sänker blodtrycket om det är för högt, eller vad som är de neurologiska förklaringarna till att vissa äldre får ett försämrat korttidsminne. I grund och botten handlar sådana frågeställningar om orsak och verkan, och den forskning som då bedrivs kallas explanativ eller hypotesprövande forskning. Flera exempel på hypotesprövande frågeställningar är om Magnecyl minskar graden av huvudvärk, om människor kan påverkas av bilder som visas så snabbt att de inte medvetet hinner uppfatta dem, om maskiner är bättre än människor på att förstå aktiemarknaden, eller om överdriven alkoholkonsumtion leder till skador på levern. I grund och botten har man då tre möjliga alternativ för hur man planerar sin undersökning: man kan göra ett experiment, ett kvasi-experiment eller ett icke-experiment. Precis som det verkar finns det här någon slags hierarki där experiment är den bästa undersökningsmetoden för möjligheten att dra slutsatser om orsak och verkan. Man har tänkt så här: ”Hur ska vi lägga upp en undersökning så att vi så mycket som möjligt ska kunna lita på att resultatet säger oss något om orsak och verkan?” – och så har man kommit fram till den experimentella metoden. Föga överraskande är därför ett kvasi-experiment ett experiment med vissa brister som gör att man inte lika säkert kan uttala sig om orsak och verkan, och ett icke-experiment är en undersökningsmetod som leder till ännu osäkrare uttalanden om orsak och verkan. Vi ska nu titta närmare på dessa tre typer av undersökningsmetoder.

Experiment Ett (äkta) experiment kännetecknas av två saker, kontroll och randomisering. Med kontroll menar vi att det är forskaren som har kontrollen över eventuella orsaker genom någon form av manipulation: att exempelvis variera tonhöjden, bildinnehållet, färgen, alkoholmängden, könsidentiteten på en fiktiv brottsling som beskrivs i en text, mängden låtsaspengar en person får förvalta för att placera i aktier – eller vad det nu är för något man vill undersöka effekterna av. Det som forskaren varierar/manipulerar och som man vill 12


1. Introduktion

se effekterna av (vår eventuella orsak), kallas oberoende variabel och brukar förkortas OV. Det som man vill se effekterna på, till exempel upplevd ljudstyrka, hjärtfrekvens, levervärden, utdömd strafflängd och ekonomisk förtjänst, kallas beroende variabel (på vilken vi eventuellt kan få en verkan) och brukar förkortas BV. Experimentet går ut på att ta reda på om OV påverkar BV. I vissa vetenskaper, som till exempel fysik, räcker det med att man har kontroll över OV för att man ska kunna prata om ett experiment. Men i psykologi, medicin, pedagogik och andra vetenskaper, framför allt där människor är undersökningsobjekten, behövs även något som kallas randomisering. Randomisering innebär att man låter slumpen avgöra vilken betingelse var och en av undersökningsdeltagarna ska hamna i. Så det är alltså slumpen som avgör vem som ska få Magnecyl och vem som ska få sockerpiller, vem som ska få se positiva och vem som ska få se negativa bilder, vem som ska få utdöma straff till en fiktiv manlig brottsling eller till en fiktiv kvinnlig brottsling. Folk får inte själva välja, och det är inte heller forskaren som efter tycke och smak fördelar individerna till olika betingelser. Alla människor har ju en mängd olika egenskaper och erfarenheter som på ett okänt sätt kan samvariera med det man undersöker. Genom att låta slumpen sköta fördelningen av individer till betingelser minskar man risken att få en systematisk skillnad mellan grupperna som inte har med den oberoende variabeln att göra men som kommer att påverka den beroende variabeln. (Mer om detta i avsnittet ”Bakomliggandevariabel-problemet”.) Det allra enklaste experiment man kan göra innefattar två grupper, en experimentgrupp och en kontrollgrupp. Man randomiserar undersökningsdeltagarna till dessa grupper och sedan behandlar man deltagarna i de två grupperna exakt likadant i alla avseenden utom ett, OV. Exempelvis ger man alla i grupperna ett piller som har samma färg, form, lukt och vikt etc. I pillret som personerna i experimentgruppen får ingår den aktiva substans man är intresserad av att utvärdera (t.ex. acetylsalicylsyra) men i pillret som personerna i kontrollgruppen får saknas denna substans. För att just förekomsten av acetylsalicylsyra verkligen ska vara det enda som skiljer grupperna åt, och inte till exempel olika förväntningar, är det viktigt att man använder sig av en så kallad dubbel-blind-design, det vill säga att varken undersökningsdelta13


1. Introduktion

gare eller undersökningsledare vid undersökningstillfället vet vem som har hamnat i vilken betingelse. Exempel 1:1 Vi vill ta reda på om könet hos en fiktiv brottsling påverkar det straff som tilldöms och vi börjar med att författa en liten berättelse som handlar om Martin som går in på Konsum, slår expediten i huvudet med en flaska för att sedan plocka åt sig alla pengarna i kassan och springa därifrån. Lyckligtvis fångas Martin kort därefter av polisen. Under vår berättelse, på samma sida, uppmanas undersökningsdeltagaren att med en siffra, 0–24, ange hur många månaders fängelse hen anser att Martin ska dömas till. Sedan författar vi en till beskrivning som i alla avseenden utom ett är identisk med den ovannämnda. Den enda skillnaden i den nya texten är att vi i stället för Martin har skrivit Martina. Vi kopierar upp Martin-texten i 20 exemplar och Martina-texten i 20 exemplar. Sedan blandar vi våra papper ordentligt och delar ut texterna till 40 undersökningsdeltagare (utan att titta på vem som får vilken version och utan att undersökningsdeltagarna kan se varandras texter). Om det sedan visar sig att de två grupperna skiljer sig åt när det gäller genomsnittligt tilldömt straff finns bara två möjliga förklaringar: 1) Slumpen åstadkom denna skillnad. Av en slump råkade vi exempelvis få lite strängare undersökningsdeltagare i den ena gruppen än i den andra, eller så kanske vi råkade få många fler brottsoffer i den ena gruppen än den andra. Sannolikheten för att en skillnad som den vi funnit ska uppkomma av en slump kan vi beräkna med inferentiell statistik (se kapitel 7). Om sannolikheten visar sig vara liten tror vi inte på slumphypotesen, utan föredrar i stället följande förklaring: 2) Att skillnaden beror på vår manipulation, nämligen att den ena berättelsen handlade om en man (Martin) och den andra om en kvinna (Martina).

Experiment kan göras på olika sätt, man kan ha fler än två grupper som man jämför, man kan ha en enfaktoriell eller en flerfaktoriell design (en eller flera OV), man kan göra ett laboratorieexperiment eller ett fältexperiment och man kan ha en mellanindividsdesign (olika personer för varje försöksbetingelse) eller en inomindividsdesign (samma individer deltar i alla försöksbetingelser). (En inomindividsdesign blir dock egentligen inget äkta experiment, 14


1. Introduktion

eftersom individerna inte randomiseras till de olika betingelserna.) Experimentet med Martin och Martina är ett exempel på en enfaktoriell mellanindividsdesign. Längre fram i boken kommer vi att återkomma till några av dessa undersökningsdesigner. Ibland, särskilt i kliniska sammanhang, kallas experiment för ”Randomized control trials”, vilket brukar förkortas ”RCT:er”.

Kvasi-experiment Ett kvasi-experiment kännetecknas av att man har kontroll över OV, men inte kan randomisera individer till betingelser. Att man inte kan randomisera får till följd att det kan finnas en annan, bakomliggande variabel, snarare än OV, som leder till effekter på BV. Säg exempelvis att vi vill jämföra undervisningsmetoderna A och B. Vi har redan en indelning i två grupper, en förmiddagsgrupp och en eftermiddagsgrupp. Grupperna har inte bildats genom randomisering, i stället har eleverna själva fått bestämma om de vill tillhöra förmiddagsgruppen eller eftermiddagsgruppen. Vi undervisar förmiddagsgruppen med metod A och eftermiddagsgruppen med metod B och efter en månad får alla eleverna göra en tenta. Sedan jämför vi grupperna på tentan och ser att de som blivit undervisade med metod A i genomsnitt har fått en betydligt högre poäng på tentan än de som blivit undervisade med metod B. Skillnaden är så stor att den rimligtvis inte kan bero på en slump. Men behöver detta betyda att det var OV (typ av undervisningsmetod) som gav upphov till skillnaderna i BV (tentapoäng)? Nej, en mycket möjlig alternativ förklaring kan vara att grupperna redan från början skilde sig åt i fråga om någon bakomliggande variabel. Att vissa elever valde att tillhöra eftermiddagsgruppen kanske exempelvis berodde på att de hade ett arbete vid sidan av sina studier (som de måste sköta på förmiddagen). Dessa elever har rimligen mindre tid till studier än andra och borde därför klara tentan sämre. Att grupperna redan från början kan vara olika när man gör kvasi-experiment gör att man ibland refererar till denna undersökningstyp som ”experiment med icke-ekvivalenta grupper” (medan ”riktiga” experiment kallas ”experiment med ekvivalenta grupper”). Att man trots det bakomliggande-variabel-problemet ändå ibland gör kvasi-experiment beror på att man inte har något alternativ. Detta illustreras av exempel 1:2 på nästa sida. 15


1. Introduktion

Exempel 1:2 Vi vill ta reda på om ökade öppettider på Systembolaget leder till ökad alkoholkonsumtion. Idealet vore om vi slumpmässigt kunde fördela folk till att bo i två olika städer som i alla avseenden är så lika varandra som möjligt men där man i den ena staden, men inte i den andra, fick ökade öppettider på Systembolaget. Tyvärr skulle nog knappast folk gå med på detta, så vi får nöja oss med den färdiga uppdelning av individer på städer som redan finns och göra ett kvasi-experiment i stället.

En vanlig variant av kvasi-experiment är en så kallad tidsseriedesign där man lägger till och drar ifrån den oberoende variabeln och samtidigt ser efter vad som händer med den beroende variabeln. Man kanske vill se om en sänkning av hastigheten på motorvägen leder till ett minskat antal trafikolyckor. Man börjar med att observera hur många trafikolyckor som inträffar på en viss motorväg under en viss tid, till exempel 100 dagar och med dagens hastighetsbegränsning (110 km/h). Sedan sänker man hastighetsbegränsningen till 90 km/h, väntar 100 dagar och ser hur många trafikolyckor som inträffat. Säg att vi noterar att antalet trafikolyckor sjunkit. Behöver detta bero på sänkningen av hastighetsbegränsningen? Nej, naturligtvis inte. Det skulle kunna vara en följd av en allmän minskning av antalet trafikolyckor, beroende på säkrare bilar, dyrare bensin, ökad användning av bilbälte etc. Så vi återställer hastighetsbegränsningen till 110, väntar 100 dagar och ser hur många trafikolyckor som nu inträffat. Säg att mängden trafikolyckor ökar tillbaka till ungefär samma nivå som vi hade från början. Då måste väl ändå variationen i antalet trafikolyckor kunna sägas bero på variationen i hastighetsbegränsningen? Njaee … Det är kanske troligt, men inte helt nödvändigt. Säg att det råkade bli så att de första 100 dagarna (med 110 km/h) vi observerade inträffade på vintern/våren, att nästa 100 dagar (med 90 km/h) inträffade på sommaren och att de senaste 100 dagarna (med 110 km/h) inträffade på hösten/vintern – ja, då skulle ju detta med årstid kunna vara en bakomliggande variabel till det observerade sambandet mellan OV och BV. För varje gång vi observerar att en förändring i OV åtföljs av en förändring i BV blir vi förstås mer och mer övertygade om att det verkligen är OV (och inget annat) som påverkar BV. Men helt säkra kan vi egentligen aldrig vara. 16


1. Introduktion

Icke-experiment Icke-experiment, eller korrelationsstudier som de ofta kallas, kännetecknas av att man varken har kontroll över OV eller kan randomisera individer till betingelser. Det enda vi kan göra är att observera ett eventuellt samband mellan en tänkt OV och en tänkt BV och att med olika, ofta mycket sofistikerade statistiska metoder, så gott det går försöka utesluta att det i själva verket handlar om 1) ett skensamband där någon annan, bakomliggande förväxlingsvariabel, kan förklara sambandet och att 2) riktningen för sambandet verkligen går från OV till BV och inte tvärtom. Men hur noga vi än är, kan vi aldrig nå upp till den säkerhet i slutsatsen att det verkligen var OV som påverkade BV som vi kan med ett äkta experiment. (Se nedan under avsnittet ”Intern validitet”.) Precis som när det gäller kvasi-experiment, är förklaringen till att man använder sig av en icke-experimentell undersökningsmetod i stället för ett (äkta) experiment, helt enkelt att man inte har något annat alternativ. Vi kan inte randomisera barn till olika uppväxtförhållanden för att försöka förstå vilka faktorer som påverkar ungdomskriminalitet. Vi kan inte randomisera folk till två grupper, där den ena gruppen får röka i 30 år och den andra gruppen inte får röka under 30 år för att ta reda på om rökning ökar risken för lungcancer. Förutom de etiska problem som skulle uppstå om man försökte sig på att undersöka en del fenomen experimentellt (t.ex. kriminalitet, lungcancer, självmord, depression, psykopati) så kan det också finnas ekonomiska och resursmässiga anledningar till att en experimentell design inte kan komma på fråga. Beteckningen icke-experiment kanske låter lite nedsättande men innan man fnyser alltför mycket ska man veta att de allra mest avancerade statistiska metoderna har utvecklats just för att användas i samband med icke-experimentella undersökningar. Det är också så att icke-experiment troligen är den vanligaste undersökningsmetoden inom många viktiga forskningsområden i psykologi (t.ex. personlighetspsykologi, utvecklingspsykologi samt arbets- och organisationspsykologi), men även inom andra ämnesområden såsom pedagogik, sociologi samt vård- och hälsovetenskap. Skillnaderna mellan experiment, kvasi-experiment och ickeexperiment sammanfattas i tabell 1:1 på nästa sida. 17


1. Introduktion

Tabell 1:1 Skillnaderna mellan experiment, kvasi-experiment och ickeexperiment.

Design

Kontroll av OV

Randomisering av individer till betingelser

Experiment Kvasi-experiment Icke-experiment

Ja Ja Nej

Ja Nej Nej

Undersökningens validitet Vad är det som avgör om man kan lita på slutsatserna som dras från en viss undersökning? Jo, det är om undersökningen har god eller dålig validitet (giltighet, relevans). När det gäller validiteten i en undersökning (till skillnad mot exempelvis validiteten hos en mätning) skiljer man i huvudsak mellan intern och extern validitet.

Intern validitet Intern validitet handlar om med vilken säkerhet vi kan lita på slutsatsen att det verkligen var OV (och ingenting annat) som påverkade BV, det vill säga att vi 1) kan dra slutsatser om ett orsakssamband och 2) i vilken riktning detta går: OV

BV

Som vi sett har experiment i allmänhet en mycket god intern validitet, kvasi-experiment har en något sämre intern validitet och icke-experiment har den sämsta interna validiteten. Det finns som vi har antytt ovan två hot mot den interna validiteten i en undersökning, riktningsproblemet och bakomliggandevariabel-problemet. Riktningsproblemet

Vad kom först, hönan eller ägget? Ja, det är denna fråga som riktningsproblemet handlar om. Med en psykologisk frågeställning skulle det kunna handla om huruvida det är humöret som påverkar prestationen eller prestationen som påverkar humöret, eller så skulle det kunna handla om huruvida det är utseendet som påverkar attraktiviteten eller om det är attraktiviteten som påverkar utseendet. Om man har kontroll över OV så kan man inte ha något rikt18


1. Introduktion

ningsproblem. Om det är vi som randomiserar folk till att få Aspirin eller sockerpiller så kan Aspirinet påverka huvudvärken, men huvudvärken kan knappast påverka Aspirinet. Så riktningsproblemet har man alltså varken vid experiment eller kvasi-experiment. Vid icke-experiment är riktningsproblemet ett allvarligt hot då man gör en tvärsnittsstudie, det vill säga då man undersöker OV och BV vid (ungefär) samma tillfälle. Till exempel kanske man noterar att ungdomar som ofta spelar våldsamma dataspel också oftare än andra är våldsamma i riktiga livet. Då är det ju svårt att veta om det är dataspelen som gjort dem våldsamma eller om det är våldsamma ungdomar som gärna spelar våldsamma dataspel. Gör man däremot en longitudinell studie, och följer folk över en längre tid, kan man bemästra riktningsproblemet. Det kan knappast vara kriminalitet vid vuxen ålder som påverkar vilka uppväxtförhållanden man haft som barn. Bakomliggande-variabel-problemet

Ponera att vi undersöker sambandet mellan elförbrukning och försäljning av varma jackor i en viss stad med ett icke-experiment. För varje vecka under ett helt år noterar vi dels hur många gigawattimmar el som förbrukats, dels hur många varma jackor som sålts. Vi kommer nog att finna att det råder ett positivt samband. Veckor som det förbrukats mycket el har det också sålts många varma jackor och veckor som det förbrukats lite el har det sålts färre varma jackor. Vad kan detta nu bero på? Kan det möjligtvis vara så att elförbrukningen påverkar jackförsäljningen? Nej, knappast. Här är antagligen den bakomliggande variabeln temperatur boven i dramat. Under varma veckor förbrukas lite el och få varma jackor säljs, men under kalla veckor förbrukas mycket el och många varma jackor säljs. Vi har alltså ett skensamband mellan en ”OV” och en ”BV” som egentligen förklaras av en bakomliggande variabel: Bakomliggande variabel

OV

BV

19


1. Introduktion

till exempel Temperatur

Elförbrukning

Varma jackor

Ett exempel på en vanlig bakomliggande variabel är människors ålder som i sin tur ofta är relaterad till andra saker i samhället. Under många år lagades hål i tänderna med en kvicksilverlegering som kallas amalgam. När man började misstänka att detta kanske inte var så nyttigt, började man studera amalgamets samverkan med olika hälsovariabler. Då gjorde man det förvånande fyndet att de som inte hade något amalgam alls i munnen hade en betydligt högre dödlighet än andra. Vad man hade missat var att det här var den äldsta åldersgruppen och att de hade löständer! Ett annat exempel på det bakomliggande-variabel-problemet är det som nämnts ovan i avsnittet om kvasi-experiment då vi ville jämföra två undervisningsmetoder på en förmiddagsgrupp och en eftermiddagsgrupp. Vi kanske får en skillnad mellan gruppernas resultat på en tenta och det ser därför ut som att undervisningsmetoden påverkar tentaresultatet, men det skulle mycket väl kunna vara den bakomliggande variabeln ”Hur mycket man jobbar vid sidan av studierna” som avgör både vilken grupp man hamnar i och hur bra det går på tentan. Bakomliggande-variabel-problemet hanteras med randomisering och kan alltså undvikas helt endast med hjälp av ett (äkta) experiment. Nu finns det emellertid sofistikerade statistiska metoder (t.ex. partiella korrelationer, se kapitel 6) med vars hjälp man kan pröva möjligheten att det är en viss bestämd variabel som kan sägas vara den bakomliggande variabeln till ett observerat samband. På så sätt kan man åtminstone beta av de mer uppenbara (och mätbara) möjliga bakomliggande variablerna till ett visst samband.

Extern validitet När man väl kommit fram till att undersökningen åtminstone har hyfsad intern validitet kan man gå vidare och fråga sig hur det står till med den externa validiteten. Den externa validiteten handlar om giltigheten i att göra generaliseringar från det samband mellan 20


1. Introduktion

OV och BV som man påvisat. Det finns framför allt tre typer av generaliseringar man vill kunna göra: generaliseringar till andra sätt att manipulera/mäta OV och BV, generaliseringar till andra miljöer eller tidpunkter än den använda och generaliseringar till andra individer än de undersökta. Vi ska nu titta närmare på dessa typer av generaliseringar. Generaliseringar till andra sätt att manipulera/mäta OV och BV

Säg att vi har en teori om att ”arousal” påverkar prestationsförmågan. ”Arousal” är ett ganska diffust begrepp, som möjligen skulle kunna översättas med ”vakenhetsgrad”, och man kan tänka sig ett oräkneligt antal olika metoder för att manipulera arousal i ett experiment. Likaså är ”prestationsförmåga” ett något diffust begrepp som i princip skulle kunna mätas på oändligt många sätt. För att göra ett experiment och pröva teorin behöver vi en metod för att manipulera arousal och något sätt att mäta prestationsförmåga. Säg att vi bestämmer oss för att manipulera arousal genom så kallat ”vitt brus” med ljudstyrkan 90 dB (hög arousal) respektive 30 dB (låg arousal) och randomiserar ett antal individer till respektive betingelse. Säg sedan att vi mäter prestationsförmåga genom att räkna hur många ord som börjar på bokstaven ”k” som deltagarna kan säga under en minut. Säg slutligen att vi finner att vår manipulation av OV ger påvisbara effekter på BV. Vi har gjort ett experiment och har god intern validitet och kan alltså med gott samvete påstå att det verkligen var OV (skillnaden mellan 90 och 30 dB vitt brus) som påverkade BV (antal sagda ord som börjar på ”k” under en minut). Men var det verkligen detta vi var ute efter? Nej, vi ville komma åt något mycket större, sambandet mellan ”arousal” och ”prestation”. Så frågan är i vilken utsträckning vi kan generalisera vårt samband från just de metoder för att manipulera/mäta OV och BV som vi använt oss av i vår undersökning. När det gäller OV, arousal, kan vi fråga oss om vi även skulle få en skillnad i prestation om vi använt oss av andra ljudstyrkor (till exempel 80 dB mot 40 dB). Skulle vi få en effekt även med så kallat ”skärt brus”. Fungerar det med en injektion med adrenalin i stället för kraftigt oväsen? Hur är det med otäcka bilder? Prestationsångest? Kaffe? Och när det gäller BV, prestationsförmåga, kan man undra om arousal även påverkar förmågan att under en minut komma på ord som 21


1. Introduktion

börjar på ”r”. Och hur är det med ord som slutar på ”a”? Påverkas förmågan att lösa enkla matematiska problem? Hur är det med svåra matematiska problem? Bilkörning? Kan vi ge goda argument för att resultatet i vår undersökning kan generaliseras till att gälla även för andra sätt att operationalisera1 OV och BV – då stärks den externa validiteten i undersökningen. Det bästa argumentet får man genom att kunna visa, med empiriska undersökningar där man verkligen prövar de olika operationaliseringarna, att man faktiskt får samma resultat. Generaliseringar till andra miljöer eller tidpunkter än den använda

Bara för att vi kan visa att folk beter sig på ett visst sätt i ett psykologiskt laboratorium behöver detta inte betyda att de beter sig på exakt samma sätt hemma hos sig, eller på sin arbetsplats, eller i tunnelbanan, eller på en fredag som på en måndag. Och bara för att vi lyckats visa att folk beter sig på ett visst sätt en viss dag då det regnade så är det inte säkert att de beter sig på samma sätt en annan dag då det är strålande solsken. Kan vi ge goda argument för att resultatet i vår undersökning kan generaliseras till att gälla även i andra miljöer än den undersökta – då stärks den externa validiteten i undersökningen. Det bästa argumentet får man återigen genom att kunna visa, med empiriska undersökningar, att man faktiskt får samma resultat i olika miljöer och vid olika tidpunkter. Generaliseringar till andra individer än de undersökta

Vi kanske har lyckats visa att OV påverkar BV för personer som anmält sig till försöket efter att ha läst en kortfattad annons i en morgontidning. Men skulle vi fått samma resultat om vi undersökt de personer som läste annonsen men inte anmälde sig? Hur är det med de som läser kvällstidningar, eller inte läser någon tidning alls? Skulle vi kanske till och med få samma samband mellan OV och BV om vi hade undersökt råttor i stället för människor? De möjligheter vi har att generalisera från den undersökta populationen till en annan population beror på hur pass allmängil1

Detta innebär, förenklat, proceduren att omforma mer eller mindre komplicerade begrepp till mätbara variabler (se under avsnittet ”Variabler” längre fram i detta kapitel).

22


1. Introduktion

tig den företeelse som vi undersökt kan tänkas vara. I vissa attitydundersökningar har vi antagligen mycket små möjligheter att generalisera våra resultat utanför den undersökta populationen, medan vi däremot kanske med fog skulle kunna generalisera vissa neurologiska fynd på en enda råtta till att gälla för populationen av alla människor. Kan vi ge goda argument för att resultatet i vår undersökning kan generaliseras till att gälla även i andra populationer än i den undersökta – då stärks den externa validiteten i undersökningen. Det bästa argumentet får man återigen genom att kunna visa, med empiriska undersökningar, att man faktiskt får samma resultat i olika populationer. Den allra första generaliseringen man gör är dock statistisk till sin natur, och den handlar om att generalisera från det undersökta stickprovet till den population som stickprovet dragits ifrån.

Population och urval Med population brukar man mena den, ofta mycket stora, mängd individer som man i undersökningen är intresserad att få veta någonting om. Det skulle exempelvis kunna vara så att populationen är den totala mängden av alla högskolestudenter i Sverige. Eftersom populationen är så stor har vi dock inga möjligheter att undersöka samtliga individer i populationen utan vi får i stället nöja oss med en delmängd, ett stickprov, av individer som vi dragit från populationen. Eftersom vi vill att stickprovet ska vara representativt för populationen kan vi dock inte välja vilka individer i populationen som ska få ingå i stickprovet på vilket sätt som helst. Vi kan till exempel inte nöja oss med att gå till psykologiska institutionen vid Stockholms universitet och fråga de som råkar vara där en viss dag om de vill delta i vår undersökning. Det duger inte heller att vi vänder oss till studentföreningen KBBÖT (Klockan är ju Bara Barnet – en Öl Till!) för att få adresser till dem som betalt årsavgiften. Om man funderar en stund kommer man att inse att alla systematiska metoder för att välja ut stickprovet innebär en risk för snedvridning av resultatet. Lösningen är därför att välja individerna till stickprovet osystematiskt, det vill säga helt slumpmässigt. Således är slumpmässigt urval den optimala metoden för att välja individer till sitt stickprov. 23


1. Introduktion

Men, kanske någon invänder, det är ju inte säkert att ens det slumpmässiga urvalet leder till ett representativt stickprov. Har vi otur kanske alla individerna i stickprovet råkar vara medlemmar i KBBÖT och de attityder till alkoholkonsumtion som vi får fram i vårt stickprov kommer då knappast att spegla de attityder som finns i populationen. Detta är alldeles sant. Det slumpmässiga urvalet är ingen garanti för att man ska få ett representativt stickprov. Men det fiffiga med slumpen är att man kan räkna ut hur den kan slå och det är precis detta som man har statistiken till. Med statistikens hjälp kan man beräkna exakt hur stor sannolikheten är för att man ska ha fått ett snedvridet stickprov och att någon egenskap hos stickprovet (t.ex. medelvärdet) ska avvika med ett visst antal enheter från motsvarande egenskap i populationen (se t.ex. kapitel 10 om konfidensintervall). Det finns ett antal olika sätt att skapa slumpmässiga stickprov. Vad man ska välja beror till exempel på sådana faktorer som vilken frågeställning man har, vilken undersökningsdesign man använder och vilka ekonomiska resurser som står till ens förfogande.

Den oändliga populationen Den population som man normalt, särskilt vid grundforskning, är intresserad av är oändligt stor och abstrakt. Ett exempel: Säg att vi vill veta det genomsnittliga antalet vita blodkroppar per kubikcentimeter blod som personer med en viss smittsam sjukdom har. Säg också att denna sjukdom är väldigt ovanlig och att det bara finns två personer i hela Sverige som lider av denna sjukdom. Vad är då populationen? Dessa två personer? Njaee … Det räcker knappast med att beräkna det genomsnittliga antalet vita blodkroppar för dessa två individer. Det räcker nog inte heller om vi undersöker alla personer på hela jorden som lider av denna sjukdom. För det vi är intresserade av är ju sjukdomen som sådan och inte bara just de personer som råkar ha blivit smittade av det aktuella viruset. Och populationen av alla människor som skulle kunna tänkas bli drabbade av sjukdomen är i princip oändligt stor. I denna bok, liksom i andra statistikböcker, beskrivs populationer och stickprov som mängder bestående av individer. Detta är i själva verket en förenkling. Statistik handlar om siffror och inte om människor (även om siffrorna kan användas till att dra slutsatser om människor). Så om vi exempelvis studerar intelligens skulle 24


1. Introduktion

populationen kunna bestå av mängden av alla intelligenskvoter som vi skulle få om vi testade alla barn i åldern 9–11 år med intelligenstestet Ravens matriser. Stickprovet kommer likaså att bestå av ett antal intelligenskvoter som på något sätt dragits från denna population.

Obundet slumpmässigt urval Den urvalsmetod som man vanligen tänker på när man talar om slumpmässiga urval är så kallat obundet slumpmässigt urval (förkortas ibland OSU). Detta går i princip till så att man slumpmässigt väljer det antal individer som man behöver för undersökningen ur sin urvalsram. Urvalsramen är den faktiska förteckning man har över individerna. Den bör i så stor utsträckning som möjligt motsvara hela den population man är intresserad av. I ett obundet slumpmässigt urval har alla individer samma sannolikhet att komma med i stickprovet.

Systematiskt urval Ett systematiskt urval brukar vanligtvis innebära att man ur sin urvalsram väljer enheter med någon viss periodicitet, till exempel var 100:e person. Det är ofta billigare och enklare att genomföra än ett OSU och fungerar lika bra under förutsättning att man har en bra urvalsram. Enda faran med ett systematiskt urval är om urvalsramen har någon viss periodicitet som sammanfaller med hur man väljer undersökningsdeltagarna. Om till exempel varannan individ i urvalsramen är man och varannan individ är kvinna, skulle ett systematiskt urval med var 100:e person bara ge kvinnor i stickprovet.

Stratifierat urval När det finns stora olikheter i viktiga bakgrundsvariabler kan stratifierat urval vara att föredra. Populationen delas då in i undergrupper, strata, med hjälp av sådana bakgrundsvariabler, stratifieringsvariabler, som ska vara viktiga för undersökningsvariablerna. Enskilda individer får inte förekomma i mer än ett stratum. När det väl har bestämts hur ens strata ska skapas, dras slumpmässiga stickprov ur varje stratum. Här kan sannolikheten för den enskilda individen att komma med i urvalet variera för olika strata, vilket man i så fall måste ta hänsyn till när statistiska beräkningar görs. 25


1. Introduktion

Om man exempelvis är intresserad av att studera mobbning i lågstadieskolor kanske man misstänker att storleken på skolan kan vara en viktig bakgrundsvariabel. I så fall skulle ett OSU troligtvis göra att alltför få elever från små skolor kom med i undersökningen. Man delar därför in populationen av alla lågstadieelever i sådana som går i 1) stora, 2) mellanstora, och 3) små skolor. Därefter skulle man slumpmässigt till exempel välja 5 % ur stratum 1 och 10 % ur stratum 2 och 25 % ur stratum 3. Uppenbarligen kommer enskilda individer att ha olika sannolikhet att komma med i stickprovet, och detta måste man hålla reda på när man utför vissa beräkningar.2 En fördel med metoden är att man får hög representativitet från olika undergrupper när populationen är mycket heterogen och att man kan erhålla data för dessa speciella undergrupper (strata). En nackdel är att även om tekniken är billigare än ett OSU är den ändå tidskrävande och relativt kostsam.

Klusterurval Klusterurval innebär ytterligare en förenkling och kostnadsbesparing jämfört med stratifierat urval. Ett kluster är en redan befintlig enhet som man kan använda för att dra ett slumpmässigt stickprov ur. Också vid klusterurval blir sannolikheten för enskilda individer att komma med i urvalet olika, vilket man måste hålla reda på när man utför sina beräkningar. I exemplet med mobbning i lågstadieskolor skulle man vid ett klusterurval slumpmässigt dra till exempel 3 skolor från de olika skolorna, sedan ett visst antal skolklasser och slutligen slumpmässigt dra ett visst antal elever ur varje klass som får ingå i undersökningen.

Bekvämlighetsurval När man ber vänner och bekanta, kollegor eller studenter ställa upp som undersökningsdeltagare brukar man ibland säga att man gör ett bekvämlighetsurval. Detta kan dock låta sämre än vad det

2

Om man exempelvis vill beräkna ett totalmedelvärde baserat på alla strata kan 1 L detta göras med formeln x = ∑ N i x i , där N är antalet individer i populationen, N i =1 Ni = antalet individer i stratum i, och L är totala antalet strata.

26


1. Introduktion

egentligen behöver vara. Kom ihåg det som sades ovan i avsnittet om extern validitet och generaliseringar till andra individer än de undersökta. Gör man en survey3-undersökning över attityder, såsom exempelvis svenskars inställning till primärvården, bör man i görligaste mån välja någon av ovanstående urvalsmetoder. Om däremot de fenomen man ska undersöka är mer allmängiltiga (exempelvis perceptuella illusioner, människors förmåga att förstå pengars värde, eller individers reaktioner på acetylsalicylsyra) är det kanske mindre viktigt vilka individer som ingår i undersökningen så länge de är tillräckligt representativa för det fenomen man undersöker. Faktum är att de allra flesta undersökningar som det berättas om i läroböcker som du läst under din utbildning bygger på något slags bekvämlighetsurval. Men får man verkligen göra så? Tanken är väl att vi ska dra ett representativt urval från populationen? Och hur kan ett bekvämlighetsurval vara representativt? Jo, vi får helt enkelt vända på resonemanget. Den population som vi kan generalisera till från vårt bekvämlighetsurval är helt enkelt den population som vi kan betrakta stickprovet som slumpmässigt draget från. Detta gör att det är ytterst viktigt att berätta för läsaren exakt hur man gick till väga för att få fram sitt bekvämlighetsurval.

Felkällor vid urval Övertäckning innebär att urvalsramen innehåller individer som inte ska ingå i populationen. Till exempel kan ungdomar fortfarande vara skrivna på sina föräldrars adress. Undertäckning innebär på motsvarande sätt att personer som borde ingå i populationen inte finns med i urvalsramen. Till exempel att nyinflyttade ännu inte finns med i registret. Urvalsfel kan uppstå om stickprovet inte är representativt. För slumpmässiga stickprov minskar urvalsfelet ju större stickprovet är. Bortfall är sådana personer som är utvalda till stickprovet men som man inte lyckas undersöka. Det är viktigt att försöka göra en bortfallsanalys. Detta innebär att man försöker redovisa det man trots allt ändå vet om de personer som inte svarat. Hur många var 3

En frågeformulärs-/intervjuundersökning som avser kartlägga exempelvis attityder, åsikter, vanor, intressen och liknande hos någon population.

27


1. Introduktion

det? Vilken könsfördelning hade de? Var de från något visst område? Någon speciell åldersgrupp? Om de som inte har undersökts skiljer sig från dem som har undersökts kan deras uteblivna svar innebära missad information som snedvrider resultatet och påverkar validiteten. Risken för sådant systematiskt bortfall är extra stor om det man undersöker kan uppfattas som känsligt eller är svårt för någon viss grupp att svara på. Till exempel att personer med alkoholproblem väljer att inte svara på en arbetsplatsenkät om alkoholvanor, eller att patienter som inte svarar på en patientenkät är sjukare än de som har svarat. Partiellt bortfall eller internt bortfall innebär att svar saknas på någon viss fråga i undersökningen. Detta kan till exempel bero på att just den frågan var känslig eller formulerad på ett svårbegripligt sätt. Genom att noga utarbeta och testa sitt frågeformulär innan man använder det kan man minska det partiella bortfallet.

Variabler och mätning Variabler Variation gör tillvaron intressant. Om det enda väder som fanns var solsken, vindstilla och 25 grader varmt skulle väl ingen människa prata om vädret. Vi skulle aldrig få höra kommentarer om vilket väder någon hade på semestern. Ingen skulle någonsin behöva undra om de skulle behöva ta på en extra tröja. Frågan: ”Skiner solen i dag?” är endast meningsfull om det finns en mängd tänkbara svar, det vill säga om det finns variation i svaren. Ett liknande resonemang gäller den stora variation som vi ser i människors egenskaper och beteenden. Med uttrycket variabel menar vi därför en egenskap vars variation vi är intresserade av att studera. Ofta innebär detta att man först behöver formulera en bra definition och eventuellt operationalisera variabeln så att den blir mätbar. Det kan också innebära att man behöver konstruera speciella mätinstrument för att genomföra mätningen, exempelvis ett IQ-test eller en blodtrycksmätare. Statistiska variabler kännetecknas av en viss slumpmässig variation. Denna variation kan till exempel bero på osäkerheten hos själva mätmetoden, men också på att det finns en sann variation i den egenskap vi mäter. Om vi mäter längden av en och samma 28


1. Introduktion

lyktstolpe flera gånger kommer vi att få lite olika värden beroende på hur noggrann vår mätmetod är. Om vi i stället mäter längden på en människa flera gånger kommer variationen också att bero på andra saker, exempelvis gravitationens inverkan som ju gör att vi är något kortare på kvällen än på morgonen. För en variabel som är ett resultat av ett rent slumpmässigt försök, som till exempel antal ”ögon” vid tärningskast, används ofta termen stokastisk variabel eller slumpvariabel. När man samlar in statistiska data gör man en form av mätning. Enligt några väldefinierade regler tilldelas tal till en storhet som är av intresse. För en fysiker kan denna storhet vara massan eller längden hos ett föremål, för en läkare kan det vara kroppstemperaturen hos en patient. Ett storhetsvärde, produkten av ett mätetal och en enhet, används för att beskriva en storhets storlek, till exempel säger man att ”längden på Elisabet är 167 cm” (egentligen 167 × 1 cm). Om en storhet är oföränderlig kallas den konstant (ett exempel på detta är ljusets hastighet i vakuum, 299 792 458 m/s), men om den kan anta olika värden är den en variabel och dess olika värden kallas variabelvärden. I den här boken kommer vi att använda versaler för variabelbeteckningar, till exempel X, och gemener för variabelvärdena, till exempel x. De flesta psykologiska variabler, som exempelvis intelligenskvot eller betyg, saknar enheter. Detta har gjort S.S. Stevens definition av mätning, ”att tilldela tal till objekt eller händelser enligt någon regel”, särskilt användbar inom psykologin och närbesläktade discipliner. Två något olika ämnesområden inom psykologin som hanterar mätning är psykometrin och psykofysiken. Inom samhällsvetenskaperna kallas resultatet av en mätning ofta en observation, och en uppsättning observationer av ett antal variabler är vad som utgör det totala insamlade statistiska datamaterialet. Man brukar skilja mellan kvalitativa och kvantitativa variabler. En kvalitativ variabel är icke-numerisk, och de olika variabelvärdena utgörs vanligen av ord. Vädertyp är ett exempel, och några olika variabelvärden är då solsken, mulet, regn och snö. Andra exempel på kvalitativa variabler är civilstånd, yrke och sjukdomssymptom. I statistikprogram ger man ofta sifferkoder till kvalitativa variabler. Man måste då komma ihåg att variablerna fortfarande är till naturen icke-numeriska och att de siffror man an29


1. Introduktion

vänder bara är etiketter och inte säger något om variabelvärdenas inbördes relation. Kön är ett annat exempel på en kvalitativ variabel, vanligen med de två variabelvärdena: man respektive kvinna, numera ibland med tillägget ”annat” eller ”obestämd”. Med bara två variabelvärden kallas den för en dikotom variabel och kodas ofta 0–1 eller 1–2. Kvantitativa variabler är till sin natur numeriska eftersom tilldelade numeriska mätvärden ger information om relationen mellan variabelvärdena. Ålder, kroppslängd, antal sjukdomssymptom, inkomst, antal studenter i klassrummet, kroppstemperaturen hos en patient är alla exempel på kvantitativa variabler. Dessa variabler kan i sin tur vara diskreta respektive kontinuerliga. En diskret variabel kan bara anta vissa värden (oftast heltalsvärden). Så fort vi räknar antal (frekvenser) av någonting är variabeln diskret. Antal studenter i klassrummet och antal sjukdomssymptom är exempel, liksom antal personer som tillfrisknade efter en viss behandling, men också antal poäng på ett visst test. En kontinuerlig kvantitativ variabel kan anta oändligt många värden inom ett visst intervall. Ålder, kroppslängd och temperatur är exempel på kontinuerliga variabler. Eftersom möjligheten till variation för en kontinuerlig variabel är oändlig finns aldrig två variabelvärden som är exakt desamma. Två individer är till exempel aldrig exakt lika långa, lika tunga, lika gamla. En konsekvens av detta är att variabelvärden för kontinuerliga variabler alltid är avrundade och beroende av hur noggrant man kan mäta variabeln. Rent praktiskt betyder skillnaden mellan en kontinuerlig och en diskret variabel att man måste se upp lite extra när man arbetar med diskreta variabler eftersom dessa inte kan anta alla tal på tallinjen. Det genomsnittliga antalet allergiska symptom hos personer med hösnuva kan visserligen anges med en decimal (säg 3,4 symptom), men ett sådant värde skulle inte kunna fungera som ett gränsvärde för att diagnostisera personer med hösnuva eftersom den enskilda individen antingen har eller inte har rinnande näsa, kliande ögon etc.

30


1. Introduktion

VARIABEL

Kvalitativ

Kvantitativ Diskret

Kontinuerlig

Figur 1:1 Variabelegenskaper. En kvalitativ variabel har icke-numeriska data (”ord”), en kvantitativ variabel har numeriska data (”tal”) och kan vara antingen diskret (antar bara vissa värden) eller kontinuerlig (kan anta alla värden).

Skaltyp/datanivå För att mäta något behövs ett mätinstrument med någon form av gradering, en ”skala”. Beroende dels på variabeln som mäts, dels på den använda skalan kan variabelvärdena som man får indelas i ett antal olika skaltyper eller datanivåer. De vanligaste skaltyperna är nominal-, ordinal-, intervall-, och kvotskala. Dessa ger data som benämns på motsvarande sätt. Uppdelningen grundar sig på vilken typ av matematiska transformeringar som är möjliga för en viss datatyp och gjordes ursprungligen av S.S. Stevens (se Stevens 1975). Nominalskala

Variabelvärdena på en nominalskala kan bara namnges och grupperas. Eftersom det inte är meningsfullt att tala om något inbördes förhållande mellan variabelvärdena är detta inte en skala i egentlig mening. När siffror används utgör dessa bara bekväma etiketter som inte har mer mening än vad bokstäver eller färgsymboler exempelvis skulle ha. Hit hör de kvalitativa variablerna. Exempel är Kön och Civilstånd. Ordinalskala

Variabelvärdena på en ordinalskala kan rangordnas. Ett variabelvärde kan alltså vara större eller mindre än ett annat men det finns ingen matematisk information om hur mycket större eller mindre. Exempel är Placering i en tävling och Betyg (G/VG/MVG). Om 31


1. Introduktion

skalstegen tilldelas siffervärden måste man se upp eftersom hur stora skillnaderna ”egentligen” är, måste betraktas som okända. Om man tilldelar betygsskalan sifferkoderna G = 1, VG = 2 och MVG = 3, så gäller att 3 > 2 > 1 eftersom MVG > VG > G. Däremot gäller inte att 3 – 2 egentligen är lika med 2 – 1 eftersom man inte kan säga att MVG – VG = VG – G. Det betyder faktiskt att det skulle vara precis lika rätt att använda helt andra värden än 1, 2, 3, så länge som rangordningen bevaras, till exempel 2, 7, 18. Vanliga så kallade kategoriskalor med uttryck av typen aldrig/sällan/ ibland/ofta/alltid, liksom svag/måttlig/stark, räknas också hit. Intervallskala

På en intervallskala är dessutom avstånden mellan skalstegen lika stora (det råder ekvidistans, lika steg). Minusvärden kan förekomma, men även om siffran noll kan finnas på skalan finns ingen absolut nollpunkt. Exempel är Celsius för temperatur och fysiologiska GSR-mätningar (för galvanisk hudrespons som används vid mätning av känsloreaktioner). Borg RPE-skalan® (för skattning av upplevd ansträngning) räknas också hit genom sin speciella konstruktion (Borg 1998). Detsamma gäller många andra psykologiska skalor (även om det inte är självklart utan beror på hur mätinstrumentet är konstruerat). Med intervalldata kan man beräkna differenser. Det är till exempel samma skillnad (fysikaliskt) mellan 80 °C och 90 °C som mellan 10 °C och 20 °C. Matematiskt är det tillåtet att multiplicera intervalldata med en konstant och även addera en konstant. Genom att multiplicera antal grader Celsius med 1,8 och lägga till 32 kan man gå över till Fahrenheit, och skillnaden mellan 176 °F och 194 °F är också densamma som mellan 50 °F och 68 °F. Eftersom det inte finns någon absolut nollpunkt blir det däremot inte meningsfullt att tala om kvoter. Det innebär att 10 °C inte är hälften av 20 °C, vilket man kan förstå när man ser vad kvoten mellan motsvarande temperaturer i Fahrenheit blir (räkna gärna).

32


1. Introduktion

Kvotskala 0

På en kvotskala råder ekvidistans och det finns även en absolut nollpunkt, det vill säga den totala frånvaron av det jag är intresserad av att mäta. De flesta fysikaliska skalorna är kvotskalor, såsom kilogram för massa, meter för avstånd, eller kelvin för temperatur. Med kvotdata blir det meningsfullt att beräkna kvoter och relationer. Till exempel är 20 kg dubbelt så mycket som 10 kg, 4 dl är dubbelt så mycket som 2 dl, och det är ungefär dubbelt så långt mellan Stockholm och Jönköping som mellan Halmstad och Göteborg. Den enda matematiskt tillåtna operationen när man omvandlar data mellan kvotskalor är att multiplicera med en konstant – till exempel med 3,28 för att gå från meter till engelsk fot (längden 1,67 m är lika lång även om den anges som 5,48 fot). Inom psykologi och medicin är det vanligt med olika typer av frågeformulär för diagnostik. De skattningsskalor som då ingår för intensitetsmätning är av varierande kvalitet och ger data som ofta ligger någonstans mellan ordinaldata och intervalldata. Ett exempel är VAS – Visuell Analog Skala – som används flitigt inom sjukvården. Den utgörs vanligen av en 1 decimeter lång linje med en nedre och en övre förankringspunkt, till exempel ”Ingen alls” och ”Värsta tänkbara”. Patienten ombeds göra sin skattning genom att sätta ett streck på linjen. De som utarbetade VAS hävdade att den ger kvotdata, men det har senare ifrågasatts och en del menar att man endast får ordinaldata med VAS. Ett annat vanligt exempel är så kallade Likert-skalor ofta med till exempel 5 eller 7 kryssrutor, med eller utan språkliga etiketter (Likert 1932). Under vissa förutsättningar, bland annat beroende på val av språkliga etiketter, kan sådana skalor ge intervalldata. Men oftare får man nog, tyvärr, endast ordinaldata. Vissa statistiker har en mycket sträng syn på vikten av att låta datanivån styra vilken statistisk metod man använder. Andra menar att en alltför sträng syn medför att man riskerar att förlora värdefull information från data. Varje användare av ett mätinstrument måste naturligtvis själv ta ställning till på vilken datanivå man anser att data befinner sig och använda de statistiska analysmetoder som man anser lämpliga. Ibland är det egenskaper hos variabeln som avgör på vilken datanivå data kan erhållas, men oftare är det begränsningar hos 33


1. Introduktion

det använda mätinstrumentet. Konsekvenserna av det här för mätning av subjektiva variabler skulle man kunna skriva en hel bok om, men vi ska försöka att illustrera problemet lite kortfattat i alla fall. Låt säga att vi är intresserade av att försöka mäta en psykologisk variabel som exempelvis Ångest4. Som många andra psykologiska tillstånd är ångest någonting komplext och flerdimensionellt och för att få en bra mätning på en individs ångest räcker det troligen inte att be personen göra en skattning av sin ångest på en skala från 1 till 5. Säg att vi kommer fram till att personer som känner ångest är överdrivet oroliga, retliga och ängsliga, och går omkring med en känsla av att de är rädda för att något hemskt ska hända. Säg att jag sätter ihop ett mätinstrument som ser ut så här och där varje delfråga besvaras med en Likert-skala från 0 till 3 poäng: Hur bra har följande påståenden passat in på dig de senaste två veckorna? 1. Jag har känt mig orolig [ ] Stämmer inte alls [ ] Stämmer något [ ] Stämmer ganska mycket [ ] Stämmer fullständigt 2. Jag har varit extra retlig [ ] Stämmer inte alls [ ] Stämmer något [ ] Stämmer ganska mycket [ ] Stämmer fullständigt 3. Jag har känt mig mycket ängslig för olika saker [ ] Stämmer inte alls [ ] Stämmer något [ ] Stämmer ganska mycket [ ] Stämmer fullständigt 4. Jag har varit rädd för att något hemskt ska hända [ ] Stämmer inte alls [ ] Stämmer något [ ] Stämmer ganska mycket [ ] Stämmer fullständigt 4

Det finns flera olika ångestsyndrom. Exemplet här är förenklat för att illustrera mätproblematiken. Den som är intresserad av ångestproblematiken som sådan bör vända sig till DSM-5.

34


1. Introduktion

Om vi använder värdena 0 – 3 för skalstegen, så skulle det här mätinstrumentet ge en poäng för ångest som kan variera mellan 0 och 12 poäng. Låt oss nu analysera det här mätinstrumentet lite grann. Det finns nämligen ett par egenskaper som komplicerar hur vi ska tolka svaren som vi kan få från ett sådant formulär. Vi börjar med att titta på själva svarsskalan: [ 0 ] Stämmer inte alls [ 1 ] Stämmer något [ 2 ] Stämmer ganska mycket [ 3 ] Stämmer fullständigt Först kan vi väl fundera över valet av språkliga ankare. Varför har man valt just dessa ankare? Svarsskalan kunde kanske ha sett ut så här i stället? [ 0 ] Stämmer inte alls [ 1 ] Stämmer ganska lite [ 2 ] Stämmer något [ 3 ] Stämmer fullständigt I så fall skulle plötsligt 2 betyda samma sak som 1 gjorde alldeles nyss! Om hela mätinstrumentet i stället använde den här svarsskalan så skulle 4 poäng med den första svarsskalan i värsta fall kunna motsvara 8 poäng med den andra! De språkliga ankare man har på svarsskalan påverkar alltså innebörden i skalvärdena och måste väljas noggrant och med eftertanke. Så vilken typ av data får man då med den här sortens svarsskala? Är det kvotdata? Det kan vara lätt att tänka att eftersom den börjar på noll (0) som motsvarar ”inget alls” av det man mäter så måste det vara kvotdata. Men för att det ska vara kvotdata så ska 2 enheter av det man mäter vara dubbelt så mycket som 1 enhet, 4 vara dubbelt så mycket som 2 och så vidare. Den som svarar 2 på fråga 1 ska alltså vara dubbelt så orolig som den som svarar 1 på den frågan. Och den som har fått 10 poäng totalt ska ha dubbelt så mycket ångest som den som har fått 5 poäng. Och det vet vi faktiskt ingenting om. Ger skalan intervalldata då? Tja, för att det ska vara sant ska det vara lika mycket mer ångest mellan skalsteg 2 och 3, som mellan 1 och 2, och mellan 0 och 1. Men på grund av att vi inte vet vad de 35


1. Introduktion

sanna numeriska relationerna är mellan de språkliga ankarna som finns på svarsskalan så vet vi inte det heller. Alltså återstår ordinaldata. För faktum är att det enda vi helt säkert kan säga om ångesten hos en person som använder den här svarsskalan är att ”Stämmer fullständigt” innebär mer ångest än ”Stämmer ganska mycket” som innebär mer ångest än ”Stämmer något” som i sin tur innebär mer ångest än ”Stämmer inte alls”. Det betyder också att det skulle vara precis lika rätt att använda andra värden än 0 – 3 som ersättning för de fyra kategorierna. Kanske så här? [ 1 ] Stämmer inte alls [ 3 ] Stämmer något [ 6 ] Stämmer ganska mycket [10] Stämmer fullständigt Men om vi tar bort alla språkliga ankare utom det första och det sista då? Ja, då borde vi faktiskt kunna säga att vi har åtminstone intervalldata för varje enskild fråga. (Och egentligen bör man ha några fler skalsteg, gärna minst 7.) [ 0 ] Stämmer inte alls [1] [2] [ 3 ] Stämmer fullständigt Men för att hela mätinstrumentet ska ge intervalldata så behöver även de olika delfrågorna bidra till mätningen av ångest på ett sätt som gör att två personer som båda har fått exempelvis 9 poäng på skalan har lika mycket ångest (om man räknar bort att personer svarar ”fel” för att de tolkar sig själva och skattningsskalan olika, skattningsbeteende, social önskvärdhet och annat). Det kan delfrågorna göra på två sätt: antingen genom att vara helt likvärdiga i hur de bidrar till ångest så att en 2:a betyder ett lika stort tillskott av ångest för varje delfråga; eller genom att varje delfråga bidrar till att mäta ångest på samma sätt för alla individer så att även om exempelvis en 3:a på fråga 1 betyder mindre ångest än en 3:a på fråga 4, så är detta förhållande detsamma för alla individer. Av det här exemplet kan man kanske misstänka att många kliniska mätinstrument och psykoloiska test egentligen inte ger mer än ordinaldata. Det i sin tur betyder att det enda man säkert kan 36


1. Introduktion

säga med hjälp av resultatet från dessa är om en individ har mer eller mindre av den uppmätta egenskapen än en annan. Ändå görs ofta ett antagande om att man får intervalldata med dessa mätskalor och de statistiska analyser man vanligen använder bygger på det antagandet. Enligt vår kännedom har ingen hittills försökt sig på att uppskatta hur stora konsekvenser den här approximationen kan ha på data eller på de slutsatser som dragits. Om man bara är intresserad av att exempelvis studera om det finns en skillnad mellan två grupper i någon egenskap tror vi inte att konsekvensen blir så stor att man skulle komma till en helt annan slutsats, däremot är det troligt att uppskattningen av hur stor en viss effekt är kan påverkas. Säg exempelvis att vi vill undersöka om en viss terapi mot ångest fungerar. En grupp personer med ångest får behandling med terapin och vi finner att de efter behandlingen i genomsnitt har sänkt sin ångest med 3 poäng på skalan. Men vad betyder det egentligen? Vi kan säga att de i genomsnitt har fått mindre ångest än de hade innan och att terapin därför troligen fungerar, men vi vet ingenting om hur stor själva behandlingseffekten är. Och ännu mer problematiskt blir det om vi vill jämföra behandlingseffekter mellan olika grupper. Säg att vi vill jämföra behandlingseffekten för en grupp med stark ångest med en grupp med medelstark ångest. Vi finner att gruppen med stark ångest sänker sin ångest med i genomsnitt 5 poäng och att gruppen med medelstark ångest sänker sin ångest med i genomsnitt 2 poäng. Kan vi då säga att terapin fungerar bättre för personer med stark ångest än för personer med medelstark ångest? Nej, för en skillnad på 1 poäng på en viss del av skalan betyder kanske något helt annat än 1 poängs skillnad på en annan del av skalan.

Mätteori De tal som vi bearbetar med statistiska metoder har vi fått genom att göra mätningar. Vi har till exempel mätt ett antal individers attityd i en viss fråga, deras reaktionstid, vikt, längd, ålder, blodtryck, kroppstemperatur, hudmotstånd, intelligens, prestation, årsinkomst eller vad det nu kan vara för något. För att undersökningen ska vara meningsfull är det av grundläggande betydelse att mätinstrumentet man använt är av god kvalitet, och går att lita på. Vad är det då som avgör om man kan lita på ett mätinstrument? Jo, det är mätinstrumentets reliabilitet och validitet. Vi kommer att 37


1. Introduktion

titta närmare på dessa begrepp i kapitel 9 och vi nöjer oss här med en kort översikt.

Reliabilitet Ponera att Jocke vill veta hur lång han är. Till sitt förfogande har han ett mycket elastiskt måttband. Han ställer sig mot väggen och försöker med måttbandet mäta sin längd. ”183 cm” avläser han. Nu tycker han detta låter väldigt lite, han trodde han var längre än så. Därför gör han om proceduren: Han ställer sig mot väggen och försöker mäta sin längd en gång till. Nu avläser han ”214 cm”. Detta var underligt, nog är jag rätt lång, men såå lång är jag väl inte, tänker han och mäter sig själv en gång till. Denna gång säger måttbandet att han är 191 cm. Han gör ytterligare ett försök och nu blev det ”203 cm”. Jocke inser nu att även om han mäter en och samma sak med det här gummisnoddsmåttbandet så kommer han få olika resultat, lite hipp som happ, från gång till annan. Han drar därför slutsatsen att gummisnoddsmåttbandet har mycket låg reliabilitet. Reliabilitet handlar alltså om hur mycket slumpen kan förvränga resultatet, än hit och än dit. Jocke slänger ifrån sig gummisnoddsmåttbandet och plockar i stället fram ett gammalt hederligt stålmåttband. Han ställer sig mot väggen och avläser ”195,6 cm”. Vis av erfarenhet från mätningarna med gummisnoddsmåttbandet gör han ett nytt försök. Denna gång avläser han ”195,4 cm”. Upprepade mätningar visar att resultatet faktiskt varierar även med stålmåttbandet, dock mycket mindre än förut. Slumpen har tydligen inte samma möjlighet att påverka resultatet nu och han drar slutsatsen att stålmåttbandet är ett mätinstrument med mycket hög reliabilitet.

Validitet Nöjd med att måttbandet visade sig ha så hög reliabilitet bestämmer han sig för att passa på att använda det för att mäta lite andra saker än längd, som exempelvis vikt. Skulle han göra på det sättet skulle han ha ett mätinstrument med mycket låg validitet. I detta sammanhang vore en personvåg ett mätinstrument med hög validitet. Så validitet hos mätinstrumentet handlar alltså om att man verkligen mäter det man avser att mäta. Finns det empiriska belägg för att mätinstrumentet verkligen mäter det som det avser att mäta har mätinstrumentet god validitet, annars inte. 38


1. Introduktion

Reliabiliteten är förhållandevis lätt att uppskatta, och till och med att kvantifiera. Däremot är validiteten betydligt mer problematisk (men kanske just därför mer intressant), särskilt om det handlar om mätning av psykologiska attribut (t.ex. introversion, intelligens, intolerans mot tvetydighet).

Överkurs Psykofysisk skalning5 Inom psykologin finns ett område som kallas psykofysik, där man bland annat fokuserat på att beskriva relationen mellan den värld vi upplever med våra sinnen och den fysikaliskt mätbara. Man har i det sammanhanget utvecklat mätmetoder för detektion (finns något där?), identifikation (vad finns där?), diskrimination (finns det en skillnad?) och skalning (hur mycket finns det där?). Med psykofysisk skalning har man till exempel funnit att den upplevda intensiteten av något oftast inte ökar på samma sätt som den fysikaliska intensiteten. Låt oss illustrera detta med två exempel: Tänk dig att du sitter skönt tillbakalutad i en fåtölj framför tv:n en januarikväll när det plötsligt blir strömavbrott. Efter en stunds fumlande lyckas du ta dig fram till middagsbordet där adventsljusstaken står kvar. Eftersom du endast är så där lagom ordentlig ligger det som tur är en tändsticksask och skräpar precis intill. Du tänder det första ljuset och det lyser upp rummet ganska bra. Du tänder ett till och det blir lite ljusare. Du tänder ytterligare ett och märker fortfarande att ljuset i rummet ökar. Men när du tänder det sista ljuset blir det inte så väldigt mycket ljusare längre. Tänk dig nu att en god vän till dig, en psykofysiker, också befinner sig i rummet – vi kan kalla honom docent Skalman. När du tänt det första ljuset ber han dig att göra en bedömning av ljusintensiteten och att kalla din upplevelse för ett tal, vilket du vill. Du hugger till med ”10” (som du tycker känns jämnt och bra). När du tänder nästa ljus ber han dig att ange ett tal som motsvarar din upplevelse av den nya ljusintensiteten så du säger ”12,5”. För nästa ljus säger du ”14” och för det sista ”15”. Detta betyder att du upplever ljusstyrkan från 4 ljus som ungefär 1,5 gånger ljusare än den från endast ett ljus. Nu till det andra exemplet. Har du spelat bowling någon gång? Kanske vet du i alla fall på ett ungefär hur tungt ett bowlingklot är? Föreställ dig att du, docent Skalman och några andra kamrater just har avslutat ett bowlingpass. Docent Skalman ber dig nu (förtjust) göra bedömningar av tyngden på bowlingkloten. Eftersom talet tio fungerade bra förra gången så väljer du ”10” för tyngden av det första klotet. Docent Skalman lägger i ett klot till i sin sportbag och, kanske lite förvånad, säger du nu ”30”, ytterligare ett klot och 5

Du kan behöva läsa avsnittet om diagram (kapitel 2) innan du läser det här avsnittet.

39


1. Introduktion

20

100

15

80

Upplevd tyngd

Upplevd ljusstyrka

du säger ”60” och fyra klot orkar du nästan inte lyfta så med ett lätt stönande och en ilsken blick på din vän säger du nu ”100”. Du upplever nämligen tyngden av fyra lika tunga klot som ungefär 10 gånger tyngre än ett klot. Om relationen mellan dina skattningar och antalet ljus respektive antalet klot beskrivs i var sitt diagram, skulle dessa kunna se ut som i figur 1:2.

10 5 0

0

1

2 Antal ljus

3

4

60 40 20 0

0

1

2 Antal klot

3

4

Figur 1:2 Upplevelsen av ljusstyrka som funktion av antalet ljus (vänster) och antalet klot (höger).

Med den enkla metod som docent Skalman använde (och som kallas för magnitudestimation) får man faktiskt kvotdata (i alla fall i teorin). Det finns en absolut nollpunkt (under vilken ingen upplevelse är möjlig) och – förutsatt att du klarade av att använda siffror proportionellt mot din inre upplevelse – kvoter kan bildas (tre klot var ungefär dubbelt så tungt som två klot). Den stränge statistikern säger kanske att eftersom man inte kan vara säker på att varje individ verkligen klarar av att hantera siffror på det sättet (och därom tvistar de lärde) och därför endast kan vara säker på att personens siffersvar visar att det blir ljusare för varje ljus respektive tyngre för varje klot, så måste man nöja sig med att använda dessa data som om de vore ordinaldata. Men ta en titt på sambanden i figur 1:2 och säg om du inte också tycker att det vore synd att bara kasta bort den extra information som antagandet om kvotdata ändå möjliggör. Tänk så användbart för en ingenjör som ska planera för lämplig belysning i en arbetslokal, eller för en ergonom som ska avgöra när en belastning uppnår en risknivå. (Se avsnitt ”Överkurs” i kapitel 15 under funktion IV. Potensfunktion). Inom psykologin används ofta så kallade kategoriskalor av typen 1 2 3 4 5 6 7

Extremt svag Mycket svag Svag Måttlig Stark Mycket stark Extremt stark

En sådan skala är ett exempel på en ordinalskala. Det finns ingen nollpunkt på skalan och det finns egentligen ingenting som säger hur stora avstånden mellan uttrycken är. Kategoriskalor har ändå vissa klara fördelar genom att 40


1. Introduktion

de ger en möjlighet att studera nivåer. Inför en höftledsoperation är det till exempel viktigt att veta om patientens smärta är ”Stark” eller ”Extremt stark”. Docent Skalman visar den här skalan för två av dina kamrater och ber sedan dessa (Johanna som är väldigt stark och Olivia som är ganska svag) att bedöma hur tungt de tycker att ett bowlingklot är. Johanna ger skattningen 3 och Olivia säger 5. Olivia upplever alltså att klotet är tyngre än vad Johanna gör men eftersom detta endast är en ordinalskala säger Olivias skattning ingenting om hur mycket tyngre hon anser att klotet är. Genom att kombinera dessa två typer av skattningsmetoder så att en harmoni erhålls mellan siffror och ord har så kallade Kategori-Kvot-skalor utvecklats. Ett sådant exempel är Borg centiMax-skalan® (CR100), se figur 1:3 nedan. Några viktiga principer till grund vid utvecklingen av den här skalan har varit: 1) dess numeriska variationsområde, sifferskalan, har valts för att täcka hela det perceptuella variationsområdet från min till max oavsett vad som studeras; 2) att få kvotdata (i analogi med vad man får med magnitudestimation); 3) att välja ord till skalan som människor är så överens om som möjligt när det gäller deras ”numeriska” betydelse; 4) att placera orden där de numeriskt ”hör hemma” på en kvotskala; 5) tak- och golveffekter i skattningarna ska kunna undvikas; 6) Gunnar Borgs så kallade ”Range-modell” som gör det möjligt att göra jämförelser mellan individer och som gör att man kan mena att ”centiMax” (cM) blir en enhet för upplevelseintensitet (Se G. Borg & E. Borg 2001; E. Borg 2007). Ett annat exempel är Borg CR10skalan® (G. Borg 1998). Med en god instruktion kan data från dessa skalor behandlas som kvotdata samtidigt som man har kvar fördelarna med nivåuttrycken.

Figur 1:3 Borg centiMax Scale® (Borg CR Scale®, CR100). © Gunnar Borg & Elisabet Borg, 2001, 2007, 2017 Swedish.

41


1. Introduktion

࿹ Sammanfattning Nedan följer en sammanfattning av några av de viktigare begreppen i kapitlet. Kvalitativ metod

Data, ofta i form av språkliga enheter. Bearbetningen är beskrivande och kategoriserande.

Kvantitativ metod Insamling av siffermässiga data. Bearbetningen är matematisk/statistisk. Undersökningsdesign

Försöksupplägg.

Deskriptiv, explorativ

Syftet med undersökningen är endast att beskriva, kartlägga och utforska världen.

Hypotesprövande, Syftet med undersökningen är att förstå meexplanativ kanismer och orsakssamband. Oberoende variabel (OV)

Den variabel som kan ses som en orsak till något. I ett experiment är det den variabel som man manipulerar.

Beroende variabel Den variabel som kan ses som påverkad av (BV) den oberoende variabeln, eller som mäts som en effekt av den manipulation man har gjort.

42

Experiment

Kännetecknas av kontroll över OV och randomisering av undersökningsdeltagare till betingelser.

Kvasi-experiment

Kännetecknas av kontroll över OV men ingen randomisering av undersökningsdeltagare till betingelser.

Icke-experiment

Så kallade korrelationsstudier. Varken kontroll över OV eller randomisering av individer till betingelser.

Undersökningens validitet

I vilken utsträckning man kan lita på slutsatserna från undersökningen.

Intern validitet

Handlar om att man verkligen kan lita på att det var OV och ingenting annat som påverkade BV. Riktningsproblemet och bakomliggande-variabel-problemet måste beaktas.


1. Introduktion

Extern validitet

Handlar om giltigheten i att göra generaliseringar från det samband mellan OV och BV som påvisats. Dels till andra sätt att mäta OV och BV, dels till andra miljöer, dels till andra individer än de undersökta.

Urvalsmetoder

Speciellt vid större frågeformulärsundersökningar (surveyer) är det viktigt att man är noggrann med hur man slumpmässigt väljer undersökningsdeltagare till stickprovet.

Mätdata

Uppmätta variabelvärden.

Mätinstrumentets Handlar om hur pålitligt instrumentet är för reliabilitet att mäta det som det avser att mäta. Hur litet det påverkas av slumpmässiga fel. Mätinstrumentets Handlar om huruvida instrumentet verkligen validitet mäter det som det ska mäta. Dess giltighet. Variabel

En mätbar egenskap vars variation kan studeras. En variabel antar ett antal variabelvärden. Mängden av uppmätta variabelvärden kallas värdemängd.

Dikotom

Kan endast anta två värden.

Kvalitativ

Icke-numerisk, till exempel en variabel vars variabelvärden uttrycks med ord.

Kvantitativ

Numerisk, till exempel en variabel vars variabelvärden uttrycks med siffror.

Diskret

Sägs om en variabel som bara kan anta vissa värden, till exempel heltalsvärden.

Kontinuerlig

Sägs om en variabel som kan anta alla värden inom ett intervall.

Nominaldata

Gäller för kvalitativa variabelvärden som endast kan grupperas.

Ordinaldata

Gäller för variabler som är uppmätta med en ordinalskala och vilkas variabelvärden endast kan rangordnas.

43


1. Introduktion

Intervalldata

Gäller för variabler som är uppmätta med en intervallskala och vilkas variabelvärden har lika stora steg, men ingen absolut nollpunkt.

Kvotdata

Gäller för variabler som är uppmätta med en kvotskala och vilkas variabelvärden har lika stora steg samt en absolut nollpunkt.

ཝ Övningsuppgifter 1.

Vid en läkarundersökning av samtliga anställda vid Sony Ericsson i Kista samlades mätdata in på nedanstående variabler: {Personnummer, Namn, Kön, Civilstånd, Antal barn, Befattning, Avdelning, Längd, Vikt, Blodtryck}. a) Vilka är kvalitativa respektive kvantitativa? b) Vilka är kontinuerliga respektive diskreta? c) Vilken datanivå kan man förvänta sig mätdata på?

2.

Ange datatyp för nedanstående variabelvärden. a) x = {barn, ungdom, ung vuxen} b) y = {3; 7; 12; 18; 3; 22; 9; 5; 24} år c) Vikt = {52; 61; 57; 71; 63; 59; 58; 65} kg d) Yrke = {målare; snickare; mattläggare; elektriker; rörmokare} e) Placering = {1:a plats; 3:e plats; 8:e plats; 5:e plats; 14:e plats}

3.

Vilken datatyp har variabelvärdena i tabellen? Kön Man Kvinna

44

Antal 32 14

Ålder (år) Inkomst (TKr) 37,4 280 46,3 208


1. Introduktion

4.

Kroppstemperatur (T) är en kontinuerlig variabel. Vilka värden ingår i ett intervall som matematiskt beskrivs så här: a) 37 °C ≤ t b) t < 42 °C

5.

Antal mål som en fotbollsspelare kan hinna göra under en match är en diskret variabel. Vilka värden ingår i intervallet 5 ≤ antal mål < 9?

6.

Magister Larsson har delat ut en tenta i psykologi. Hur kan den konstrueras så att poängsättningen kan göras på a) Ordinaldatanivå? b) Kvotdatanivå?

7.

Petter kom hem och klagade över huvudvärk. Eftersom det var influensatider tog hans mamma tempen på både honom och hans två yngre systrar, Lisa och Hedvig. a) Petter hade den högsta temperaturen, därefter kom Hedvig och sist Lisa. På vilken datanivå ligger denna beskrivning? Hur kan den uttryckas matematiskt? b) På vilken datanivå har mätningarna gjorts om Petter hade 38,7 °C, Lisa 36,7 °C och Hedvig 37,2 °C? Vad kan sägas matematiskt om relationerna mellan deras kroppstemperaturer?

45


2. Grafisk redovisning: tabeller och diagram 105

Medelvärde, IQ

104 103 102 101 100

Pojkar

Flickor

Figur 2:1 Genomsnittlig IQ för 10 pojkar och 10 flickor slumpmässigt utvalda bland elever i årskurs 9 i en Stockholmsskola. Vad är problematiskt med diagrammet?

När ett statistiskt material är omfattande, är det ofta lämpligt att sammanställa det i en tabell eller ett diagram. Dessa bör förtydliga och underlätta läsningen och hjälpa läsaren att förstå slutsatserna. Vilken typ av tabell eller diagram man väljer beror på vilka data som redovisas och vilka statistiska mått som beräknats, men varierar också en del mellan olika ämnesområden. En vetenskaplig artikel kräver dessutom ett presentationssätt, en Powerpoint-presentation ett annat. Statistiska tabeller brukar förses med en förklarande tabelltext ovanför tabellen. Själva tabellen består överst av ett tabellhuvud och därunder av en tabellkropp. I huvudet skriver man vanligen namnet på variabeln/variablerna och vilket statistiskt mått som beräknats. I kroppen anges värdena. Vanligen förekommer inte några lodräta linjer i tabellerna. Se tabell 2:1 på nästa sida. För diagram används koordinatsystemet med en x-axel och en 46


2. Grafisk redovisning: tabeller och diagram

y-axel för presentation av data (se t.ex. figur 2:9 i avsnittet ”Punktdiagram och linjediagram”). Figurer kan också vara av mer teoretiskt slag (exempelvis figur 4:3). En förklarande figurtext brukar skrivas under diagrammet/figuren.

Tabeller för kvalitativa variabler Användbara tabeller för kvalitativa variabler är olika frekvenstabeller, som envägstabeller, korstabeller och fyrfältstabeller.

Frekvenstabeller I en frekvenstabell redovisas antalen eller frekvenserna för de olika variabelvärdena. Summan av frekvenserna ska alltid bli densamma som det totala antalet personer (n). I exempel 2:1 anges antalet män och antalet kvinnor för variabeln Kön. Tabelltexten ovanför tabellen beskriver kortfattat innehållet. Eftersom det inte finns någon inbördes rangordning mellan variabelvärdena för en kvalitativ variabel spelar ordningen mellan variabelvärdena mindre roll, alltså om man börjar tabellen med Män (som i exempel 2:1) eller med Kvinnor. Exempel 2:1 Vid en viss arbetsplats år 2006 svarade 116 att de var män och 258 att de var kvinnor. Tabell 2:1 Antal anställda vid en viss arbetsplats 2006.

tabelltext

Antal anställda

huvud

Män Kvinnor

116 258

kropp

Totalt

374

Kön

I stället för Totalt kan man skriva Summa eller S:a

Ibland vill man ange den relativa frekvensen, det vill säga andelen angiven i procent. Åtminstone om totalmängden är någorlunda stor. Att säga att 33 % av de anställda var män om det var totalt 3 anställda skulle inte vara särskilt meningsfullt. I tabell 2:2 anges både den absoluta och den relativa frekvensen.

47


2. Grafisk redovisning: tabeller och diagram

Exempel 2:2 Andelen män: 116/374 ≈ 0,31, dvs. 31 % Andelen kvinnor: 258/374 ≈ 0,69, dvs. 69 % Tabell 2:2 Antal män och kvinnor på en viss arbetsplats 2006 samt den relativa frekvensen (%).

Kön

Antal anställda

Könsfördelning (%)

Män Kvinnor

116 258

31 69

Totalt

374

100

Tabellerna 2:1 och 2:2 ovan är exempel på envägstabeller där en variabel redovisas. Ofta vill man sammanställa information om flera variabler i samma tabell. I en korstabell gäller att frekvenserna för två kvalitativa variabler redovisas tillsammans. Exempel 2:3 Vid tidigare nämnda arbetsplats fanns följande yrkeskategorier (förutom vd:n och 3 avdelningschefer som alla var män): ekonomer, handläggare och sekreterare. Könsfördelningen för variabeln Befattning framgår av tabell 2:3 nedan. Tabell 2:3 Fördelningen av Kön på olika befattningar vid en viss arbetsplats.

Kön Män Kvinnor Totalt

Ekonomer

Befattning Handläggare Sekreterare

Totalt

86 65

30 169

0 24

116 258

151

199

24

374

Fyrfältstabellen är en korstabell där de två variablerna har vardera två variabelvärden (t.ex. variabeln Kön med värdena man och kvinna, och variabeln Svar med värdena nöjd och inte nöjd). I en fyrfältstabell finns två rader och två kolumner och sammanlagt fyra fält för frekvenser. Ofta konstrueras en fyrfältstabell som i tabell 2:4, så att den variabel som man uppmätt värden på (den beroende variabeln, se kapitel 1 avsnittet ”Experiment”) står som rubrik för raderna i tabellen och grupperingsvariabeln (den obe48


2. Grafisk redovisning: tabeller och diagram

roende variabeln) står som rubrik över kolumnerna (jfr x-axeln i ett koordinatsystem, se avsnittet ”Diagram för kvantitativa variabler” nedan). Exempel 2:4 Företagets ekonomer tillfrågades om de var nöjda med sin lön. Nedanstående fyrfältstabell redovisar resultatet. Tabell 2:4 Antal manliga och kvinnliga ekonomer som var nöjda respektive inte nöjda med sin lön.

Kön

Svar

Inte nöjd Nöjd

Man

Kvinna

54

23

32

42

Man kan förstås lägga in flera variabler eller statistiska mått i samma tabell. Det är då viktigt att man anger förklarande information i såväl tabellhuvudet som i tabelltexten. Exempel 2:5 I en undersökning av sjukfrånvaron vid en arbetsplats med totalt 374 anställda fann man år 2006 att av de 53 som var sjukskrivna under året (borta mer än 3 dagar) var 20 män och 33 kvinnor. Eftersom det var fler anställda kvinnor än män (258 kvinnor respektive 116 män) var det relativt sett högre sjukfrånvaro bland männen under året. Därför kan man vilja ange både antalet och den relativa frekvensen i tabellen (se tabell 2:5 nedan). Tabell 2:5 Antal anställda samt antal sjukskrivna män och kvinnor vid en viss arbetsplats 2006, samt andelen sjukskrivna i procent av antalet anställda.

Kön

Antal anställda

Antal sjukskrivna

Sjukskr. %

Män Kvinnor

116 258

20 33

17 13

Totalt

374

53

14

49


2. Grafisk redovisning: tabeller och diagram

Diagram för kvalitativa variabler Ett diagram eller en graf kan ibland vara mer åskådliggörande än en tabell. För kvalitativa variabler kan man använda ett cirkeldiagram eller ett stapeldiagram. Ett diagram benämns ”figur” och beskrivs med en förklarande figurtext som (oftast) sätts under figuren (se t.ex. figur 2:3).

Cirkeldiagram Ett cirkeldiagram, på engelska pie chart, består av cirkelsektorer (”tårtbitar”) vars areor är proportionella mot frekvenserna. Så om vi till exempel frågar ett antal studenter på campusfiket vilket ämne de studerar och en femtedel svarar ”psykologi” så bör ”psykologitårtbiten” utgöra en femtedel av cirkelns totala yta. Vill man handrita ett cirkeldiagram beräknar man gradtalen för medelpunktsvinklarna (som pekar mot cirkelns mitt) genom att multiplicera de relativa frekvenserna (frekvenserna som andelar av 100) med 360 grader och så använder man passare och gradskiva. Exempel 2:6 Vid en attitydundersökning om ungdomars syn på alkohol fann man bland en kommuns 15-åringar att 39 % ansåg att det var okey för ungdomar att dricka alkohol i smyg, 53 % ansåg att det var okey i någon vuxens sällskap, 8 % ansåg att det inte alls var okey före 18 års ålder. Först beräknas medelpunktsvinklarna: Okey i smyg: 0,39 × 360 grader ≈ 140 grader Okey med vuxen: 0,53 × 360 grader ≈ 191 grader Inte okey: 0,08 × 360 grader ≈ 29 grader Sedan ritas cirkeldiagrammet. Resultatet redovisas i figur 2:2 nedan. Okey i smyg Okey med vuxen Inte Okey

Figur 2:2 Fördelning av attityder till alkohol bland 15-åringar i kommunen.

50


2. Grafisk redovisning: tabeller och diagram

Stapeldiagram och stolpdiagram Om man har många variabelvärden blir cirkeldiagrammet svårt att tolka och det kan vara bättre med ett stapeldiagram (stapel heter bar på engelska). Ett stapeldiagram har rektangulära staplar vars höjder vanligen motsvarar frekvenserna (eller något annat statistiskt mått) för de olika variabelvärdena. Man använder koordinatsystemet där det vågräta nedre strecket där man har sin kvalitativa variabel kallas för x-axeln och den lodräta ”linjalen” till vänster för frekvenserna är y-axeln (se avsnittet ”Diagram för kvantitativa variabler” längre fram i detta kapitel). Ett stolpdiagram är en enklare variant på stapeldiagram. Det består av raka streck vilkas höjder svarar mot frekvenserna. Stolpdiagram är lättare att rita för hand men statistikprogram ger vanligen stapeldiagram liknande det i exempel 2:7. Grupperade staplar kan användas om man vill ange värden för två kvalitativa variabler i samma diagram som i exempel 2:8. Exempel 2:7 Vid den ovan nämnda undersökningen tillfrågades 1 193 15-åringar som ansåg att det var okej att dricka alkohol, antingen i smyg eller i vuxens sällskap, om varför de drack. Följande svarsfördelning erhölls: {Är gott, 7; Slappnar av, 21; Är kul, 173; Bli full, 312; Vara populär, 463; Är häftigt, 138; Bli roligare, 79}. Ett stapeldiagram över detta resultat återfinns i figur 2:3. Antal 500 450 400 350 300 250 200 150 100 50 0

Är kul

Är häftigt

Är gott

Vara populär

Slappnar av

Bli roligare

Bli full

Anledning

Figur 2:3 Varför 15-åringar i kommunen dricker alkohol (totalt tillfrågades 1 193 15-åringar).

51


2. Grafisk redovisning: tabeller och diagram

Exempel 2:8 Eftersom man misstänkte att det kunde finnas en könsskillnad ville man åskådliggöra resultatet uppdelat på pojkar och flickor. Ett stapeldiagram med grupperade staplar illustrerar informationen i tabell 2:6 nedan. Tabell 2:6 Antal 15-åriga pojkar och flickor som anser att det är okej att dricka alkohol och anledningen till att de dricker.

Anledning

Pojkar

Flickor

Totalt

Är gott Slappnar av Är kul Bli full Vara populär Är häftigt Bli roligare

2 7 71 218 163 118 54

5 14 102 94 300 20 25

7 21 173 312 463 138 79

Totalt

633

560

1 193

Stapeldiagrammet redovisas i figur 2:4. Antal 350 300 250 200

Pojkar

150

Flickor

100

Är kul

Är häftigt

Är gott

Slappnar av

Vara populär

Blir roligare

0

Bli full

50

Anledning

Figur 2:4 Antal pojkar respektive flickor i kommunen och anledningen till att de dricker alkohol.

Ett varningens ord är på sin plats när det gäller skalan på y-axeln. Om den inte går ner till noll kommer inte längre staplarnas areor att vara proportionella mot frekvenserna. Detta kan ge en missvisande bild av att skillnader som egentligen är ganska obetydliga skulle vara stora. Problemet illustreras av figur 2:5.

52


2. Grafisk redovisning: tabeller och diagram

Exempel 2:9 För att studera kundunderlaget vid lördagsöppet på Systembolaget noterades hur många män respektive kvinnor som handlade under en slumpmässigt utvald lördag. Resultatet redovisas i figur 2:5 nedan. 160 140

Antal

Antal

120 100 80 60 40 20 0

Kvinnor

Män

148 146 144 142 140 138 136 134 132 130

Kvinnor

Män

Figur 2:5 Den ganska obetydliga skillnaden mellan antalet män och kvinnor (vänstra diagrammet) kan verka alldeles för stor om y-axeln inte går ner till noll (högra diagrammet).

Tabeller för kvantitativa variabler För att skapa frekvenstabeller för kvantitativa variabler behöver man, precis som när det gäller de kvalitativa variablerna, först räkna antalet förekomster av respektive variabelvärde. För kvalitativa variabler, som oftast inte har så många variabelvärden, är detta relativt enkelt. För exempelvis Kön räknar man antalet män och antalet kvinnor (och eventuellt antalet icke-binära). För en kvantitativ variabel kan det däremot vara lite bökigare eftersom kvantitativa variabler ofta har betydligt fler variabelvärden. Exempel 2:10 visar hur det kan gå till. Exempel 2:10 I en undersökning av motionsvanor hos medelålders kvinnor ville man även undersöka deras hälsa. 148 kvinnor fick därför skatta sin hälsa på en intervallskala 1–13. För enkelhetens skull använder vi bara data från de 34 första för att visa hur man gör frekvenstabellen. 9

5

5

10

4

7

6

7

8

9

2

8

4

5

7

6

3

11

4

10

9

7

6

4

7

7

6

5

5

3

9

7

6

7

etc.

53


2. Grafisk redovisning: tabeller och diagram

Först räknar man antalet observationer av varje variabelvärde (skattning 1–13 på skalan).

Skattning (x)

Antal observationer

1

Frekvens (f) 0

2 3

| ||

1 2

4 5 6 7 8 9

|||| |||| |||| |||| ||| || ||||

4 5 5 8 2 4

|| |

2 1 0 0

10 11 12 13

etc.

Därefter tas kolumnen för avprickning bort och svaren från kvinnorna redovisas i den slutliga tabell 2:7 nedan. Tabell 2:7 Frekvensfördelning över skattningar av hälsa (n = 148).

Skattad hälsa 1 2 3 4 5 6 7 8 9 10 11 12 13

54

Frekvens (f ) 0 4 2 7 10 7 39 15 26 24 7 7 0 Totalt = n = 148


2. Grafisk redovisning: tabeller och diagram

Relativa frekvenser (f/n) kan vara intressanta bland annat om man vill jämföra data från två olika stora grupper. Ofta anges de relativa frekvenserna i procent (beräknas som f/n × 100). Kumulerade frekvenser (F) innebär att frekvenserna adderas kumulativt nedåt (eller ibland uppåt) i frekvenstabellen. Kumulerade relativa frekvenser är därmed kumulativt adderade relativa frekvenser. Se tabell 2:8. En situation när de senare frekvenstyperna kan vara av intresse hittar du i exempel 2:17 och 2:18 i avsnittet ”Frekvenspolygon och summapolygon”. I en rapport redovisar man sällan en tabell som tabell 2:8, utan man väljer den/de mest relevanta frekvenserna.

Frekvenstabeller för klassindelat material När det gäller kvantitativa variabler (speciellt för kontinuerliga sådana) är det ofta praktiskt att klassindela sitt material. Det bästa är vanligen om man väljer klasser så att de blir lika breda. Tabell 2:8 Frekvenser, relativa frekvenser, kumulerade frekvenser och kumulerade relativa frekvenser för materialet i tabell 2:7 ovan.

Skattad Frekvens (f ) Relativ frekvens i hälsa procent (f/n × 100) 1 0 0 2 4 4/148 · 100 = 2,70 3 2 2/148 · 100 = 1,35 4 7 7/148 · 100 = 4,73 5 10 6,76 6 7 4,73 7 39 26,35 8 15 10,14 9 26 17,57 10 24 16,22 11 7 4,73 12 7 4,73 13 0 0,00 n = 148

Summa = 100 %

Kumulerad frekvens (F)

Kumulerad relativ frekvens (%) 0 0,00 0 + 4 = 4 0,00 + 2,70 = 2,70 4 + 2 = 6 2,70 + 1,35 = 4,05 6 + 7 = 13 4,05 + 4,73 = 8,78 23 15,54 30 20,27 69 46,62 84 56,76 110 74,32 134 90,54 141 95,27 148 100,00 148 100,00 n = 148

Det här kan göras på flera sätt. Ett enkelt sätt kan vara att först bestämma vilken klassbredd man vill ha. Genom att sedan ta det högsta värdet minus det lägsta värdet (variationsbredden) och dividera det med klassbredden samt därefter avrunda uppåt får man en god uppskattning av det antal klasser man kommer att få. 55


2. Grafisk redovisning: tabeller och diagram

Därefter väljer man ett jämnt och bra värde under den lägsta observationen och skapar sina klasser genom att låta nästkommande klass börja en klassbredd ovanför och så vidare (se exempel 2:11). Man bör dock komma ihåg att de faktiska klassgränserna hamnar mitt emellan de värden man skriver ut i sin tabell (på 159,5; 169,5; 179,5 etc. i tabell 2:9). Klassmitten hamnar sedan i sin tur mitt emellan klassgränserna (se tabell 2:9). Ibland kan man välja att ha öppna klasser för den första och/eller sista klassen. Detta innebär att bara den ena klassgränsen är definierad. Exempel 2:11 Vid en hälsokontroll på en gymnasieskola mättes längden på 40 pojkar i årskurs 2. De uppmätta värdena enligt gängse avrundningsregler var (högsta och lägsta värdet fetmarkerade): Längd = {167; 186; 188; 181; 177; 182; 175; 202; 195; 182; 190; 189; 161; 182; 170; 195; 186; 190; 192; 177; 174; 187; 188; 184; 183; 197; 184; 181; 190; 178; 186; 180; 186; 186; 171; 188; 165; 180; 173; 169} cm Välj klassbredd, till exempel 10 cm Variationsbredden = 202 – 161 = 41 Antal klasser = 41/10 = 4,1 = 5 klasser Tabell 2:9 Kroppslängd för 40 gymnasiepojkar.

Klass Längd (cm) 160–169 170–179 180–189 190–199 200–209

Klassgränser

Klassmitt

Antal

159,5–169,5 169,5–179,5 179,5–189,5 189,5–199,5 199,5–209,5

164,5 174,5 184,5 194,5 204,5

4 8 20 7 1 S:a 40

Ibland kanske man hellre än att utgå från klassbredden vill bestämma hur många klasser man ska använda sig av. Även i det fallet beräknar man först variationsbredden (högsta minus lägsta värdet). Man dividerar nu i stället med det antal klasser man vill ha och avrundar det resulterande värdet till en lämplig klassbredd (se exempel 2:12).

56


2. Grafisk redovisning: tabeller och diagram

Exempel 2:12 Vid utarbetandet av ett mätinstrument för diagnostik av kroniskt trötthetssyndrom undersöktes ett obundet slumpmässigt urval om 3 000 personer. Testet kunde ge värden mellan 20 och 100 poäng och man tänkte sig 9 klasser för en klassindelning av resultatet. Variationsbredden = 100 – 20 = 80 Klassbredd = 80/9 = 8,9 poäng ≈ 9 poäng/klass Tabell 2:10 Testresultat för 3 000 personer.

Klass Poäng 20–28 29–37 38–46 47–55 56–64 65–73 74–82 83–91 92–100

Klassgränser

Klassmitt

Frekvens

19,5–28,5 28,5–37,5 37,5–46,5 46,5–55,5 55,5–64,5 64,5–73,5 73,5–82,5 82,5–91,5 91,5–100,5

24 33 42 51 60 69 78 87 96

91 604 1 147 836 218 78 18 6 2 S:a 3 000

Om observationerna är något så när jämnt fördelade inom varje klass kan klassmitten sägas representera observationsvärdena för den klassen. Detta kan utnyttjas för att få en approximation av totalvärdet för respektive klass, vilket beräknas som frekvensen multiplicerad med klassmitten. För den första klassen i tabell 2:10 skulle totalvärdet alltså vara ungefär 24 × 91 = 2 184 poäng. (Genom att sedan summera totalvärdena för samtliga klasser får man en totalsumma för hela materialet som man kan använda för att beräkna ett approximativt medelvärde för ett klassindelat material, se kapitel 3.) Kumulerade frekvenser, relativa frekvenser och kumulerade relativa frekvenser kan naturligtvis också beräknas för ett klassindelat material.

57


2. Grafisk redovisning: tabeller och diagram

Diagram för kvantitativa variabler Också för kvantitativa variabler finns ett antal mycket användbara diagram. De vanligaste är punktdiagram, linjediagram, stapeldiagram och histogram.

Koordinatsystemet I de diagram vi hittills presenterat har vi redan använt oss av koordinatsystemet. Detta har två axlar placerade vinkelrätt mot varandra. Den horisontella axeln brukar benämnas x-axeln och den vertikala y-axeln. Skärningspunkten mellan axlarna kallas origo och är den punkt där skalvärdet på båda axlarna är noll. De fyra ”rutor” som bildas brukar betecknas kvadranter och numreras moturs så att första kvadranten är den där alla tal är positiva. Skalan på respektive axel kan variera för att på bästa sätt återge de data som ska presenteras. X-axelns värden kallas x-koordinater, y-axelns värden y-koordinater. Se figur 2:6. 50 40

2:a

1:a kvadranten

30

y-axeln

20

origo

10 0 –10 –20

3:e

–30

4:e

–40 –50 –15

–10

–5

0

5

10

15

x-axeln

Figur 2:6 Koordinatsystemet.

För att avsätta data i koordinatsystemet bör man lämpligen ha värdena som talpar (x, y), det vill säga ett y-värde för varje x-värde. För varje talpar avsätts sedan en markering i koordinatsystemet där en tänkt lodrät linje genom x-koordinaten skär en tänkt vågrät linje genom y-koordinaten.

58


2. Grafisk redovisning: tabeller och diagram

Exempel 2:13 Avsätt talparen (10, 18) samt (–10, –40) i koordinatsystemet. Lägg en linjal (eller använd rutat papper) från värdet på x-axeln uppåt och från värdet på y-axeln inåt och markera med exempelvis ett kryss där dessa två tänkta linjer möts. 50 40 30

y-axeln

20 10 0

–10 –20 –30 –40 –50 –15

–10

–5

0

5

10

15

x-axeln

Figur 2:7 Koordinatsystemet med talparen (10, 18) och (–10, –40) inritade (hjälplinjerna x = 10 och y = 18 ritas normalt inte ut).

Ibland väljer man att inte låta den ena, den andra eller båda axlarna gå ner till noll, speciellt om mätområdet för en variabel är begränsat och ligger långt från origo. Man säger att man skär eller gör ett brott på axeln. Ska detta göras korrekt ska origo ändå vara med och ett brott markeras på axeln (se figur 2:8). Numera är det dock allmänt accepterat att den ena eller båda axlarna börjar med en siffra annan än noll såsom till exempel för y-axeln i figur 2:9. 0

50

52

54

56

58

60

62

64

66

68

70

x-axeln Figur 2:8 Exempel på en bruten x-axel.

Punktdiagram och linjediagram När värden för två variabler (x respektive y) markeras i ett koordinatsystem med någon symbol (kryss, ringar, fyrkanter etc.) kallas den erhållna grafen ett punktdiagram. På engelska kallas detta scattergram eller scatterplot och man säger ibland att man ”plottar” sina data. Om man har kontinuerliga variabler väljer man ibland 59


2. Grafisk redovisning: tabeller och diagram

att sammanbinda punkterna med en linje till ett linjediagram. Detta är speciellt vanligt om man har Tid som x-variabel. Exempel 2:14 Maxpulsen hos 5 individer med olika ålder uppmättes vid ett arbetsprov på ergometercykel (se figur 2:9 nedan). 220

maxpuls (slag/min)

210 200 190 180 170 160 150 140 0

10

20

30

40

50

60

70

80

ålder (år)

Figur 2:9 Maxpuls hos 5 individer med olika ålder.

I exempel 2:14 ser vi att y-axeln är bruten vid en pulsfrekvens på 140 slag/min. Detta gör att man slipper en massa ”luft” i diagrammet under 140, men vid en tolkning av figuren är det viktigt att komma ihåg att läsa på skalan på y-axeln. Annars kanske man felaktigt får för sig att den som har den högsta pulsen i diagrammet har mer än dubbelt så hög maxpuls som den som har den lägsta.

Stapeldiagram och histogram För diskreta kvantitativa variabler använder man vanligen stapeldiagram och stolpdiagram för att ange frekvenser. För klassindelat material används histogram. Dessa typer av diagram ger en bra bild av hur variabelns frekvensfördelning ser ut (hur frekvenserna är fördelade på de olika variabelvärdena). Frekvensfördelningen är av betydelse för många statistiska mått, vilket kommer att behandlas längre fram i boken.

60


2. Grafisk redovisning: tabeller och diagram

Exempel 2:15 I figur 2:10 nedan visas ett stapeldiagram över den vänstra kolumnen i tabell 2:7, frekvensfördelning för skattad hälsa. 40

Frekvens (antal)

35 30 25 20 15

Figur 2:10 Skattad hälsa bland 148 medelålders kvinnor.

10 5 0

1

2 3

4 5

6 7 8

9 10 11 12 13

Skattad hälsa

Ett histogram är ett stapeldiagram för klassindelat material. Det är därför det inte finns några mellanrum mellan rektanglarna. Där den ena klassen slutar tar den andra klassen vid. Bredden i rektanglarna bör vara lika med klassbredden och höjden densamma som frekvensen. På så sätt motsvaras frekvenserna av rektanglarnas areor. Exempel 2:16 Histogram för det klassindelade materialet i tabell 2:9 redovisas i figur 2:11 nedan.

Frekvens (antal)

20 18 16 14 12 10 8 6 4

Figur 2:11 Kroppslängd för 40 gymnasiepojkar (tabell 2:9).

2 0 150

160

170

180

190

200

210

220

Längd (cm)

Precis som för punktdiagram väljer man ibland att bryta axlarna. I figur 2:11 ovan ser vi till exempel att x-axeln börjar på 150. Också för stapeldiagram och histogram måste man emellertid se upp. Såg du vad som var problematiskt med det inledande diagrammet i kapitlet (figur 2:1)? Prova gärna att rita om diagrammet för hand 61


2. Grafisk redovisning: tabeller och diagram

och låt y-axeln börja i origo. Hur stor ser skillnaden nu ut att vara mellan män och kvinnor? Det bör dock dessutom påpekas att IQ inte är kvotdata, så att börja med noll kan också vara vilseledande. Ett annat problem är att diagrammet i figur 2:1 inte säger något om hur representativa dessa 10 pojkar och 10 flickor är för alla pojkar och flickor i årskurs 9. Som vi ska se längre fram är det ofta osäkert att dra slutsatser från små stickprov. Ett viktigt skäl till att alltid rita stapeldiagram respektive histogram över sina variabler är att man kan se fördelningsformen (frekvensfördelningen). Ett annat skäl är att det kan vara till hjälp för att hitta extremvärden (eng. outliers), sådana värden som ligger extremt långt bort från de flesta andra värdena i fördelningen. Ett extremvärde kan, förutom att vara ett extremt ovanligt värde, antingen tyda på en felinmatning, eller på att den individen till exempel skiljer sig i någon bakgrundsvariabel.

Överkurs Frekvenspolygon och summapolygon Ordet polygon betyder ”månghörning” och som alternativ till histogrammet kan en frekvenspolygon användas (och endast för kontinuerliga variabler). En frekvenspolygon bildas genom att man sammanbinder frekvensvärdena för varje klassmitt i histogrammet. Exempel 2:17 En värktablett innehållande ibuprofen testades i ökande dos på 74 personer med huvudvärk. Nedan redovisas vid vilken minsta dosering de angav att huvudvärken släppte (påhittade data). Tabell 2:11 Dosering av ibuprofen och antal personer som angav att huvudvärken släppte vid denna dosering (totalt testades n = 74 personer).

Dos ibuprofen Frekvens (f) Relativ frekvens, % Kumulerad (mg) (f/n × 100) relativ frekvens, % 100–149 3 4,05 4,05 150–199 8 10,81 14,68 200–249 27 36,49 51,35 250–299 18 24,32 75,67 300–349 11 14,36 90,53 350–399 6 8,11 98,64 400–449 1 1,35 99,99 S:a 74 100 100

62


2. Grafisk redovisning: tabeller och diagram

Ett histogram över frekvenserna redovisas i figur 2:12 nedan.

Frekvens (antal)

30 25 20 15 10 5 0 0

100

200

300

400

500

Dos ibuprofen (mg)

Figur 2:12 Antal personer som blev av med sin huvudvärk vid olika minsta dosering av ibuprofen (n = 74).

För att skapa en frekvenspolygon sätter man sedan en markering för frekvensen vid varje klassmitt (mitt i taket på varje rektangel). Man markerar även frekvenserna noll för en klassbredd under den första och över den sista klassmitten. Dessa markeringar sammanbinder man därefter med en linje (se figur 2:13 nedan). 30

Frekvens (antal)

25 20 15 10 5 0

0

100

200

300

400

500

Dos ibuprofen (mg)

Figur 2:13 Antal personer som blev av med sin huvudvärk vid olika minsta dosering av ibuprofen (n = 74).

Ibland har man mer nytta av en summapolygon eftersom en sådan i stället bygger på de kumulerade frekvenserna. För att skapa en summapolygon markerar man klassmitten på x-axeln och värdet för den kumulerade frekvensen (eller kumulerade relativa frekvensen) på y-axeln och sammanbinder punkterna med en linje. Även här börjar man med frekvensen noll en klassbredd under klassmitten i det första intervallet. För de kumulerade relativa frekvenserna i tabell 2:11 ovan kommer diagrammet att se ut som i figur 2:14 i exempel 2:18, som också illustrerar hur en summapolygon kan användas.

63


Statistik för beteendevetare

Statistik för beteendevetare Statistik för beteendevetare är en heltäckande grundbok i statistik. Författarna går steg för steg igenom hur du planerar, genomför och redovisar en statistisk undersökning: • Vilken undersökningsdesign ska jag välja? • Hur samlar jag in och beskriver mina data? • Vad innebär en hypotesprövning? • Vilka statistiska analyser kan jag göra? • Hur kan jag tolka och redovisa mina resultat? • Vilka fallgropar ska jag se upp med? Ända sedan första upplagan har boken rönt stor uppskattning bland studenter för att den på ett lättillgängligt och pedagogiskt sätt väver samman teori och praktik, med exempel och övningar som underlättar inlärningen. Boken innehåller också mer avancerade fördjupningsavsnitt.

Statistik för beteendevetare Faktabok

Elisabet Borg Joakim Westerlund

I denna fjärde upplaga har ett antal förändringar gjorts för att möta de senaste årens diskussion kring hur statistik används inom speciellt samhällsvetenskaplig forskning. Vissa förenklingar har gjorts, större fokus har lagts på betydelsen av god mätning och användandet av konfidensintervall och mått på effektstyrka, och två helt nya kapitel har lagts till. Det första om den så kallade replikeringskrisen och det andra om Bayesiansk statistik, författat av kollegan Anders Sand, forskare vid Karolinska Institutet.

Elisabet Borg Joakim Westerlund

Elisabet Borg och Joakim Westerlund är universitetslektorer och forskare vid Stockholms universitet, Psykologiska institutionen. Elisabet Borg fick 2011 den pedagogiska utmärkelsen Årets lärare vid Stockholms universitet. Boken är i tidigare upplagor fackgranskad av professor Åke Hellström, Stockholms universitet och universitetslektor Daniel Sjödin, Örebro universitet.

Faktabok

Best.nr 47-12940-9 Tryck.nr 47-12940-9

Fjärde upplagan

Stat f beteendevetare - omslag uppl 4_2.indd 1

2020-08-24 15:05


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.