9789144115917

Page 1

29 mm

Hans Nyquist  |

Statistikens grunder

Hans Nyquist är professor i statistik vid Stockholms universitet. Han undervisar på kurser i sannolikhetsteori, statistisk inferens samt generaliserade linjära modeller. Hans forskningsområde är design av planerade experiment.

Statistikens grunder Vetenskap, empiriska undersökningar och statistisk analys Statistikämnet behandlar metoder för att skapa kunskap genom att göra observationer. Att tolka och förstå statistik är en viktig vetenskaplig färdighet men också många gånger en förutsättning för ett kritiskt förhållningssätt i vardagen. Statistikens grunder syftar till att skapa förståelse för hur statistiska metoder används för att generera kunskap och hur dessa metoder fungerar respektive inte fungerar.

Statistikens grunder Vetenskap, empiriska undersökningar och statistisk analys

Statistikens grunder tar avstamp i vetenskapsteori och vetenskapens grundbegrepp och sätter på detta sätt in statistikämnet i sitt vetenskapliga sammanhang. Boken går därefter ingående igenom ämnets grunder från sannolikhetsteori via empiriska undersökningar och deskription till statistisk inferens. Detta ger de grundläggande verktyg som krävs för att utföra statistiska analyser och för att kritiskt granska tidigare analyser. Statistikens grunder lyfter också fram varför statistiska metoder kan användas i vissa situationer men inte i andra. Boken är avsedd som litteratur på en introduktionskurs i statistik, men kan även användas som en metodbok för studerande på alla nivåer, från grundkurs till forskarnivå, i ämnesområden där statistiska metoder kommer till användning.

Art.nr 39413 2:a uppl.

Hans Nyquist

studentlitteratur.se

78-91-44-11591-7_01_cover.indd All Pages

2017-03-07 11:50


7 mars 2017 – sida 2 – # 2

Kopieringsförbud Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och studenters begränsade rätt att kopiera för undervisningsändamål enligt Bonus Copyright Access kopieringsavtal, är förbjuden. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller Bonus Copyright Access. Vid utgivning av detta verk som e-bok, är e-boken kopieringsskyddad. Den som bryter mot lagen om upphovsrätt kan åtalas av allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till upphovsman eller rättsinnehavare. Studentlitteratur har både digital och traditionell bokŋutgivning. Studentlitteraturs trycksaker är miljöanpassade, både när det gäller papper och tryckprocess. Art.nr 39413 isbn 978-91-44-11591-7 Upplaga 1:1 © Författaren och Studentlitteratur 2017 www.studentlitteratur.se Studentlitteratur AB, Lund Sakgranskning: Kenny Bränberg Omslagslayout: Jens Martin/Signalera Omslagsbild: Dimitrios/Shutterstock Printed by Mediapool Print Syd AB, Estonia 2017


7 mars 2017 – sida 3 – # 3

INNEHÅLL

Förord 11 DEL I

Statistik och vetenskap

KAPITEL 1

1.1 1.1.1 1.1.2 1.1.3 1.2

Några exempel på problem som kan belysas med hjälp av statistiska undersökningar 17 Pris och efterfrågan 17 Opinionsundersökningar 18 Kunskapstest 18 De olika kapitlen 19

KAPITEL 2

2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10

Vetenskap 21

Vad är vetenskap? 21 Kunskap 23 Förklaringar 26 Prediktioner 28 Orsaker 29 Empiri 30 Forskningsprocessen 31 Kumulativitet 33 Forskningsetik 34 Vetenskap och värderingar 35

KAPITEL 3

3.1 3.2 3.2.1 3.2.2

Statistik – att lära sig något från observationer 15

Några vetenskapliga grundbegrepp 37

Begrepp 37 Definitioner 38 Konceptuella definitioner 38 Operationella definitioner 39

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

3


7 mars 2017 – sida 4 – # 4

innehåll

3.3 3.4 3.5 3.6

Teori 40 Modeller 42 Teorier, modeller och empirisk forskning 44 Ett klassiskt exempel 46

KAPITEL 4

4.1 4.2 4.3 4.3.1 4.3.2 4.4 4.4.1 4.5 4.6 4.7 4.8

Forskningsproblem 49 Population och urval 50 Variabler 51 Kvantitativa variabler 52 Kvalitativa variabler 52 Relationer 53 Riktning och styrka hos relationer 54 Hypoteser 55 Den hypotetisk-deduktiva metoden 56 De olika stegen i en empirisk undersökning 58 Problemformulering 60

DEL II

Sannolikhetsteori

KAPITEL 5

5.1 5.2 5.3 5.3.1 5.3.2 5.3.3 5.3.4 5.4 5.5 5.5.1 5.5.2

6.1 6.2 6.3 6.4

Sannolikhetsmodeller 65

Modeller av slumpmässiga försök 65 Sannolikhet av ett utfall och en händelse 69 Tolkningar av sannolikheter 70 Den klassiska sannolikhetsdefinitionen 70 Kombinatorik 72 Frekventistisk tolkning av sannolikhet 74 Sannolikhet som grad av tilltro 76 Osannolika händelser och otroliga händelser (*) 77 Några exempel på modeller av slumpmässiga försök 78 Förekomsten av en gen 79 Att mäta avstånd 79

KAPITEL 6

4

Empiriska undersökningar 49

Beräkning av sannolikheter 83

Additionssatsen 83 Betingad sannolikhet – multiplikationssatsen 87 Satsen om total sannolikhet och Bayes sats (*) 94 Beroende och oberoende händelser 96

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R


7 mars 2017 – sida 5 – # 5

innehåll

KAPITEL 7

7.1 7.2 7.3 7.4 7.5 7.6 7.6.1 7.6.2 7.6.3 7.7 7.7.1 7.7.2 7.7.3 7.7.4 7.8 7.8.1 7.9

Stokastiska variabler 103

Stokastiska variabler 103 Frekvens- och täthetsfunktionerna 106 Fördelningsfunktionen 109 Väntevärde och varians 112 Några räkneregler för väntevärden och varianser 118 Simultant fördelade stokastiska variabler 122 Simultana frekvensfunktioner 122 Simultana täthetsfunktioner 124 Marginalfördelning 125 Betingade sannolikhetsfördelningar 126 Betingade frekvensfunktioner 127 Betingad täthetsfunktion 128 Beroende och oberoende stokastiska variabler 128 Betingade väntevärden 129 Kovarians och korrelation 131 Korrelation 134 Linjära kombinationer av stokastiska variabler 135

KAPITEL 8

Några vanliga diskreta sannolikhetsfördelningar 145

8.1 8.2 8.3 8.4 8.5

Binomialfördelningen 145 Geometriska fördelningen 154 Multinomialfördelningen (*) 156 Poissonfördelningen (*) 158 Blandade övningar 161

KAPITEL 9

Några vanliga kontinuerliga sannolikhetsfördelningar 165

9.1 9.2 9.3 9.3.1 9.4 9.5

Normalfördelningen 165 Den standardiserade normalfördelningen 169 Normalfördelningen som approximation av binomialfördelningen 174 Kontinuitetskorrektion 175 Exponentialfördelningen (*) 177 Blandade övningar 179

KAPITEL 10

Tillämpningar av sannolikhetsmodeller (*) 185

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

5


7 mars 2017 – sida 6 – # 6

innehåll

10.1 10.2 10.3 10.4 10.5 10.6

Lageroptimering 185 Arbetskraft 187 Tillförlitlighet hos system 190 Medicinska test 192 Slumpvandring 195 Analys av värdepappersportföljer 197

DEL III

Empiriska undersökningar

KAPITEL 11

11.1 11.2 11.3 11.4

Olika typer av statistiska undersökningar 205 Att bestämma en fysisk konstant 207 Att bestämma en egenskap hos en population 208 Att bestämma orsakssamband 209

KAPITEL 12

12.1 12.2 12.3 12.3.1 12.3.2 12.4 12.4.1 12.4.2 12.4.3 12.5 12.6 12.7

6

Experiment (*) 225

Strukturen hos ett experiment 225 Faktoriella försök 231 Kontinuerlig experimentvariabel 233

KAPITEL 14

14.1 14.2 14.3

Kausalitet och validitet 213

Kausala samband 213 Samvariation 214 Intern validitet 215 Yttre faktorer för intern validitet 216 Inre faktorer för intern validitet 217 Metoder för kontroll av den interna validiteten 218 Kontrollgrupp 218 Matchning 219 Randomisering 220 Tidsordning 221 Generaliserbarhet: extern validitet 221 Statistiska undersökningar för att studera kausala samband 222

KAPITEL 13

13.1 13.2 13.3

Statistiska undersökningar 205

Observationsstudier 235

Totalundersökningar och urvalsundersökningar 236 Slutsatser från urvalsundersökningar 238 Slumpmässiga urval 238

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R


7 mars 2017 – sida 7 – # 7

innehåll

KAPITEL 15

15.1 15.1.1 15.1.2 15.2 15.3 15.4

Kvasiexperiment och korrelationsstudier (*) 245

Kvasiexperiment 245 Explicita jämförelsegrupper 246 Implicita jämförelsegrupper 247 Kohortstudier 248 Fall-referensstudier 249 Korrelationsstudier 251

KAPITEL 16

Databildning 253

16.1 16.2 16.3 16.3.1 16.3.2 16.3.3 16.3.4 16.4 16.5 16.6 16.7 16.8 16.8.1 16.8.2

Data och information 253 Mätning 255 Skalnivåer 257 Nominalskala 258 Ordinalskala 258 Intervallskala 259 Kvotskala 260 Mätfel 260 Validitet 262 Reliabilitet 263 Datainsamling 265 Datakvalitet 266 Relevansfaktorer, validitet 267 Noggrannhetsfaktorer, reliabilitet 268

DEL IV

Deskription

KAPITEL 17

17.1 17.2

Empiriska fördelningar 274 Klassindelning 277

KAPITEL 18

18.1 18.2 18.3 18.4 18.5

Deskription 273

Deskription – en variabel 281

Tabeller 281 Grafisk framställning 284 Lägesmått och kvartiler 290 Spridningsmått 294 Boxplotdiagrammet 299

KAPITEL 19

Deskription – två variabler 301

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

7


7 mars 2017 – sida 8 – # 8

innehåll

19.1 19.1.1 19.2 19.3 19.4

Jämförelser i frekvenstabeller 301 Betingade empiriska fördelningar och riktningen hos ett samband 304 Grafisk framställning 307 Jämförelser i kvottabeller 313 Kovarians och korrelation 315

KAPITEL 20

20.1 20.2 20.3 20.4 20.5

Deskription – fler än två variabler 321

Parvisa samband och störningsvariabler 321 Kontroll genom analys av delgrupper 324 Mera om betingade medelvärden – samspelseffekt (*) 329 Standardvägning – standardpopulationsmetoden (*) 331 Partiell korrelation (*) 337

KAPITEL 21

Deskription – tidsserier 339

21.1 21.2 21.3 21.3.1 21.3.2 21.3.3 21.3.4 21.3.5

Modeller av tidsserier 340 Grafisk framställning av tidsserier 342 Indexberäkningar 346 Enkla index – definition och tolkning 346 Byte av bastidpunkt 347 Kedjning 349 Sammansatta index 350 Fasta och löpande priser – deflatering 353

DEL V

Statistisk inferens

KAPITEL 22

22.1 22.2 22.3 22.4

Att jämföra modeller med observationer (*) 359

Residualer 360 Residualkvadratsumma 365 χ 2 -måttet 368 Likelihood 371

KAPITEL 23

Samplingfördelningar och centrala gränsvärdessatsen 375

23.1 23.2

8

Samplingfördelningar 375 Urval från en normalfördelad population med känd varians 380

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R


7 mars 2017 – sida 9 – # 9

innehåll

23.3 23.3.1 23.3.2 23.4 23.5 23.6 23.7 23.8

χ 2 -fördelningen 382 Samplingfördelningen för urvalsvariansen 385 Analys av observationer från en multinomialfördelning 386 t-fördelningen 388 Urval från en normalfördelad population med okänd varians 390 Centrala gränsvärdessatsen 392 Samplingfördelningen för proportioner 394 F-fördelningen 396

KAPITEL 24

24.1 24.2 24.3 24.4 24.5

Uppskattning av populationsmedelvärde 401

Uppskattning vid oberoende observationer 401 Uppskattning vid ändlig population 404 Osäkerhet i uppskattningar 405 Konfidensintervall 406 Dimensionering av urvalsstorleken 410

KAPITEL 25

Prövning av hypoteser om populationsmedelvärden 423

25.1 25.2 25.2.1 25.2.2 25.2.3 25.3 25.3.1 25.3.2 25.3.3 25.4 25.5 25.6

Grundläggande begrepp 423 Val av beslutsregel, hypoteser och testvariabel 428 Att välja beslutsregel 429 Formulering av hypoteser 431 Val av testvariabel 433 Prövning av hypoteser om populationsmedelvärdet i en normalfördelad population 435 Ensidigt test 435 Tvåsidiga test 437 Okänd varians 438 Prövning av hypoteser om populationsmedelvärdet i en icke-normalfördelad population 440 Prövning av hypoteser om proportioner 441 p-värden 442

KAPITEL 26

Prövning av hypoteser om flera populationsmedelvärden 453

26.1

Två orelaterade urval 454

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

9


7 mars 2017 – sida 10 – # 10

innehåll

26.2 26.2.1 26.3 26.4 26.4.1

Variansanalys med en faktor (*) 456 Fler än två populationer 460 Två relaterade urval 464 Variansanalys med en faktor och block (*) 466 Fler än två populationer 470

KAPITEL 27

27.1 27.2 27.3 27.4

Enkel linjär regression 482 Hypotesprövning i enkel linjär regression (*) 487 Multipel linjär regression 491 Lite mer om partiell korrelation 497

KAPITEL 28

28.1 28.2 28.3 28.4

χ 2 -metoden 499

Allmänt om χ 2 -metoden 499 Goodness of fit-test 501 Test av homogenitet 505 Prövning av hypoteser om oberoende 511

KAPITEL 29

29.1 29.2 29.3 29.3.1 29.3.2 29.3.3 29.3.4

Regression 481

Beslutsteori 515

Beslutsprocessen 516 Beslut under risk 518 Beslut under osäkerhet 520 Maximinkriteriet 520 Maximaxkriteriet 521 Minimax-regretkriteriet 522 Laplacekriteriet 524

Sakregister 531

10

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R


7 mars 2017 – sida 11 – # 11

FÖRORD

Under min tid vid Statistiska institutionen, Umeå universitet, förde vi många, långa och intressanta diskussioner om statistikämnets roll som vetenskaplig metod vid empiriskt baserad kunskapsbildning. Vi som deltog i diskussionerna var, förutom jag själv, främst initiativtagaren professor Uno Zackrisson samt lektorerna Hans Stenlund, Bengt Lundqvist och Kenny Bränberg. Ett syfte med diskussionerna var att försöka se statistikämnet utifrån ett vetenskapsteoretiskt synsätt. Ett intryck jag hade då var att många läroböcker i statistik, i synnerhet böcker på grundnivå, hade en tendens att beskriva hur en viss teknik för dataanalys genomförs mer eller mindre mekaniskt. Ibland kan beskrivningen upplevas som algoritmisk i meningen att läsaren får ta del av stegvisa instruktioner om hur en analys genomförs, men inte varför eller vad resultaten visar eller ens om analysen i fråga är meningsfull. Diskussioner om vilka förutsättningar som behöver gälla, varför man ska göra på det beskrivna sättet och vilka slutsatser som är möjliga att dra hoppades sorgfälligt över. Det var därför naturligt för mig att försöka skapa en text om statistik som mer fokuserar på hur man kan tänka statistiskt och som försöker skapa förståelse för hur statistiska metoder hänger ihop med ett vetenskapsteoretiskt förhållningssätt. Genom åren olika versioner av den ursprungliga texten använts vid undervisning på grundkurser i statistik vid Umeå universitet och vid Stockholms universitet. Över tid har den texten utvecklats, kompletterats och utvidgats till boken du håller i din hand – en grundläggande bok i statistik med vetenskap i fokus. Boken är indelad i fem delar – statistik och vetenskap, sannolikhetsteori, empiriska undersökningar, deskription och statistisk inferens – som ger verktygen för att såväl genomföra och som utvärdera statistiska analyser. I alla delar finns även övningar vars lösningar går att ladda ner från www.studentlitteratur.se/39413. Under, det nu mångåriga, arbetet med boken har jag tacksamt tagit emot synpunkter från undervisande lärare, främst lektorerna Ellinor Fackle-Fornius och Jessica Franzén. För den slutliga utformningen har jag haft stor hjälp av lektor Kenny Bränberg, lektor Siv Nyquist och för-

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

11


7 mars 2017 – sida 12 – # 12

förord

läggare Eric Rehn. Jag vill tacka alla er som har bidragit med synpunkter. Utan er hade boken förmodligen aldrig blivit av. Gnarp, februari 2017 Hans Nyquist

12

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R


K APITEL 1

7 mars 2017 – sida 15 – # 15

Statistik – att lära sig något från observationer

Människan har under hela sin historia, ända från stenålderns grottmänniska till dagens rymdmänniska, haft behov av att sammanfatta erfarenheter, göra förutsägelser, dra slutsatser och fatta beslut. Ofta måste detta göras då den tillgängliga informationen är ofullständig. Ett exempel på detta är den för stenåldersmänniskorna så viktiga jakten. Då stenåldersmänniskorna skulle jaga måste de fatta ett beslut om att bege sig till ett ställe där det av erfarenhet kunde antas finnas djur lämpliga för jakt. Givetvis kunde ingen i förväg tala om för stenåldersmänniskorna vart de skulle gå och hur de skulle ligga på pass för att med säkerhet fånga ett byte. Stenåldersmänniskorna måste alltså göra sina förutsägelser och fatta sina beslut då den tillgängliga informationen var osäker. På samma sätt har en astronaut som återvänder till jorden och ska landa sin rymdfärja att göra förutsägelser och fatta beslut då den tillgängliga informationen är ofullständig. Astronauten vet hur farkostens flyktbana påverkas av de manövrer som kan utföras, men hela tiden påverkas flyktbanan också av sådant som astronauten inte har kontroll över, t.ex. vinden och förändringar i lufttrycket. De metoder som används för att sammanfatta samlade erfarenheter, göra förutsägelser, dra slutsatser och fatta beslut då informationen är ofullständig brukar kallas statistiska metoder. Fastän de metoder som stenåldersmänniskan och astronauten använde skiljer sig en hel del åt vad beträffar graden av komplexitet, har båda använt sig av något vi kan kalla statistiska metoder. Detta ger oss en liten vink om att det finns många statistiska metoder och att deras användningsområde är stort. Inom vetenskapen statistik studeras dessa metoder. Man försöker också konstruera nya metoder för nya situationer och problemställningar som uppkommer i det moderna samhället. Stenåldersmänniskan, t.ex., hade inget behov av att göra partisympatiundersökningar eller att landa rymdfärjor. Hur man gör partisympatiundersökningar och landar rymdfärjor är problem som har kommit till vårt samhälle på senare tid. Inom den

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

15


7 mars 2017 – sida 16 – # 16

del i statistik och vetenskap

statistiska vetenskapen försöker man också vidareutveckla och förbättra gamla metoder så att t.ex. förutsägelser om framtiden kan göras med större precision. I det moderna samhället får undersökningar av olika slag en allt större betydelse. Beroende på kunskapsläget inom det område man vill undersöka och den aktuella problemställningen, förekommer flera olika syften och ambitionsnivåer med undersökningar. Ett syfte kan vara att försöka ange typiska fall, bestämma vad som behöver undersökas, vad som kan anses relevant, vad som hör till problemet och vad som inte hör till problemet. Sådana undersökningar kallas explorativa. Beskrivande (deskriptiva) studier syftar till att ta reda på hur något, i mycket vid mening, ser ut. Det kan t.ex. vara att ta reda på hur inkomstfördelningen ser ut för en viss kategori människor eller hur förbrukningen av elenergi fördelar sig på olika användningsområden. Förklarande studier har en lite högre ambitionsnivå. Sådana studier tar upp "varför-problem", exempelvis att söka förklaringar till varför inkomstfördelningen ser olika ut för olika kategorier människor eller varför förbrukningen av elenergi fördelar sig olika för olika användningsområden. Normativa studier, slutligen, syftar till att ge konkreta handlingsplaner i någon speciell situation. Sådana studier är viktiga underlag för beslut om investeringar, marknadsföringskampanjer, produktutvecklingsprogram och budgeteringar. För att kunna fatta sådana beslut behöver vi undersöka hur problemområdet ser ut, hur det fungerar och hur det kan komma att utveckla sig. Undersökningar av hur verkligheten ser ut och hur den fungerar är också centrala i natur- och samhällsvetenskaper. Frågeställningarna här utgörs ofta av vad-, var-, när-, hur- och varför-frågor. Vad inträffar i ekonomin när bankernas utlåningsräntor förändras? Var inträffar jordbävningar? När inträffar norrsken? Hur utvecklas celler från stamceller till specialiserade muskel- eller leverceller? Varför sker en gradvis klimatförändring? För att i någon mån kunna belysa sådana frågor och därmed utveckla kunskapen inom ett vetenskapsområde behövs undersökningar av det område som studeras. Ett gemensamt syfte för alla undersökningar är att öka kunskapen om ett visst problem eller en viss frågeställning. Ett sätt, kanske det viktigaste, att skaffa sig sådan kunskap, är att göra observationer, antingen i form av direkta iakttagelser eller genom mätningar med hjälp av olika instrument. Statistikteori är en viktig teori för hur observationer samlas in och analyseras och hur slutsatser kan dras från givna observationer. Statistikteori spelar därför en viktig roll vid planering och analys av undersökningar.

16

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R


7 mars 2017 – sida 17 – # 17

1 statistik – att lära sig något från observationer

Ytterst kan vi se statistikteorin som teorin för hur observationer kan ligga till grund för en ökad kunskap om omvärlden. Ordet statistik förekommer även i en annan och kanske vanligare betydelse, nämligen en samling uppgifter om iakttagna händelser. Statens årliga inkomster och utgifter samt aktiepriserna då börsen stänger för dagen är exempel på statistik i betydelsen en samling uppgifter. På en ishockeymatch brukar man räkna antalet skott på mål, antal mål, antal utvisningsminuter etc. Alla dessa uppgifter brukar kallas statistik. För att skilja statistikteorin och läran om de statistiska metoderna från denna senare betydelse, kallar vi uppgifter om iakttagna händelser för observationer eller statistiska observationer. Antalet invånare i Sverige den 1 januari varje år, priset på smör den första varje månad och antalet åskådare på en ishockeymatch är alltså exempel på vad vi kallar observationer. Syftet med den här boken är att ge läsaren en introduktion till statistikteorin, förmedla en idémässig bakgrund till statistisk metod och visa några enkla statistiska tekniker som kommer till användning vid några av stegen i en statistisk undersökning. Som ett första steg ger vi i nästa avsnitt tre mycket kortfattade exempel på problem som kan belysas med hjälp av statistiska undersökningar. I avsnittet därefter ger vi en översikt över vi bokens innehåll.

1.1 Några exempel på problem som kan belysas med hjälp av statistiska undersökningar 1.1.1 PRIS OCH EFTERFRÅGAN

Enligt ekonomisk teori finns ett samband mellan pris och efterfrågan på en vara. Teorin säger att om priset ökar minskar efterfrågan och vice versa. För att få stöd för den uppfattningen, eller, alternativt, för att visa att den inte stämmer, gör vi observationer på priset och på såld kvantitet av en vara vid ett antal olika tidpunkter. Förutom priset finns det en stor mängd andra faktorer som kan påverka efterfrågan av en vara. En del av dessa faktorer är kända, men de flesta är obekanta och kan därför inte mätas, inte ens om man vill mäta dem. Den samlade effekten av alla sådana faktorer brukar betraktas som en slumpmässig inverkan på efterfrågan. Detta innebär att vi inte kan observera det teoretiska sambandet mellan pris och efterfrågan, utan det finns en viss slumpmässig avvikelse mellan det teoretiska sambandet och de observationer vi gör. Hur mätningarna av priser och kvantiteter går till och hur mätresultaten ska analyseras när vi tar hänsyn till de slumpmässiga avvikelserna är ett problem för

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

17


7 mars 2017 – sida 18 – # 18

del i statistik och vetenskap

statistikteorin. Det finns även en rad andra frågor som är av intresse, t.ex. hur stor blir förändringen i efterfrågan om priset förändras.

1.1.2 OPINIONSUNDERSÖKNINGAR

När man söker kunskap om människors åsikter är det vanligt att använda sig av opinionsundersökningar. Förmodligen är de olika partisympatiundersökningar som genomförs med jämna mellanrum de mest kända opinionsundersökningarna. Eftersom mätningarna ska ske snabbt och till låg kostnad brukar man undersöka ett urval ur den befolkning vars opinion ska mätas. I urvalsundersökningar uppstår fel på grund av att inte alla individer undersöks utan endast ett urval av individer. Därför finns det en risk att de gjorda observationerna inte speglar egenskaperna hos hela den grupp som ska undersökas. Teorin för hur man planerar och genomför opinionsundersökningar är en stor och viktig del av statistikteorin. Planeringen av sådana undersökningar syftar till att så billigt som möjligt kunna få så precis information som möjligt om en grupp individers åsikter, planer för framtiden, ageranden osv.

1.1.3 KUNSKAPSTEST

Att undersöka hur stora kunskaper olika människor har om ett visst ämnesområde är ett både viktigt och vanligt problem i dagens samhälle. När det rör sig om inträdesprov till olika utbildningar har man en grupp sökande och problemet är att sortera fram de som har den största kunskapen eller har den förmodat största potentialen att klara utbildningen. Högskoleprovet är ett exempel på ett sådant kunskapstest. Resultaten från högskoleprovet antas ge ett mått på provdeltagarnas studieförmåga och används för intagning till många olika högskoleutbildningar. En annan typ av kunskapstest används för att undersöka ifall en provdeltagare kan tillräckligt mycket för att bli godkänd på en kurs eller en utbildning. Här är syftet inte att rangordna provtagarna utan att se om de har tillräckligt stora kunskaper. Tentamina i slutet av kurser och körkortsprovet är exempel på den typen av kunskapstest. När det gäller kunskapstest finns det flera problem att undersöka. Dels vill man naturligtvis få en uppfattning om provtagarens kunskaper. Det är även av intresse att bestämma hur svåra frågorna eller uppgifterna provdeltagarna har att lösa verkligen är. Om frågorna är allt för svåra blir det många felaktiga svar på frågorna och det är lätt att få uppfattningen att provtagarna har svagare kunskaper än de faktiskt har, och vice versa.

18

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R


7 mars 2017 – sida 19 – # 19

1 statistik – att lära sig något från observationer

När vi inser detta problem, inser vi också att det är viktigt att ett prov sätts samman av frågor med lämplig svårighet för att provet ska ge så bra information som möjligt om provtagarnas kunskaper. Med hjälp av statistikteori kan kunskapsprov konstrueras och analyseras. Vidare är det möjligt att med hjälp av statistikteori analysera provtagarnas resultat och uppskatta provtagarnas kunskapsnivåer.

1.2 De olika kapitlen För att mer precist kunna diskutera teorin för statistiska metoder diskuterar vi först några grundläggande vetenskapsteoretiska begrepp i kapitel 2. Modeller och hur de kommer till användning i analys av data diskuteras i kapitel 3 och en teori för kunskapsbildning baserad på observationer, dvs. hur vi ökar vårt kunnande genom att göra iakttagelser, diskuteras därefter i kapitel 4. I kapitlen 5–10 diskuteras några grundläggande begrepp inom sannolikhetsläran. Vad en modell av slumpmässiga händelser är och hur sannolikheter kan tolkas beskrivs i kapitel 5 medan några grundläggande räkneregler för sannolikhetsberäkningar presenteras i kapitel 6. Om observationerna är tal kan de beskrivas med hjälp av s.k. stokastiska variabler. Stokastiska variabler introduceras i kapitel 7 och några modeller för stokastiska variabler som ofta förekommer i tillämpningar presenteras i kapitlen 8 och 9. Presentationen av sannolikhetsmodeller avslutas i kapitel 10 med några exempel på tillämpningar. Kapitlen 11–16 ägnas åt grunderna för statistiska undersökningar. I kapitel 11 introduceras några centrala begrepp för statistiska undersökningar. Kausalitet, dvs. orsakssamband, diskuteras i kapitel 12. Experiment och observationsstudier är två viktiga typer av undersökningar. Sådana undersökningar beskrivs i kapitlen 13–15. Databildning, dvs. modeller för hur data genereras, presenteras i kapitel 16. Den enklaste typen av analys består av en sammanfattande beskrivning, deskription, av observationerna. Deskription presenteras i kapitlen 17–21. Kapitel 17 introducerar några grundläggande begrepp för deskription, kapitel 18 behandlar fallet då vi studerar endast en variabel, kapitel 19 fallet med två variabler, kapitel 20 fallet med fler än två variabler och kapitel 21 fallet då vi studerar variabler över tiden. Grunderna för en mer formaliserad analys av observationer behandlas i kapitlen 22–28. Analys av observationer innebär ofta någon form av jämförelse mellan vad vi förväntar oss att observera, dvs. en modell, och vad vi faktiskt observerar. Några sätt att göra sådana jämförelser intro-

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R

19


7 mars 2017 – sida 20 – # 20

del i statistik och vetenskap

duceras i kapitel 22. Det visar sig att en analys av observationer består av att studera en funktion av observationerna. Sannolikhetsfördelningar för några sådana funktioner behandlas i kapitel 23. Kapitel 24 behandlar tekniker för att uppskatta okända parametrar i sannolikhetsmodeller. De nästföljande två kapitlen behandlar några tekniker för att statistiskt pröva hypoteser om parametrar i sannolikhetsmodeller. Teorier för analys av samband mellan variabler introduceras i kapitlen 27 och 28. I det avslutande kapitlet diskuteras några teorier om beslutsfattande.

20

© F Ö R FAT TA R E N O C H S T U D E N T L I T T E R AT U R



29 mm

Hans Nyquist  |

Statistikens grunder

Hans Nyquist är professor i statistik vid Stockholms universitet. Han undervisar på kurser i sannolikhetsteori, statistisk inferens samt generaliserade linjära modeller. Hans forskningsområde är design av planerade experiment.

Statistikens grunder Vetenskap, empiriska undersökningar och statistisk analys Statistikämnet behandlar metoder för att skapa kunskap genom att göra observationer. Att tolka och förstå statistik är en viktig vetenskaplig färdighet men också många gånger en förutsättning för ett kritiskt förhållningssätt i vardagen. Statistikens grunder syftar till att skapa förståelse för hur statistiska metoder används för att generera kunskap och hur dessa metoder fungerar respektive inte fungerar.

Statistikens grunder Vetenskap, empiriska undersökningar och statistisk analys

Statistikens grunder tar avstamp i vetenskapsteori och vetenskapens grundbegrepp och sätter på detta sätt in statistikämnet i sitt vetenskapliga sammanhang. Boken går därefter ingående igenom ämnets grunder från sannolikhetsteori via empiriska undersökningar och deskription till statistisk inferens. Detta ger de grundläggande verktyg som krävs för att utföra statistiska analyser och för att kritiskt granska tidigare analyser. Statistikens grunder lyfter också fram varför statistiska metoder kan användas i vissa situationer men inte i andra. Boken är avsedd som litteratur på en introduktionskurs i statistik, men kan även användas som en metodbok för studerande på alla nivåer, från grundkurs till forskarnivå, i ämnesområden där statistiska metoder kommer till användning.

Art.nr 39413 2:a uppl.

Hans Nyquist

studentlitteratur.se

78-91-44-11591-7_01_cover.indd All Pages

2017-03-07 11:50


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.