9789147053513

Page 1

Boken beskriver teorin inom dessa och angränsande områden, men ger också många exempel på tillämpningar. Boken innehåller ett stort antal lösta exempel och ännu fler övningsuppgifter, alla med svar och många även med ledningar. Boken lämpar sig för grundläggande kurser i matematisk statistik på 5 –15 högskolepoäng för civilingenjörsutbildningar och matematiskt inriktade naturvetenskapliga utbildningar, samt till fristående kurser i matematisk statistik.

TOM BRITTON

STOKASTIK

Ämnet består huvudsakligen av två delar, sannolikhetsteori och statistisk inferensteori. Sannolikhetsteori är den del av matematik som behandlar slumpmässiga fenomen: ”Hur sannolikt är det att en viss händelse inträffar?” ”Vilken sannolikhetsmodell passar för ett visst slumpförsök?” Statistisk inferensteori använder sig av sannolikhetsteori för att dra slutsatser om datamaterial: ”Föreligger det någon skillnad mellan två mätserier?” ”Hur säkert kan vi uttala oss om en populationsandel från att ha observerat ett urval av populationen?”

SVEN ERICK ALM

ALM BRITTON

STOKASTIK är en grundläggande bok i matematisk statistik.

Författarna är professorer i matematisk statistik, Sven Erick Alm vid Uppsala universitet och Tom Britton vid Stockholms universitet.

Sannolikhetsteori och statistikteori med tillämpningar

Best.nr 47-05351-3 Tryck.nr 47-05351-3

Omslag Stokastik.indd 1

08-03-17 08.12.42


Stokastik ISBN 978-91-47-05351-3 © 2008 Sven Erick Alm, Tom Britton och Liber AB Typografi: Anna Hild Omslag: Nette Lövgren Första upplagan 1 Repro: Repro 8 AB, Nacka Tryck: Korotan, Ljubljana, Slovenien 2008

Kopieringsförbud

Detta verk är skyddat av upphovsrättslagen! Kopiering, utöver lärares rätt att kopiera för undervisningsbruk enligt BONUS-avtal, är förbjuden. BONUS-avtal tecknas mellan upphovsrättsorganisationer och huvudman för utbildningsanordnare t ex kommuner/universitet. Den som bryter mot lagen om upphovsrätt kan åtalas av allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig erlägga ersättning till upphovsman/rättsinnehavare. Liber AB, 113 98 Stockholm tfn 08-690 92 00 www.liber.se Kundservice tfn 08-690 93 30, fax 08-690 93 01 e-post: kundservice.liber@liber.se


2008-02-27 – sida i – # 1

Förord

Denna bok är avsedd för grundkurser i matematisk statistik för såväl teknologer som matematiker och naturvetare. Det kan gälla allmänna grundkurser i matematisk statistik på 5–15 hp, eller specifika kurser i sannolikhetsteori eller statistisk inferensteori. Lämpliga förkunskaper för boken är en termins högskolestudier i matematik. Anledningen till att vi skrivit denna bok är att vi bägge har undervisat många olika grundläggande kurser i matematisk statistik och då känt ett behov av en ny, modern, grundläggande bok på svenska i ämnet. Det är inte så att boken avviker diametralt från alla andra böcker inom ämnet, även om den är mer problemorienterad än brukligt, men vi hoppas i alla fall att vi tagit upp en del områden från lite nya perspektiv. Innehållet i boken är inriktat mot teori men det finns gott om tillämpningar som illustrerar olika användningsområden. Utöver traditionell sannolikhetsteori och statistisk inferensteori innehåller boken ett utförligt kapitel om icke-parametriska metoder, samt kapitel om stokastiska processer, simulering och statistiska undersökningar. Vi har även tagit med lite utvikningar mot modernare metoder, t.ex. koppling, bootstrap och MCMC. För att eliminera behovet av kompletterande problemsamlingar innehåller boken knappt 200 lösta exempel samt cirka 300 övningar och 175 blandade problem, alla utom ”bevisuppgifter” med svar, och många med separata ledningar. Innehållet har använts på, och påverkats av, flera olika kurser, för både teknologer och naturvetare, både på inledande kurser i matematisk statistik och fortsättningskurser i sannolikhetsteori och inferensteori. Vi är tacksamma för de synpunkter som framkommit från studenterna, inte minst från Måns Eriksson som har korrekturläst hela boken. Många kollegor har också kommit med värdefulla kommentarer under skrivandets gång. Vi vill speciellt tacka Dag Jonsson för hans kloka och genomtänkta synpunkter.


2008-02-27 – sida ii – # 2

II

FÖRORD

Att producera ett tryckfärdigt alster har varit tidsödande. Vi har lärt oss mycket om hur man framställer och konverterar figurer; ett tack till Thomas Andersson och Erik Starbäck. Vi vill också tacka Per Starbäck som skrivit ett listigt program, vilket eliminerat ett antal olyckliga avstavningar. Slutligen, utan Anders Källströms ovärderliga hjälp hade vi säkert fortfarande suttit och grävt i våra LATEX-manualer! Ett stort tack också till vår redaktör Jan-Eric Ohlsson vid Liber som varit behjälplig med korrekturläsandet och som också accepterat våra återkommande framflyttningar av ”deadlines”. Till slut vill vi önska dig som läsare en lärorik läsning av boken — att tillgodogöra sig innehållet gör man dock på riktigt först när man räknar uppgifterna. Uppsala och Stockholm, mars 2008, Sven Erick Alm och Tom Britton.


2008-02-27 – sida iii – # 3

Innehåll

Förord 1

Inledning

1.1 1.2 1.3 1.4 2

Vad är stokastik? . . . . . . . . . . . . Några exempel på stokastiska modeller . Bokens struktur . . . . . . . . . . . . . Läsanvisningar . . . . . . . . . . . . .

1

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

1 2 3 4

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

5 10 14 16 17 19 22 22 25 29 31 34 37

Slumpvariabler

41

3.1 3.2 3.3

Definition av slumpvariabel . . . . . . . . . . . . . . . . . . Diskreta slumpvariabler . . . . . . . . . . . . . . . . . . . . Fördelningsfunktioner . . . . . . . . . . . . . . . . . . . . .

41 44 48

Sannolikhetsteorins grunder

2.1 2.2 2.3

2.4 2.5

2.6 2.7 3

i

Utfallsrum och mängdlära . . . . . . . Sannolikheter på utfallsrum . . . . . . . Tolkning och exempel på sannolikheter 2.3.1 Tolkning av sannolikheter . . . 2.3.2 Träddiagram . . . . . . . . . . Kombinatorik . . . . . . . . . . . . . . Betingning och oberoende . . . . . . . 2.5.1 Betingning . . . . . . . . . . . 2.5.2 Oberoende . . . . . . . . . . . 2.5.3 Lagen om total sannolikhet . . . 2.5.4 Bayes sats . . . . . . . . . . . . * Sannolikhetsmått . . . . . . . . . . . Blandade problem . . . . . . . . . . . .

5


2008-02-27 – sida iv – # 4

IV

INNEHÅLL

3.4 3.5

3.6

3.7

3.8

3.9

3.10

3.11 3.12 3.13

3.14

3.15

Kontinuerliga slumpvariabler . . . . . . . . . . . . . . . . Lägesmått och spridningsmått . . . . . . . . . . . . . . . 3.5.1 Lägesmått . . . . . . . . . . . . . . . . . . . . . . 3.5.2 Spridningsmått . . . . . . . . . . . . . . . . . . . 3.5.3 Olikheter . . . . . . . . . . . . . . . . . . . . . . Några vanliga diskreta fördelningar . . . . . . . . . . . . 3.6.1 Tvåpunktsfördelning och Bernoulli-fördelning . . 3.6.2 Diskret likformig fördelning . . . . . . . . . . . . 3.6.3 Binomialfördelning . . . . . . . . . . . . . . . . . 3.6.4 Hypergeometrisk fördelning . . . . . . . . . . . . 3.6.5 Poisson-fördelning . . . . . . . . . . . . . . . . . 3.6.6 Geometrisk fördelning och besläktade fördelningar Några vanliga kontinuerliga fördelningar . . . . . . . . . . 3.7.1 Kontinuerlig likformig fördelning . . . . . . . . . 3.7.2 Exponentialfördelning . . . . . . . . . . . . . . . 3.7.3 Normalfördelning . . . . . . . . . . . . . . . . . . 3.7.4 *Fler kontinuerliga fördelningar . . . . . . . . . . Flerdimensionella slumpvariabler . . . . . . . . . . . . . . 3.8.1 Definition av flerdimensionella slumpvariabler . . 3.8.2 Kovarians och korrelation . . . . . . . . . . . . . 3.8.3 Oberoende slumpvariabler . . . . . . . . . . . . . 3.8.4 * Betingade fördelningar . . . . . . . . . . . . . . Några vanliga flerdimensionella fördelningar . . . . . . . 3.9.1 Kontinuerlig tvådimensionell likformig fördelning 3.9.2 * Multinomialfördelning . . . . . . . . . . . . . . 3.9.3 * Bivariat normalfördelning . . . . . . . . . . . . Funktioner av slumpvariabler . . . . . . . . . . . . . . . . 3.10.1 Funktioner av en slumpvariabel . . . . . . . . . . 3.10.2 Funktioner av flera slumpvariabler . . . . . . . . . 3.10.3 Väntevärden av funktioner av slumpvariabler . . . 3.10.4 Felfortplantningsformlerna . . . . . . . . . . . . . Stora talens lag . . . . . . . . . . . . . . . . . . . . . . . Centrala gränsvärdessatsen . . . . . . . . . . . . . . . . . Approximationer av fördelningar . . . . . . . . . . . . . . 3.13.1 Halvkorrektion . . . . . . . . . . . . . . . . . . . 3.13.2 Approximationer för några vanliga fördelningar . . Blandade och singulära fördelningar . . . . . . . . . . . . 3.14.1 Blandning av diskret och kontinuerlig fördelning . 3.14.2 * Singulära fördelningar . . . . . . . . . . . . . . Blandade problem . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51 57 57 63 67 71 71 73 76 81 86 89 95 95 98 100 111 116 116 121 125 130 133 133 134 138 143 144 146 149 156 160 162 168 168 169 175 175 177 180


2008-02-27 – sida v – # 5

INNEHÅLL

4

Stokastiska processer

185

4.1 4.2

185 187 189 192 196 196 201 204 205 205 206 213 214 216 219

4.3

4.4

4.5

4.6 5

Definition av stokastisk process . . . . . . . . . . . . . . . . Slumpvandring . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Passagesannolikheter och passagetider . . . . . . . . 4.2.2 Ruinsannolikheter . . . . . . . . . . . . . . . . . . Poisson-processen . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Addition och märkning . . . . . . . . . . . . . . . . 4.3.3 * Generaliseringar . . . . . . . . . . . . . . . . . . Tidsserier . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Stationära processer . . . . . . . . . . . . . . . . . 4.4.2 Glidande medelvärden och autoregressiva processer . Brownsk rörelse . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Definition . . . . . . . . . . . . . . . . . . . . . . . 4.5.2 Egenskaper . . . . . . . . . . . . . . . . . . . . . . Blandade problem . . . . . . . . . . . . . . . . . . . . . . .

Simulering

5.1

5.2 5.3 5.4 6

V

225

Generering av slumptal . . . . . . . . . . . . . . . . . . . 5.1.1 Generering av likformigt fördelade slumptal . . . . 5.1.2 Generering av slumptal från godtycklig fördelning Monte Carlo-metoder . . . . . . . . . . . . . . . . . . . . Koppling . . . . . . . . . . . . . . . . . . . . . . . . . . Blandade problem . . . . . . . . . . . . . . . . . . . . . .

. . . . . .

226 226 229 235 237 241

. . . . . . . . . . . .

243 243 243 245 248 248 250 252 253 254 258 263

Dataanalys

6.1 6.2

6.3

6.4 6.5

Inledning . . . . . . . . . Läges- och spridningsmått 6.2.1 Lägesmått . . . . . 6.2.2 Spridningsmått . . Grafisk illustration . . . . 6.3.1 Stam-blad-diagram 6.3.2 Lådagram . . . . . 6.3.3 Stolpdiagram . . . 6.3.4 Tårtdiagram . . . . 6.3.5 Histogram . . . . . Flerdimensionella material Blandade problem . . . . .

243

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .


2008-02-27 – sida vi – # 6

VI

7

INNEHÅLL

Statistisk inferens

7.1 7.2

7.3

7.4

7.5

7.6

7.7 8

265

Inledning . . . . . . . . . . . . . . . . . . . . . . . . . Estimation . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Egenskaper hos skattningar . . . . . . . . . . . . 7.2.2 * Asymptotiska egenskaper . . . . . . . . . . . 7.2.3 Momentmetoden . . . . . . . . . . . . . . . . . 7.2.4 Maximum likelihood-metoden . . . . . . . . . . 7.2.5 Minstakvadratmetoden . . . . . . . . . . . . . . 7.2.6 Skattningar av parametrar i standardfördelningar 7.2.7 Skattning av fördelningar . . . . . . . . . . . . . Konfidensintervall . . . . . . . . . . . . . . . . . . . . . 7.3.1 Definition av konfidensintervall . . . . . . . . . 7.3.2 Allmän metod för konfidensintervall . . . . . . . Hypotesprövning . . . . . . . . . . . . . . . . . . . . . 7.4.1 Begrepp inom hypotesprövning . . . . . . . . . 7.4.2 Val av metod . . . . . . . . . . . . . . . . . . . 7.4.3 Val av hypoteser . . . . . . . . . . . . . . . . . 7.4.4 Val av felrisk . . . . . . . . . . . . . . . . . . . 7.4.5 Val av testvariabel . . . . . . . . . . . . . . . . 7.4.6 Val av kritiskt område . . . . . . . . . . . . . . Stickprovsfördelningar . . . . . . . . . . . . . . . . . . 7.5.1 χ 2 -fördelningen . . . . . . . . . . . . . . . . . 7.5.2 t-fördelningen . . . . . . . . . . . . . . . . . . 7.5.3 * F -fördelningen . . . . . . . . . . . . . . . . . Inferens vid standardfördelningar . . . . . . . . . . . . . 7.6.1 Normalfördelning, ett stickprov . . . . . . . . . 7.6.2 Normalfördelning, två stickprov . . . . . . . . . 7.6.3 Stickprov i par . . . . . . . . . . . . . . . . . . 7.6.4 Normalapproximation . . . . . . . . . . . . . . Blandade problem . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Icke-parametriska metoder

8.1 8.2

8.3 8.4

Inledning . . . . . . . . . χ 2 -metoder . . . . . . . . 8.2.1 Test av anpassning 8.2.2 Homogenitetstest . 8.2.3 Oberoendetest . . 8.2.4 Fishers exakta test Teckentest . . . . . . . . . Rangsummetest . . . . . .

265 268 270 273 275 279 286 289 296 298 299 300 305 307 312 313 314 314 320 320 321 325 329 332 332 337 342 345 357 365

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

365 367 367 374 380 382 384 387


2008-02-27 – sida vii – # 7

INNEHÅLL

8.5 8.6

8.7 8.8 9

8.4.1 Teckenrangtest . . . . . . . 8.4.2 Wilcoxons tvåstickprovstest 8.4.3 Spearmans rangkorrelation . Test av slumpmässig ordning . . . . Datorintensiva metoder . . . . . . . 8.6.1 Permutationstest . . . . . . 8.6.2 Återsampling (Bootstrap) . Skalor . . . . . . . . . . . . . . . . Blandade problem . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

387 393 398 402 406 407 409 412 415

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

421 424 425 429 437 439 442 445 449 451

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

453 453 455 456 460 463 465 468

Regression

9.1 9.2

9.3 9.4 9.5 9.6

421

Inledning . . . . . . . . . . . . . . . . . . . Enkel linjär regression . . . . . . . . . . . . 9.2.1 Skattning av α och β . . . . . . . . . 9.2.2 Förklaringsgrad och konfidensintervall 9.2.3 Hypotestest . . . . . . . . . . . . . . 9.2.4 Prediktion . . . . . . . . . . . . . . . *Multipel linjär regression . . . . . . . . . . Korrelation . . . . . . . . . . . . . . . . . . Fallgropar i samband med regression . . . . . Blandade problem . . . . . . . . . . . . . . .

10 Statistiska undersökningar

453

10.1 Olika sorters undersökningar . . . . 10.1.1 Undersökningars syfte . . . 10.1.2 Population . . . . . . . . . 10.1.3 Olika undersökningsmetoder 10.2 Felkällor . . . . . . . . . . . . . . . 10.3 Officiell statistik . . . . . . . . . . . 10.4 Bayesiansk statistik . . . . . . . . . 10.5 Något om statistisk programvara . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

Litteratur

Sannolikhetsteori . . . . Stokastiska processer . . Simulering . . . . . . . . Inferensteori . . . . . . . Ickeparametriska metoder Regression . . . . . . . . Bayesiansk statistik . . . Förströelseläsning . . . .

VII

471

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

471 471 471 472 472 472 472 472


2008-02-27 – sida viii – # 8

VIII

INNEHÅLL

Tabeller

Det grekiska alfabetet . . . . . . . . . . . . . . Binomialfördelningen . . . . . . . . . . . . . . Poisson-fördelningen . . . . . . . . . . . . . . Normalfördelnings fördelningsfunktion, Φ(t) . Normalfördelningens kvantiler, λα . . . . . . . t-fördelningens kvantiler, tα (f ) . . . . . . . . . χ 2 -fördelningens kvantiler, χα2 (f ) . . . . . . . F -fördelningens kvantiler, Fα (f1 , f2 ) . . . . . Kritiska gränser för Wilcoxons tvåstickprovstest Kritiska gränser för teckenrangtestet . . . . . . Slumptal . . . . . . . . . . . . . . . . . . . . .

473

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

473 474 480 483 484 485 486 488 492 494 495

Ledningar till vissa av övningarna

497

Svar till övningarna

501

Ledningar till vissa av de blandade problemen

511

Svar till de blandade problemen

515

Sakregister

523


2008-02-27 – sida 1 – # 9

KAPITEL 1

Inledning

1.1 Vad är stokastik? Vi inleder med att förklara vad bokens titel Stokastik innebär, eftersom begreppet kanske inte är bekant för alla läsare. Stokastik1 är ett sammanfattande begrepp för de matematiska metoder som används för att modellera och analysera slumpmässiga fenomen. Ämnet kan delas upp i sannolikhetsteori, som behandlas i Kapitel 2 – 5, och statistikteori, Kapitel 6 – 10. Stokastik kan även anses vara en beskrivning av innehållet i ämnet Matematisk statistik. Slump kan uppfattas på flera olika sätt. Det vanligaste är att man tänker sig ett försök där utfallet inte är helt förutsägbart, utan påverkas av slumpen. Sådana försök kallas slumpförsök. Vi kommer att studera modeller för sådana och ta fram metoder för att analysera dessa. En mer allmän tolkning är att uppfatta och beskriva all osäkerhet, inklusive osäkerheter i modellen, med hjälp av slump, vilket är utgångspunkten för bayesiansk statistik som diskuteras i Avsnitt 10.4. Sannolikhetsteori handlar om att ställa upp modeller för slumpförsök och att ta fram räkneregler för sannolikheter för att utifrån dessa modeller kunna uttala sig om hur troliga olika observationer i försöket är. Statistikteori utgår från det omvända förhållandet, att vi har utfört ett slumpförsök, gjort våra observationer och utifrån dessa vill försöka dra slutsatser om den bakomliggande verkligheten. Det kan vara värt att påpeka att stokastik är en form av tillämpad matematik, vilket gör att den i vissa avseenden skiljer sig från andra matematikkurser, som analys och algebra. I dessa finns i allmänhet ett enda korrekt svar på alla problem, men så är inte fallet i tillämpad matematik, där svaret beror både på vilken modell man ansätter och vilken metod man använder för att behandla 1 Ordets ursprung är det grekiska ordet stochos, som betyder förmodan eller gissning, eller stochastikos, ungefär ”skicklig på att gissa”.


2008-02-27 – sida 2 – # 10

2

KAPITEL 1 INLEDNING

problemet. Detta kan kännas ovant om man tidigare inte ägnat sig åt någon form av tillämpad matematik.

1.2

Några exempel på stokastiska modeller

För att kunna göra sannolikhetsuttalanden eller dra statistiska slutsatser måste vi beskriva vårt slumpförsök med en lämplig slumpmodell. Som alla modeller, vare sig dessa är fysiska eller abstrakta, är dessa approximationer (förenklingar) av verkligheten. Att ha en känsla för vilka förenklingar som är rimliga är en viktig förmåga om man ska tillämpa stokastik i praktiken. Ibland är modellen så naturlig att man inte ens tänker på att den innehåller någon approximation. Ett sådant exempel är kast med en vanlig sexsidig tärning där den rimliga modellen är att alla sidor har samma chans att komma upp. Detta förutsätter dock att man kan tillverka en helt perfekt kub, men sådana existerar bara i matematiken och inte i verkligheten! Modellen förutsätter dessutom att kastet utförs så att utfallet verkligen är slumpmässigt. Vi fortsätter med ett något mer subtilt exempel, som kommer att behandlas utförligare i Exempel 2.14 på sidan 27. EXEMPEL 1.1 (Födelsedagsproblemet )

Hur troligt är det att det i en grupp om 25 personer finns två som har samma födelsedag? Hur många personer behövs det för att det ska vara troligare att detta förekommer än att alla har olika födelsedagar? För att kunna besvara dessa frågor behöver vi, förutom räkneregler för sannolikheter, ställa upp en modell som ger en rimlig beskrivning av verkligheten samtidigt som den är så pass enkel att den går att räkna med. Ett första antagande bör vara att personerna valts i någon mening slumpmässigt, dvs. så att olika födelsedagar är lika sannolika. Här uppstår dock två problem. Det första är att den 29 februari knappast kan vara lika vanlig som övriga datum. Det enklaste är vi låtsas som om det inte finns några skottår och räknar med att alla år har 365 dagar. I vissa fall är dock detta olyckligt, t.ex. om gruppen utgörs av en skolklass där alla är födda samma år, som råkar vara ett skottår. I detta fall bör man låta året ha 366 dagar i stället. Det andra problemet är att födelsedagar inte är likformigt utspridda över året. Vårmånaderna är något vanligare än höstmånaderna. Dock är dessa skillnader så pass små att de knappast påverkar svaret nämnvärt. Vi bör också kräva att de olika personernas födelsedagar är ”oberoende” av varandra, så att gruppen t.ex. inte innehåller tvillingpar!


2008-02-27 – sida 3 – # 11

1.3 BOKENS STRUKTUR

3

Vi avslutar med ett par exempel på statistiska frågeställningar som kommer att behandlas i Kapitel 7 och 8. EXEMPEL 1.2 (Opinionsundersökning)

Vid politiska opinionsundersökningar tillfrågas ett antal slumpmässigt utvalda röstberättigade om sina partisympatier, eller om hur de skulle rösta ”om det vore val idag”. Antag att 1000 personer tillfrågats och att 52 sagt sig sympatisera med ett visst parti. Partiets väljarandel uppskattas då till 0.052 eller 5.2 %. Eftersom procentandelen ligger ganska nära riksdagsspärren 4 % vill man i partiet veta om man kan känna sig någorlunda säker på att den verkliga väljarandelen är större än 0.04. Detta kan undersökas med ett statistiskt test, se Exempel 7.33 på sidan 351.

EXEMPEL 1.3 (Biverkningar, test )

För att få introducera en ny medicin på marknaden måste fabrikanten bland annat visa att den inte medför allvarliga biverkningar. I en studie ges den nya medicinen till 30 försökspersoner varav ingen får några biverkningar. Parallellt ges den tidigare använda medicinen till en kontrollgrupp bestående av 120 personer. Av dessa får 11 personer biverkningar. Kan man av denna undersökning dra slutsatsen att den nya medicinen mera sällan ger biverkningar än den gamla? Problemet behandlas i Exempel 8.11 på sidan 383.

1.3 Bokens struktur Grundläggande sannolikhetsteori behandlas i Kapitel 2. Det centrala begreppet slumpvariabel (eller stokastisk variabel) introduceras i det följande kapitlet, som också är bokens längsta. I Kapitel 4 studeras stokastiska processer, dvs. slumpmässiga förlopp i tiden. Sannolikhetsdelen avslutas med en orientering om datorsimulering i Kapitel 5. Statistikdelen inleds i Kapitel 6 med dataanalys, dvs. beskrivande (eller deskriptiva) statistiska metoder. De analytiska delarna av statistikteorin behandlas i de följande tre kapitlen. Det mest omfattande av dessa är Kapitel 7 om statistisk inferens. Här behandlas så kallad parametrisk inferens, vilket innebär att vi med hjälp av observationer vill uttala oss om en slumpmodell som


2008-02-27 – sida 4 – # 12

4

KAPITEL 1 INLEDNING

är känd så när som på värdet av en eller flera storheter (parametrar). Ett annat angreppssätt beskrivs i Kapitel 8 som presenterar icke-parametriska metoder. Kapitel 9 ägnas åt regressionsanalys som handlar om att beskriva samband mellan variabler, i första hand linjära samband. Statistikdelen avslutas med ett kapitel om statistiska undersökningar. Boken avslutas med tabeller över statistiska fördelningar, samt ledningar och svar till bokens övningar och problem. Den teoretiska delen av kursen presenteras på traditionellt matematiskt sätt med definitioner och satser, medan vissa approximationer i sannolikhetsdelen och statistiska metoder i inferensdelen presenteras i metodrutor. Dessa har samma grafiska framställning (skuggade) som definitioner och satser och är (minst) lika viktiga delar av framställningen som dessa.

1.4

Läsanvisningar

Vissa avsnitt är markerade med en asterisk (*). Detta anger att innehållet är av karaktären ”överkurs”. Även vissa av problemen är markerade med en asterisk, vilket anger att svårighetsgraden är högre än normalt. Boken är försedd med ett stort antal anmärkningar. Dessa ger kompletterande information och är inte nödvändiga för den fortsatta framställningen, men kan bidra till förståelsen. ANMÄRKNING 1.1

Det förekommer också ett mindre antal fotnoter. Innehållet i dessa har ofta en mer allmänbildande karaktär, se sidan 1 för ett exempel.

Det finns två typer av övningsuppgifter i boken, övningar och blandade problem. Övningarna är tänkta som direkta tillämpningar på den teori, eller de metoder, som ingår i ett avsnitt och är placerade i slutet av respektive avsnitt. Varje kapitel avslutas med blandade problem som täcker in hela kapitlets innehåll. Övningarna är i allmänhet något lättare än de blandade problemen. Vi rekommenderar dig som läsare att vänta med att försöka lösa de blandade problemen tills du hunnit tillgodogöra dig hela innehållet i kapitlet och tränat på övningarna. Svar till övningar och problem återfinns i slutet av boken. Till vissa av uppgifterna finns det dessutom ledningar, vilket anges med ett (L) efter uppgiften. Vi har valt att separera ledtrådarna både från problemen och från svaren för att man ska kunna gå direkt till svaret, eller få hjälp på traven utan att se svaret.


2008-02-27 – sida 5 – # 13

KAPITEL 2

Sannolikhetsteorins grunder

I detta kapitel kommer vi att gå igenom grunderna för sannolikhetsteorin. Inledningsvis kommer merparten exempel vi använder att vara enkla, klassiska slumpexperiment såsom slantsingling, tärningskast och kortdragning. Vi använder dessa eftersom de är renodlade och kräver liten eller ingen ytterligare förklaring. I senare avsnitt i boken kommer våra exempel att bli mer varierade och intressanta.

2.1 Utfallsrum och mängdlära Vi skall nu definiera vad som menas med utfall, händelser och utfallsrum, samt gå igenom några viktiga begrepp från mängdläran. Dessa kunskaper kommer vi att använda oss av i nästa avsnitt då vi presenterar slumpexperiment och beräknar sannolikheter för utfall av slumpexperiment. I grunden ligger hela tiden ett slumpexperiment eller slumpförsök. Med detta menas en situation där något kommer att inträffa, men som vi inte med säkerhet i förhand kan säga vad.

DEFINITION 2.1 (UTFALL, HÄNDELSER OCH UTFALLSRUM)

Resultatet av ett slumpförsök kallas ett utfall. Mängden av möjliga utfall från ett visst slumpförsök kallas utfallsrum. En viss specificerad mängd utfall kallas för en händelse – således är enskilda utfall, liksom hela utfallsrummet, också händelser. Enskilda utfall betecknas med u1 , u2 , . . . , händelser betecknas med versaler A, B, . . . och utfallsrummet med Ω. Utfallsrum med ändligt eller uppräkneligt oändligt många utfall kallas diskreta utfallsrum medan övriga kallas kontinuerliga utfallsrum.


2008-02-27 – sida 6 – # 14

6

KAPITEL 2 SANNOLIKHETSTEORINS GRUNDER

Det är värt att påpeka att utfall och händelser inte är ”tal” utan element respektive mängder av element. Man kan alltså inte addera eller subtrahera händelser med varandra men man kan däremot betrakta unioner och snitt av händelser, och dessa unioner och snitt är i sin tur också händelser. Unioner betecknas med ∪ och snitt med ∩. Händelsen A ∪ B, som läses ”A union B”, utgörs av alla utfall som ingår i någon av händelserna A eller B, eller bägge (vilket illustreras av områdena 1, 2 och 3 i Figur 2.1 som är ett s.k. Venndiagram). Händelsen A ∩ B, ”snittet av A och B”, består däremot bara av utfallen B

A 1

2

3

4 Figur 2.1. Ett Venndiagram med utfallsrum Ω och två händelser A och B. Hur områdena 1, 2, 3 och 4 (det som ligger utanför ringarna) uttrycks i termer av A och B beskrivs i texten.

som ingår i bägge händelserna (område 2 i Figur 2.1). Notera vidare att A ∪ B = B ∪ A, och att A ∩ B = B ∩ A. För flera händelser, A1 , . . . , An , består händelserna ∪ni=1 Ai och ∩ni=1 Ai på motsvarande sätt av de utfall som ingår i någon av, respektive alla, Ai -händelserna. EXEMPEL 2.1 (Årsdatum)

Låt Ω := {1/1, 2/1, . . . , 31/1, 1/2, . . . , 31/12} vara dagarna på året under ett år utan skottdag. Om vi låter A := {1/1, . . . , 30/6} vara det första halvåret medan B := {1/6, . . . , 31/8} vara dagarana i de tre sommarmånaderna blir A ∪ B = {1/1, . . . , 31/8}, dvs. alla dagar i januari till och med augusti, medan A ∩ B = {1/6, . . . , 30/6} endast består av dagarna i juni. Definiera även A1 := {1/1, 1/2, . . . , 1/12}, dvs. den första dagen i varje månad och på motsvarande sätt Ai := {i/1, i/2 . . . , i/12}, den i:te dagen i varje månad, i = 1, . . . , 31. Då omS fattar 5i=1 Ai = {1/1, . . . , 5/1, 1/2, . . . , 5/12} de första fem dagarna i T varje månad. Mängden 5i=1 Ai = ∅ (nedan förklaras beteckningen ∅)


2008-02-27 – sida 7 – # 15

2.1 UTFALLSRUM OCH MÄNGDLÄRA

7

innehåller däremot inga utfall eftersom månadernas första dag inte har någon gemensam dag med månadernas andra dag osv.

Ibland vill man betrakta ”komplementet” till en händelse, och med detta menas ”de utfall som inte ingår i händelsen”. Komplementet till händelsen A betecknas Ac , läses som ”A-komplement”, och består således av utfallen som inte finns i A, dvs. Ac = {u ∈ Ω : u ∈ / A} (områdena 3 och 4 i Figur 2.1). En annan typ av händelse är ”A men inte B”. Denna händelse har fått en egen beteckning, nämligen A \ B (område 1 i Figur 2.1). Egentligen är denna beteckning överflödig eftersom A \ B = A ∩ B c , och vi kommer inte att använda den i fortsättningen. En speciell händelse är ”inget utfall” vilket brukar betecknas med ∅ och kallas för tomma mängden. Till exempel gäller att Ωc = ∅. Två händelser sägs vara oförenliga, eller disjunkta, om de inte har några gemensamma utfall (se Figur 2.2). För sådana par av händelser gäller att A ∩ B = ∅.

A

B

Figur 2.2. Ett Venndiagram med ett utfallsrum Ω med två oförenliga (disjunkta) händelser A och B, dvs. A ∩ B = ∅.

Slutligen definierar vi begreppet delmängd. En händelse A är en delmängd av händelsen B om alla utfall i A också ligger i B. Detta skrivs som A ⊂ B. Det gäller för övrigt att A ⊂ B om och endast om A ∩ B = A. Sammanfattningsvis gäller alltså: ⊲ ⊲ ⊲ ⊲

att A inte inträffar skrivs som Ac , att minst en av A och B inträffar skrivs A ∪ B, att både A och B inträffar skrivs A ∩ B, att A men inte B inträffar skrivs A ∩ B c (= A \ B).


2008-02-27 – sida 8 – # 16

8

KAPITEL 2 SANNOLIKHETSTEORINS GRUNDER

EXEMPEL 2.2 (Kortdragning)

För slumpexperimentet att dra ett kort ur en kortlek består utfallsrummet av Ω = {S1, . . . , S13, H1, . . . , H13, K1, . . . , K13, R1, . . . , R13}, där utfallet S1 betyder spader ess, utfallet H13 hjärter kung osv. Händelsen A :=”klöver” omfattar således utfallen A = {K1, . . . , K13}, händelsen B :=”femma” definieras av B = {S5, H5, K5, R5} och händelsen C :=”klädda kort” (dvs. knekt, dam eller kung) omfattar C = {S11, S12, S13, H11, . . . , R13}. För dessa händelser gäller A ∪ B = {K1, . . . , K13, S5, H5, R5}, A ∩ B = {K5} samt Ac = {S1, . . . , S13, H1, . . . , H13, R1, . . . , R13}. Händelserna B och C är oförenliga; ett kort kan ju inte vara en femma och klätt på samma gång, så B ∩ C = ∅.

EXEMPEL 2.3 (Temperaturmätning)

Låt oss studera ”slumpexperimentet” att man mäter temperaturen en viss tid på en viss plats. Här definieras utfallsrummet lämpligen som Ω = R, dvs. alla reella tal (där talen motsvararar temperaturen angiven i grader Celsius). Det är möjligt att snäva in utfallsrummet, t.ex. är det ju teoretiskt omöjligt att det är kallare än −273.15. (Om det gäller utomhustemperatur i skuggan i Sverige kan man nog snäva in Ω ännu mer: kallare än −100 känns inte aktuellt och varmare än 50 dröjer väl ännu några år innan växthuseffekten ger upphov till, men vi lämnar dessa justeringar därhän.) Om A :=”minusgrader” gäller att A = (−∞, 0), medan händelsen ”mellan 10 och 20 grader kallt” blir B = (−20, −10). För A gäller Ac = [0, +∞), dvs. ”plusgrader” (om man räknar in 0 i ”plus”). Det gäller vidare att A ∪ B = (−∞, 0) och A ∩ B = (−20, −10). De två sistnämnda resultaten är en direkt följd av att B ⊂ A, vilket alltid medför att A ∪ B = A och A ∩ B = B. Utfallsrum som har ändligt många, eller uppräkneligt oändligt många, utfall definierades tidigare som diskreta medan övriga benämndes kontinuerliga. Utfallsrummet bestående av resultatet från en kortdragning i Exempel 2.2 är diskret, liksom t.ex. utfallsrummet som består av alla positiva heltal, medan utfallsrummet för temperaturen i Exempel 2.3 är kontinuerligt. Om kontinuerliga variabler endast uppmäts med given noggrannhet, vilket nästan alltid är fallet, är emellertid även dylika utfallsrum diskreta. Om t.ex. temperaturen anges med en decimals noggrannhet blir utfallsrummet Ω = {. . . , −0.2, −0.1, 0.0, 0.1, 0.2, . . . } vilket är ett diskret utfallsrum.


2008-02-27 – sida 9 – # 17

2.1 UTFALLSRUM OCH MÄNGDLÄRA

9

ÖVNING 2.1.1

Betrakta utfallsrummet Ω bestående av ett företags ekonomiska resultat (avrundat och mätt i tusental kronor). Låt A beteckna händelsen att företaget gör ett positivt resultat. Låt B beteckna händelsen att företaget gör ett bättre resultat än föregående år då man gjorde ett vinstresultat på 1.400 miljoner kronor. a) Definiera Ω, A och B. b) Bestäm A ∪ B och A ∩ B. c) Bestäm Ac . ÖVNING 2.1.2

En pilkastningstävling går till så att deltagarna får kasta tills de för första gången träffar ”bulls eye” (den innersta lilla cirkeln på piltavlan). Den vinner som klarar detta på minst antal kast. Bestäm utfallsrummet av möjliga utfall, samt händelserna A att det sker efter högst 10 kast och B att det sker på ett jämnt antal kast. a) Definiera Ω, A och B. b) Bestäm A ∪ B och A ∩ B. c) Bestäm Ac . ÖVNING 2.1.3

Betrakta årets dagar ett år som inte är skottår (t.ex. 2/9 och 31/7). a) Definiera utfallsrummet Ω. b) Specificera händelserna S bestående av september månads dagar och O bestående av oktober månads dagar. c) Bestäm V := ”dagarna i stjärntecknet Vågen” (Vågen inträffar mellan 24/9 och 23/10). d) Uttryck följande händelser i termer av S, O och V , samt i termer av de enskilda utfallen: september månads dagar då inte Vågens stjärntecken inträffar, dagarna i oktober då Vågen inträffar, dagarna då det är september eller Vågen inträffar. ÖVNING 2.1.4

Visa de Morgans lagar, som säger att för godtyckliga händelser (mängder) A1 , . . . , Ak det gäller att (A1 ∪ · · · ∪ Ak )c = Ac1 ∩ · · · ∩ Ack

(A1 ∩ · · · ∩ Ak ) = c

Ac1

∪···∪

Ack .

och (L)

ÖVNING 2.1.5

Visa de distributiva lagarna för händelser (mängder), som säger att för godtyckliga händelser A, B, C det gäller att A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)

A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).

och (L)


2008-02-27 – sida 10 – # 18

10

KAPITEL 2 SANNOLIKHETSTEORINS GRUNDER

2.2

Sannolikheter på utfallsrum

Nu när vi preciserat vad som menas med utfallsrum så ska vi definiera slumpförsök och sannolikheter på sådana. Ett slumpförsök på ett utfallsrum består av ett försök som resulterar i ett av utfallen i utfallsrummet, där man på förhand inte kan veta exakt vilket av utfallen som kommer att inträffa. I stället beskrivs slumpförsöket genom att man preciserar sannolikheterna för (alla) händelser i utfallsrummet. Sannolikheten för händelsen A brukar skrivas P (A) inspirerat av engelskans ”probability”. Man ställer dock vissa krav på funktionen P (·) för att den ska få kallas en sannolikhetsfunktion. Följande högst rimliga krav på sannolikheter infördes av den ryske matematikern Andrej Kolmogorov (1903-1987). DEFINITION 2.2 (KOLMOGOROVS AXIOMSYSTEM)

En reell funktion, P , på händelser i utfallsrummet Ω är en sannolikhetsfunktion om den uppfyller följande tre villkor (axiom): 1. 0 ≤ P (A) ≤ 1 för alla händelser A ⊂ Ω, 2. P (Ω) = 1, 3. om A ∩ B = ∅ så gäller P (A ∪ B) = P (A) + P (B). Om utfallsrummet är oändligt ersätts villkor 3 med 3’. Om A1 , A2 , . . . är en oändlig följd av parvis oförenliga händelser (dvs. P∞ Ai ∩ Aj = ∅ för alla i 6= j) så gäller P (∪∞ i=1 P (Ai ). i=1 Ai ) =

ANMÄRKNING 2.1

I Axiom 1 räcker det att P (A) ≥ 0. Att P (A) ≤ 1 följer av de övriga axiomen, se Övning 2.2.6.

Alla tre villkoren i Kolmogorovs axiomsystem är självklara för alla utan att man reflekterat över det. Det första villkoret är en ren konvention – någon som pratar om negativa sannolikheter eller sannolikheter större än 1 betraktas med rätta med skepsis. Även det andra villkoret är en konvention – det har blivit praxis att den helt säkra händelsen, dvs. den som innehåller alla möjliga utfall, ges sannolikheten 1. Det tredje villkoret slutligen, säger att sannolikheten för två oförenliga händelser är lika med summan av sannolikheterna för var och en av händelserna. Förutsättningen att A och B skall vara oförenliga i villkor 3 är viktigt – i annat fall gäller inte utsagan.


2008-02-27 – sida 11 – # 19

2.2 SANNOLIKHETER PÅ UTFALLSRUM

11

Den vanligaste tolkningen av en sannolikhet, t.ex. P (A) = 0.3, är att om man upprepar slumpförsöket många gånger så kommer den relativa frekvensen för händelsen A, dvs. andelen försök där A inträffar, att ligga nära 0.3. Även för detta sätt att se på sannolikheter är utsagorna i Kolmogorovs axiomsystem självklara: den relativa frekvensen ligger ju alltid mellan 0 och 1, den relativa frekvensen för utfall i Ω är förstås 1 (alla utfall ligger ju i Ω så den relativa frekvensen av utfall i Ω blir 1). Slutligen blir den relativa frekvensen av unionen av oförenliga händelser lika med summan av de respektive relativa frekvenserna: inga utfall ingår ju i flera händelser, så antalet utfall i unionen blir lika med summan av antalet utfall i respektive händelse. EXEMPEL 2.4 (Kortdragning, sannolikheter )

I Exempel 2.2 betraktades försöket att dra ett kort slumpmässigt ur en kortlek. Det betyder att varje kort, dvs. varje utfall, har samma sannolikhet, 1/52. (Denna vanliga slumpstruktur kallas likformig sannolikhetsfördelning och tas upp i Definition 2.3 i nästa avsnitt.) Sannolikheten för en händelse blir därför antalet utfall i händelsen dividerat med 52. I exemplet definierades händelserna A :=”klöver”, B :=”femma” och C :=”klädda”. Genom att räkna antal utfall i respektive händelse inser man snabbt att P (A) = 13/52 = 1/4, P (B) = 4/52 = 1/13 och P (C) = 12/52 = 3/13. Vi konstaterade att händelserna B och C var oförenliga (B ∩ C = ∅). Således gäller P (B ∪ C) = P (B) + P (C) = 1/13 + 3/13 = 4/13. Vidare är A ∩ B = ”klöver fem”, så att P (A ∩ B) = 1/52. Det är ofta klargörande att föreställa sig en sannolikhetsfunktion som att en enhet ”sannolikhetsmassa” smetas ut över ett Venndiagram (t.ex. Figur 2.1 på sidan 6). Värdet P (A) kan då tolkas som hur stor del av sannolikhetsmassan som ligger i händelsen A. Med denna tolkning är de tre villkoren i Kolmogorovs axiomsystem också självklara. Även följande sats är självklar med denna bildtolkning. SATS 2.1 (KOMPLEMENT- OCH ADDITIONSSATSEN)

Låt A och B vara godtyckliga händelser i utfallsrummet Ω. Då gäller 1. P (Ac ) = 1 − P (A), 2. P (∅) = 0, 3. P (A ∪ B) = P (A) + P (B) − P (A ∩ B). Det första resultatet säger att mängden sannolikhetsmassa utanför A är 1 (dvs. all sannolikhetsmassa) minus den som finns i A. Eftersom den tomma mäng-


2008-02-27 – sida 12 – # 20

12

KAPITEL 2 SANNOLIKHETSTEORINS GRUNDER

den inte innehåller något utfall kan den ju inte ha någon sannolikhetsmassa, vilket är resultat 2. Om vi skall räkna ut hur mycket sannolikhetsmassa som finns i unionen av A och B kan vi göra detta genom att addera mängden sannolikhetsmassa som finns i A (områdena 1 och 2 i Figur 2.1 på sidan 6) med mängden sannolikhetsmassa i B (områdena 2 och 3 i Figur 2.1). Vi ser då att vi räknat mängden sannolikhetsmassa i område 2, dvs. P (A ∩ B), två gånger varför vi måste subtrahera denna mängd sannolikhetsmassa. Man kan även visa resultaten i Sats 2.1 mer formellt från sannolikhetsaxiomen. Vi gör detta för det tredje resultatet och lämnar de övriga två resultaten som övningar. BEVIS, SATS 2.1, RESULTAT 3

Mängden A ∪ B kan skrivas som A ∪ (B ∩ Ac ) där de två mängderna är oförenliga, dvs. A ∩ (B ∩ Ac ) = ∅. Att så är fallet ses lätt i Figur 2.1 på sidan 6 där A utgör områdena 1 och 2 medan B ∩ Ac är område 3. Axiom 3 i Kolmogorovs axiomsystem ger oss då att P (A ∪ B) = P (A) + P (B ∩ Ac ). Vidare kan händelsen B delas upp i de två disjunkta delarna (B ∩ A) och (B∩Ac ), så från samma axiom får vi att P (B) = P (B∩A)+P (B∩Ac ), dvs. att P (B ∩ Ac ) = P (B) − P (B ∩ A). Om vi substituerar detta i föregående uttryck erhåller vi P (A ∪ B) = P (A) + P (B) − P (B ∩ A), dvs. satsens tredje resultat.

EXEMPEL 2.5 (Kortdragning, sannolikheter, forts.)

Händelsen A betyder ”klöver” vilket gör att Ac betyder ”ej klöver” och sannolikheten för detta blir enligt satsen 1 − P (A) = 1 − 1/4 = 3/4. Detta överensstämmer med det andra sättet att räkna ut denna sannolikhet, nämligen genom att räkna antalet utfall i ”icke-klöver” som är 39 och dividera detta med 52. Sannolikheten för ”inget utfall” blir förstås P (∅) = 0. Sannolikheten för händelsen A ∪ B, som alltså utgörs av utfallen med klöver och/eller siffran 5, blir enligt satsen P (A ∪ B) = P (A) + P (B) − P (B ∩ A) = 1/4 + 1/13 − 1/52 = 4/13. Om vi i stället betraktar vilka utfall som ingår i A ∪ B är dessa A ∪ B = {K1, . . . , K13, S5, H5, R5} som består av 16 utfall, varför händelsen får sannolikheten 16/52 = 4/13, vilket alltså överensstämmer med det svar som satsen gav oss.


2008-02-27 – sida 13 – # 21

2.2 SANNOLIKHETER PÅ UTFALLSRUM

13

ÖVNING 2.2.1

Betrakta försöket att kasta en vanlig tärning, dvs. där utfallsrummet är Ω = {1, . . . , 6}, och antag att alla utfall har samma sannolikhet, som alltså måste vara 1/6. Låt A vara händelsen att tärningen visar ett jämnt antal ögon och B vara händelsen att antalet ögon är delbart med 3. Ange vilka utfall som utgör händelserna A, B, A ∩ B och A ∪ B och beräkna motsvarande sannolikheter. ÖVNING 2.2.2

Antag att för ett slumpförsök med två händelser A och B gäller P (A) = 0.4, P (B) = 0.5 och P (A ∪ B) = 0.6. Beräkna P (A ∩ B). ÖVNING 2.2.3

I ett lotteri med en vinstmöjlighet per lott finns tre vinstkategorier. Den högsta vinsten, H, vinner man med sannolikheten P (H) = 0.001, den näst högsta vinsten, N, vinner man med sannolikheten P (N ) = 0.01 och den tredje priskategorin, T , vinner man med sannolikheten P (T ) = 0.1. Bestäm sannolikheten för att överhuvud taget vinna, och sannolikheten att inte vinna (och därmed förlora satsat belopp). ÖVNING 2.2.4

Bevisa resultat 1 i Sats 2.1 utifrån Kolmogorovs axiomsystem.

(L)

ÖVNING 2.2.5

Bevisa resultat 2 i Sats 2.1 utifrån Kolmogorovs axiomsystem.

(L)

ÖVNING 2.2.6

Visa att den högra olikheten, P (A) ≤ 1, i Axiom 1 följer av den vänstra olikheten, P (A) ≥ 0, och de övriga axiomen. (L) ÖVNING 2.2.7 (Booles olikhet )

Bevisa Booles olikhet, dvs. att för två godtyckliga händelser A och B det gäller att P (A ∪ B) ≤ P (A) + P (B). (L) ÖVNING 2.2.8

Formulera och visa Booles olikhet, se Övning 2.2.7, a) för tre händelser, (L) b) för n händelser, n ≥ 2. (L)


Boken beskriver teorin inom dessa och angränsande områden, men ger också många exempel på tillämpningar. Boken innehåller ett stort antal lösta exempel och ännu fler övningsuppgifter, alla med svar och många även med ledningar. Boken lämpar sig för grundläggande kurser i matematisk statistik på 5 –15 högskolepoäng för civilingenjörsutbildningar och matematiskt inriktade naturvetenskapliga utbildningar, samt till fristående kurser i matematisk statistik.

TOM BRITTON

STOKASTIK

Ämnet består huvudsakligen av två delar, sannolikhetsteori och statistisk inferensteori. Sannolikhetsteori är den del av matematik som behandlar slumpmässiga fenomen: ”Hur sannolikt är det att en viss händelse inträffar?” ”Vilken sannolikhetsmodell passar för ett visst slumpförsök?” Statistisk inferensteori använder sig av sannolikhetsteori för att dra slutsatser om datamaterial: ”Föreligger det någon skillnad mellan två mätserier?” ”Hur säkert kan vi uttala oss om en populationsandel från att ha observerat ett urval av populationen?”

SVEN ERICK ALM

ALM BRITTON

STOKASTIK är en grundläggande bok i matematisk statistik.

Författarna är professorer i matematisk statistik, Sven Erick Alm vid Uppsala universitet och Tom Britton vid Stockholms universitet.

Sannolikhetsteori och statistikteori med tillämpningar

Best.nr 47-05351-3 Tryck.nr 47-05351-3

Omslag Stokastik.indd 1

08-03-17 08.12.42


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.