9789144133249

Page 1

MATEMATISK STATISTIK

KERSTIN VÄNNMAN ADAM JONSSON


Kopieringsförbud Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och studenters begränsade rätt att kopiera för undervisningsändamål enligt Bonus Copyright Access kopieringsavtal, är förbjuden. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller Bonus Copyright Access. Vid utgivning av detta verk som e-bok, är e-boken kopieringsskyddad. Den som bryter mot lagen om upphovsrätt kan åtalas av allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till upphovsman eller rättsinnehavare. Studentlitteratur har både digital och traditionell bok­utgivning. Studentlitteraturs trycksaker är miljöanpassade, både när det gäller papper och tryckprocess.

Art.nr 3218 ISBN 978-91-44-13324-9 Upplaga 3:1 ©Författarna och Studentlitteratur 1990, 2002, 2020 studentlitteratur.se Studentlitteratur AB, Lund Illustrationer: Andrejs Dunkels Omslagslayout: Jens Martin/Signalera Printed by Dimograf, Poland 2020


INNEHÅLL

Förord 9 1

Slumpmässig variation 11

1.1 1.2 1.3 1.3.1 1.3.2 1.3.3 1.4 2

Några grundläggande begrepp 43

2.1 2.2 2.3 3

Sannolikheter 43 Betingad sannolikhet 61 Oberoende händelser 69 Diskreta fördelningar 81

3.1 3.2 3.2.1 3.2.2 3.2.3 3.2.4 3.3 3.4 4

Inledning 11 Några exempel på slumpmässig variation 12 Beskrivande statistik 17 Litet material 17 Stort material 21 Några avslutande kommentarer 27 Explorativ dataanalys 30

Diskreta stokastiska variabler 81 Några ofta förekommande diskreta fördelningar 91 Den likformiga fördelningen 92 Den hypergeometriska fördelningen 92 Binomialfördelningen 93 Poissonfördelningen 95 Väntevärde 101 Varians och standardavvikelse 109

Kontinuerliga fördelningar 115

4.1 4.2 4.2.1

Kontinuerliga stokastiska variabler 115 Några ofta förekommande kontinuerliga fördelningar 124 Rektangelfördelningen 124

© FFÖÖRRFAT RR NA HHS T UU DD EN T LTILTITTETREAT U RU R FATTA TA E NOOCC ST EN R AT

5


Innehåll

4.2.2 4.2.3 4.2.4 4.3 4.4 4.5 5

Funktioner av stokastiska variabler 151

5.1 5.2 5.3 5.3.1 5.3.2 5.4 5.5 6

7.1 7.2 7.3 7.4

6

Oberoende stokastiska variabler 151 Linjära funktioner och summor 153 Icke-linjära funktioner 161 Minsta och största värde 161 Kvadrater och χ2 -fördelning 163 Om mätfel 165 Gauss approximationsformler 170

Normalfördelningen 177

6.1 6.2 6.3 6.4 6.4.1 7

Exponentialfördelningen 126 Weibullfördelningen 129 Normalfördelningen 130 Väntevärde 137 Varians och standardavvikelse 141 Andra läges- och spridningsmått 144

Inledning 177 Allmänna egenskaper 177 Summor av normalfördelade stokastiska variabler 181 Centrala gränsvärdessatsen och approximationer 188 Halvkorrektion 196

Punktskattningar 201

Inledning 201 Punktskattningars fördelning 204 Väntevärdesriktighet och effektivitet 206 Maximum-likelihood-metoden 211

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


Innehåll 8

Intervallskattning 219

8.1 8.2 8.3 8.3.1 8.3.2 8.4 8.4.1 8.4.2 8.4.3 8.5 8.6 9

Inledning 219 Teckenintervall 219 Konfidensintervall för µ i N(µ, σ) 226 σ känt 226 σ okänt 230 Jämförelser mellan två väntevärden 238 Stickprov i par 238 Två stickprov 241 Stickprov i par eller två stickprov? 247 Konfidensintervall för σ 2 och σ i N(µ, σ) 251 Hur gör man, om man inte har normalfördelning? 256

Hypotesprövning 261

9.1 9.2 9.3 9.3.1 9.3.2 9.4 9.5 9.6 9.7

Inledning 261 Enkla hypoteser 261 Sammansatta mothypoteser vid normalfördelning 268 Test av µ, då σ är känt 269 Test av µ, då σ är okänt 278 Samband mellan konfidensintervall och hypotesprövning 286 Sammansatta mothypoteser vid binomialfördelning 288 Teckentest 293 Normalfördelningsdiagram 299

10 Regressionsanalys 303

10.1 10.2 10.2.1 10.2.2 10.2.3 10.2.4 10.2.5 10.2.6 10.2.7 10.2.8

Inledning 303 Enkel linjär regression 303 Modellantagande och skattad modell 306 Skattning av regressionsparametrar och förklaringsgrad 308 Test och konfidensintervall för regressionsparametrar 312 Undersökning av modellantagandena 315 Konfidensintervall för förväntat Y-värde 319 Prognosintervall 321 Korrelationskoefficient 324 Om tolkning av regression och korrelation 325

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

7


Innehåll Innehåll

10.3 10.3 10.3.1 10.3.1 10.3.2 10.3.2 10.3.3 10.3.3 10.3.4 10.3.4 10.3.5 10.3.5 10.3.6 10.3.6 10.3.7 10.3.7 10.4 10.4

Multipel linjär regression 330 Multipelmodell linjär regression 330 Skattad och förklaringsgrad 330 Skattad modell och förklaringsgrad 330 Test och konfidensintervall för regressionsparametrarna 334 Test och konfidensintervall för regressionsparametrarna 334 Residualanalys 337 Residualanalys 337för E(Y0 ) samt prognosintervall 339 Konfidensintervall Konfidensintervall Kollinearitet 342 för E(Y0 ) samt prognosintervall 339 Kollinearitet 342 345 Indikatorvariabler Indikatorvariabler 345modell 350 Att välja ut en lämplig Att välja ut en lämplig modell 350 354 Formelsamling i regressionsanalys Formelsamling i regressionsanalys 354

11 Flerdimensionella stokastiska variabler 359 11 Flerdimensionella stokastiska variabler 359

11.1 11.1 11.2 11.2 11.3 11.3 11.3.1 11.3.1 11.3.2 11.3.2 11.4 11.4 11.5 11.5 11.6 11.6 11.7 11.7

Inledning 359 Inledning 359 Diskret tvådimensionell fördelning 359 Diskret tvådimensionell fördelning 359 361 Kontinuerlig tvådimensionell fördelning Kontinuerlig tvådimensionell fördelning Likformig tvådimensionell fördelning 364361 Likformig tvådimensionell fördelning 364 365 Mer om funktioner av stokastiska variabler Mer om funktioner av stokastiska variabler 365 Betingade fördelningar 371 Betingade fördelningar 371 väntevärden 374 Betingade väntevärden 374 Kovarians och korrelationskoefficient 377 Kovarians och korrelationskoefficient Tvådimensionell normalfördelning 380377 Tvådimensionell normalfördelning 380

A A

Tabeller 387 Tabeller 387

B B

Svar 399 Svar 399

A.1 A.1 A.2 A.2 A.3 A.3 A.4 A.4 A.5 A.5 A.6 A.6 A.7 A.7

Grekiska alfabetet 387 Grekiska alfabetet 387 388 Binomialfördelningen Binomialfördelningen 388 Poissonfördelningen 393 Poissonfördelningen Normalfördelningen 393 395 Normalfördelningen (forts.) 395 396 Normalfördelningen (forts.) 396 t-fördelningen 397 t-fördelningen χ2 -fördelningen397 398 χ2 -fördelningen 398

Sakregister 421 Sakregister 421

8 8

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3 Diskreta fördelningar 3.1 Diskreta stokastiska variabler Vid många slumpmässiga försök är utfallen reella tal, t.ex. antalet pulser per tidsenhet (exempel 1.2, sid 12) eller den motverkande kraften i en stödpunkt (exempel 2.6, sid 51). Vi har också stött på situationer där utfallen inte är av sådan typ, exempelvis om kedjan ska brista eller hålla (exempel 2.15, sid 70) eller om ett gods är transportskadat eller ej (exempel 2.13, sid 64). I sådana fall kan utfallen ofta förknippas med reella tal på ett naturligt sätt. Vi kan t.ex. låta 0 stå för att en kedja brister och 1 för att den håller. Antag att vi har ett slumpmässigt försök vars utfall är reella tal. Om vi betraktar försöket innan det är utfört, dvs. då det fortfarande kan påverkas av slumpen, så kallar vi dess utfall för en stokastisk variabel eller slumpvariabel. Vi betecknar stokastiska variabler med grekiska bokstäver ξ, η, ζ, . . . . Efter att man utfört försöket har man fått ett observerat värde på den stokastiska variabeln. Det observerade värdet betecknas med motsvarande latinska bokstav x, y, z, . . .. Vi sammanfattar. Definition 3.1 Utfallet i ett slumpmässigt försök i form av ett reellt tal, betraktat innan försöket är utfört, kallas för stokastisk variabel. Resultatet sedan man utfört försöket kallas observerat värde på den stokastiska variabeln. Anmärkning 3.1 Enligt en mer matematiskt exakt definition är en slumpvariabel är en reellvärd funktion definierad på ett utfallsrum Ω, dvs. en funktion vars definitionsmängd är Ω och vars värdemängd är en delmängd av de reella talen.

© FFÖÖRRFAT RR NA HHS T UU DD EN T LTILTITTETREAT U RU R FATTA TA E NOOCC ST EN R AT

81


3. Diskreta fördelningar

Exempel 3.1 Betrakta försöket med radioaktivt sönderfall i exempel 1.2, sid 12, innan mätningarna har påbörjats. Sätt ξ = antal pulser per 5 sekunder.

Då är ξ en stokastisk variabel. Sedan påbörjas mätningarna. Om första mätningen ger 3 sönderfall är x = 3 ett observerat värde på ξ. Vi kan aldrig på förhand ange ett värde som ξ helt säkert kommer att anta i en enskild mätning. Däremot kan vi säga att ξ kommer att anta något av värdena 0, 1, 2, 3, . . ..

Definition 3.2 Om en stokastisk variabel bara kan anta ändligt eller numrerbart många värden, säger man att den är diskret. Den stokastiska variabeln i exempel 3.1 är diskret. Man inser också att varje gång en stokastisk variabel räknar antalet av någonting är den en diskret stokastisk variabel. Exempel 3.2 Betrakta försöket i exempel 2.4, sid 49. Där väljs 5 motstånd på måfå från en ask med 20 motstånd, av vilka 4 är felmärkta. Låt ξ = antalet felmärkta motstånd i urvalet. Då är ξ en diskret stokastisk variabel som kan anta värdena 0, 1, 2, 3 och 4. Med vilken sannolikhet antas de olika värdena? Lösning. Låt P(ξ = x) beteckna sannolikheten att ξ antar värdet x. I exempel 2.4 och exempel 2.10 har vi beräknat P(A2 ) som ju är detsamma som P(ξ = 2), P(A1 ) = P(ξ = 1) och P(A0 ) = P(ξ = 0). Vi får P(ξ = 0) =

P(ξ = 2) =

(40)(16 ) 5 (20 ) 5

(42)(16 ) 3 (20 ) 5

= 0.2817, = 0.2167.

P(ξ = 1) =

(41)(16 ) 4 (20 ) 5

= 0.4696,

Med samma resonemang som i exempel 2.10, sid 57, får vi P(ξ = 3) = 82

(43)(16 ) 2 (20 ) 5

= 0.0310 samt P(ξ = 4) =

(44)(16 ) 1 (20 ) 5

= 0.0010

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3.1. Diskreta stokastiska variabler

Eftersom P(ξ antar något av värdena 0, 1, 2, 3 eller 4) är 1 så måste det gälla att ∑4x=0 P(ξ = x) är lika med 1. Kontroll av summan ger mycket riktigt ◻ ∑4x=0 P(ξ = x) = 1.

För att beskriva en stokastisk variabels egenskaper ska man ange vilka värden den kan anta och med vilken sannolikhet dessa värden antas. Man har då angett den stokastiska variabelns sannolikhetsfördelning. Sannolikhetsfördelningen till ξ i exempel 3.2 kan kortfattat skrivas P(ξ = x) =

16 ) (x4)(5−x

(20 ) 5

x = 0, 1, 2, 3, 4.

Funktionen p(x) = P(ξ = x) kallas sannolikhetsfunktionen till ξ. Sannolikhetsfördelningen kan tolkas som en massfördelning på x-axeln, där P(ξ = x) är massan i punkten x. Att den totala sannolikhetsmassan är 1 svarar då mot att ∑x P(ξ = x) = 1. Grafiskt kan man beskriva sannolikhetsfördelningen som i figur 3.1.

Figur 3.1 Sannolikhetsfunktionen i exempel 3.2.

Sannolikhetsfunktionen till en stokastisk variabel ξ kan ses som en förutsägelse om de relativa frekvenser man kan vänta sig om man gör ett stort antal observationer på ξ. Om vi i ett slumpmässigt försök inför en stokastisk variabel och bestämmer dess fördelning, säger vi att vi har bestämt en stokastisk modell eller slumpmodell till försöket. Exempel 3.3 Bestäm en stokastisk modell till försöket i exempel 2.19, sid 74. © F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

83


3. Diskreta fördelningar

Lösning. Man tillverkar 6 enheter där sannolikheten att en tillverkad enhet är felaktig är 0.1 och tillverkade enheter blir felaktiga oberoende av varandra. Man är intresserad av antalet felaktiga enheter. Sätt ξ = antal felaktiga enheter bland 6 tillverkade. Då är ξ en diskret stokastisk variabel som kan anta värdena 0, 1, 2, 3, 4, 5 eller 6. Från exempel 2.19 får vi 6 P(ξ = 0) = ( )0.10 0.96 = 0.531, 0 6 P(ξ = 1) = ( )0.11 0.95 = 0.354, 1 6 P(ξ = 2) = ( )0.12 0.94 = 0.098. 2

Allmänt kan vi skriva upp sannolikhetsfördelningen med hjälp av sats 2.8 som 6 P(ξ = x) = ( )0.1x 0.96−x , x

Som sig bör blir

x = 0, 1, 2, 3, 4, 5, 6.

6 6 6 x 6−x = (0.1 + 0.9)6 = 1. ∑ P(ξ = x) = ∑ ( )0.1 0.9 x=0 x=0 x Binomialsatsen

Figur 3.2 Sannolikhetsfunktionen i exempel 3.3.

84

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3.1. Diskreta stokastiska variabler

Exempel 3.4 I ett försök vill man studera sönderfallet hos ett radioaktivt preparat av exakt samma typ som i exempel 1.2, sid 12. Man tänker mäta antalet pulser per 5 sekunder. Försök finna en lämplig stokastisk modell för försöket. Lösning. Eftersom man ska mäta antalet pulser per 5 sekunder så gör vi som i exempel 3.1, sid 82, och sätter ξ = antal pulser per 5 sekunder. Då är ξ en diskret stokastisk variabel som kan anta värdena 0, 1, 2, . . . . Det återstår att finna en lämplig sannolikhetsfördelning till ξ. Ett tänkbart alternativ är att, på samma sätt som i exempel 2.7, sid 52, utgå från frekvenstabellen tabell 2.1 och låta relativa frekvensen för 0 approximera P(ξ = 0) osv. Vi skulle då få fördelningen i den mittersta kolumnen i tabell 3.1. Tabell 3.1 En tänkbar sannolikhetsfördelning P(ξ = x) i exempel 3.4.

x 0 1 2 3 4 5 6 7 8 9 10 11 12

e −4 4 x x!

Från tabell 1.2 0.019 0.073 0.146 0.196 0.195 0.156 0.105 0.059 0.030 0.013 0.005 0.002 0.001

0.018 0.073 0.147 0.195 0.195 0.156 0.104 0.060 0.030 0.013 0.005 0.002 0.001

I exempel 3.4 kan man fråga sig om sannolikhetsfördelningen kan skrivas upp i en formel på samma sätt som i exempel 3.2 och exempel 3.3. Söker man i litteratur om radioaktiv strålning, finner man att följande samband kan härledas från naturliga antaganden om radioaktivitetens natur: P(ξ = x) =

e −λ λ x , x!

x = 0, 1, 2, . . .

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

, 85


3. Diskreta fördelningar

där ξ = antal pulser per 5 sekunder och där λ är någon lämpligt vald konstant. Om man prövar med några olika värden på λ, så får man t.ex. för λ = 4 resultatet i kolumnen längst till höger i tabell 3.1. Här blir ∑12 x=0 P(ξ = x) = 0.999 och inte 1 på grund av avrundningsfel. Vi ser i tabell 3.1 att de två kolumnerna stämmer bra överens och antar då att λ = 4. En lämplig sannolikhetsfördelning för ξ är alltså P(ξ = x) =

e −4 4x , x!

x = 0, 1, 2, . . .

.

Se figur 3.3. I avsnitt 3.2.4 nedan ska vi kort nämna de antaganden som leder till denna fördelning.

Figur 3.3 Sannolikhetsfunktionen i exempel 3.4.

Hittills har vi beskrivit en stokastisk variabels sannolikhetsfördelning genom att ange P(ξ = x) för de värden på x som ξ kan anta. Man kan också beskriva sannolikhetsfördelningen genom att ange P(ξ ≤ x) för alla x. Funktionen F(x) = P(ξ ≤ x) kallas för fördelningsfunktionen för ξ. Om ξ är en diskret stokastisk variabel som bara kan anta icke-negativa heltalsvärden och x är ett positivt heltal så gäller

samt

86

P(ξ = x) = P(ξ ≤ x) − P(ξ ≤ x − 1) P(ξ ≤ x) = P(ξ = 0) + P(ξ = 1) + . . . + P(ξ = x). © F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3.1. Diskreta stokastiska variabler

Om vi känner P(ξ = x) för varje x så känner vi alltså P(ξ ≤ x) och omvänt. Därför kan vilken som helst av funktionerna P(ξ = x) och P(ξ ≤ x) användas för att beskriva fördelningen för ξ. Vi sammanfattar de införda begreppen. Definition 3.3 Låt ξ vara en diskret stokastisk variabel, som antar värdena x1 < x2 < x3 < . . . < x k < x k+1 < . . .. Med sannolikhetsfunktionen p till ξ menas p(x k ) = P(ξ = x k ).

Med fördelningsfunktionen F till ξ menas F(x) = P(ξ ≤ x).

Vilken som helst av dessa funktioner kan användas för att beskriva sannolikhetsfördelningen till ξ. Exempel 3.5 Bestäm fördelningsfunktionen till den stokastiska variabeln i exempel 3.2, sid 82. Där är ξ = antalet felmärkta motstånd i urvalet, då 5 motstånd väljs på måfå från en ask med 20 motstånd, av vilka 4 är felmärkta. Det betyder att ξ är en diskret stokastisk variabel som kan anta värdena 0, 1, 2, 3, 4. Lösning. I exempel 3.2, sid 82, finns sannolikhetsfunktionen beräknad för vart och ett av de värden som ξ kan anta. Med hjälp av dessa värden och definitionen ovan får vi F(0) = P(ξ ≤ 0) = P(ξ = 0) = 0.2817,

F(1) = P(ξ ≤ 1) = P(ξ = 0) + P(ξ = 1) = 0.2817 + 0.4696 = 0.7513,

F(2) = P(ξ ≤ 2) = P(ξ ≤ 1) + P(ξ = 2) = 0.7513 + 0.2167 = 0.9680,

F(3) = P(ξ ≤ 3) = P(ξ ≤ 2) + P(ξ = 3) = 0.9680 + 0.0310 = 0.9990,

F(4) = P(ξ ≤ 4) = P(ξ ≤ 3) + P(ξ = 4) = 0.9990 + 0.0010 = 1.0000.

Då ξ är en diskret stokastisk variabel är F(x) en trappfunktion, som växer från 0 till 1, har språng i de x-värden där P(ξ = x) > 0 och är konstant emellan

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

87


3. Diskreta fördelningar

språngpunkterna. Fördelningsfunktionen F är alltså ⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ F(x) = ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩

Se figur 3.4.

0 0.2817 0.7513 0.9680 0.9990 1

för för för för för för

x<0 0≤x<1 1≤x<2 2≤x<3 3≤x<4 4≤x

Figur 3.4 Fördelningsfunktion och sannolikhetsfunktion till ξ i exempel 3.5.

Som vi ser i exempel 3.5 är språngets höjd i punkten x lika med P(ξ = x), dvs. P(ξ = x) = F(x) − F(x − 1), om x bara antar heltalsvärden. Allmänt kan vi formulera resultatet på följande sätt. 88

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3.1. Diskreta stokastiska variabler

Sats 3.1 Om ξ är en diskret stokastisk variabel som antar värdena x1 < x2 < x3 < . . . < x k < x k+1 < . . .

så gäller

k

F(x k ) = P(ξ ≤ x k ) = ∑ P(ξ = x i ) i=1

och

P(ξ = x k ) = F(x k ) − F(x k−1 ). Sannolikheter för godtyckliga händelser kan beräknas utifrån vilken som helst av funktionerna P(ξ = x) och F(x). Exempel 3.6 Låt ξ vara den stokastiska variabeln i exempel 3.2, sid 82. Bestäm P(0 < ξ ≤ 2).

Lösning. Om vi utnyttjar P(ξ = x) i exempel 3.2, får vi P(0 < ξ ≤ 2) = P(ξ = 1 eller ξ = 2) =

= P(ξ = 1) + P(ξ = 2) =

= 0.4696 + 0.2167 = 0.6863 ≈ 0.69.

Vi kan också beräkna den sökta sannolikheten med hjälp av fördelningsfunktionen i exempel 3.5 genom att använda sats 3.1. P(0 < ξ ≤ 2) = P(ξ = 1) + P(ξ = 2) =

= (F(1) − F(0)) + (F(2) − F(1)) =

= F(2) − F(0) = 0.9680 − 0.2817 = 0.6863 ≈ 0.69.

Den sannolikhet vi har beräknat här är densamma som den vi beräknade i exempel 2.10, sid 57. ◻

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

89


3. Diskreta fördelningar

Övningar 3.1 En entreprenörfirma planerar att köpa in 3 schaktningsmaskiner. Den aktuella maskintypen har 50 % chans att fungera i minst 6 månader utan att några delar behöver bytas. (Se exempel 2.1, sid 43.) Låt ξ vara antalet inköpta maskiner som kommer att fungera efter 6 månader. Bestäm sannolikhetsfördelningen till ξ genom att bestämma både sannolikhetsfunktionen och fördelningsfunktionen. Illustrera båda grafiskt. 3.2 I ett laboratorium gör man regelbundet kontroll av halten Cl och halten Br i de burkar som används. Varje burk klassificeras med avseende på halten av vardera av dessa föroreningar i två kategorier. Man vet av erfarenhet att burkar från en viss leverantör uppför sig enligt följande sannolikheter:

Br låg hög

låg 0.82 0.05

Cl

hög 0.09 0.04

Man tar en burk på måfå från denna leverantör. (Se övning 2.21, sid 67.) Sätt ξ = 0 om burken har låg Br-halt och ξ = 1 om burken har hög Br-halt. Sätt η = 0 om burken har låg Cl-halt och η = 1 om burken har hög Cl-halt. Bestäm och rita sannolikhetsfördelningen till a) ξ,

b) η.

3.3 Bland 10 muttrar finns 4 defekta. Man tar 4 muttrar på måfå utan återläggning. Låt ξ vara antalet defekta muttrar i urvalet. Bestäm sannolikhetsfördelningen till ξ. Illustrera den grafiskt. (Jämför med övning 2.1, sid 58.) 3.4 I exempel 3.3 sid 83 betraktas ξ = antal felaktiga enheter bland 6 tillverkade. Sannolikhetsfunktionen till ξ bestäms där till 6 P(ξ = x) = ( )0.1x 0.96−x , x

Bestäm

a) P(0 < ξ ≤ 3),

90

b) P(0 ≤ ξ < 3),

x = 0, 1, 2, 3, 4, 5, 6. c) P(0 < ξ < 3),

d) P(0 ≤ ξ ≤ 3).

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3.2. Några ofta förekommande diskreta fördelningar

3.5 En entreprenör har lämnat in anbud på tre olika jobb A, B och C. Hon bedömer sannolikheten att få de olika jobben till 0.5 för A, 0.8 för B och 0.3 för C. Händelserna att få olika jobb antas oberoende. Låt ξ vara totala antalet jobb som entreprenören får (av dessa tre). a) Vilka värden kan ξ anta? Bestäm och rita upp sannolikhetsfunktionen för ξ. b) Bestäm och rita upp fördelningsfunktionen för ξ. c) Vad är P(0 < ξ ≤ 2)?

3.6 I en tillverkningsprocess med felsannolikhet p undersöker man tillverkade enheter, tills man får en defekt enhet. Låt ξ vara antalet undersökta enheter, när man för första gången får en defekt enhet, denna enhet medräknad. Antag att felen förekommer oberoende av varandra. Bestäm a) sannolikheten att ξ = 4,

b) sannolikhetsfördelningen till ξ. En stokastisk variabel med denna sannolikhetsfördelning sägs ha en för-förstagången-fördelning eller ffg-fördelning. 3.7 En spelare kastar en tärning efter att ha satsat 1 kr på var och en av följande tre händelser: A = udda resultat, B = resultatet högst lika med tre, C = resultatet högst lika med två. A ger 3 kr i vinst om den inträffar medan B ger 2 kr och C ger 1 kr i vinst. Betrakta spelarens nettovinst som en stokastisk variabel ξ. a) Bestäm sannolikhetsfördelningen till ξ.

b) Beräkna P(−2 < ξ < 7).

3.2 Några ofta förekommande diskreta fördelningar Om ξ är en diskret stokastisk variabel, talar vi om dess sannolikhetsfördelning som en diskret fördelning. Vissa fördelningar förekommer så ofta att de fått speciella namn. Vi kommer i detta avsnitt att gå igenom några sådana standardfördelningar. Flera av dem är redan härledda tidigare utan att de fått några speciella namn. Här kommer de dessutom att ges speciella beteckningar, som är praktiska att använda och vanliga i den statistiska litteraturen.

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

91


3. Diskreta fördelningar

3.2.1 Den likformiga fördelningen Betrakta en situation med N lika sannolika utfall. Numrera utfallen från 1 till N och låt ξ vara utfallets ordningsnummer. Då är enligt den klassiska sannolikhetsdefinitionen P(ξ = x) =

1 , N

x = 1, 2, . . . , N.

Vi säger att ξ är likformigt fördelad på x = 1, 2, . . . , N. Konstanten N kallas fördelningens parameter. Om man t.ex. kastar en symmetrisk tärning och låter ξ vara antalet ögon, är ξ likformigt fördelad på 1, 2, . . . , 6. Parametern N är alltså 6.

3.2.2 Den hypergeometriska fördelningen

Betrakta en mängd med N element av vilka N ⋅ p är av ett speciellt slag, dvs. p är andelen element av det speciella slaget. Välj på måfå (och utan återläggning) n av elementen. Låt ξ vara antalet element av det speciella slaget i urvalet. Detta är exakt samma situation som i exempel 3.2, sid 82, där 5 motstånd väljs på måfå från en ask med 20 motstånd, av vilka 4 är felmärkta. Där är N = 20, N ⋅ p = 4 och n = 5. Genom att använda den klassiska sannolikhetsdefinitionen med m = (Nn ) )(N⋅(1−p) ) får vi, som i exempel 3.2, och д = (N⋅p x n−x P(ξ = x) =

)(N⋅(1−p) ) (N⋅p x n−x (Nn )

,

där x är heltal sådant att 0 ≤ x ≤ N ⋅ p och 0 ≤ n − x ≤ N − N ⋅ p. Vi säger att ξ är hypergeometriskt fördelad med parametrar N, n, p och skriver detta kortfattat som ξ ∈ Hy p(N , n, p). I exempel 3.2 gäller alltså ξ ∈ Hy p(20,5,4/20). Där är då ξ antalet felmärkta motstånd i urvalet när 5 motstånd väljs på måfå från en ask med 20 motstånd, av vilka 4 är felmärkta. Den hypergeometriska fördelningen kallas även för urnmodellen eftersom man ofta exemplifierar den på följande sätt. Exempel 3.7 I en urna finns 1 000 kulor av vilka 30 % är vita och resten svarta. Välj på måfå (och utan återläggning) 10 kulor ur urnan. Vad är sannolikheten att man får 4 vita kulor? 92

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3.2. Några ofta förekommande diskreta fördelningar

Lösning. Låt ξ vara antalet vita kulor i urvalet. Då är ξ hypergeometriskt fördelad med N = 1 000, n = 10 och p = 0.30. Alltså är P(ξ = 4) =

)(700 ) (300 4 6 (1000 ) 10

.

Efter lite räknearbete finner man att P(ξ = 4) = 0.20084.

3.2.3 Binomialfördelningen Betrakta ett försök bestående av n oberoende upprepningar av ett delförsök. Låt A vara en händelse som inträffar vid delförsöket med sannolikhet p. Låt ξ vara antalet gånger A inträffar i försöket. Då gäller enligt sats 2.8, sid 74, n P(ξ = x) = ( )px (1 − p)n−x , x

x = 0, 1, 2, . . . , n.

Vi säger att ξ är binomialfördelad med parametrar n och p och skriver detta som ξ ∈ Bin(n, p). Binomialfördelningen har vi också räknat på tidigare. I exempel 3.3, sid 83, gäller att ξ ∈ Bin(6, 0.1). Där är ξ antalet felaktiga enheter bland 6 tillverkade, när sannolikheten är 0.1 att en tillverkad enhet blir felaktig och tillverkade enheter blir felaktiga oberoende av varandra. Binomialfördelningen finns tabellerad för vissa värden på n och p (se sid 388). Med hjälp av räknare eller dator kan även binomialsannolikheterna beräknas för alla tänkbara värden på n och p. Av figur 3.5, sid 94, framgår hur parametern p påverkar snedheten hos fördelningen. Det karakteristiska för en binomialsituation är att man har oberoende delförsök och att sannolikheten p att händelsen A inträffar är densamma i varje delförsök. Är inte sannolikheten att händelsen A inträffar densamma vid varje upprepning, så har vi inte en binomialsituation. Men ibland varierar sannolikheten för den betraktade händelsen så lite mellan upprepningarna att den approximativt kan sättas konstant. Vi ger ett sådant exempel.

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

93


3. Diskreta fördelningar

Figur 3.5 Binomialfördelningen för n = 6 och några olika p-värden.

Exempel 3.8 Fortsättning på exempel 3.7. Då N = 1 000 och man bara väljer ut 10 kulor så ändras inte sammansättningen av svarta och vita kulor nämnvärt när man väljer ut en kula i taget. Vi kan då approximativt säga att i varje dragning finns 30 % vita kulor. Vi tänker oss då att vi gör 10 oberoende upprepningar av delförsöket välja kula, där p ≈ 0.30 i varje delförsök. Alltså blir ξ approximativt binomialfördelad med n = 10 och p = 0.30 och 10 P(ξ = 4) = ( )0.34 ⋅ 0.76 = 0.20012. 4

Vi ser att resultatet inte skiljer sig så mycket från det i exempel 3.7. Ibland kan man alltså approximera en hypergeometrisk fördelning med en binomialfördelning utan att göra alltför stort fel. Allmänt gäller att om N är stort och om kvoten n/N är liten, gäller följande approximation: (N⋅p )(N⋅(1−p) ) x n−x (Nn )

94

n ≈ ( )px (1 − p)n−x x

En tumregel för att approximationen ska gälla är att n/N < 0.1.

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R


3.2. Några ofta förekommande diskreta fördelningar

3.2.4 Poissonfördelningen Betrakta händelser A som inträffar slumpmässigt och oberoende av varandra i tiden. Händelsen A kan vara att en partikel sönderfaller i ett radioaktivt preparat eller att ett anrop inkommer till en telefonväxel eller att en vara kommer till ett lager längs ett löpande band. Låt ξ vara antalet händelser A som inträffar under ett tidsintervall av given längd. Då gäller ofta att P(ξ = x) =

e −λ λ x , x!

x = 0, 1, 2, . . . .

Vi säger att ξ är Poissonfördelad med parameter λ och skriver ξ ∈ Po(λ). I nästa avsnitt kommer vi att se att parametern λ anger det genomsnittliga antalet händelser under tidsintervallet (se sid 105). För att beräkna P(ξ ≤ x) för ett heltal x och ett givet värde på parametern λ beräknar vi P(ξ = 0) + ⋅ ⋅ ⋅ + P(ξ = x) på miniräknare eller dator. Poissonfördelningen finns också tabellerad för olika värden på λ (se sid 393). Ur den tabellen kan vi utläsa hur fördelningen varierar med parametern λ. Se även figur 3.6.

Figur 3.6 Poissonfördelningen för några olika värden på λ.

© F Ö R FAT TA R NA O C H S T U D E N T L I T T E R AT U R

95


Kerstin Vännman är professor emerita i matematisk statistik. Hon har lång erfarenhet av undervisning främst vid Luleå tekniska universitet men även vid Umeå universitet. Hon har ett mångårigt engagemang i utbildningsfrågor och har utvecklat såväl nya kurser som nya undervisningsformer. Adam Jonsson är universitetslektor i matematisk statistik. Han har mångårig erfarenhet av undervisning, främst vid Luleå tekniska universitet.

MATEMATISK STATISTIK Denna bok är en omarbetning av Kerstin Vännmans tidigare bok Matematisk statistik från 2002. Boken syftar till att träna det statistiska tänkandet så att man kan förstå och använda några ofta förekommande statistiska metoder. Den är uppbyggd kring ett stort antal exempel och nya begrepp introduceras och motiveras med hjälp av inledande exempel. I boken behandlas bland annat enkla sannolikhetsresonemang, några vanligt förekommande fördelningar, till exempel binomial-, Poisson-, normal- och exponential-fördelningen, samt olika läges- och spridningsmått. Vidare behandlas punktskattningar, konfidensintervall (även jämförande situationer) och test. Den största förändringen jämfört med den tidigare boken är att regressionsanalys (både enkel och multipel) och flerdimensionella stokastiska variabler behandlas i denna bok. I regressionsanalysen ligger fokus på tillämpning med hjälp av statistisk programvara och tolkning av resultat. Boken vänder sig i första hand till studenter inom utbildningarna för civil- och högskoleingenjörer, men den är även lämplig för annan högskoleutbildning eller för självstudier. Till varje kapitel finns ett stort antal övningsuppgifter med svar. Dessutom finns ett separat kapitel med blandade övningar av varierande svårighetsgrad.

Tredje upplagan Art.nr 3218

studentlitteratur.se


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.