9789144113142

Page 1

16 mm

Johan Lindström är docent i matematisk statistik vid Lunds universitet och arbetar med utveckling av statistiska metoder som kan användas inom miljö- och klimatforskning. Han undervisar kurser på flera nivåer vid LTH och har varit inbjuden föreläsare vid internationella kurser i geostatistik.

– ett arbetsmaterial i sannolikhetslära och statistisk inferens Räkna med variation är ett omfångsrikt arbetsmaterial i grundläggande sannolikhetslära och statistisk inferens. Materialet innefattar bok och e-bok med digitala övningar. Det kan kombineras med olika textböcker i ämnet matematisk statistik. Materialets fokus på tillämpningar, inom t.ex. bygg, kemi och medicin, gör det lämpligt för tekniska och naturvetenskapliga utbildningar. Det stora ”smörgåsbordet” av olika uppgifter och uppgiftstyper ger läraren möjlighet att välja moment efter just sitt kursupplägg. Det breda materialet tränar studenten på såväl begrepps­förståelse, räknefärdighet som dataanalys. Räkna med variation innehåller: • digitala övningar för begreppsförståelse • papper-och-penna uppgifter med stödjande videolösningar • nyutvecklade rutiner i Matlab och R och handledda digitala datorlaborationer för interaktiv utforskning av teorin • datoruppgifter med datamaterial för träning av modellbygge, dataanalys och tolkning av resultat • miniprojekt med öppna frågeställningar Art.nr 39276

|  RÄKNA MED VARIATION

Räkna med variation

Lena Zetterqvist Johan Lindström

Lena Zetterqvist är universitetslektor i matematisk statistik vid Lunds universitet och har under ett flertal år arbetat med kursutveckling av grundkurser. Hon är lärare med ”Excellent Teaching Practice” vid LTH och har fått Lunds universitets pedagogiska pris.

RÄKNA MED VARIATION – ett arbetsmaterial i sannolikhetslära och statistisk inferens

LENA ZET TERQVIST JOHAN LINDSTRÖM

studentlitteratur.se

978-91-44-11314-2_01_cover.indd Alla sidor

2017-03-10 11:46


Kopieringsförbud Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares begränsade rätt att kopiera för undervisningsbruk enligt Bonus Copyright Access skolkopieringsavtal, är förbjuden. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller Bonus Copyright Access. Vid utgivning av detta verk som e-bok, är e-boken kopieringsskyddad. Den som bryter mot lagen om upphovsrätt kan åtalas av allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till upphovsman eller rättsinnehavare. Studentlitteratur har både digital och traditionell bokutgivning. Studentlitteraturs trycksaker är miljöanpassade, både när det gäller papper och tryckprocess. Art.nr 39276 isbn 978-91-44-11314-2 Upplaga 1:1 © Författarna och Studentlitteratur 2017 studentlitteratur.se Studentlitteratur AB, Lund Printed by Holmbergs i Malmö AB, Sweden 2017


FÖRORD

”Räkna med variation” är ett arbetsmaterial utvecklat för grundkurser i sannolikhetslära och statistisk inferens på tekniska och naturvetenskapliga utbildningar. Det kan kombineras med olika läroböcker i matematisk statistik. Det omfattande materialet består av bok och e-bok med ett stort antal digitala moment såsom digitala övningsuppgifter, inspelade lösningar, datorhandledningar och rutiner i matlab och R. Ett bra arbetsmaterial belyser teorin och tränar studenterna på olika kompetenser, samtidigt som det motiverar och väcker intresse för ämnet. Uppgifterna i ”Räkna med variation” är utarbetade för att inte enbart träna begreppsförståelse och räknefärdighet; de ger också möjlighet att träna på dataanalys, modellbygge, tolkning av resultat samt skriftlig kommunikation av statistiska resultat. Eftersom datorn är ett självklart hjälpmedel i såväl utbildning som i studenternas framtida arbetsliv innehåller materialet ett stort antal uppgifter som utnyttjar beräkningsprogrammen matlab eller R för analys, visualisering och illustration. Motivation är en viktig faktor i allt lärande. Det är betydelsefullt att studenter får arbeta med intressanta tillämpningar inom sannolikhetsteori och statistik. Materialet är därför anpassat till olika studentgrupper inom teknik och naturvetenskap: Flertalet uppgifter har relevanta tillämpningar inom biologi, medicin, kemi-, miljö-, bygg- eller maskinteknik. Materialet stödjer också studenternas lärande och underlättar självstudier genom digitala övningar med omedelbar feedback, inspelade lösningar och handledda datormoment. Slutligen, ett stort tack till Olof Zetterqvist som hjälpt till i utvecklingen av rutiner i matlab och räknat igenom samtliga uppgifter. Tack också till en stor mängd studenter, övningsledare och kollegor vid Matematikcentrum, Lunds universitet, vilka givit synpunkter på tidigare versioner av arbetsmaterialet. Lund, februari 2017 Lena Zetterqvist

Johan Lindström

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

3



INNEHÅLL

Förord 3

Introduktion till materialet 9

KAPITEL 1

1.1 1.2

Sammanfattande numeriska och grafiska mått 13 Empirisk fördelningsfunktion 15

KAPITEL 2

2.1 2.2 2.3

Beskrivning av data 13

Grundläggande sannolikhetsteori 19

Händelser och sannolikheter 19 Betingade sannolikheter 23 Total sannolikhet och Bayes regel 27

KAPITEL 3

Fördelningar 33

3.1

Diskreta fördelningar 33 3.1.1 Sannolikhets- och fördelningsfunktion 33 3.1.2 Några diskreta standardfördelningar 34 3.1.3 Väntevärde och varians 42 3.2 Kontinuerliga fördelningar 45 3.2.1 Täthets- och fördelningsfunktion 45 3.2.2 Några kontinuerliga standardfördelningar 47 3.2.3 Väntevärde, percentil, kvantil och varians 49 3.3 Summa, medelvärde och andra linjärkombinationer 52 3.3.1 Största och minsta värde 52 © F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

5


innehåll

3.3.2 Väntevärde och varians för linjärkombinationer 53 3.4 Normalfördelning 56 3.4.1 Normalfördelning som modell 56 3.4.2 Beräkna sannolikheter och kvantiler 58 3.4.3 Lognormalfördelning 61 3.4.4 Linjärkombinationer 63 3.4.5 Centrala gränsvärdessatsen 68 3.5 Fördelningsanpassning 75 3.5.1 Finns det en standardfördelning till data? 75 3.6 Mätsituationen, felfortplantning 84 3.6.1 Mätsituationen 84 3.6.2 Felfortplantning 86 KAPITEL 4

Grundläggande inferens 89

4.1

Slumpmässiga försök 89 4.1.1 Slumpmässiga stickprov 89 4.1.2 Lite om försöksplanering 90 4.2 Punktskattningar 93 4.2.1 Skattningars egenskaper 93 4.2.2 Skattningar baserade på flera stickprov 96 4.2.3 Hur hittar man lämpliga skattningar? 99 4.3 Konfidensintervall 102 4.3.1 Konfidensintervall för µ 102 4.3.2 Konfidensintervall för σ 105 4.4 Hypotestest 107 4.4.1 Grundläggande begrepp 107 4.4.2 Samband med konfidensintervall 111 4.4.3 Direktmetoden 112 KAPITEL 5

5.1 5.2 5.3 5.4 6

Inferens i några vanliga statistiska modeller 115

Inferens i ett normalfördelat stickprov 115 Jämförelse av två väntevärden 126 Inferens för diskreta data 139 Inferens för kategoridata 148 © F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


innehåll

KAPITEL 6

Sambandsanalys 151

6.1

Regressionsanalys 151 6.1.1 Enkel linjär regression 151 6.1.2 Transformerade linjära samband 163 6.1.3 Multipel linjär regression och polynomregression 165 6.1.4 Allmänt om regression och modellval 169 6.2 Korrelationsanalys 174 KAPITEL 7

Faktorförsök 177

KAPITEL 8

Orientering om tidsserier 185

KAPITEL 9

Miniprojekt 191

9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 9.9 9.10 9.11 9.12 9.13 9.14 9.15 9.16 9.17 9.18

Ska vi klaga hos tillverkaren? 193 Hur ska vi tänka kring vår lagerhållning? 193 Hur lång tid tar resan till jobbet? 195 Hur ska vi modellera höga flöden? 195 Hur ska vi modellera snölaster? 196 Vågar vi bygga vår glastrappa? 198 Hur länge får en patient vänta på provsvar? 199 Hur mycket insjöfisk kan vi äta? 200 Påverkar fabrikens vattenuttag nivån i vår brunn? 201 Hade vår aktiveringskampanj effekt? 202 Är NOx -halten från värmepannor hälsovådlig? 203 Vad påverkar maxpulsen? 204 Vilket värmebehov har våra småhus? 205 Vad hände med fastighetspriserna efter järnvägsflytten? 205 Vilka faktorer påverkar huspriset? 206 Tungmetaller i mossa 207 Vindelälven 208 Ger ett dubbdäcksförbud lägre halt av luftföroreningar? 209

KAPITEL 10

Svar 211

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

7


innehåll

KAPITEL 11

Lösningar till vissa uppgifter 253

Datakällor 301

8

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


Introduktion till materialet

UPPGIFTSTYPER

Arbetsmaterialet ”Räkna med variation” innehåller en mängd olika uppgiftstyper. Vi menar att motivationen ökar och inlärningen förbättras om studenterna får arbeta med olika teorimoment och färdigheter på ett varierat sätt och med olika beräkningshjälpmedel. Nedan följer en beskrivning av materialets uppgiftstyper och förslag till hur uppgifterna kan användas: Digitala övningar (ca 200) tränar på begreppsförståelse och tolkning av resultat. De består av korta frågor typ flerval, para ihop, tolka figur eller skriva svar i lucka. Beräkningar kan oftast göras med huvudräkning. Uppgifterna kan användas vid introduktionen av ett visst moment. De passar också utmärkt för självstudier och repetition. Uppgifter av papper-och-penna karaktär (ca 350) har ofta en relevant ingenjörs- eller naturvetenskaplig koppling. Det finns inspelade eller skriftliga lösningar till vissa nyckeluppgifter, som introducerar grundläggande begrepp eller helt enkelt är lite knepigare. Analys vid dator är viktigt för t.ex. visualisering, träning av modellval och tolkning av resultat. Dessa uppgifter (ca 50) baseras oftast på verkliga datamaterial och relevanta frågeställningar. Ibland finns digitala handledningar tillgängliga där kommentarer eller tips på kommandon i matlab eller R ges. Rutiner och simuleringar i matlab eller R ger möjlighet att interaktivt utforska teorin. I uppgifter (ca 25) som utnyttjar rutiner/simuleringar ges alltid omfattande handledningar och tips på kommandon. Miniprojekten presenterar problemställningar vilka täcker flera teorimoment och kräver en något mer omfattande analys.

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

9


introduktion till materialet

MATERIALETS SYMBOLER

I materialet används genomgående ett antal symboler som förklaras nedan. Symbolerna är i e-boken klickbara länkar som smidigt tar läsaren mellan olika delar av materialet: Svar. Skriftlig lösning finns till uppgiften. Gå tillbaka till uppgiftstexten från svar eller lösning. Uppgiften har ett datamaterial och/eller rutin; dessa uppgifter kan/bör utföras med hjälp av dator. Datamaterial och rutiner kan även hämtas från Matematikcentrum vid Lunds universitet: www.maths.lu.se/forskning/boecker/raekna-med-variation Uppgiften innehåller simuleringar på dator. Länkar till andra delar av det digitala materialet, såsom: • Digitala uppgifter • Inspelad lösning till uppgiften. • Handledningar med matlab- eller R-kod till datorbaserade uppgifter.

TIPS TILL FÖRELÄSAREN

Arbetsmaterialet tränar på de teoretiska moment som ingår i en traditionell grundläggande kurs i sannolikhetslära och statistisk inferens: grundläggande sannolikhetsteori, endimensionella diskreta och kontinuerliga fördelningar, grundläggande inferensteori samt enkel och multipel linjär regression. Dessutom ingår två avsnitt med orientering om faktorförsök respektive tidsserier. En inledande kurs i sannolikhetslära och statistik kan genomföras på många olika sätt. Vi har valt att utöver klassiska uppgifter även lägga stor vikt vid modellbyggande, tolkning av resultat och olika användningsområden. För att snabbt ge studenterna en koppling till andra ämnen och illustrera statistikens möjligheter utgår vi från data. Därför börjar materialet med uppgifter om ”beskrivning av data” innan grundläggande sannolikhetsteori avhandlas i kapitel 2. Statistisk inferens täcks i två kapitel: I kapitel 4 introduceras grundbegreppen för punktskattningar, konfidensintervall och hypotestest i 10

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


introduktion till materialet

en normalfördelning. I kapitel 5 förstärks dessa begrepp genom ett stort antal blandade uppgifter där studenterna tränar på, att utifrån en given frågeställning, välja lämplig modell, analysera data och dra slutsatser. I materialet står studenternas motivation och tillämpningsområde i fokus. Det innebär att samma typ av frågeställning kan återkomma i flera uppgifter med olika tillämpningar. Det totala antalet uppgifter i materialet är därför stort, långt fler än vad som ingår i en kurs. Det ger läraren ett stort ”smörgåsbord” av uppgifter att välja mellan till sitt kursupplägg. För att underlätta för läraren att hitta lämpliga uppgifter finns en detaljerad tabell som listar lämpliga uppgifter utifrån teorimoment, tillämpningsområde och beräkningshjälpmedel (penna/räknare eller dator). Denna tabell kan nås via materialets e-bok. Tabell över uppgifterna

BETECKNINGAR

Arbetsmaterialet kan kombineras med flera läroböcker i ämnet. Ibland skiljer sig beteckningarna åt i böckerna. Här har vi t.ex. valt att beteckna slumpvariabler med latinska versaler som X eller Y, för komplement använder vi AC . Likaså använder vi beteckningen N(µ, σ) för en normalfördelning med väntevärde µ och standardavvikelse σ samt beteckningen Exp(λ) för en exponentialfördelning med väntevärde λ1 .

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

11



K APITEL 3

Fördelningar

3.1 Diskreta fördelningar NYCKELBEGREPP:

• • • •

Sannolikhets- och fördelningsfunktion Standardfördelningar – Poisson, binomial, ffg, hypergeometrisk Väntevärde Varians och standardavvikelse

3.1.1 SANNOLIKHETS- OCH FÖRDELNINGSFUNKTION

Digitala uppgifter 3.1

Vid ett tärningsspel får man flytta en spelpjäs det antal steg tärningen visar, utom då den visar etta: då får man flytta sex steg. Låt X vara det antal steg man får flytta spelpjäsen. a) Vilka värden, x, kan X anta? b) Vad är sannolikheten att man får flytta precis tre steg, d.v.s. vad är p(3) = P(X = 3)? c) Vad är sannolikheten att man får flytta precis sex steg, d.v.s. vad är p(6) = P(X = 6)? d) Ange hela sannolikhetsfunktionen, p(x) = P(X = x) för X, d.v.s. p(x) för de värden på x som X antar. Skissa funktionen! e) Vad är sannolikheten att man får flytta högst tre steg? f) Ange fördelningsfunktionen F(x) = P(X ≤ x) för X. Skissa den i ett koordinatsystem! Inspelad lösning

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

33


3 fördelningar

3.2

Aina har sökt tre jobb: A, B och C. Hon bedömer sannolikheten att få komma på intervju till de olika arbetsplatserna enligt följande tabell. Jobb P(intervju)

A 0.3

B 0.5

C 0.1

Låt X vara antalet intervjuer hon kommer på. Bestäm sannolikhetsfunktionen, p(x), för X, d.v.s. beräkna P(X = 0), P(X = 1), P(X = 2) och P(X = 3). 3.3

Man noterade antalet förarprov som en person gjorde innan hen fick sitt körkort för bil. Om X står för antalet förarprov för en slumpmässigt vald person, uppskattade man dess sannolikhetsfunktion: x p(x)

1 0.38

2 0.50

3 0.08

4 0.03

≥5 0.01

a) Vad är sannolikheten att en person kuggas vid första förarprovet? b) Beräkna sannolikheten att en person får göra minst 3 förarprov? c) Beräkna den betingade sannolikheten att en person som missade första förarprovet kommer att klara det i andra försöket, d.v.s. P(X = 2 ∣ X ≥ 2).

3.1.2 NÅGRA DISKRETA STANDARDFÖRDELNINGAR

Digitala uppgifter 3.4

En diskret slumpvariabel X är Poissonfördelad med parameter λ, vilket in kortform skrivs X ∈ Po(λ). Det innebär att X, har sannolikhetsfunktionen p(x) = P(X = x) = e−λ

λx , x!

x = 0,1,2, . . . .

Antag att λ = 4 och beräkna a) P(X = 1) b) P(1 ≤ X ≤ 2) c) P(X > 2). 34

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


3 fördelningar

3.5

För slumpvariabeln X i 3.4, beräkna fördelningsfunktionen F(x) = P(X ≤ x) för följande värden på x: x = −0.5, x = 0, x = 0.3, x = 1, x = 1.6 och x = 2. Skissera F(x). Inspelad lösning

3.6

Antal morgnar under en månad då trafikljuset i en livligt trafikerad korsning är trasigt är Poissonfördelat med λ = 1.4. a) Beräkna sannolikheten för att trafikljuset är helt alla morgnar under en månad. b) Vad är fördelningen för antalet morgnar med trasigt ljus under tre månader? c) Beräkna sannolikheten för att trafikljuset är helt alla morgnar under tre månader?

3.7

I en fabrik är antalet strömavbrott under 1 timme en slumpvariabel X, där X ∈ Po(λ). Från tidigare undersökningar antog man att λ = 361 . Beräkna sannolikheten att få mer än ett strömavbrott under 18 timmars produktion.

3.8

Tillfällen då ett sjukhus drabbas av akut blodbrist kan modelleras enligt en Poissonprocess med intensitet λ = 0.5 (per år). Det innebär att antalet tillfällen med blodbrist under ett år är Poissonfördelat med väntevärde λ = 0.5. a) Beräkna sannolikheten för att man under ett år får högst ett tillfälle med blodbrist. b) Vad är fördelningen för antalet tillfällen med blodbrist under 4 år? c) Beräkna sannolikheten för att man under en fyraårsperiod får högst ett tillfälle med blodbrist.

3.9

Man kastar en symmetrisk tärning 10 gånger. Beräkna sannolikheten att man får a) precis 4 sexor b) högst två femmor c) precis 5 kast där antalet prickar är fem eller sex d) minst ett kast med ett udda antal prickar. Inspelad lösning

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

35


3 fördelningar

3.10

För att kontrollera en tillverkningsprocess undersöks 10 slumpmässigt utvalda enheter. Om fler än 1 av dessa är felaktig, justeras processen. Antag att en enhet blir defekt med sannolikheten 0.05 och att enheter blir defekta oberoende av varandra. Vad är sannolikheten att processen justeras?

3.11

Man uppskattar att ett läkemedel ger upphov till muntorrhet med sannolikhet 0.2. Man ger detta läkemedel till 30 oberoende patienter. a) Ange fördelningen för X = ”antalet patienter av de 30 som får muntorrhet”. b) Beräkna sannolikheten att ingen får muntorrhet. c) Beräkna sannolikheten att minst en får muntorrhet. d) Beräkna sannolikheten att precis två personer får muntorrhet.

3.12

I ett stort parti enheter är felkvoten 5 %, d.v.s. tar man en enhet slumpmässigt är den felaktig med sannolikheten 0.05. I en kvalitetskontroll kontrolleras en enhet i taget. Man slutar då man har fått den första felaktiga. Låt X vara antalet enheter som kontrolleras (inklusive den som är felaktig). a) Beräkna sannolikheten att de två första kontrollerade är felfria, medan den tredje är felaktig. b) Beräkna P(X = 5). c) Teckna sannolikhetsfunktionen för X, d.v.s. P(X = x). Vilka värden kan x anta?

3.13

Per spelar Fia med sina kompisar. Enligt reglerna får han flytta ut sin spelpjäs från boet då tärningen visar etta eller sexa. Teckna sannolikheten att detta sker först i spelomgång nr x, x = 1,2, . . ..

3.14

En person plockar 5 kort från en kortlek. a) Beräkna sannolikheten att 3 av korten är damer. b) Beräkna sannolikheten att 3 av korten är av samma valör.

3.15

Till en populär cykeltävling har 260 personer, varav 40 % är kvinnor, anmält sitt intresse. Arrangörerna lottar ut de tillgängliga 100 platserna. Beräkna sannolikheten att exakt 40 % av de 100 är kvinnor.

36

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


3 fördelningar

3.16

Antalet jordskalv under ett år i ett område anses vara Poissonfördelat med parameter λ. a) Gör en konkret tolkning av parametern λ. b) Antag att λ = 1.6. Beräkna sannolikheten för högst 2 jordskalv under ett år. c) Antag att λ = 1.6. Beräkna sannolikheten för ett jordskalvsfritt decennium i området.

3.17

Antalet döda eller svårt skadade i olyckor på gator och vägar i en medelstor svensk stad antas vara Poissonfördelat med väntevärde λ. Statistik några år från gatu- och trafikkontoret: År Antal döda eller skadade

2008 37

2009 50

2010 45

2011 47

År Antal döda eller skadade

2012 57

2013 41

2014 44

2015 41

Utifrån dessa data, uppskatta sannolikheten att det under år 2016 ska vara högst 32 döda eller skadade. 3.18

Med en 100-årsöversvämning menar man en översvämning som i genomsnitt inträffar vart 100:e år, d.v.s. sannolikheten för översvämning ett år är 0.01. Antag oberoende mellan år. Vad är sannolikheten att få precis två 100-årsöversvämningar under en femtioårsperiod?

3.19

Mats går upp på tre tentor under en omtentamensperiod. Han klarar en slumpmässigt vald tenta med sannolikheten 0.7. Antag att tentorna är oberoende. Beräkna sannolikheten att han klarar minst en tentamen.

3.20 Utanför affären där Jenny brukar handla finns en avgiftsbelagd parkering. Jenny har som strategi att aldrig betala parkeringsavgift för sin bil: ”det går så länge det går”. Antag att risken är 0.03 att en parkeringsvakt kontrollerar bilen vid ett inköpstillfälle; antag också oberoende mellan olika tillfällen. Beräkna sannolikheten att Jenny får sin första parkeringsbot vid det 20:e inköpstillfället. © F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

37


3 fördelningar

3.21

I en industri tillverkar man enheter som vid kontroll klassificeras som antingen korrekta eller defekta. För att kontrollera kvaliteten i ett stort parti har man följande kontrollplan: Tag ut 300 enheter och avskilj partiet, om antalet defekta enheter överstiger acceptansgränsen 7. a) Antag att det kommer in ett acceptabelt parti med den låga felfrekvensen 1 %. Beräkna producentrisken, d.v.s. sannolikheten att partiet avskiljs. b) Antag att det kommer in ett dåligt parti med den höga felfrekvensen 5 %. Beräkna konsumentrisken, d.v.s. sannolikheten att partiet godkänns. c) Antag att felfrekvensen är större än 5 %. Hur ändras konsumentrisken i förhållande till det beräknade värde i (b)?

3.22

Teoridelen av ett körkortsprov består av 65 flervalsfrågor, och man måste ha rätt på minst 52 frågor för att bli godkänd. När Pia gör testet är hon helt säker på 48 frågor, medan hon inte har någon aning om de övriga, där hon bara gissar. Antag att samtliga frågor där hon gissar har 4 svarsalternativ. Beräkna sannolikheten att hon klarar provets teoridel.

3.23

Vid en kvalitetskontroll av ett nyanlänt stort parti enheter väljer man slumpmässigt ut 10 enheter för kontroll. Om antalet felaktiga av de kontrollerade är 3 eller fler, klagar man hos producenten. a) Antag att felkvoten i partiet är p = 0.03. Vad är sannolikheten för att man kommer att klaga hos producenten? b) Antag att felkvoten i partiet är p = 0.1. Vad är sannolikheten för att man inte kommer att klaga hos producenten, utan därmed godkänner partiet?

3.24 Avfallsvattnet från en industri genomgår rening i två, på varandra följande, steg: steg I och steg II. Resultatet i de båda stegen kan värderas som dåligt eller bra. De tillhörande sannolikheterna för var och en av de fyra möjliga händelserna ges i följande tabell: Steg I Steg II 38

Bra rening 0.8 0.7

Dålig rening 0.2 0.3

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


3 fördelningar

Antag att resultatet från de två stegen är oberoende. a) Vad är sannolikheten att en omgång vatten blir bra behandlat i båda stegen? b) Om precis ett av stegen ger en bra rening (och det andra en dålig) benämner man detta som acceptabel rening. Vad är sannolikheten för denna händelse? c) En oacceptabel rening har man, om reningen är dålig i båda stegen. Om man studerar 10 oberoende omgångar avfallsvatten, vad är sannolikheten att minst 2 omgångar har en oacceptabel rening? 3.25

När en ko mjölkas i en mjölkrobot inträffar ibland incidenter som stoppar maskinen och ett larm skickas till skötaren. Sannolikheten för en incident vid ett mjölkningstillfälle är 0.02 och incidenter anses ske oberoende av varandra. Antag att skötaren just åtgärdat en incident. Beräkna sannolikheten att a) nästa larm kommer då den 25:e kon mjölkas b) roboten inte hinner mjölka 5 kor felfritt innan nästa larm kommer.

3.26 Antalet försvagningar på tråden i en garnrulle är Poissonfördelat med λ = 1.7. Garnet paketeras i förpackningar om 20 garnrullar vardera. Beräkna sannolikheten att en förpackning innehåller högst 2 rullar, där antalet försvagningar överstiger 3. Inspelad lösning 3.27

Antalet fel i en tillverkningsprocess under en timme anses vara Poissonfördelad med väntevärde λ = 0.5. Beräkna sannolikheten för att det a) under en timme sker precis 1 fel b) under en timme sker högst 3 fel c) under en timme sker minst 1 fel d) under en arbetspass om 8 timmar sker minst 5 fel, men högst 10 fel.

3.28 Antalet defekter på en producerad keramisk platta antas vara Poissonfördelat med parameter λ. Gör en uppskattning av λ då man vet att 90 % av de tillverkade plattorna är felfria. © F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

39


3 fördelningar

3.29 Till en sportkedjas lager levereras 50 cyklar. Vid kvalitetskontrollen väljs 7 av cyklarna ut och studeras. Om man finner fler än 1 felaktig cykel, skickas partiet tillbaka. Beräkna sannolikheten att man skickar tillbaka partiet om av de 50 levererade cyklarna a) 10 % är felaktiga b) 4 % är felaktiga. 3.30 På en infektionsklinik tas regelbundna prov på en viss typ av patienter. Ibland händer det att ett prov hanteras fel och måste slängas. Detta inträffar med sannolikheten 0.03 och proven antas oberoende. Vad är sannolikheten att det bland fyra prov finns minst tre som kan användas? 3.31

I en kvalitetskontroll av ett stort parti tillverkade enheter tas slumpmässigt 15 enheter ut och partiet avskiljs om fler än 1 enhet är felaktig. Vad är konsumentrisken, om felandelen i partiet är 0.10, d.v.s. vad är sannolikheten att ett så pass dåligt parti godkänns i kontrollen?

3.32

Ett idrottsarrangemang har kapacitet att hantera 365 deltagare. Eftersom man av erfarenhet vet att 10 % av de anmälda inte brukar komma tar man emot 400 anmälningar. a) Beräkna sannolikheten att det kommer fler än 365 anmälda till arrangemanget ett år. b) Samma strategi har används av arragörerna under de 10 år evenemanget anordnats. Beräkna sannolikheten att man minst två gånger under 10 år råkar ut för händelsen att det kommer fler än 365 anmälda.

3.33

Rutherford. Vid ett berömt experiment räknade Ernest Rutherford, tillsammans med Hans Geiger, antalet alfa-partiklar som under korta tidsperioder emitteras från ett radioaktivt preparat. De räknade in totalt 10 097 alfa-partiklar under 2 608 tidsintervall. I varje intervall kunde de räkna från 0 och upp till ett tiotal alfa-partiklar. Data finns i filen Rutherford. a) Ladda in datafilen och se efter vilka variabler som ligger i filen. b) Beskriv data med ett stolpdiagram.

40

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


3 fördelningar

c) Beräkna medelantalet partiklar per intervall. d) Man funderar på om dessa data kan beskrivas med hjälp av någon statistisk standardfördelning. En sådan är Poissonfördelningen, Po(λ) där λ är det förväntade antalet partiklar per intervall. Rita upp sannolikhetsfunktionen för olika värden på x. Plotta även fördelningsfunktionen. e) Enligt denna modell, vad är sannolikheten att antalet emitterade partiklar i ett tidsintervall är 1? Beräkna sannolikheten att antalet emitterade partiklar är minst 2, d.v.s. P(X ≥ 2). f) Jämför modellen med observerade data. Verkar det rimligt att anta att X= ”antalet partiklar per intervall” i experimentet är Poissonfördelat? Uppgiften med matlab-kod 3.34

Uppgiften med R-kod

Avloppen i en stad är dimensionerade efter regnmängder med en återkomsttid på 10 år. Det tolkas som att sannolikheten att det sker en översvämning ett slumpmässigt valt år är 0.1. Antag att översvämningar olika år inträffar oberoende av varandra. a) Vad är sannolikheten, enligt dimensioneringen, för minst 2 översvämningsår under en 20-årsperiod? b) Dimensioneringen gjordes redan 1995. De senaste 20 åren tycker man att det har regnat mer än tidigare eftersom antalet år med översvämningar varit 5. Beräkna sannolikheten att man får minst 5 översvämningar under 20 år enligt den gamla dimensioneringen. Diskutera: Tyder detta på att det regnat mer de senaste decennierna så att sannolikheten för översvämning har ökat?

3.35

Gränsvärdet för radonkoncentrationen i hus är λ = 200 Bq/m3 . Ett sätt att mäta radonkoncentrationen i inomhusluft är att hänga upp en film känslig för alfa-partiklar. När filmen träffas av en partikel uppstår efter framkallning ett hål i filmen. Om X är antalet hål i en film, är det rimligt att anta att X är Poissonfördelat med ett väntevärde som är proportionellt mot radonkoncentrationen λ, d.v.s X ∈ Po(K λ). Då man gör mätningar i Wilmas hus är i denna mätsituation K = 0.1.

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

41


3 fördelningar

a) Antag att radonkoncentrationen i huset ligger på gränsvärdet λ = 200 Bq/m3 . Hur många hål i filmen förväntas då? b) I huset uppmätte man 26 hål på filmen. Beräkna sannolikheten att det finns 26 hål eller fler på en film, om λ = 200 Bq/m3 . Diskutera: Verkar det finnas fog för påståendet att gränsvärdet har överskridits i Wilmas hus? Inspelad lösning 3.36

Antalet fall av en ovanlig cancersjukdom i en befolkning modelleras med hjälp av en Poissonfördelning. Genom att jämföra med nationella cancerregistret förväntar man sig, under en viss tidsperiod, 9 fall i ett område. a) Beräkna sannolikheten att man observerar exakt 9 fall i området. b) I området observerade man 19 fall. Beräkna sannolikheten att få minst 19 fall då man förväntat sig 9. Diskutera: Tyder detta på att området är mer drabbat av cancersjukdomen än resten av landet?

3.1.3 VÄNTEVÄRDE OCH VARIANS

Digitala uppgifter 3.37

Vid ett kameraövervakat trafikavsnitt noterades antalet tillbud under var och en av 68 dagar. Baserat på dessa data antar man följande sannolikhetsfunktion för antalet tillbud under en dag. Antal tillbud Sannolikhet

0 0.3

1 0.5

2 0.1

3 0.05

4 0.05

Beräkna förväntat antal tillbud under en dag. 3.38

I en fabrik har man under en längre tid studerat antal produktionsstopp som sker under en arbetsvecka: Antal stopp Sannolikhet

0 0.6

1 0.3

2 0.05

3 0.03

4 0.02

Beräkna förväntat antal produktionsstopp under en arbetsvecka. 42

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R


3 fördelningar

3.39

Sannolikheten att ett område med kolonilotter översvämmas ett år anses vara p = 0.08 och översvämningar olika år är oberoende. Översvämning skedde i år och man funderar på förväntat antal år till nästa översvämning, d.v.s. översvämningens återkomsttid. Låt X vara antal år till nästa översvämningsår, detta nya översvämningsår medräknat. a) Verifiera att sannolikhetsfunktionen för X är en för första gången fördelning (ffg) med sannolikhetsfunktion p(x) = P(X = x) = (1 − p)x−1 p = 0.92x−1 0.08, där x = 1,2, . . .. b) Beräkna E(X), d.v.s. förväntat antal år till nästa översvämningsår. 1 k−1 Ledning: Utnyttja att ∑∞ = (1−a) 2. k=1 k ⋅ a c) Verkar det rimligt att återkomsttiden för en händelse tolkas som p1 , där p är sannolikheten att händelsen inträffar ett år? Inspelad lösning

3.40 En person planerar att göra 50 åk nerför skidsystemets svåraste pist. Hen bedömer att risken att skada sig i ett åk är p och att olika skidåk är oberoende med samma skaderisk. a) Antag att p = 0.02. Beräkna förväntat antal skadeåk. b) Personen vill att sannolikheten för minst ett skadeåk ska understiga 0.10. Vad ger ger det för villkor på p, skaderisken i ett åk? 3.41

Jon spelar quizkampen. Av spelets 18 frågor, som alla har 4 svarsalternativ, kan Jon vanligtvis svaret på 6 frågor. På 4 frågor brukar han gissa mellan två alternativ, medan han bara gissar på resterande 8 frågor. I spelet får man ett poäng för varje korrekt svar. Vad är Jons förväntade poängantal efter ett spel?

3.42 Antalet åskväder i en svensk stad under en sommarmånad anses vara Poissonfördelat med λ = 2.7. a) Beräkna förväntat antal åskväder under perioden juni-augusti. Förutsätt oberoende mellan månader. b) Vilket är det troligaste antal åskväder i staden under juli månad? 3.43

En fabrikant masstillverkar en vara, där varje enhet med sannolikhet 0.10 blir defekt. En felfri vara ger en vinst på 60 kr, medan en defekt

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R

43


3 fördelningar

ger en förlust på 40 kr. Beräkna väntevärdet på vinsten hos ett parti med 200 enheter. 3.44 I uppgift 3.37 undersöktes antalet tillbud vid ett kameraövervakat trafikavsnitt: Antal tillbud Sannolikhet

0 0.3

1 0.5

2 0.1

3 0.05

4 0.05

Beräkna varians och standardavvikelse för antalet tillbud. 3.45

Efter en viss typ av operation kan patienten få feber som komplikation, sannolikheten för detta anses vara 0.07 vid ett sjukhus. Under ett år utfördes 85 sådana operationer. Beräkna väntevärde och standardavvikelse för X, antalet patienter med feberkomplikation.

3.46 En korrekturläsare anser att antalet fel på en textsida är oberoende och Poissonfördelat med väntevärde λ = 1.9. Beräkna standardavvikelsen för antalet fel på a) en textsida b) 10 textsidor. 3.47

En biolog studerar hur en viss typ av maskar fördelar sig i sand. Hon delar in en bit strand i rutor och räknar antalet maskar per ruta. Baserat på sina data uppskattar hon följande sannolikhetsfunktion för X, antalet maskar per ruta. Antal maskar per ruta Sannolikhet

0 0.4

1 0

2 0

3 0.2

4 0.3

5 0.1

a) Beräkna väntevärde och varians för X. b) Under förutsättning att maskarna placerar sig slumpmässigt i sanden är en rimlig modell för X en Poissonfördelning. Vad är väntevärde och varians i en Po(λ)? c) Utifrån resultaten i (a) och (b), verkar antalet maskar per ruta vara Poissonfördelat? Verkar maskarna placera sig slumpmässigt i sanden?

44

© F Ö R FAT TA R N A O C H S T U D E N T L I T T E R AT U R



16 mm

Johan Lindström är docent i matematisk statistik vid Lunds universitet och arbetar med utveckling av statistiska metoder som kan användas inom miljö- och klimatforskning. Han undervisar kurser på flera nivåer vid LTH och har varit inbjuden föreläsare vid internationella kurser i geostatistik.

– ett arbetsmaterial i sannolikhetslära och statistisk inferens Räkna med variation är ett omfångsrikt arbetsmaterial i grundläggande sannolikhetslära och statistisk inferens. Materialet innefattar bok och e-bok med digitala övningar. Det kan kombineras med olika textböcker i ämnet matematisk statistik. Materialets fokus på tillämpningar, inom t.ex. bygg, kemi och medicin, gör det lämpligt för tekniska och naturvetenskapliga utbildningar. Det stora ”smörgåsbordet” av olika uppgifter och uppgiftstyper ger läraren möjlighet att välja moment efter just sitt kursupplägg. Det breda materialet tränar studenten på såväl begrepps­förståelse, räknefärdighet som dataanalys. Räkna med variation innehåller: • digitala övningar för begreppsförståelse • papper-och-penna uppgifter med stödjande videolösningar • nyutvecklade rutiner i Matlab och R och handledda digitala datorlaborationer för interaktiv utforskning av teorin • datoruppgifter med datamaterial för träning av modellbygge, dataanalys och tolkning av resultat • miniprojekt med öppna frågeställningar Art.nr 39276

|  RÄKNA MED VARIATION

Räkna med variation

Lena Zetterqvist Johan Lindström

Lena Zetterqvist är universitetslektor i matematisk statistik vid Lunds universitet och har under ett flertal år arbetat med kursutveckling av grundkurser. Hon är lärare med ”Excellent Teaching Practice” vid LTH och har fått Lunds universitets pedagogiska pris.

RÄKNA MED VARIATION – ett arbetsmaterial i sannolikhetslära och statistisk inferens

LENA ZET TERQVIST JOHAN LINDSTRÖM

studentlitteratur.se

978-91-44-11314-2_01_cover.indd Alla sidor

2017-03-10 11:46


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.