Issuu on Google+

Opgave 5.2 Spørgsmål 1: Vi definerer X1 som "antal husstande som tager imod tilbuddet blandt de 40". Idet vi har - alternativ variation, A eller AC , hvor A er "husstanden modtager tilbuddet" - P (A) = p1

konstant (tvivlsom)

- uafhængighed så er X1 binomialfordelt med n1 = 40, altså X1 ∼ b(n1 = 40, p1 ) Vi formulerer testhypoteserne således H0 : p1 = 0.05 H1 : p1 > 0.05 Som teststørrelse vælges X1 ∼ b(n1 = 40, p1 = 0.05) under H0 Signifikanssandsynligheden bliver ved opslag i appendix F α∗ = P (X ≥ 5) = 1 − P (X1 ≤ 4) = 1 − 0.952 = 0.048 Hypotesen om at virksomheden lider tab forkastes på ethvert niveau større end 0.048, og dermed også på niveau α = 0.05, men konklusionen er i dette 1


tilfælde meget niveaufølsom. Spørgsmål 2: Vi definerer nu X2 som "antal husstande som tager imod tilbuddet blandt de 50". Analogt med fremstillingen i spørgsmål 1 får vi X2 ∼ b(n2 = 50, p2 ) Vi formulerer testhypoteserne således H0 : p2 = 0.03 H1 : p2 > 0.03 Som teststørrelse vælges X2 . Men da b(n2 = 50, p2 = 0.03) ikke direkte er tabelleret i appendix F, og da normaltilnærmelsen heller ikke er brugbar uden videre, eftersom n2 p2 = 50 · 0.03 = 1.5 < 5, benyttes Poissontilnærmelsen for λ = 1.5. Vi får a

X2 ∼ b(n2 = 50, p2 = 0.03) ∼ p(λ = n2 p2 = 1.5) under H0 Signifikanssandsynligheden bliver ved opslag i appendix F α∗ = P (X2 ≥ 5) = 1 − P (X2 ≤ 4) = 1 − 0.981 = 0.019 Hypotesen om at virksomheden lider tab forkastes klart på niveau α = 0.05.

2


Opgave 5.4 Spørgsmål 1: Vi definerer X som "antal ulykker før indførelsen af sommertid"ud af et samlet ulykkestal på n = 47 + 28 = 75. Idet vi har - alternativ variation, A eller AC , hvor A er "ulykken indtræffer før indførelsen af sommetid" - P (A) = p

konstant

- uafhængighed så er X binomialfordelt med n = 75, altså X ∼ b(n = 75, p) Spørgsmål 2: Hvis lysforholdenen ikke spiller nogen rolle, så burde ulykkerne fordele sig ligeligt på "før"og "efter". Vi formulerer derfor testhypoteserne således H0 : p = p0 = 0.5 H1 : p = p0 Som teststørrelse benyttes pˆ − p0 U=

p0 (1−p0 ) 75

a

∼ N (0, 1)

Idet ”førandelen” pˆ = 47/75 = 0.627, så er 0.627 − 0.5 u=  = 2.20 0.5(1−0.5) 75

Da u = 2.20 > u0.975 = 1.96, forkastes H0 på niveau α = 0.05. Ved indførelse af sommertid bliver det lysere. Forkastelse af H0 kan derfor muligvis tages som udtryk for, at lysforhold spiller en rolle for antallet af ulykker. 3


Opgave 5.6 Spørgsmål 1: X ∼ b(n = 100, p) Forudsætninger: - alternativ variation, A eller AC , hvor A er "defekt" - P (A) = p

konstant

- uafhængighed

(defekte enheder kommer ikke i "byger")

Spørgsmål 2: H0 : p = p0 = 0.1 H1 : p > p0 Ved opslag i Excel får vi signifikanssandsynligheden α∗ = P (X ≥ 12|H0 ) = 1 − P (X ≤ 11|H0 ) ≈ 1 − 0.7 = 0.3 Da α∗ > α accepteres H0 . Spørgsmål 3: Da man ved test af ovenstående hypoteser, er nået frem til en kritisk værdi K = 13, må man have haft signifikansniveauet α = P (X ≥ K = 13|H0 ) = 1 − P (X ≤ 12|H0 ) ≈ 1 − 0.8 = 0.2

4


Opgave 5.8 Spørgsmål 1: Vi definerer X som antal bilag med fejl ud af 1000. Idet vi har - alternativ variation, A eller AC , hvor A er "bilag med fejl" - P (A) = p

konstant

- uafhængighed så er X binomialfordelt med n = 1000, altså X ∼ b(n = 1000, p) Vi har observeret x = 20. Estimatet for p bliver pˆ = 20/1000 = 0.02 Spørgsmål 2: Et tilnærmet 95% konfidensinterval for p bliver 

pˆ(1 − pˆ)  1000 0.02 · 0.98 = 0.02 ± 0.0087 = 0.02 ± 1.96 1000 = [0.0113, 0.0287]

 p) = pˆ ± u0.975 pˆ ± u0.975 · SD(ˆ

Spørgsmål 3: Nej, det er det ikke, da afvigelsen er 0.0087. Vi stiller som krav at  1.96

p(1 − p) ≤ 0.006 n

Problemet er, at vi på planlægningstidspunktet ikke kender p. Produktet p(1 − p) har maksimum for p = 1/2. Sætter vi derfor p = 1/2 er vi sikre på, 5


at få en tilstrækkelig stor stikprøve. Vi behøver dog ikke at gå til den slags yderligheder, idet vi har fået oplyst at p højst er 0.05. Sætter vi p = 0.05, kan vi nu bestemme n af udtrykket  1.96

0.05 · 0.95 ≤ 0.006 n  2 0.0475 0.006 ≤ n 1.96 0.0475 n≤  2 = 5068.7 0.006 1.96

∼ 5069

6


Opgave 5.10 Spørgsmål 1: Teststørrelse pˆ − p0 

a

∼ N (0, 1) under H0

p0 (1−p0 ) n

H0 accepteres, hvis pˆ − p0 − u1−α/2 <  

< u1−α/2

p0 (1−p0 ) n

 p0 (1 − p0 ) p0 (1 − p0 ) p0 − u1−α/2 < pˆ < p0 + u1−α/2 n n   0.05 · 0.95 0.05 · 0.95 < pˆ < 0.05 + 1.96 0.05 − 1.96 150 150 0.05 − 0.035 < pˆ < 0.05 + 0.035 0.015 < pˆ < 0.085 Spørgsmål 2: Nedenstående figur er et kontrolkort for defektsandsynligheden. Kontrolkortet viser alt for mange "gode udfald". Det kunne tyde på, at virksomhedens bestræbelser er lykkedes over al forventning. Spørgsmål 3: Y ∼ b(m = 3750, p) pˆ = y/m = 94/3750 = 0.025 H0 : p = p0 = 0.03 H1 : p = p0 Da pˆ − p0 |u| = 

p0 (1−p0 ) 3750

=

|0.025 − 0.03|  = 1.79 < 1.96 0.03·0.97 3750

7


accepteres H0 på niveau α = 0.05. Det stadfæster indtrykket fra kontrolkortet.

K o n tr o lk o r t fo r d e fe k ts a n d s y n lig h e d

0 ,0 8 D e fe k ta n d e l

0 ,0 6

N K G

0 ,0 4

Ø K G

0 ,0 2

S tik p r ø v e n r .

8

2 5

2 2

1 9

1 6

1 3

1 0

7

4

0 1

D e fe k ta n d e l

0 ,1


Opgave 5.12 Spørgsmål 1: X ∼ b(n = 105, p = 0.2) 1) n forsøg: A eller AC 2) P (A) = p

konstant

3) uafhængige forsøg

E(X) = n · p = 105 · 0.2 = 21 V ar(X) = n · p(1 − p) = 21 · 0.8 = 16.8 √ SD(X) = 16.8 = 4.1

Spørgsmål 2: 

14 + 0.5 − 21 P (X ≥ 15) = 1 − P (X ≤ 14) = 1 − Φ 4.1 = 1 − Φ(−1.585) ≈ 1 − 0.0565 = 0.944



Spørgsmål 3:

X ∼ b(n = 2100, p)

x = 400 pˆ = 400/2100 = 0.19

H0 : p = p0 = 0.2 H1 : p = p0 Da |u| =



|ˆ p−p0 | p0 (1−p0 ) n

√ 0.2·0.8 = 1.15 < u0.975 = 1.96, accepteres H0 på = |0.19−0.2| 2100

niveau α = 0.05, hvilket stemmer overens med hotellets formodning. 9


Opgave 5.14 Spørgsmål 1: X ∼ p(λ) dvs. Poissonfordelt med intensitet λ. X måler antal pr. et eller andet uden overgrænse. Spørgsmål 2: Vi indfører testhypoteserne H0 : λ = λ0 = 4 H1 : λ = λ0 Som teststørrelse benyttes ˆ − λ0 a λ U= ∼ N (0, 1) under H0 λ0 /28 ˆ = Σxi /28 = 95/28 = 3.39, så er Da λ 3.39 − 4 = −1.61 u=  4/28 Da |u| = 1.61 < u0.975 = 1.96 accepteres H0 på niveau α = 0.05. Undersøgelsen giver ikke grundlag for at foretage en justering.

10


Opgave 5.16 Spørgsmål 1: X : antal maskinstop pr. maskine pr. måned X ∼ p(λ) Vurdering: 49 ˆ = x¯ = 1 xi = = 2.45 λ n i 20 Observeret X P (X = x|λ = 2.45) relativ hyppighed 0 0.0863 0.05 1 0.2114 0.15 2 0.259 0.30 3 0.2115 0.35 4 0.1296 0.10 ≥5 0.1022 0.05 1 1 Der synes at være en tendens til, at modellen måske er lidt for "haletung". Spørgsmål 2: Vi indfører testhypoteserne H0 : λ = λ0 = 2 H ! : λ > λ0 Som teststørrelse benyttes ˆ − λ0 a λ U= ∼ N (0, 1) under H0 λ0 /20 ˆ = 2.45, får vi Indsættes λ 2.45 − 2 = 1.42 u=  2/20 Da u = 1.42 < u0.95 = 1.645, accepteres H0 på niveau α = 0.05, og svaret på det stillede spørgsmål må blive bekræftende. 11


Opgave 5.18 Spørgsmål 1: Vi antager at X er Poissonfordelt med parameter λ, altså X ∼ p(λ) Forudsætninger: Vi indfører hændelsen A = {én indbetaling i tidsrummet ∆t}, idet det antages at ∆t vælges således at sandsynligheden for at få to eller flere indbetalinger i δt er nul. Forudsætningerne kan nu præciseres som - A eller AC i ∆t - P (A) = λ · ∆t - forekomsterne af A kommer uafhængigt af hinanden Spørgsmål 2: Et tilnærmet 95% konfidensinterval for λ bliver

ˆ ± u0.975 λ ˆ = x¯ = Idet λ

Σxi n

=

ˆ λ n

270 100

= 2.7, får vi  2.7 ≈ 2.9 ± 0.32 = [2.38, 3.02] 2.7 ± 1.96 100

Spørgsmål 3: Testes tosidet har vi testhypoteserne H0 : λ = λ0 = 3 H1 : λ = λ0 12


Da 95% konfidensintervallet indeholder værdien 3, accepteres H0 på niveau α = 0.05. Testes ensidet får vi H0 : λ = λ0 = 3 H 1 : λ < λ0 Tststørrelsesværdien bliver ˆ − λ0 λ 2.7 − 3 =  = −1.73 u=  3 100

λ0 100

Da |u| = 1.73 > u0.95 = 1.645, forkastes H0 på niveau α = 0.05. Testet er med andre ord så niveaufølsomt, at konklusionen afhænger af hvordan alternativhypotesen formuleres.

13


Opgave 5.20 Spørgsmål 1: X er Poissonfordelt med parameter λ, altså X ∼ p(λ) Valget kan enten begrundes med en procesbetragtning eller ved at udnytte forbindelse til binomialfordelingen. Vi vælger det sidste idet vi udnytter, at hvis X ∼ b(n, p) med n stor og p lille, så kan X lige så godt beskrives ved en Poissonfordeling med parameter λ = np. Man kan forestille sig, at man pr. tidsenhed har et stort antal potentielle kunder, som uafhængigt af hinanden kan vælge enten at købe eller ikke købe, formodentlig med en forholdsvis lille købssandsynlighed. Er disse betingelser til stede, vil det kunne begrunde det foretagne fordelingsvalg. Som et skøn over λ benyttes ˆ = x¯ = Σx = 0 · 11 + 1 · 28 + 2 · 43 + . . . + 10 · 1 = 600 = 3 λ 200 200 200 Spørgsmål 2: Et tilnærmet 95% konfidensinterval for λ bliver

ˆ ± u0.975 λ

ˆ λ n

Indsættelse giver  3.0 ± 1.96

3 = [2.76, 3.24] 200

Spørgsmål 3: Idet der mindes om regnereglerne

14


E(aX) = a · E(X) og Var (aX) = a2 V (X) fås følgende 95% konfidensinterval for det forventede årlige salg 

3 200 = [275 · 2.76, 275 · 3.24] = [759, 891]

275 · 3.0 ± 275 · 1.96

15


Opgave 5.22 Spørgsmål 1: Vi definerer X som samletiden pr. produkt og påstår at X er normalfordelt, altså X ∼ N (µ, σ 2 ) Figuren nendenfor viser normalfraktildiagram for samletiderne. Ser man bort fra den mindste og den største værdi - som meget ofte er problematiske - så snor resten af punkterne sig pænt om et retlinet forløb, således at vi kan godkende påstanden om at samletiden er normalfordelt.

Normalfraktildiagram for samletid 3 2 U-fraktil

1 0 -1

9

9,5

10

10,5

-2 -3 Tider

Spørgsmål 2: Vi indfører testhypoteserne H0 : µ = 10 H1 : µ = 10 16

11

11,5


Som teststørrelse benyttes ¯ − 10 √ X 20 ∼ T (n − 1) under H0 S √ Da µ ˆ = x¯ = 10.09, σ ˆ 2 = s2 = 0.2199 og dermed s = 0.2199 = 0.4689, så får vi teststørrelsesværdien T =

t=

10.09 − 10 √ 20 = 0.86 0.4689

Da t = 0.86 < t0.975 (19) = 2.093, accepteres H0 på niveau α = 0.05. Det ser ikke ud til at samletiden har ændret sig.

17


Opgave 5.24 Spørgsmål 1: Teststørrelse U=

¯ − µ0 √ X n ∼ N (0, 1) σ0

H0 accepteres, hvis ¯ − µ0 √ X n < u1−α/2 σ0 σ0 σ0 ¯ < µ0 + u1−α/2 √ µ0 − u1−α/2 √ < X n n 0.00032 ¯ < 0.0773 + 1.96 0.00032 √ 0.0773 − 1.96 √ <X 5 5 ¯ 0.0773 − 0.00028 < X < 0.0773 + 0.00028 ¯ < 0.0776 0.0770 < X −u1−α/2 <

Spørgsmål 2: Teststørrelse Q = (n − 1)

S2 ∼ χ2 (n − 1) 2 σ0

H0 accepteres, hvis χ2α/2 (n − 1) < (n − 1) χ2α/2 (n − 1) · σ02

S2 < χ21−α/2 (n − 1) σ02

χ2 (n − 1) · σ02 <S < n−1 n−1 0.48 · 107 11.14 · 107 < S2 < 4 4 −7 2 0.12 · 10 < S < 2.8 · 10−7 2

Spørgsmål 3: Kontrolkortene nedenfor ser forholdsvis udramatiske ud. For variansens vedkommende har man én værdi på overgrænsen og én værdi som falder udenfor i bunden. I princippet bør man reagere på begge typer af store afvigelser, gode som dårlige, da begge kan være lærerige.

18


Kontrolkort for middelværdi 0,0778 Gennemsnit

0,0776 0,0774

gennemsnit

0,0772

NKG

0,077

ØKG

0,0768 25

23

21

19

17

15

13

9

11

7

5

3

1

0,0766 Stikprøve nr.

Kontrolkort for varians 0,0000003

0,0000002

varians

0,00000015

NKG

0,0000001

ØKG

0,00000005

Stikprøve nr.

19

25

23

21

19

17

15

13

9

11

7

5

3

0 1

Varians

0,00000025


Spørgsmål 4: X : Antal værdier uden for X ∼ b(n = 25, p = 0.05) E(X) = n · p = 25 · 0.05 = 1.25 dvs. ca. 1

20


Opgave 5.26 Spørgsmål 1: X: fjerderlængden E(X) = µ  Var (X) = σ 2 SD(X) = Var (X) = σ

H0 : µ = µ0 = 500 H1 : µ = µ0 Teststørrelse u=

¯ − µ0 √ X n ∼ N (0, 1) under H0 σ

√ Da u = 501.2−500 100 = 12 > u0.975 = 1.96, forkastes H0 på niveau α = 0.05. 1 Der bør ske en niveaujustering, middellængden er for stor. Spørgsmål 2: Det antages, at x1 , . . . , xn=100 er uafhængige observationer af den stokastiske variabel X og at X ∼ N (µ, σ 2 ). Endvidere er anvendt er U-test, idet det åbenbart antages √ at variabiliteten er under kontrol. Men et T-test med anvendelse af s = 1.2 = 1.34 i stedet for σ = 1 ville have givet samme konklusion i dette tilfælde. Spørgsmål 3:

H0 : σ 2 = σ02 = 1 H1 : σ 2 > σ02 (el σ 2 = σ02 ) Teststørrelse Q=

(n − 1) · S 2 ∼ χ2 (n − 1) under H0 σ22 21


Da q = 99·1.2 = 118.8 < χ20.95 (99) = 123.23, accepteres H0 på niveau α = 0.05. 1 Der skal ikke justeres umiddelbart, men testet er niveafølsomt. Spørgsmål 4: X ∼ N (µ = 500, σ 2 = 1) P "for kort"= P (X < 498) P "for lang"= P (X > 502) P "tilpas"= P (498 ≤ X ≤ 502) På grund af symmetrien er 1 P (X < 498) = P (X > 502) = (1 − P (498 ≤ X ≤ 502)) 2 

502 − 500 P (”tilpas”) = P (498 ≤ X ≤ 502) = Φ 1 Φ(2) − Φ(−2) = Φ(2) − (1 − Φ(2)) = 2Φ(2) − 1 = 2 · 0.97725 − 1 = 0.9545



 −Φ

498 − 500 1



1 0.0455 P (”f or kort”) = P (”f or lang”) = (1 − 0.9545) = = 0.02275 2 2

22


Opgave 5.28 Vi definerer X som den daglige afsætning. Erfaringsmæssigt vides, at når prisen, p, er 20 kr., så er X ∼ N (µ = 500, σ 2 ) Spørgsmål 1: p = 18 : Figuren nedenfor er et normalfraktildiagram for den daglige afsætning. Punkterne udviser et nogenlunde retlinet forløb undtagen i begyndelsen, hvor forløbet er lidt for stejlt. Det kunne tyde på at der måske er en svag tendens til højreskævhed. Men alt i alt kan vi konkluderer at normalfordelingen vil være en rimelig model.

Normalfraktoldiagram for afsætningen 4 3

U-fraktil

2 1 0 -1

0

200

400

600

800

1000

1200

-2 -3 Afsætning pr dag

Spørgsmål 2: Vi ønsker at undersøge om prisnedsættelsen har haft en effekt, forstået på den måde at niveauet for den daglige afsætning er blevet hævet. Vi indfører testhypoteserne H0 : µ = 500 H1 : µ > 500 23


Som teststørrelse benyttes ¯ − 500 √ X n ∼ T (n − 1) under H0 S √ Vi har at x¯ = 590.16 og s2 = 35727.1 og dermed at at s = 35727.1 = 187.81 Indsættes fås teststørrelsesværdien T =

t=

590.16 − 500 √ 50 = 3.395 187.81

Da t = 3.395 > t0.95 (49) = 1.68, forkastes H0 på niveau α = 0.05, og vi kan konkludere at prisnedsættelsen har haft en signifikant positiv effekt. Spørgsmål 3: Afsætningskurven - en ret linie - går gennem punkterne (m, p) = (500, 20) og (m0 , p0 ) = (590.16, 18) Denne linie har hældningen 20 − 18 p − p0 = = 0.02218 m − m0 500 − 590.16 Heraf får vi afsætningskurven I p = (m − 590.16)(−0.02218) + 18 = −0.02218 · m + 31.0897 Grænseomsætningskurven bliver den rette linie II p = −0.04436 · m + 31.0897

24


Ved at indsætte p = 2 i II får vi 2 = −0.04436 · m + 31.0897 m = 655.76 som indsat i I giver p = −0.02218 · 655.76 + 31.0897 = 16, 54kr. Disse beregninger tyder på, at det faktisk vil kunne betale sig at sætte prisen yderligere ned.

25


Opgave 5.30 Spørgsmål 1: Vi definerer X som vægt pr. pose. Garantien siger at X er normalfordelt med en given varians. Normalfraktildiagrammet nedenfor viser at der ikke er problemer med normalfordelingsforudsætningerne, da punkterne nærmest ligger på en ret linie.

Normalfraktildiagram for vægten pr pose 2,5 2 1,5 U-fraktil

1 0,5 0 -0,5 245

246

247

248

249

250

251

252

253

254

-1 -1,5 -2 -2,5 Vægt

Garantien siger endvidere at variansen højst er 10 gram2 . Vi vil vurdere dette ved at opstille et 95% konfidensinterval for σ 2 og sammenligne det med garantien. Konfidensintervallet bliver (n − 1)s2 (n − 1)s2 2 < < σ χ20.975 (n − 1) χ20.025 (n − 1) Idet s2 beregnes til 4.105, får vi 16 · 4.105 16 · 4.105 < σ2 < 28.845 6.908 2.28 < σ 2 < 9.51 Da hele konfidensintervallet ligger til venstre for 10, er der heller ingen problemer med denne del af garantien. 26


Opgave 5.32 Spørgsmål 1: Vi definerer Xi i = 1, . . . 5 som antal solgte enheder af mærke i ud af et samlet salg på n = 200. Idet vi har - mærkerne Ai i = 1, . . . , 5 hvor Ai er salg af ”en mærke-i-enhed” - P (Ai ) = pi

konstant

- uafhængighed så er Xi , i = 1, . . . 5 multinomisk fordelt med parameter n, p1 , . . . , p5 , altså (X1 , . . . , X5 ) ∼ M (n, p1 , . . . , p5 ) hvor Σxi = n og Σpi = 1. Spørgsmål 2: Vi indfører testhypoteserne H0 : p1 = 0.625 og p2 = 0.226 og p3 = 0.115 og p4 = 0.014 og p5 = 0.02 H1 : H0C Som teststørrelse benyttes

Q=

k=5 (obsi − f orvi )2 i=1

f orvi

a

∼ χ2 (k − 1 = 4) under H0

Vi har f orvi = n · pi = 200 · pi og dermed f orv1 = 200 · 0.625 = 125, f orv2 = 200·0.226 = 45.2, f orv3 = 200·0.115 = 23, f orv4 = 200·0.014 = 2.8 og f orv5 = 200 · 0.02 = 4. Da testet er tilnærmet, og tilnærmelsen bliver bedst hvis f orvi ≥ 5, slås de sidste to grupper sammen så vi i stedet benyttet teststørrelsen

27


Q=

4 (obsi − f orvi )2 i=1

f orvi

a

∼ χ2 (k1 − 1 = 3) under H0

Indsættes fås (95 − 125)2 (50 − 45.2)2 (41 − 23)2 (14 − 6.8)2 + + + 125 45.2 23 6.8 = 7.2 + 0.51 + 14.09 + 7.62 = 29.42

q=

Da q = 29.42 > χ20.95 (3) = 7.815, forkastes H0 på niveau α = 0.05. Det kunne tyde på at A’s kundegruppe afviger fra landsgennemsnittet. Den køber hyppigere de mindre populære mærker end folk i almindelighed.

28


Opgave 5.34 Spørgsmål 1: Vi definerer Xi , i = A, B, C, D, E, som det antal ud af n = 80 som har afgivet svaret "i". Idet vi har - svarmulighederne "i" - P (i) = pi konstant (når der gættes) - uafhængighed

(kan forhåbentlig sikres)

så er Xi , i = A, B, C, D, E, multinomisk fordelt, altså (XA , . . . , XE ) ∼ M (n = 80, pA , . . . , pE ) Det rene gætteri er ensbetydende med testhypoteserne H0 : pA = pB = pC = pD = pE = 0.2 H1 : H0C Som teststørrelse benyttes

Q=

E (obsi − f orvi )2 i=A

f orvi

a

∼ χ2 (k − 1 = 4) under H0

Vi har f orvi = n · pi = 80 · 0.2 = 16, i = A, B, C, D, E. Indsættes får vi (28 − 16)2 (10 − 16)2 (8 − 16)2 (15 − 16)2 (19 − 16)2 + + + + 16 16 16 16 16 = 9 + 2.25 + 4 + 0.06 + 0.56 = 15.87

q=

Da q = 15.87 > χ20.95 (4) = 9.488, forkastes H0 på niveau α = 0.05. Påstanden om at der afkrydses "i blinde"kan afvises.

29


Opgave 5.36 Spørgsmål 1: Vi skal undersøge om X er Poissonfordelt med parameter λ, altså H01 : X ∼ p(λ) Parameteren λ estimeres underH01 ved gennemsnittet ˆ = x¯ = 1 Σxj = 1 (0 · 50 + 1 · 15 + 2 · 4 + 3 · 1) = 26 = 0.37 λ n 70 70 Vi indfører følgende beregningsskema

1 2 3

x 0 1 2

4

3

i

yi = obsi 50 15 ⎫ 4 ⎬ 5 ⎭ 1 70

ˆx

ˆ

P (X = x) = p˜i = λx! e−λ p˜1 = e−0.37 = 0.69 e−0.37 = 0.26 p˜2 = 0.37 1 2 e−0.37 = 0.05 p˜3 = 0.37 2 p˜4 = 1 − p˜1 − p˜2 − p˜3 ≈ 0 1

f orvi = 70 · pˆi 48.3 18.2 ⎫ ⎬ 3.5 ⎭ 70

(obsi −f orvi )2 f orvi

0.06 0.56 0.64 1.26

Søjle 2 og 4 er en tabellering af Poissonfordelingen med parameter λ = 0.37. Vi definerer variablene Yi i = 1, . . . , 4 som antal maskiner med x serviceopkald, hvor x = 0, 1, 2, 3 (eller flere) Under de givne betingelser er Y ’erne multinomisk fordelt med parametrene n = 70 og pi i = 1, . . . , 4, hvor pi er sandsynligheden for den til i svarende x-værdi, altså (Y1 , . . . , Y4 ) ∼ M (n = 70, p1 , . . . , p4 ) og nulhypotesen H01 bliver derved ensbetydende med nulhypotesen H02 : pi = p˜i i = 1, . . . , 4 30


Som teststørrelse benyttes

Q=

k (obsi − f orvi )2

f orvi

i=1

som er tilnærmet χ2 -fordelt med f = k − 1 − m frihedsgrader under H0 . De forventede værdier under H0 står i søjle 5 og de beregnede q-bidrag stor i søjle 6. Da den forventede værdi i gruppe 4 er tæt på nul, slås de sidste to grupper sammen, således at k = 3. Der estimeres én parameter, λ, så m = 1. Antal frihedsgrader bliver f = 3 − 1 − 1 = 1. Da q = 1.26 < χ20.95 (1) = 3.841, accepteres H0 på niveau α = 0.05. Så Poissonfordelingen er godkendt som model for data. Spørgsmål 2: Et 95% konfidensinterval for E(X) = λ bliver

ˆ ± u0.975 λ

 ˆ 0.37 λ = 0.37 ± 1.96 n 70 = 0.37 ± 0.14 = [0.23, 0.51]

31


Opgave 5.38 Spørgsmül 1: Vi har observerede vÌrdier, obsij , fra tabellen i opgaven og beregnede forventede vÌrdier, f orvij , i parentes, beregnet som f orvij = i j 1 2 3 A B

obsi+ ¡ obsj+ : obs++

1 antal â&#x2030;¤8 AUC 14 (14.29) HHA 14 (13.74) HHK 44 (43.97)  72 (74.73) OU 13 (10.27)  85

12 11 36 59 5 64

2 >8 (11.71) (11.26) (36.03) (56.27) (7.73)

 26 25 80 131 18 149

Model: Xi (= obsi1 ) : antal â&#x2030;¤ 8 Xi â&#x2C6;ź b(ni , pi ) i = 1, 2, 3 Vi indfører testhypoteserne H0 :p1 = p2 = p3 (homogenitet) H1 :H0C Teststørrelse: Q=

(obsij â&#x2C6;&#x2019; f orvij )2 a â&#x2C6;ź Ď&#x2021;2 (f = (3 â&#x2C6;&#x2019; 1)(2 â&#x2C6;&#x2019; 1) = 2) under H0 f orvij

IndsĂŚttes fĂĽs (36 â&#x2C6;&#x2019; 36.03)2 (14 â&#x2C6;&#x2019; 14.29)2 (12 â&#x2C6;&#x2019; 11.71)2 + + ... + = 0.024 q= 14.29 11.71 36.03 32


Da q = 0.024 < χ20.95 (2) = 5.99, accepteres H0 klart på niveau α = 0.05. (p-værdi = 0.988.) Spørgsmål 2: Model som før: Xj ∼ b(nj , pj ) j = A, B Hypoteser: H0 :pA = pB H1 :pA =  pB Teststørrelse

Q=

(obsij − f orvij )2 a ∼ χ2 (f = (2 − 1)(2 − 1) = 1) under H0 f orvij

Indsættes fås

q=

(72 − 74.73)2 (5 − 7.73)2 + ... + = 1.922 74.73 7.73

Da q = 1.922 < χ20.95 (1) = 3.84, accepteres H0 på niveau α = 0.05. Observationsmaterialet er altså ikke tilstrækkeligt til at den observerede forskel kan bruges mod OU.

33


Opgave 5.40 Model (X11 , . . . , X22 ) ∼ M (n = 7006, p11 , . . . p22 ) Vi indfører testhypoteserne H0 :pij = pi+ · p+j H1 :H0C Som teststørrelse benyttes

Q=

(obsij − f orvij )2 a ∼ χ2 (f = (2 − 1)(2 − 1) = 1) under H0 f orvij

Forventede værdier:

Xi+ ·X+j n

687.29 116.71

5301.71 900.29

Indsættes fås (656 − 687.29)2 (5333 − 5301.71)2 (148 − 116.71)2 (869 − 900.29)2 q= + + + 687.29 5301.71 116.71 900.29 = 1.42 + 0.18 + 8.39 + 1.09 = 11.08 Da q = 11.08 > χ20.95 (1) = 3.841, forkastes H0 på niveau α = 0.05. Der er flere ejerlejligheder på tvangsauktion end forventet under uafhængighed.

34


HD - løsninger