VBTL 5/6 - Statistiek specifieke vorming - inkijk methode (materiaal VBTL)

Page 1

LEERBOEK

Statistiek

D-finaliteit specifieke vorming

Philip Bogaert

Filip Geeurickx

Marc Muylaert

Roger Van Nieuwenhuyze

Erik Willockx

CARTOONS

Dave Vanroye

Hoe gebruik je VBTL ?

Dit boek bevat vijf hoofdstukken. Elk hoofdstuk is opgebouwd uit verschillende paragrafen met aan het einde een handige samenvatting.

Definities vind je op een rode achtergrond. Eigenschappen vind je op een groene achtergrond. Methodes, rekenregels en formules vind je op een zachtblauwe achtergrond.

Wiskunde is een eeuwenoude wetenschap. De geschiedenis van de wiskunde en de herkomst van bepaalde begrippen worden zachtpaars afgedrukt.

1 Telproblemen 1.1 Inleiding  Telproblemen zonder herhaling  1.3 De driehoek van Pascal en het binomium van Newton  1.4 Kansen berekenen met behulp van combinaties  2 Kansverdelingen en toevalsveranderlijken Toevalsveranderlijken  Rekenregels voor toevalsveranderlijken  70 3 Discrete verdelingen 3.1 De binomiale verdeling  85 De centrale limietstelling  4 Betrouwbaarheidsintervallen en toetsen van hypothesen Betrouwbaarheidsintervallen  4.2 Toetsen van hypothesen  139 5 Werken met grote datasets bevolking naar woonplaats, nationaliteit, burgerlijke staat, leeftijd en geslacht  5.3 Onderzoeksopdrachten  170 Bijlagen  171 Oplossingen  Trefwoordenregister  Statistiek
–in de wiskunde onderwezen door zijn vader. Op zestienjarige leeftijd formuleerde hij al een belangrijke stelling in de projectieve meetkunde, later bekend als de stelling van Pascal. Na zijn studies legde hij zich toe op wetenschappelijk onderzoek m.b.t. fysica en wiskunde. Hij formuleerde o.a. theorieën over de luchtdruk en de luchtledigheid. Natuurkundige ideeën de hydraulische pers en de barometer. In de wiskunde gaf Pascal zijn naam o.a. aan de slakkenlijn en aan de driehoek van Pascal. De driehoek van Pascal is in 1645 niet door Blaise Pascal uitgevonden, maar werd in China voor het eerst vermeld in het boek ‘Kostbare Spiegel van de vier Elementen’ van Shijie Zhu (gepubliceerd in 1303). De driehoek (de ‘Oude Spiegel’ genoemd) werd rond 1100 door de wiskundige Jia Xian besproken Het bord van Galton (genoemd naar een Britse ontdekkingsreiziger en wetenschapsman, 1822–1911) is een mooie illustratie van de driehoek van Pascal. Het toestel bestaat uit een hellend vlak waarop zich pinnetjes bevinden zoals door de bolletjes voorgesteld op de figuren hieronder. Het vlak helt, zodat het bovenste deel van de figuren hieronder het hoogst is. De afstand tussen naburige pinnetjes net groot genoeg om een knikker door te laten. wegen aan waarlangs de knikker die plaats kon bereiken.
2 Kansverdelingen en toevalsveranderlijken WINST VAN ROBBE NOTATIE KANS ––1 P X toevalsveranderlijke stochast Meestal gebruiken we een hoofdletter …) voor de toevalsveranderlijke en een kleine letter voor de waarde ervan. Een toevalsveranderlijke kan discreet of continu zijn. discrete toevalsveranderlijke kansfunctie wordt gegeven door aan die uitkomsten kansen toe te kennen. )= kansfunctie met voorschrift P ) {1, 2, 3, …, p p p In de beschrijvende statistiek wordt niet alleen met enkelvoudige frequenties, maar ook met cumulatieve cumulatieve verdelingsfrequentie ) definiëren we de cumulatieve verdelingsfunctie Hieronder vind je de grafiek van zowel de kansfunctie als van de cumulatieve verdelingsfunctie voorbeeld 2 (het aantal geworpen ogen bij het gooien van twee dobbelstenen). y

1 2 *

De nummers van de oefeningen hebben een gele kleur. Een sterretje duidt op een extra uitdaging. Maak ook kennis met voorbeeldvragen uit ijkingstoetsen en toelatingsexamens.

Achteraan in dit boek vind je de oplossingen

ICT is een ideaal hulpmiddel. Bij dit boek hoort een webpagina van GeoGebra, gevuld met heel wat digitale oefeningen en applets. Die vind je terug via www.polpo.be.

Wat moet je kennen en kunnen ?

Op het einde van elk hoofdstuk zie je een handig overzicht van wat je moet kennen en kunnen

WAT MOET JE KENNEN EN KUNNEN Telproblemen 1 pagina Ik ken de productregel en kan die toepassen. Ik ken de somregel en kan die toepassen. Ik ken de complementregel en kan die toepassen. Ik kan telproblemen bij geordende keuzes zonder herhaling oplossen. 21 Ik ken het binomium van Newton en kan het toepassen. 37
3Toepassingen Toepassing Een vulmachine met een standaardafwijking van gram vult potjes met abrikozenconfituur. De kwaliteitscontroleur wil met een zekerheid van 90% een betrouwbaarheidsinterval opstellen waarbinnen het gemiddelde gewicht van één potje abrikozenconfituur zich bevindt. Op basis van die steekproef kan hij met een betrouwbaarheid van 90% stellen dat het gemiddelde van één potje √ √ 410,22 1,65 √ ;410,22 1,65 √ 408,295gram;412,145gram lijst
Oplossingen Oplossingen 1.1 Inleiding 32495102400 7 12 12 12 120 210 17 15 21 D 22 C 1.2 Telproblemen zonder herhaling (blz. 27) 1 360 27 216 d 2562 6 24 7 3 628 800 24 12 239 500 800

Welkom terug in deze boeiende tak van de wetenschap waarin we gegevens verzamelen, ordenen en interpreteren : de statistiek. In het dagelijkse leven kom je voortdurend data, statistieken en resultaten van statistische gegevens tegen.

In dit boek wordt gestart met telproblemen en combinatoriek. De verklarende statistiek maakt immers gebruik van die kansrekening. Inferentiële statistiek probeert algemene uitspraken te formuleren binnen een zeker betrouwbaarheidsniveau over een gehele populatie.

Ook vliegtuigmaatschappijen passen dat toe. Stel dat ze weten dat 4% van de personen die een plaats reserveerden niet komen opdagen. En stel dat ze daardoor 154 tickets verkopen voor 150 plaatsen. Hoe groot is dan de kans dat alle passagiers een plekje hebben op het vliegtuig ? Kom het te weten in dit boek, dat boordevol praktische toepassingen zit op betrouwbaarheid en hypothesen.

Inhoud

Statistiek

1

Telproblemen

1.1 Inleiding  9

1.2 Telproblemen zonder herhaling  21

1.3 De driehoek van Pascal en het binomium van Newton  34

1.4 Kansen berekenen met behulp van combinaties  43

2

Kansverdelingen en toevalsveranderlijken

2.1 Toevalsveranderlijken  51

2.2 Rekenregels voor toevalsveranderlijken  70

3

Discrete verdelingen

3.1 De binomiale verdeling  85

3.2 De centrale limietstelling  99

4

Betrouwbaarheidsintervallen en toetsen van hypothesen

4.1 Betrouwbaarheidsintervallen  121 4.2 Toetsen van hypothesen  139

5

Werken met grote datasets

5.1 Voorbeeld 1 : bevolking naar woonplaats, nationaliteit, burgerlijke staat, leeftijd en geslacht  163

5.2 Voorbeeld 2 : NBA  166

5.3 Onderzoeksopdrachten  170

Bijlagen  171 Oplossingen  173 Trefwoordenregister  182

Hoofdstuktitel 0

Hier komt het introductie tekstje. Witregels worden manueel ingegeven.

Als acht deelnemers de finale van een 100 meter lopen, weet je wellicht nog van vorig jaar hoe je het aantal mogelijke podiums kunt berekenen. Iets moeilijker wordt het om te berekenen op hoeveel verschillende manieren ze over de finish kunnen lopen. Maar wat dan te zeggen over de marathon van Boston, een van de grootste ter wereld die jaarlijks zo’n 20 000 deelnemers telt …

Combinatoriek schuilt in talloze voorbeelden en kun je ook toepassen in evenveel dagdagelijkse situaties. Net als de Boston Marathon zelf is dit brokje wiskunde erg boeiend om mee te maken!

Telproblemen 1
© Boston Athletics Association

Telproblemen

1.1 Inleiding

1

2

3

7

1.2 Telproblemen zonder herhaling

1

1.3 De driehoek van Pascal en het binomium van Newton 1

1.4 Kansen berekenen met behulp van combinaties

1

8
Noodzaak tot formalisering  9
n-faculteit  11
Geordende of ongeordende keuzes, zonder of met herhaling  12
De productregel  14
De somregel  15
De complementregel  15
4
5
6
Samenvatting  16
Oefeningen  17
8
Variaties  21
Permutaties  23
Combinaties  24 4 Samenvatting  26
Oefeningen  27
2
3
5
Inleiding  34
Het binomium van Newton  37
Grafische interpretatie  38 4 De ontwikkeling van (a – b)n 38 5 Toepassingen  39 6 Samenvatting  40
Oefeningen  41
2
3
7
Formule van Laplace  43 2 Voorbeeld 1  44 3 Voorbeeld 2  45 4 Samenvatting  45 5 Oefeningen  46 Wat
je
48 1
moet
kennen en kunnen?

1.1

Inleiding 1 Noodzaak tot formalisering

In het vierde jaar heb je al kennisgemaakt met eenvoudige telproblemen. Om die op te lossen, leerde je het aantal elementen van een verzameling tellen met behulp van figuren of schema’s. Dat kan als volgt :

a Door ze aanschouwelijk voor te stellen

1 Boomdiagram

We stellen een probleem schematisch voor met takken en vertakkingen van een boom. Het totale aantal mogelijkheden is het product van de vertakkingsaantallen per niveau.

2 Wegendiagram

Daarin vind je het aantal mogelijkheden door het aantal wegen tussen de knooppunten te vermenigvuldigen.

3 Rooster

Het aantal wedstrijden in een competitie met 4 voetbalploegen is in het rooster af te lezen. Het aantal is 12.

4 Systematisch noteren van de mogelijkheden

Stijn, Dries en Karlien kunnen op 6 manieren achter elkaar staan.

5 Venndiagram

De gegevens worden overzichtelijk voorgesteld in een venndiagram. We bepalen eerst A ∩ B ∩ C en vullen dan verder aan.

6 Driehoek van Pascal

Het getallenpatroon van deze driehoek wordt gebruikt om het aantal wegen tussen 2 punten A en B te tellen.

b Door gebruik te maken van de volgende regels

1De productregel (vermenigvuldigingsregel)

Hetexperimentbestaatuithandeling1ENhandeling2EN...ENhandeling k #(A1 × A2 × × Ak ) = #A1 ·

2De somregel (inclusie-exclusieprincipe)

Hetexperimentbestaatuithandeling1OFhandeling2.

A ∩ B = ∅ :#(A ∪ B) = #A + #B #(A ∩ B)

A ∩ B = ∅ (AenBzijndisjunct):#(A ∪ B) = #A + #B

3De complementregel (ontkenning)

9 1 Telproblemen
*** * * ** * *** * A A B C D BCD
SDK DSK KDS SKD DKS KSD
A B C
1 1 1 1 1 1 2 3 4 1 3 6 1 41
· · #Ak = n 1 · n 2 · · n k
#A2
Wegaanoverophetcomplement AvanA: #A
#(A ∪ A
#U wantA ∩ A = ∅ enA ∪ A = U
+ #A =
) =

2De somregel (inclusie-exclusieprincipe) Hetexperimentbestaatuithandeling1OFhandeling2.

A ∩ B = ∅ :#(A ∪ B) = #A + #B #(A ∩ B)

A ∩ B = ∅ (AenBzijndisjunct):#(A ∪ B) = #A + #B

3De complementregel (ontkenning)

Wegaanoverophetcomplement AvanA:

#A + #A = #(A ∪ A) = #U wantA ∩ A = ∅ enA ∪ A = U dus:#A = #U #A met#U = totaalaantalmogelijkheden

#A = mogelijkhedendienietinaanmerkingkomen

4 Duivenhokprincipe

Worden n voorwerpengeplaatstin r doosjes (n > r ),danisereendoosjemetminimaaltweevoorwerpen.

De combinatoriek is een zekere formalisering van die telproblemen. In dit hoofdstuk zullen de zogenaamde formules uit de combinatoriek ons werkinstrument zijn bij het oplossen van telproblemen.

Voorbeeld 1 :

In de posterwinkel hebben ze mooie replica’s van vier schilderijen van Van Gogh. Je kunt kiezen tussen drie soorten lijsten om ze in te kaderen. Hoeveel mogelijke keuzes kan Lise maken als ze een schilderij voor haar oma wil kopen ?

Oplossing :

We maken een boomdiagram met de mogelijke keuzes.

lijst model A

replica 1

replica 2

replica 3

replica 4

Antwoord :

lijst model B

lijst model C

lijst model A

lijst model B

lijst model C

lijst model A

lijst model B

lijst model C

lijst model A

lijst model B

lijst model C

Lise kan in totaal 4 · 3 = 12 keuzes maken bij de aankoop van een ingelijste replica van Van Gogh.

Veronderstel dat er 20 mogelijke replica’s zijn en 12 soorten lijsten in 4 verschillende houtsoorten. Het opstellen van een boomdiagram is dan niet meer het aangewezen middel om alle mogelijke keuzes te bepalen.

We kunnen dit probleem wel nog oplossen met de productregel : #replica’s · #lijsten · #houtsoorten = 20 · 12 · 4 = 960

In dat geval zijn er 960 mogelijke keuzes bij de aankoop van een replica.

Voorbeeld 2 :

Een grootmoeder wil graag twee van haar zes kleinkinderen (Anke, Bert, Carsten, Daisy, Elke en Fanny) meenemen naar een plaatselijke boekenbeurs. Op hoeveel manieren kan ze een keuze maken?

Oplossing :

We zetten alle mogelijkheden op een rijtje :

Anke & Bert

Anke & Carsten

Anke & Daisy

Anke & Elke

Anke & Fanny

Bert & Carsten

Bert & Daisy

Bert & Elke

Bert & Fanny

Carsten & Daisy

Carsten & Elke

Carsten & Fanny

Daisy & Elke

Daisy & Fanny Elke & Fanny

10 #(A1 2 k ) 1 2 k 1 2 k
A A U

Antwoord :

Ze kan op 15 mogelijke manieren twee kleinkinderen meenemen naar de boekenbeurs.

Veronderstel dat je zes getallen moet kiezen uit de getallen 1 tot 45 (zoals bij de Lotto). Heel waarschijnlijk ben je meer dan een dag bezig om alle mogelijkheden op te schrijven. Het opstellen van algemene formules (formalisering) is dus noodzakelijk.

2 n-faculteit

In wat volgt hebben we regelmatig producten nodig van opeenvolgende natuurlijke getallen, zoals :

6 5 4 3 2 1

10 9 8 7 6 5 4 3 2 1

Hiervoor kennen we al de verkorte notatie faculteit.

6

Voorbeelden :

2 ! = 2 5 ! =

3

Merk op dat :

of algemeen :

Faculteit

De notatie n ! en de benaming faculteit werden in 1808 door de Franse wiskundige Christian Kramp (1760 –1826) ingevoerd. Hij studeerde geneeskunde maar had een uiterst breed interesseveld, gaande van de kristallografie tot … de wiskunde.

Toen Keulen in 1794 voor een kleine twintig jaar onder Frans bewind kwam te staan, doceerde hij er verschillende jaren wiskunde, chemie en fysica.

Hij werd professor in zijn geboortestad Straatsburg in 1809 en werkte ook voor de Franse Académie des Sciences.

11 1 Telproblemen
6 5 4 3 2 1
! = 10 9 8 7 6 5 4 3 2 1 n
∀n ∈ N0 \{1} : n ! = n (n 1) (n 2) ... 3 2 1 1! = 1
! =
10
-faculteit
0! = 1
120
720
! = 6 6 ! =
13
227 020 800
4 ! = 24
! = 6
12 11 10 9 8 = 12 · 11 · 10 · 9 · 8 · 7 · 6 · 5 · 4 · 3 · 2 · 1 7 6 5 4 3 2 1 = 12! 7!
n · (n 1) · (n 2) · · (n p + 2) · (n p + 1)= n ! (n p ) !

3 Geordende of ongeordende keuzes, zonder of met herhaling

Voorbeeld 1 :

Een basketbalcoach kreeg twee ballen cadeau van een fabrikant. Op hoeveel manieren kan de coach de ballen verloten onder de zeven spelers die op de training aanwezig zijn (Ahmed, Billy, Cas, Daan, Eva, Florian en Guus)?

SITUATIE 1

De ballen zijn duidelijk verschillend en er wordt afgesproken dat één speler slechts één bal kan winnen.

Oplossing :

Bal A wordt verloot. Er zijn zeven kandidaten, m.a.w. 7 mogelijkheden.

Bal B wordt verloot. Er zijn nog zes kandidaten, m.a.w. 6 mogelijkheden.

De 42 mogelijkheden kun je als volgt opschrijven : CF, BD, EG, FG, … CF = Cas heeft bal A, Florian heeft bal B Merk op : CF ≠ FC ; CC kan niet.

Antwoord :

De coach kan op 42 manieren de 2 verschillende ballen verloten onder 7 spelers als één speler slechts één bal mag winnen.

Type :

Dit is een voorbeeld van een telprobleem waarbij de volgorde van de keuze belangrijk is en herhaling niet mag. Dit is een voorbeeld van een variatie

SITUATIE 2

De ballen zijn nu identiek en er wordt afgesproken dat één speler slechts één bal kan winnen.

Oplossing :

Bal A wordt verloot. Er zijn zeven kandidaten, m.a.w. 7 mogelijkheden.

Bal B wordt verloot. Er zijn nog zes kandidaten, m.a.w. 6 mogelijkheden.

Totaal aantal mogelijkheden bij het verloten van de ballen : 7 6 = 42

Maar omdat hier CF = FC (de ballen zijn immers identiek en voor Cas speelt het geen rol of hij bij de eerste loting of bij de tweede loting prijs heeft) heb je elke oplossing twee keer. We moeten bijgevolg delen door twee.

Totaal aantal mogelijkheden : 42 : 2 = 21

De 21 mogelijkheden kun je als volgt opschrijven :

AB, CF, BG, BE, DF, … CF = Cas en Florian hebben elk een bal Merk op : CF = FC ; CC kan niet.

Antwoord :

De coach kan op 21 manieren twee identieke ballen verloten onder 7 spelers als één speler slechts één bal mag winnen. Dit is een voorbeeld van een combinatie

12

Voorbeeld 2 :

SITUATIE 1

In een mand liggen vijf stukken fruit : een appel, een banaan, een kiwi, een mango en een peer. Angelo, Britt en Rayan mogen elk om de beurt een stuk fruit kiezen. Op hoeveel manieren kunnen ze hun keuze maken ?

Oplossing :

• Angelo kiest eerst, hij heeft keuze uit 5 stukken fruit. Hij neemt bijvoorbeeld de banaan.

• Britt, die na Angelo kiest, heeft nu nog keuze uit vier stukken fruit. Zij gaat voor de mango.

• Rayan, die als laatste kiest, kan nog kiezen uit drie stukken fruit. Hij kiest de appel.

De 5 4 3 = 60 mogelijkheden kunnen we als volgt noteren :

BMA – PKM – AKP – …

BMA = Angelo kiest de banaan, Britt de mango en Rayan de appel

MAB = Angelo kiest de mango, Britt de appel en Rayan de banaan

Merk op dat BMA ≠ MAB en dat een mogelijkheid als BBA niet kan.

Antwoord :

Angelo, Britt en Rayan kunnen op 60 mogelijkheden hun keuze maken uit de vijf stukken fruit.

Omdat de volgorde van de keuze belangrijk is en herhaling niet kan, is hier sprake van een variatie.

SITUATIE 2

In een mand liggen vijf stukken fruit: een appel, een banaan, een kiwi, een mango en een peer.

Noor besluit 3 stukken fruit mee te nemen om in de loop van de dag op te eten. Op hoeveel manieren kan ze haar keuze maken ?

Oplossing :

De mogelijkheden zijn :

• appel, banaan en kiwi

• appel, banaan en mango

• appel, banaan en peer

• appel, kiwi en mango

• appel, kiwi en peer

• appel, mango en peer

• banaan, kiwi en mango

• banaan, kiwi en peer

• banaan, mango en peer

• kiwi, mango en peer

Merk op : ABK = AKB = BAK = BKA = KAB = KBA

Antwoord :

Noor kan op 10 mogelijke manieren 3 stukken fruit kiezen uit de vijf stukken.

Omdat de volgorde van de keuze niet belangrijk is en herhaling niet kan, is hier sprake van een combinatie.

13 1 Telproblemen

4 De productregel

Voorbeeld : hemden en broeken

Matteo heeft 4 verschillende hemden en 2 verschillende broeken.

Op hoeveel verschillende manieren kan hij zich kleden met een hemd en een broek ?

Uit de volgende figuur volgt onmiddellijk dat het antwoord 8 is.

We kunnen ook een boomdiagram gebruiken :

Aantal kledingcombinaties = aantal hemden maal aantal broeken, dus 4 2 = 8.

Stel A = { h 1, h 2, h 3, h 4} ⟹ #A = 4

Stel B = { b 1, b 2} ⟹ #B = 2

Stel C = {( h 1, b 1), ( h 1, b 2), , ( h 4, b 2)} ⟹ #C = 8

C wordt de productverzameling van A en B genoemd.

Notatie : C = A × B met #C = 8 = 4 · 2 = #A · #B Hieruit volgt de productregel :

Productregel : #( A × B) = #A #B

Opmerking :

Die regel geldt ook voor het product van 3 of meer verzamelingen.

14
hemd broek combinatie b1 h1 b1 h1 b2 h1 b2 b1 h2 b1 h
b2 h2 b2 8 b1 h3 b1
b2 h3 b2
b1 h4 b1 b2 h4 b2
2
h3
h4

5 De somregel

In een klas zitten 25 leerlingen. Op de vraag ‘Wie is er lid van een jeugdvereniging ?’ antwoorden volgende leerlingen positief : Ofelia, Isolde, Frauke, Michau, Nigel en Joachim. Op de vraag ‘Wie is er aangesloten bij een sportvereniging ?’ antwoorden Joachim, Rozalie, Isolde en Jarne positief.

Hoeveel leerlingen zijn nu aangesloten bij een jeugdvereniging OF een sportvereniging ?

Oplossing :

We plaatsen de leerlingen in een diagram, waarbij links de leden van de jeugdvereniging (A) en rechts de leden van de sportclub (B) zitten. We merken dat in de doorsnede twee leerlingen zitten. Zowel Isolde als Joachim zit in een sportclub en een jeugdvereniging.

Om het totale aantal leerlingen te hebben, tellen we het aantal leden van de jeugdbeweging op met het aantal van de sportclub.

Maar dan hebben we Isolde en Joachim (de doorsnede) twee keer meegeteld. Vandaar dat we dat aantal één keer zullen aftrekken.

Het juiste aantal leerlingen aangesloten bij een jeugd- of een sportvereniging is dus 6 + 4 – 2 = 8.

Somregel:

Als A ∩ B ≠ ∅, dan is #(A ∪ B) = #A + #B – #(A ∩ B)

Als A ∩ B = ∅, dan is #(A ∪ B) = #A + #B (A en B zijn disjunct)

Andere toepassingen :

Hoeveel getallen kleiner dan 100 zijn een veelvoud van 2 of 3 ?

Hoeveel leerlingen van je klas zijn in januari of februari jarig ?

6 De complementregel

Voorbeeld 1 :

Bij het coderen van een bepaald toestel moeten getallen gevormd worden van vier cijfers, gebruikmakend van de cijfers 9, 8, 7, 6 en 5. Het cijfer 6 moet minstens één keer voorkomen (A). Hoeveel mogelijkheden zijn er?

Oplossing :

Dit probleem kunnen we oplossen door eerst het totale aantal getallen te berekenen van vier cijfers die gemaakt kunnen worden met de cijfers 5, 6, 7, 8 en 9 (U)

Er zijn 5 5 5 5 = 54 = 625 mogelijkheden.

Vervolgens berekenen we het aantal getallen van vier cijfers waar het cijfer 6 NIET in voorkomt (A)

A noemen we het complement van A.

Er zijn 4 4 4 4 = 44 = 256 mogelijkheden.

We berekenen het verschil van beide resultaten : 625 – 256 = 369.

Antwoord : er zijn 369 combinaties van vier cijfers mogelijk met de cijfers 9, 8, 7, 6 en 5 waarbij 6 minstens één keer voorkomt.

Complementregel:

Als A het complement is van A, dan is #A = #U – #A U A A

15 1 Telproblemen
Ofelia Isolde Frauke Michau Nigel Joachim Jarne
A ∩ B A B
Rozalie

Voorbeeld 2 :

Hoeveel woorden van vier verschillende letters (met of zonder betekenis) kunnen we vormen met de letters van het woord ‘wiskunde’ zodat er minstens één klinker in voorkomt ?

Oplossing :

We bepalen het aantal woorden met vier verschillende letters uit ‘wiskunde’ :

8 7 6 5 = 1680

We bepalen het aantal woorden met vier verschillende letters zonder klinker (dus enkel met de medeklinkers W, S, K, N, D).

5 4 3 2 = 120

Door toepassing van de complementregel bekomen we het aantal woorden met vier verschillende letters waar minstens één klinker in staat. Dat zijn 1680 – 120 = 1560 mogelijkheden.

7 Samenvatting

• Je weet wat n ! betekent.

3

2 · 1 0 ! = 1 1 ! = 1

• Je kent het verschil tussen een variatie en een combinatie.

• Je kunt gebruikmaken van de productregel (of vermenigvuldigingsregel).

Het experiment bestaat uit handeling 1 EN handeling 2 EN … EN handeling k

#( A1 × A2 × × Ak ) = #A1 #A2 #Ak = n 1 n 2 … n k

• Je kunt gebruikmaken van de somregel.

Het experiment bestaat uit handeling 1 OF handeling 2.

A ∩ B ≠ ∅ : #( A ∪ B) = #A + #B – #( A ∩ B)

A ∩ B = ∅ ( A en B zijn disjunct): #( A ∪ B) = #A + #B

• Je kunt gebruikmaken van de complementregel.

We gaan over op het complement A van A :

#A + #A = #( A ∪ A) = #U want A ∩ A = ∅ en A ∪ A = U

#A = #U – #A met #U = totaal aantal mogelijkheden

#A = aantal mogelijkheden die niet in aanmerking komen U A A –

16
·
·
∀ n ∈ N0⧵{ 1}: n ! = n
(n – 1) · (n – 2) · …
·

8 Oefeningen

Bereken.

Toon aan dat :

Als je 225 ! op je rekenmachine wil uitrekenen, dan lukt dat niet.

Toch kun je 225! 221! uitrekenen. Hoe ?

Voor welke waarden van n ∈ N geldt : 108 < n ! < 1012 ?

Voor een tafeltennistoernooi zijn 10 leerlingen ingeschreven, die eerst elk precies één keer tegen alle deelnemers spelen. De beste vier spelers spelen (na loting) de halve finales en ten slotte volgt de finale.

a Hoeveel wedstrijden worden er in totaal gespeeld ?

b Hoeveel wedstrijden heeft de kampioen gespeeld ?

Jonas en Kim spelen een tenniswedstrijd tot een van beiden drie sets gewonnen heeft.

a Noteer alle mogelijkheden.

b Op hoeveel manieren kan de partij verlopen ?

Een bowlingclub laat een nieuwe vlag ontwerpen die bestaat uit drie horizontale banen.

Elke baan moet groen, oranje of paars zijn.

Twee naast elkaar gelegen banen mogen niet dezelfde kleur hebben.

Hoeveel mogelijke ontwerpen zijn er ?

In een scholengemeenschap met 8642 leerlingen wordt elke leerling aangegeven met een code bestaande uit de letters r, s, t, u en v. Uit hoeveel letters moet zo’n code minimaal bestaan om elke leerling een code te kunnen geven ?

1 17 Telproblemen
7! c 5! · 3! 8! e (3!) ! b 22! 18! d 6! · 4! 3! 2! f 4! (2!)2
a8!
a (n + 1) n ! =(n + 1) !c (n + 2) ! 2n n ! = 2 n ! + n (n + 1) ! b n ! = n (n 1) !d (n + 1) ! (n 1) ! n ! (n 2) ! = 2n
1 2 3 4 5 6 7 8

Thomas staat op, doet zijn kast open en ziet 3 broeken, 4 sweaters, 6 T-shirts, 8 boxershorts, 4 soorten kousen en 2 paar schoenen liggen. Op hoeveel manieren kan hij zich kleden ?

Een restaurant in het stadscentrum beweert dat klanten bij hen kunnen kiezen uit meer dan 200 menu’s. Op de menukaart staat het volgende: – soep of kaaskroketjes

– falafel, zalm of kip

• met frietjes, stoemp of couscous

• met een fris slaatje, gegrilde groenten of wokgroentjes – desserts

Hoeveel verschillende desserts moeten er minstens op de kaart staan als er inderdaad keuze is uit meer dan 200 menu’s?

Hier keuze uit meer dan 200 menu’s: soep / kaaskroketjes + falafel / zalm / kip ☛ met frietjes, stoemp of couscous

☛ met een fris slaatje, gegrilde groenten of wokgroentjes + desserts

Vier jongens en drie meisjes gaan samen naar de cinema. Ze nemen plaats op zeven zitjes naast elkaar.

Op hoeveel manieren kunnen ze plaatsnemen als er geen twee jongens naast elkaar mogen zitten ?

Aaron, Bert, Cindy, Dries en Elke gaan naar de film. Ze nemen plaats op vijf zitjes naast elkaar. Op hoeveel manieren kunnen ze plaatsnemen als Elke en Cindy allebei naast Dries willen zitten ?

De pincode van een gsm bestaat uit vier cijfers.

a Hoeveel mogelijke pincodes zijn er ?

b Hoeveel pincodes zijn er mogelijk met vier verschillende cijfers ?

c Hoeveel pincodes zijn er mogelijk met vier verschillende oneven cijfers ?

d Hoeveel pincodes zijn er mogelijk die eenmaal het cijfer 3 en tweemaal het cijfer 1 bevatten ?

e Hoeveel pincodes zijn er mogelijk bestaande uit vier verschillende cijfers die de cijfergroep ‘23’ bevatten ?

f Hoeveel pincodes bestaande uit vier verschillende cijfers zijn deelbaar door 5 en bevatten niet de cijfers 0 en 9 ?

18
9 10 11 12 13

Je beschikt over zes verschillende kleuren verf.

Op hoeveel manieren kun je deze figuur kleuren als …

a alle figuren onderling een verschillende kleur moeten hebben die ook verschilt van de achtergrondkleur ?

b elke figuur een kleur moet hebben verschillend van de achtergrondkleur. Onderling kunnen de figuren dezelfde kleur hebben.

Je beschikt over vier verschillende kleuren verf.

Op hoeveel manieren kun je volgende draaischijf kleuren ?

De drie sectoren zijn even groot en hebben een verschillende kleur.

In een mand liggen zes koffiekoeken : drie chocoladekoeken, twee croissants en één boterkoek.

a Op hoeveel manieren kunnen Amin, Britt en Claire elk één koffiekoek nemen uit de mand ?

b Op hoeveel manieren kan Daan drie koffiekoeken nemen uit de mand ?

Op hoeveel manieren kan een kleuterjuf vier dezelfde speelgoedautootjes verloten onder drie kleuters (m.a.w. één kleuter kan de vier autootjes winnen)?

Alle dobbelstenen zien er hetzelfde uit. Leg je de zes onderaan, dan ligt altijd de één bovenaan. Leg je nu de vijf vooraan, dan ligt links van de vijf de drie, rechts van de vijf de vier en tegenover de vijf de twee.

Veronderstel dat je willekeurig de cijfers 1 t.e.m. 6 op een dobbelsteen zou mogen plaatsen. Hoeveel verschillende dobbelstenen kun je dan maken ?

Aan een fruitkraam worden appelen, kiwi’s, bananen, peren en pompelmoezen verkocht. Roos koopt twee stukken fruit. Hoeveel mogelijkheden heeft ze?

1 19 Telproblemen
14 15
16 17 18 19

Dries stelt mengelingen van noten en gedroogd fruit samen. Hij koopt daarvoor voldoende cashewnoten, walnoten en hazelnoten. Hij haalt ook gedroogde frambozen, abrikozen, vijgen en braambessen in huis. Dries maakt alleen mengelingen waar minstens twee soorten noten en minstens drie soorten fruit in zitten, telkens 100 gram per soort. Hoeveel verschillende mengelingen kan hij maken?

(A) 12 (B) 15 (C) 16 (D) 18 (E) 20

VWO 2022 tweede ronde, vraag 6 © Vlaamse Wiskunde Olympiade vzw

We noteren n ! voor het product van de natuurlijke getallen 1 tot en met n . Zo is 3! = 1 2 3 = 6. Wat is het kleinste natuurlijke getal n waarvoor n ! groter is dan 3n ?

(A) 4 (B) 5 (C) 6 (D) 7 (E) 8

VWO 2022 tweede ronde, vraag 8 © Vlaamse Wiskunde Olympiade vzw

Zeven gymnasten maken een menselijke piramide zoals in de figuur. Ze hebben allemaal een verschillend nummer op de voorkant van hun gympak. Ze moeten zich opstellen voor de jury zodanig dat elke gymnast enkel gymnasten met een hoger nummer ondersteunt. Hoeveel verschillende piramides kunnen zij vormen?

(A) 24 (B) 48 (C) 80 (D) 180 (E) 360

VWO 2022 tweede ronde, vraag 25 © Vlaamse Wiskunde Olympiade vzw

We noteren n ! voor het product van de natuurlijke getallen 1 tot en met n . Zo is 4! = 1 2 3 4 = 24. Waaraan is het product 3 · 6 · 9 · … · 999 gelijk ?

(A) 3 333! (B) 3333 333! (C) 999! 333! (D) (333!)3 (E) 999!

VWO 2023 eerste ronde, vraag 20 © Vlaamse Wiskunde Olympiade vzw

20
20
21 22 23

1.2

Telproblemen zonder herhaling

1 Variaties

Voorbeeld 1 : loopwedstrijd

Zes vrienden (Arnoud, Bert, Carsten, Dries, Evert en Faroek) houden een loopwedstrijd.

Op hoeveel manieren kunnen de podiumplaatsen (goud, zilver en brons) worden verdeeld ?

We geven enkele mogelijkheden :

ABC (= Arnoud goud, Bert zilver en Carsten brons)

CAB, BED, FAC, ACF, …

Het is duidelijk dat de volgorde van aankomst belangrijk is. Ook kan elke persoon ten hoogste één podiumplaats bekleden, m.a.w. herhaling is niet toegestaan. Dit is een duidelijk geval van een variatie.

Omdat we voor de ereplaatsen drie personen halen uit een reeks van zes kandidaten, spreken we van een variatie van 3 elementen uit 6.

Hoeveel mogelijkheden zijn er nu ?

Voor de eerste plaats, het goud, zijn er 6 mogelijkheden.

Voor de tweede plaats, het zilver, zijn er nog 5 mogelijkheden, want de persoon die goud haalde doet niet meer mee voor het zilver.

Voor de derde plaats, het brons, zijn er nog 4 mogelijkheden.

In totaal zijn er voor de drie ereplaatsen dus 6 · 5 · 4 = 120 mogelijkheden.

Notatie: V 3 6 = 6 5 4 = 120

Uitbreiding 1 :

In plaats van zes vrienden lopen er nu n personen mee voor de drie ereplaatsen.

Hoeveel mogelijkheden zijn er nu ?

Voor de eerste plaats, het goud, zijn er n mogelijkheden.

Voor de tweede plaats, het zilver, zijn er nog n – 1 mogelijkheden.

Voor de derde plaats, het brons, zijn er nog n – 2 mogelijkheden.

In totaal zijn er voor de drie ereplaatsen dus n ( n – 1) ( n – 2) mogelijkheden.

Notatie: V 3 n = n (n 1) (n 2)

21 1 Telproblemen

Uitbreiding 2:

Veronderstel dat er p ( p ⩽ n ) ereplaatsen zijn voor n lopers. Hoeveel mogelijkheden zijn er dan ?

Voor de eerste plaats zijn er n mogelijkheden.

Voor de tweede plaats zijn er n – 1 mogelijkheden.

Voor de derde plaats zijn er n – 2 mogelijkheden.

Voor de p -de plaats zijn er n – ( p – 1) = n – p + 1 mogelijkheden.

Notatie: V p n = n · (n 1) · (n 2) · · (n p + 1)

Algemeen :

Een variatie van p elementen uit n elementen ( p ⩽ n ) is een geordend p -tal van p verschillende elementen gekozen uit een gegeven verzameling van n elementen.

Notatie: het aantal variaties van p elementen uit n elementen noteren we als

Notatie: ∀n , p ∈ N0 en p ⩽ n : V p n = n (n 1) (n 2) (

p + 1) .

Notatie: ∀n , p ∈ N0 en p ⩽ n : V p n = n · (n 1) · (n 2) · · (n p + 1)

Verder stellen we V 0 n = 1en V 0 0 = 1 .

Het is blijkbaar niet nodig de formule letterlijk uit het hoofd te leren. We schrijven eerst de grootste factor n op en vullen daarna aan met natuurlijke getallen die telkens een eenheid kleiner zijn. We stoppen zodra er p factoren staan.

Andere vorm voor de formule :

V p n = n · (n 1) · (n 2) · · (n p + 1)

= n (n 1) (n 2) ... (n p + 1) (n p ) ! (n p ) !

= n ! (n p ) !

V p n = n ! (n p ) !

Voorbeeld 2 : voetbaltruitjes

Een sportzaak heeft voetbaltruitjes in tien verschillende kleuren beschikbaar. De vier plaatselijke voetbalploegen willen truitjes met een verschillende kleur. Hoeveel mogelijkheden zijn er ? De kleuren : rood, geel, blauw, paars, roze, groen, oranje, grijs, bruin en kaki. De ploegen : A, B, C en D. De mogelijkheden :

rood geel blauw groen rood blauw groen geel oranje paars rood groen paars oranje rood groen

Blijkbaar is de volgorde van de kleuren belangrijk en moeten de kleuren verschillend zijn. Uit 10 verschillende kleuren moeten er dus 4 in een bepaalde volgorde gekozen worden.

Aantalmogelijkheden: V 4 10 = 10! (10 4) ! = 10! 6! = 10 9 8 7 = 5040

22
n
A
B C D

2 Permutaties

Voorbeeld 1:

Op hoeveel verschillende manieren kunnen de zes lopers uit voorbeeld 1 (loopwedstrijd) over de finish lopen ? We geven alvast een mogelijkheid :

We merken op dat de volgorde belangrijk is. Bovendien kan elke loper slechts één keer over de eindstreep lopen.

Dit is een variatie. Het grote verschil ligt in het feit dat elk element ook effectief opgenomen wordt. Wanneer bij een variatie elk beschikbaar element optreedt, spreken we van een permutatie

Bovenstaand voorbeeld is een permutatie van 6 elementen.

Notatie: P6 = V 6 6 = 6! (6 6) ! = 6! 0! = 6! 1 = 6! = 720

Algemeen :

Een permutatie van n elementen is een variatie van n elementen uit n gegeven elementen.

Een permutatie van n elementen is een geordend n -tal van n verschillende elementen.

Notatie:hetaantalpermutatiesvan n elementenstellenwevoorals Pn ∀n ∈ N : Pn = n (n 1) (n 2) ... 1 = n !

In het bijzonder is P1 = 1! = 1en P0 = V 0 0 = 0! = 1

Voorbeeld 2:

Op hoeveel manieren kan een scoutsleider twaalf verschillende zaklampen verdelen onder zijn twaalf welpjes ?

Als elk welpje één zaklamp krijgt, en die zijn allemaal verschillend, is dat een permutatie van 12 elementen :

P 12 = 12 ! = 479 001 600

23 1 Telproblemen

3 Combinaties

Voorbeeld 1 : de zangwedstrijd

Aan de preselectie voor een zangwedstrijd doen zes vriendinnen mee (Anke, Bea, Christel, Daisy, Eva en Fanny).

Uit de zes kandidaten zullen er drie worden gekozen om mee te doen aan de volgende ronde. Hoeveel mogelijkheden zijn er?

We geven enkele mogelijkheden :

ABC = BCA (Anke, Bea en Christel gaan door).

Andere combinaties :

BDE, ACF, ADF, …

We zien duidelijk dat de volgorde waarin de kandidaten gekozen worden niet belangrijk is. Bovendien kan elke persoon ten hoogste eenmaal gekozen worden, m.a.w. herhaling is niet toegestaan. Dit is een duidelijk geval van een combinatie

Omdat we drie personen kiezen uit een reeks van zes kandidaten spreken we van een combinatie van 3 elementen uit 6. Het aantal dergelijke combinaties noteren we als Notatie: C 3 6 .

Hoeveel mogelijkheden zijn er nu ?

Het kiezen van een geordend drietal uit een groep van zes elementen was een variatie Notatie: V 3 6

Die variatie kunnen we ook beschouwen als het kiezen van een niet-geordend drietal uit een groep van zes, een combinatie Notatie: C 3 6 , waarbij nadien de volgorde tussen het gekozen drietal wordt vastgelegd met een permutatie P 3

M.a.w. : V 3 6 = C 3 6 P3 C 3 6 = V 3 6 P3 = 6 5 4 3 2 1 = 20of C 3 6 = 6! (6 3) !3! = 6! 3!3! =

Uitbreiding :

In plaats van zes vriendinnen zijn er nu n vriendinnen waaruit er p kandidaten moeten worden gekozen. Dat is een combinatie van p elementen uit n elementen, notatie C p n

Hoeveel mogelijkheden zijn er nu ?

Het kiezen van een geordend p -tal uit n elementen is een variatie V p n .

Die variatie kan beschouwd worden als het kiezen van een geordend p -tal uit een groep van n elementen, een combinatie C p n , waarbinnen dan achteraf een orde wordt vastgelegd met een permutatie V p n = C p n Pp .

M.a.w. : V p n = C p n Pp

Waaruit volgt : C p n = V p n Pp = n (n 1) (n 2) ... (n p + 1) p · (p 1) · (p 2) · · 2 · 1 of C p n = n ! (n p ) ! · p !

24
20

Algemeen :

Een combinatie van p elementen uit n elementen ( p ⩽ n ) is een deelverzameling van p verschillende elementen gekozen uit een gegeven verzameling van n elementen. De volgorde is niet van belang Het aantal combinaties van p elementen uit n elementen noteren we als C p n = V

∀ n , p ∈ N0 , p ⩽ n : C p n =

Verder stellen we dat C 0 n = 1

Andere notatie :

(n 1) (n 2) (n p + 1) p (p 1) (p 2) 2 1 =

! (n p ) ! p !

Combinaties komen ook nog in andere takken van de wiskunde voor, o.a. in reeksontwikkelingen. Om praktische redenen gebruiken ze daar soms een andere notatie voor een combinatie van p elementen uit n elementen. n p = C p n

Indecombinatoriekmoeten n , p ∈ N0

Indegevallenwaarinditnietechthoeft,gebruikenwesteedsdenotatie n p .

Voorbeeld 2: Harry Potter-poppetjes

Ahmed is een grote fan van de boeken en de films van Harry Potter en mag voor zijn verjaardag drie poppetjes kiezen van zijn peter. Ze gaan samen naar een winkel, waar ze in totaal nog acht verschillende poppetjes van de Harry Potter-films hebben liggen. Nu alleen nog beslissen welke drie het zullen worden …

Het is logisch dat hij drie verschillende poppetjes zal kiezen.

De volgorde is blijkbaar niet belangrijk. Het aantal mogelijkheden is dus:

25 1 Telproblemen
p n Pp = n · (n 1) · (n 2) · · (n p + 1) p (p 1) (p 2) 2 1 of C .
n
n
Zois 1 4 = ( 1) ( 2) ( 3) ( 4) 4 3 2 1 = 1en   1 2 3   = 1 2 1 2 3 2 3 2 1 = 1 16
C 3
8
3
C 3 8 = 8! 3!(8 3) ! = 8! 3!5! = 56 of
8 =
7 6
2 1 = 56

Voorbeeld 3 : de lotto

Op hoeveel manieren kun je zes getallen trekken uit een reeks van 45 getallen ?

Wanneer je met spanning zit te wachten op het resultaat van de lottotrekking heeft de volgorde van de getallen geen belang, zolang je ze maar op je formulier aangekruist hebt. Verder kan eenzelfde getal slechts eenmaal voorkomen. Het aantal mogelijkheden is dus :

C 6 45 = 45 · 44 · 43 · 42 · 41 · 40 6 5 4 3 2 1 = 45! 6!39! = 8145060

eigenschap

∀ n , p ∈ N0 , p ⩽ n : C p n = C n p n

Immers :

Voorbeeld :

4 Samenvatting

• Je kent de betekenis van de volgende keuzes zonder herhaling.

a Variaties

Een variatie van p elementen uit n elementen ( p ⩽ n ) is een geordend p -tal van p verschillende elementen gekozen uit een gegeven verzameling van n elementen.

Het aantal variaties van p elementen uit n elementen noteren we als Notatie: ∀n , p ∈ N0 en p ⩽ n : V p n = n (n 1) (n 2) ... (

b Permutaties

Een permutatie van n elementen is een geordend n -tal van n verschillende elementen.

Notatie:hetaantalpermutatiesvan n elementenstellenwevoorals Pn

∀n ∈ N : Pn = n (n 1) (n 2) ... 1 = n ! ∀ n ∈ N : Pn = V n n = n (n 1) (n 2) 2 1 = n !

c Combinaties

Een combinatie van p elementen uit n elementen (p ⩽ n) is een deelverzameling van p verschillende elementen gekozen uit een gegeven verzameling van n elementen.

De volgorde is niet van belang.

Het aantal combinaties van p elementen uit n elementen noteren we als C p n = V p n Pp =

∀ n , p ∈ N0 , p ⩽ n : C p n = n · (n 1) · (n 2) · · (n p + 1) p (p 1) (p 2) 2 1 = n ! (n p ) ! p !

• Je kent de volgende eigenschap :

∀ n , p ∈ N0 , p ⩽ n : C p n = C n p n

26
C n p n = n ! (n p ) ! (n (n p )) ! = n ! (n p ) ! p ! = C p n
C
37 40 = C 40 37 40 = C 3 40 = 40 39 38 3 · 2 · 1 = 9880
n p + 1
n · (n
)
n , p ∈ N0 , p ⩽ n : V p n =
1) · (n 2) · · (n p + 1)= n ! (n p ) !
· (n 1
(
· (n p
n
) ·
n 2) ·
p (p 1) (p 2) ... 2 1

5 Oefeningen

Opmerking vooraf :

Voor het oplossen van telproblemen (combinatoriek) bestaan er geen algemene absolute regels. De meeste van de volgende opgaven zijn oplosbaar met formules opgesteld in dit hoofdstuk ; toch kun je via een correcte logische redenering dikwijls op een andere manier tot de juiste oplossing komen. Als er slechts een beperkt aantal mogelijkheden zijn, is het soms zelfs eenvoudiger en duidelijker om alle oplossingen effectief uit te schrijven.

c soep ; d snoep ; e polsen ? 1 2 3 4 5 6 7 8

In een kamer staan zes stoelen rond een tafel. Er komen vier personen de kamer binnen.

Elke persoon neemt plaats op een stoel. Op hoeveel manieren kan dat ?

Een frisbeetoernooi wordt gespeeld door zes ploegen :

A, B, C, D, E en F. Elke ploeg moet tegen elke andere een uitwedstrijd en een thuiswedstrijd spelen.

Stel de lijst op van alle te spelen wedstrijden.

Hoeveel zijn er dat ?

Hoeveel verschillende getallen met drie verschillende oneven cijfers kun je vormen?

Een vlag moet bestaan uit drie verticale banen met een verschillende kleur. Je beschikt over zeven kleuren.

Hoeveel vlaggen kun je samenstellen ?

Met de cijfers 0 tot 9 worden getallen bestaande uit vijf verschillende cijfers gevormd.

a Hoeveel van die getallen bestaan er (niet beginnend met het cijfer nul) ?

b Hoeveel van die getallen bevatten het cijfer 6 ?

c Hoeveel van die getallen bevatten de cijfers 0 en 7 ?

d Hoeveel van die getallen zijn deelbaar door 5 en bevatten het cijfer 8 ?

e Hoeveel van die getallen zijn even en bevatten het cijfer 5 ?

f Hoeveel van die getallen zijn even en bevatten het cijfer 4 ?

Vier basketbalploegen spelen een toernooi.

Schrijf alle mogelijke eindrangschikkingen op van het toernooi in de veronderstelling dat twee ploegen nooit op dezelfde plaats kunnen eindigen.

Tien spurters staan klaar voor de 100 m. Hoeveel mogelijke uitslagen kan deze sprint hebben ?

Hoeveel woorden met of zonder betekenis kun je vormen door de herschikking van de letters van :

a op ; b sop ;

1 27 Telproblemen

Een rechthoekig stuk karton wordt verdeeld in vier gelijke rechthoekjes. Je hebt vier verschillende kleuren.

Hoeveel mogelijke composities zijn er als je telkens alle kleuren gebruikt ?

Je hebt vijf verschillende kleuren die je moet aanbrengen op de vijf gelijke sectoren van een verdraaibare schijf. Hoeveel mogelijkheden zijn er ?

Twaalf paarden lopen na elkaar in de piste van een circusarena.

De cirkel is gesloten, er loopt dus geen paard voorop.

a Op hoeveel manieren kan de opstelling van de 12 paarden gebeuren ?

b Op hoeveel manieren kan de opstelling gebeuren als er voldoende ruimte is tussen het eerste en het laatste paard (m.a.w. als er toch een paard als eerste loopt) ?

In een sprookjesverhaal beschikt de moedige ridder over twaalf verschillende sleutels.

Daarvan moet jij er tien verschillende in de juiste volgorde gebruiken om de lieftallige prinses te verlossen.

Op hoeveel manieren kan de ridder de sleutels kiezen?

Aan een paardenkoers nemen acht paarden deel.

Er wordt gevraagd de eerste vier paarden in de juiste volgorde te geven.

Hoeveel dergelijke voorspellingen zijn er mogelijk ?

In een spelprogramma moet een kandidaat zes baasjes (A, B, C, D, E en F) bij hun respectievelijke hond zien te plaatsen.

a Hoeveel mogelijkheden heeft de kandidaat om de zes baasjes bij de zes honden te plaatsen ?

b In hoeveel gevallen heeft hij A correct geplaatst ?

c In hoeveel gevallen heeft hij B, D en F correct geplaatst ?

d In hoeveel gevallen heeft hij juist vijf koppels correct geplaatst ?

Op een gocart zijn zes plaatsen, vier trappers en twee gewone zitplaatsen.

a Op hoeveel manieren kunnen Jonas, Kasper, Lise, Magda, Niels en Olga plaatsnemen ?

b Op hoeveel manieren kunnen ze plaatsnemen als Jonas of Kasper aan het stuur willen zitten ?

c Op hoeveel manieren kunnen ze plaatsnemen als Kasper, Niels en Lise zeker willen trappen ?

d Op hoeveel manieren kunnen ze plaatsnemen als Kasper of Niels wil sturen en Lise niet wil trappen ?

28
9 10 11 12 13 14 15

Waarover gaat het in de volgende situaties : variaties, permutaties of combinaties ?

a Uit een klas worden zes leerlingen gekozen om een basketbalteam te vormen.

b In een tombola zijn er drie prijzen te winnen voor verschillende winnaars : een computer, een fiets en een reis.

c In een klas worden vier vrijkaarten voor Crammerock verloot.

d Op een klasreünie komen zes oud-leerlingen opdagen.

e Vier verschillende computerspelletjes verloten onder je vier neefjes.

Acht vrienden gaan samen badmintonnen.

a Hoeveel verschillende partijen enkelspel kunnen ze spelen ?

b Hoeveel verschillende partijen dubbelspel kunnen ze spelen ?

Je wil een salade maken met drie verschillende ingrediënten en je hebt er zes om uit te kiezen : sla (A), tomaat (B), wortelen (C), komkommer (D), witte kool (E) en radijsjes (F) .

Hoeveel verschillende salades kun je met die ingrediënten samenstellen ?

In een voetbaltoernooi met vijf ploegen (A, B, C, D en E) wordt overeengekomen dat elke ploeg precies één wedstrijd speelt tegen elke andere ploeg (en dat op een neutraal terrein). Stel de lijst op van alle te spelen wedstrijden.

Op hoeveel manieren kun je drie (gelijke) rode balletjes in vijf verschillende bakjes (A, B, C, D en E) plaatsen als er in elk bakje maar plaats is voor ten hoogste één balletje ?

Op hoeveel manieren kun je acht kaarten trekken uit een spel van 52 kaarten als er bij de acht kaarten : a precies drie azen moeten zitten; b minstens drie azen moeten zitten; c ten hoogste drie azen mogen zitten; d precies twee azen en twee heren moeten zitten; e precies twee azen, maar geen dame mag zitten; f hartenaas en vier klaveren moeten zitten; g enkel azen en rode kaarten mogen zitten; h precies drie azen en vier harten moeten zitten; i precies drie azen en vier harten, maar geen dame mag zitten; j precies twee azen, twee heren, twee dames en twee tienen moeten zitten; k precies twee azen, twee heren en vier harten moeten zitten.

In een klas zitten 10 meisjes en 15 jongens.

Op hoeveel manieren kun je een panel voor een klasdebat samenstellen bestaande uit drie jongens en twee meisjes ?

1 29 Telproblemen
16 17 18
20
22
19
21

De plaatselijke supermarkt zoekt twee jobstudenten. Er zijn zeven gegadigden.

Op hoeveel manieren kunnen ze hun keuze bepalen ?

Een winkel heeft twee uitstalramen. Om de nieuwe zomercollectie te promoten, moeten er zes kledingstukken geëtaleerd worden.

a Op hoeveel manieren kun je de kledingstukken verdelen over de twee uitstalramen ?

b Op hoeveel manieren kun je de kledingstukken etaleren over de twee uitstalramen als er in elk uitstalraam precies drie kledingstukken van de zomercollectie moeten hangen ?

c Op hoeveel manieren kun je de kledingstukken etaleren als er in elk uitstalraam ten minste twee kledingstukken van de nieuwe zomercollectie moeten hangen ?

Acht vrienden gaan kamperen. Ze hebben twee tenten.

a Op hoeveel manieren kunnen ze ’s avonds gaan slapen als er in de ene tent vijf slaapplaatsen en in de andere tent drie slaapplaatsen zijn ?

b Op hoeveel manieren kunnen ze gaan slapen als het twee tenten van vier slaapplaatsen zijn ?

Bij het einde van een vergadering geeft elk van de aanwezigen elk van de anderen een handdruk.

Er wordt in totaal 105 maal een handdruk gewisseld. Hoeveel aanwezigen waren er ?

Een examen bestaat uit tien vragen. Elke vraag wordt ofwel als ‘juist’ (= 1 punt), ofwel als ‘foutief’ (= 0 punten) beoordeeld.

a Op hoeveel manieren kun je acht punten halen ?

b Op hoeveel manieren kun je acht punten halen als je weet dat de eerste twee vragen correct werden opgelost ?

c Op hoeveel manieren kun je acht punten halen wanneer je weet dat minstens drie van de eerste vier vragen correct werden beantwoord ?

Juffrouw Laura heeft twaalf vriendinnen.

a Op hoeveel manieren kan ze zes van die vriendinnen uitnodigen op een koffiekransje ?

b Op hoeveel manieren kan ze zes vriendinnen uitnodigen als twee van de twaalf vriendinnen zussen zijn en het onbeleefd is om slechts een van de twee uit te nodigen ?

c Op hoeveel manieren kan ze zes vriendinnen uitnodigen als twee van de twaalf vriendinnen ruzie hebben en elkaar niet willen ontmoeten ?

Kim probeert het paswoord van haar vriendin te kraken. Ze weet dat het een vijfletterwoord is bestaande uit vijf verschillende letters. Hoeveel keer moet Kim proberen vooraleer ze de code kan kraken ?

Een verfdoos bevat 12 kleuren.

Op hoeveel manieren kun jij deze figuur kleuren als elk vakje een andere kleur moet hebben ?

30
23 24 25 26 27 28 29 30

Een leerkracht Frans maakte drie versies van een huistaak op voor een klas met 24 leerlingen.

a Op hoeveel manieren kan hij 8 van de 24 leerlingen kiezen voor huistaak versie 1?

b Op hoeveel manieren kan hij 8 leerlingen kiezen uit de overige 16 leerlingen voor huistaak versie 2?

c Op hoeveel manieren kan hij de drie versies van de huistaken verdelen over de klas als er telkens 8 leerlingen een welbepaalde versie krijgen?

Op het einde van een quizprogramma heeft de winnaar de letters {a, e, o, k, l, p, r, t} verzameld. De winnaar moet nu nog de brandkast kraken waarin de hoofdprijs zit. Hij krijgt te horen dat de code van de brandkast uit drie van de verzamelde letters bestaat : twee klinkers en een medeklinker.

Hoeveel codes (de volgorde is belangrijk) zijn er mogelijk?

In een vrachtwagen staan 25 kisten gestapeld. Een dievenbende heeft in 5 van de 25 kisten smokkelwaar verstopt, maar de vrachtwagen wordt wel door de douanepolitie gecontroleerd.

a De douanepolitie controleert willekeurig vier van de 25 kisten. Op hoeveel manieren kon die keuze gebeuren?

b In hoeveel van die gevallen is er minstens één kist met gesmokkelde goederen bij?

Op de menukaart van een restaurant staan 12 voorgerechten, 15 hoofdgerechten en 8 desserts.

Elke week maakt het restaurant een promotiemenu waarbij de klant kan kiezen uit 2 voorgerechten, 3 hoofdgerechten en 2 desserts, alle afkomstig van de gewone menukaart. Op hoeveel manieren kan de uitbater van het restaurant een promotiemenu samenstellen?

De knapen van de plaatselijke KSA spelen dit weekend een moordspel in het bos. Ze zijn in totaal met 17. De leiding moet twee knapen kiezen die als moordenaar zullen fungeren en drie andere die het slachtoffer spelen. Op hoeveel manieren kan de leiding die keuze maken?

1 31 Telproblemen
31 32 33 34 35

Als je met de cijfers 2, 4, 6 en 8 getallen met verschillende cijfers vormt die je rangschikt van klein naar groot, op welke plaats staat dan het getal 64 ?

Drie koppels willen in de zomer samen op reis naar Costa Rica. Ze spreken af bij een van hen om de reis te plannen en nemen daarvoor plaats aan de grote ronde eettafel.

a Op hoeveel manieren kunnen ze plaatsnemen ?

b Op hoeveel manieren kan dat als de plaats aan de tafel niet primeert, maar wel de positie van wie t.o.v. wie zit ?

c Op hoeveel manieren kunnen ze plaatsnemen als iedereen naast zijn eigen partner zit ?

d Op hoeveel manieren kunnen ze plaatsnemen als er geen twee mannen naast elkaar mogen zitten ?

Een urne bevat 3 groene, 5 blauwe en 7 gele bollen. Koen trekt 4 bollen uit de urne. Hoeveel viertallen zijn er mogelijk met:

a minstens 2 groene bollen erbij ?

b evenveel blauwe als gele bollen ?

Een urne bevat 4 groene, 6 blauwe en 8 gele bollen. Lars trekt 5 bollen uit de urne. Hoeveel vijftallen zijn er mogelijk met:

a geen gele bollen erbij ?

b ten hoogste 2 blauwe bollen erbij ?

c evenveel groene als gele bollen ?

Een pot bevat 7 gele, 8 rode, 8 blauwe en 5 groene bollen.

a Op hoeveel manieren kun je hieruit 2 rode en 3 blauwe bollen trekken ?

b Op hoeveel manieren kun je hieruit 4 bollen van dezelfde kleur trekken ?

c Op hoeveel manieren kun je hieruit 4 bollen van een verschillende kleur trekken ?

d Op hoeveel manieren kun je hieruit 4 bollen trekken ?

e Op hoeveel manieren kun je hieruit 4 bollen trekken waarbij minstens twee bollen van dezelfde kleur ?

Voor het opstellen van een muziekvraag voor een quiz moet Thomas zeven muziekstukjes kiezen : vier tv-tunes en drie filmtunes. Thomas heeft een afspeellijst met 12 tv-tunes en 8 filmtunes.

a Op hoeveel manieren kan Thomas de muziekvraag opstellen als de tv-tunes en filmtunes door elkaar mogen staan ?

b Op hoeveel manieren kan Thomas de muziekvraag opstellen als eerst de vier tv-tunes moeten worden geraden ?

In Westende op de dijk is er een kraampje waar ze heerlijke smoothies maken. Ze hebben acht soorten fruit in voorraad : aardbei, abrikoos, appel, banaan, blauwe bes, kiwi, mango en sinaasappel. Hoeveel soorten smoothies kunnen ze maken met maximaal drie soorten fruit?

32
36 37 38 39 40 41 42

Voor een nieuwe queeste in Midden-Aarde heeft Gandalf zeven ‘personen’ nodig waaronder minstens twee hobbits, twee dwergen en één elf. Bij een rondvraag naar mogelijke kandidaten bieden zich acht hobbits, negen dwergen en vijf elfen aan. Op hoeveel manieren kan Gandalf de deelnemers van de queeste samenstellen ?

Op hoeveel manieren kunnen zes meisjes en drie jongens aan een ronde tafel met negen plaatsen plaatsnemen als elk meisje naast een jongen moet zitten en niet de zitplaats belangrijk is maar wel wie naast wie zit.

Een klas van 16 leerlingen organiseert een fuif. Tijdens de fuif werken ze met twee shifts.

Een shift van 21.00 u. tot 23.00 u. en een shift van 23.00 u. tot 1.00 u. Tijdens elke shift moeten drie leerlingen helpen aan de bar en twee leerlingen aan de kassa.

a Op hoeveel manieren kunnen ze de shifts verdelen als niemand twee shifts doet ?

b Op hoeveel manieren kunnen ze de shifts verdelen als het mogelijk is dat iemand twee shifts doet ?

Op hoeveel manieren kunnen Lolsmurf, Smurfin, Moppersmurf, Knutselsmurf, Smulsmurf en Muzieksmurf op één rij gaan zitten als Moppersmurf niet naast Lolsmurf wil zitten en Smulsmurf sowieso naast Smurfin zit.

Met de cijfers 1, 2, 3, 4, 5, 6 worden getallen van zes verschillende cijfers gevormd.

a Hoeveel dergelijke getallen zijn er ?

b Bereken de som van al die getallen.

Met de cijfers 1, 2, 3, 4, 5, 6 worden getallen van vier verschillende cijfers gevormd, die we daarna rangschikken in stijgende volgorde.

a Welk rangnummer heeft het getal 5461 ?

b Welk getal staat op de tweehonderdste plaats ?

c Bereken de som van alle getallen.

a Hoeveel oneven getallen, gelegen tussen 4000 en 5000, bestaan uit vier verschillende cijfers ?

b Als je die getallen uit a in stijgende volgorde rangschikt, op de hoeveelste plaats staat het getal 4579 ?

Met n ! bedoelen we het product van alle natuurlijke getallen van 1 tot en met n . De volkomen kwadraten 1, 4, 9 en 16 zijn voorbeelden van delers van het getal 10 !.

Hoeveel delers van dat getal zijn een volkomen kwadraat? (A) 8 (B) 14 (C) 30 (D) 64 (E) 100

VWO 2023 tweede ronde, vraag 27 © Vlaamse Wiskunde Olympiade vzw

1 33 Telproblemen
43 44 45 46 47 48 49 50

1.3 De driehoek van Pascal en het binomium van Newton

1 Inleiding

∀ a , b ∈ R :

(a + b )0 = 1

(a + b )1 = a + b

(a + b )2 = a 2 + 2ab + b 2

Weproberenditnuvoorttezetten:

Weberekenennuook

valt op ?

Dit is de zogenaamde driehoek van Pascal

34
a + b
4 =(a + b )3 · (a
b
=(
=(a 3
a 2 b + 3ab 2
b
= a
b
ab
ab
b
= a 4 + a 3 b + 3a 3 b + 3a 2 b 2 + 3a 2 b 2 + 3ab 3 + ab 3 + b 4 = a
a 2 b
ab
= a 4 + 4a 3 b + 6a 2 b 2 + 4ab 3 + b 4
(a + b )3 =(a + b )2 · (a + b )(
)
+
)
a 2 + 2ab + b 2 ) (a + b )
+ 3
+
3 ) (a + b )
3 + a 2 b + 2a 2
+ 2
2 +
2 +
3
3 + 3
+ 3
2 + b 3
(a + b )5 , (a + b )6 en (a + b )7 metICT:
(
(
a + b
1 4 6 4 1 ( a + b )5 1 10 5 1 ( a + b )6 1 6 20 15 6 1 ( a + b )7 1 7 21 35 35 21 7 1
Wat
( a + b )n optredende coëfficiënten ( a + b )0 1
a + b )1 1 ( a + b )2 1 1
a + b )3 1 3 3 1 (
)4
. + 1 || 2 + || 5 + 10 || 15

Het volgende valt op :

De coëfficiënt van de 4e term uit de ontwikkeling van ( a + b )4 is gelijk aan de som van de coëfficiënten van de 3e en de 4e term uit de ontwikkeling van ( a + b )3

We kunnen de driehoek van Pascal ook noteren met binomiaalcoëfficiënten.

Merk eerst op dat

C 2 3 = 3!

2!(3 2)! = 3

C 3 3 = 3!

3!(3 3)! = 1

C 3 4 = 4!

3!(4 3)! = 4

Ergeldtdus: C 3 4 = C 3 3 + C 2 3 ofalgemeen:

van Stifel-Pascal

Bewijs :

Michael Stifel (1486 – 1567)

De Duitser Stifel en de Fransman Pascal hebben elkaar nooit ontmoet, ze leefden zelfs in een andere eeuw, maar beiden hebben wel hun aandeel verdiend in bovenstaande formule. Stifel was trouwens niet enkel wiskundige, maar ook monnik. Ooit waagde hij zich aan een voorspelling van het einde van de wereld (in 1533), maar die is dus nooit uitgekomen. Op de volgende pagina maak je kennis met Blaise Pascal.

35 1 Telproblemen
C 0 0 C 0 1 C 1 1 C 0 2 C 1 2 C 2 2 C 0 3 C 1 3 C 2 3 + C 3 3 C 0 4 C 1 4 C 2 4 C 3 4 C 4 4
∀ n , p ∈ N, p < n : C p n +1 = C p n + C p 1 n
formule
C p n + C p 1 n = C p n +1 n ! p ! (n p ) ! + n ! (p 1) ! (n p + 1) ! = (n + 1) ! p ! (n + 1 p ) ! n ! (n p + 1)+ n !p p ! (n p + 1) ! = (n + 1) ! p ! (n + 1 p ) ! n ! (n p + 1 + p )=(n + 1) ! n ! (n + 1)=(n + 1) ! (n + 1) ! =(n + 1) !

Blaise Pascal (1623 – 1662) en het bord van Galton Pascal, geboren in Clermont-Ferrand, werd al vroeg in de wiskunde onderwezen door zijn vader.

Op zestienjarige leeftijd formuleerde hij al een belangrijke stelling in de projectieve meetkunde, later bekend als de stelling van Pascal. Na zijn studies legde hij zich toe op wetenschappelijk onderzoek m.b.t. fysica en wiskunde. Hij formuleerde o.a. theorieën over de luchtdruk en de luchtledigheid. Natuurkundige ideeën paste hij ook praktisch toe. Zo vond hij in 1642 het eerste mechanische ‘rekentoestel’ uit en stond hij aan de basis van de ontwikkeling van de hydraulische pers en de barometer.

In de wiskunde gaf Pascal zijn naam o.a. aan de slakkenlijn en aan de driehoek van Pascal. De driehoek van Pascal is in 1645 niet door Blaise Pascal uitgevonden, maar werd in China voor het eerst vermeld in het boek ‘Kostbare Spiegel van de vier Elementen’ van Shijie Zhu (gepubliceerd in 1303). De driehoek (de ‘Oude Spiegel’ genoemd) werd rond 1100 door de wiskundige Jia Xian besproken en werd door hem ‘de tabel voor het ontsluiten van binomiale coëfficiënten’ genoemd.

Het bord van Galton (genoemd naar een Britse ontdekkingsreiziger en wetenschapsman, 1822 –1911) is een mooie illustratie van de driehoek van Pascal. Het toestel bestaat uit een hellend vlak waarop zich pinnetjes bevinden zoals door de bolletjes voorgesteld op de figuren hieronder. Het vlak helt, zodat het bovenste deel van de figuren hieronder het hoogst is.

De afstand tussen 2 naburige pinnetjes is net groot genoeg om een knikker door te laten. Laat nu bovenaan een knikker los. De knikker rolt naar links of naar rechts, dan weer naar links of naar rechts enz. Is op een zeker ogenblik de knikker op de plaats waar het getal n staat, dan geeft het getal het aantal mogelijke wegen aan waarlangs de knikker die plaats kon bereiken.

36
172135352171 1615201561 15101051 14641 1331 121 11 1 18285670562881 102345678 x 7 6 5 4 3 2 1 0 bord van Galton
Blaise Pascal

2 Het binomium van Newton

+

Doordat C 0 n = n ! 0!n ! = 1en C n n = n ! n !0! = 1

wordt het te bewijzen : binomium van Newton

(a + b )n = a n + C 1

p ! (n p ) !

Verkorte vorm van de formule :

(a + b )n = n k = 0 C k n a n k b k

of: (a + b )n = n k = 0 n k a n k b k

Opmerkingen :

1 De veelterm in het rechterlid bevat n + 1 termen. De eerste ervan vinden we voor k = 0, de tweede voor k = 1, …

2 De getallen C k n worden binomiale coëfficiënten genoemd. Merk ook nog op dat de binomiale coëfficiënten op gelijke afstand van de uiterste termen in de gerangschikte veelterm aan elkaar gelijk zijn. Er geldt immers : C k n = C n k n

3 De p -de term in de ontwikkeling van ( a + b )n wordt gegeven door :

Tp = C p 1 n a n p +1 b p 1

Inderdaad : (a + b )4 = 4 k = 0 C k 4 a 4 k b k

)

37 1 Telproblemen
∀n ∈ N0 : (a
b )n = C 0 n a n b 0 + C 1 n a n 1 b + + C n 1 n ab n 1 + C n n a 0 b n met C p n = n ! p ! (n p ) !
a
b
C
n ab n 1 + b n met C p n = n
n
n 1
+ +
n 1
!
3 b + C 2 4 a 2 b 2 + C 3 4 ab 3 + b 4
a
a 3 b + 6a 2 b 2 + 4ab 3 + b 4
b 2 = C 2 4 a 2 b 2
↓↓ ↓ T
Tp
= a 4 + C 1 4 a
=
4 + 4
T3 = 6a 2
T4 = 4ab 3 = C 3 4 ab 3 (a + b
n = a n + C 1 n a n 1 b + C 2 n a n 2 b 2 + ... + C p 1 n a n p +1 b p 1 + C p n a n p b p + ... + C n 1 n ab n 1 + b n
3
Tn

3 Grafische interpretatie

We bepalen het aantal verschillende kortste wegen om van O naar A te gaan via de rasterlijnen. b-weg a-weg O

Er zijn dus 6 = C 2 4 verschillende wegen om van O naar A te gaan.

( a + b ) ( a + b ) ( a + b ) ( a + b )

We zoeken eigenlijk de coëfficiënt van a 2b 2 in de ontwikkeling van ( a + b )4

4 De ontwikkeling van (a

– b)n

Om ( a – b )n te ontwikkelen, vervangen we in de ontwikkeling van ( a + b )n overal b door –b . In de ontwikkeling treden nu afwisselend even en oneven machten op van –b . De termen krijgen dus afwisselend een plusteken en een minteken.

(a b )n = n k = 0 C k n a n k ( b )k

Voorbeeld : (a b )

38
A a 2b
a 2b
a
b
2
3
3
4
6 = a 6 + C 1 6 a 5 ( b )+ C 2 6 a 4 ( b )2 + C 3 6 a 3 ( b )3 + C 4 6 a 2 ( b )4 + C 5 6 a ( b )5 + b 6 = a 6 6a 5 b + 15a 4 b 2 20a 3 b 3 + 15a 2 b 4 6ab 5 + b 6

5 Toepassingen

Toepassing 1 :

Bepaaldetermin x 5 indeontwikkelingvan √ x 1 x 8

Oplossing :

√ x 1 x 8 = 8 k = 0 C k 8 √ x 8 k 1 x k = 8 k = 0 C k 8 x 8 k 2 ( 1)k x k = 8 k = 0 C k 8 ( 1)k x 8 k 2 k

De exponent van x in de algemene term van de ontwikkeling is dus 8 k 2 k .

Een term met x –5 krijgen we enkel en alleen als

8 k 2 k = 5

8 k 2k = 10 3k = 18 k = 6

De term in x –5 is dus : C 6 8 ( 1)6 x 8 6 2 6 = C 6 8 x 5 = C 2

Toepassing 2 :

Bepaaldeachtstetermuitdeontwikkelingvan x 8 2 x 10 .

Oplossing :

Volgens opmerking 3 van blz. 37 :

T8 = C 7 10 x 8 3 2 x 7 = 120 · x 3 · 88 · ( 2)7 · x 3 ·  x = 245760 x 6 2 x

Controle met GeoGebra :

39 1 Telproblemen
8 1 x 5 = 28 x 5

6

Samenvatting

• Je kent de driehoek van Pascal.

• Je kent de formule van Stifel-Pascal.

• Je kent het binomium van Newton.

(a + b )n = a n + C 1 n a n 1 b + ... + C n 1 n ab n 1 + b n met C p n = n ! p ! (n p ) !

Verkorte vorm van de formule :

(a + b )n = n k = 0 C k n a n k b k

of:

(a + b )n = n k = 0 n k a n k b k

• Je kunt het binomium van Newton toepassen.

De p -de term in de ontwikkeling van ( a + b )n wordt gegeven door Tp = C p 1 n a n p +1 b p 1

• Je kunt (a b )n = n k = 0 C k n a n k ( b )k noteren als (a b )n = n k = 0 C k n a n k ( b )k

Isaac Newton

Binomium van Newton

Isaac Newton ontdekte een verband tussen de uitkomst van de macht van een tweeterm (bi = twee, nomen = naam) en de getallen die voorkomen in de driehoek van Pascal. Met deze binomiaalformule kun je eenvoudig en snel machten van tweetermen vinden. De ontwikkeling van (x + a)n voor n ∈ N was zeer vroeg bekend in de Chinese en Arabische wiskunde.

In Europa is de ontwikkeling zeker vanaf 1527 bekend. Blaise Pascal was in 1654 de eerste die het verband inzag tussen de coëfficiënten uit de formule en het aantal combinaties van p elementen uit n elementen.

Voor een reële exponent n werd het probleem door Newton behandeld in ‘Analysi’ (1669) waarin hij de methode geeft om algebraïsche functies te benaderen door een reeks (binomiale reeks). In samenhang hiermee ontdekte hij het binomium van Newton.

40

1 2 3 4

7 Oefeningen

Werk uit en controleer met ICT.

a (a b )4 i 3 1 x 6

b (2 x + 1)5 j a √2 + b √3 7

c x 2 y 4 k x 2 + 2 5

d a 2 c 8 l y + 1 y 7

e x 1 2 5 m √5 1 4 f x y 2 6

x 3 y 4

2 x 1 4 y 8 h ( a + 2 b )5

Bereken.

aDe6etermvan 1 1 b 9 cDe5etermvan 1 2 x 2 y 7

bDe21etermvan x 2 a x 24 dDemiddelstetermvan a 2 + 1 2 b 8

Bereken en controleer met ICT.

Bereken de termin de ontwikkeling van a in x 4 ( 2 x 1)8

b in x 8 x + 1 2 12

c in x x x + 4 5

d in x 2 x 2 x 10

e in x x 2 + 1 2 x 9

f in x 2

1 41 Telproblemen
o
n √a + 1 4 g 2
+ a
6 c 2 + 1 5 + 2 1 5 b 
+
4 7 2 3 4 7 d
a
+(a 2
5
a 1 + a 2 + 1 6 1
2 1
2
3 
(
+ 2)5
)
2
x 1 4  x 10
2 4 + 12 x 2 14
x + 2 x 7
g zonder x x
h in x 2

Bepaal de volgende sommen zonder ze voluit te schrijven.

a 20 k = 0 C k 20 (0,3)k (0,7)20 k b 50 k = 0

Een onderzoeksopdracht.

Maak een werkstuk over de driehoek van Pascal waaruit blijkt hoeveel wiskundige rijkdom deze driehoek bevat. Geef de betekenis van de getallen op de n -de rij en van de som van de getallen op de n -de rij van de driehoek.

Onderzoek ook de getallen op een ‘diagonaal’ en zoek uit wat de driehoek bijvoorbeeld te maken heeft met : – de toren van Hanoï – de Fibonaccigetallen – het binomium van Newton – de zeef van Sierpinski – de driehoeksgetallen – de getallen van Catalan – pythagorische drietallen

42
C
C
n d 6 k = 0 6 k ( 4)k e 15 k = 0 C k 15 (0,04)15 k · (0,06)k f n k = 0 n k ( 1)n k 2k
k 50 · 2k c n k = 0
k
5 6 ⑤ ③ ② ① T1 T2 T1 T2 T1 T3

1.4

Kansen berekenen met behulp van combinaties

1 Formule van Laplace

Als de uitkomstenverzameling U n elementen telt en alle uitkomsten even waarschijnlijk zijn, dan is de kans op elke uitkomst ui ( elementaire gebeurtenis) gelijk aan 1 n

P ({ u i }) = P ( u i ) = 1 n =⇒ n i = 1 P ( u i ) = 1

Voor een gebeurtenis A met p elementen is de kans gelijk aan p n .

Formule van Laplace :

P (A) = p n

P ( A) lees je als : de kans van A of de waarschijnlijkheid van A of de probabiliteit van A.

De formule van Laplace wordt vaak anders opgeschreven :

P (A) = p n = aantalvoorAgunstigeuitkomsten aantalmogelijkeuitkomsten = #A #U

Gevolgen : • P( U) = 1 en P( ∅) = 0

• ∀ A ⊂ U : 0 ⩽ P( A) ⩽ 1

Pierre-Simon Laplace (1749 – 1827)

Laplace wordt geboren op 23 maart 1749 in Beaumont-en-Auge (Normandië) als zoon van een landbouwer. Hij gaat naar school tot zijn zestiende. Al vlug is duidelijk dat wiskunde zijn roeping is en in 1769 wordt hij wiskundeleraar aan de militaire school in Parijs. Daar was in 1784 en 1785 een zekere Napoleon Bonaparte een van zijn leerlingen. Laplace hield zich vooral bezig met de waarschijnlijkheidstheorie en de sterrenkunde. In 1794 wordt hij professor in de wiskunde aan de École Polytechnique in Parijs, waar de beste studenten worden opgeleid tot ingenieurs en legerofficieren. Als Napoleon in 1799 aan de macht komt, benoemt hij Laplace tot minister van Binnenlandse Zaken. Als dank draagt Laplace zijn meesterwerk Mécanique Céleste (hemelmechanica) aan Napoleon op. In 1812 publiceert hij zijn Théorie Analytique des probabilités. Dit boek bevat een overzicht van de kansrekening uitgewerkt door zijn voorgangers Fermat, Pascal, Bernoulli, aangevuld met zijn eigen bevindingen. In verband met kansrekening schreef Laplace het volgende : “De waarschijnlijkheidstheorie is in de grond niets anders dan het gezond verstand gereduceerd tot cijfers. Ze stelt ons in staat precies weer te geven van wat grote genieën instinctief voelen zonder dat ze er rekenschap van geven.”

Laplace overlijdt in Parijs op 5 maart 1827, precies 100 jaar na zijn grote voorganger Newton.

43 1 Telproblemen
Laplace

2 Voorbeeld 1

Op het einde van een quizprogramma mag de winnaar drie doosjes kiezen van een tafel waarop 35 doosjes staan uitgestald.

– In 20 van die doosjes zit 100 euro. – In 10 doosjes zit 1000 euro.

– In de overige vijf doosjes zit 10 000 euro.

Bereken de kans dat de winnaar uiteindelijk met 12 000 euro naar huis gaat.

Oplossing :

Via de formule van Laplace weten we dat de kans op de gebeurtenis A ‘de winnaar gaat met 12 000 euro naar huis’ gegeven wordt door de formule :

P (A)= gunstigeuitkomsten mogelijkeuitkomsten

Hoeveel gevallen zijn er mogelijk ?

De kandidaat trekt drie doosjes uit 35 doosjes. De volgorde heeft geen belang en herhaling is niet mogelijk.

Dus:

#mogelijke gevallen = C 3 35 = 35! 3! · 32! = 6545

De gunstige gevallen zijn :

één doosje van de vijf van 10 000 euro + twee doosjes van de 10 van 1000 euro +

geen enkel doosje van 100 euro

Dus :

#gunstige gevallen = C 1 5 C 2 10 C 0 20 = 5 45 1 = 225

Via de formule van Laplace vinden we de gevraagde kans:

P (A)= 225 6545 = 45 1309 ≈ 3,44%

44

3 Voorbeeld 2

Zenna trekt willekeurig zeven kaarten

uit een spel van 52 kaarten. Wat is de kans dat minstens vijf van de zeven kaarten harten zijn ?

Oplossing :

A : minstens vijf van de zeven getrokken kaarten zijn harten

Hoeveel gevallen zijn er mogelijk ? Op hoeveel manieren kan iemand zeven kaarten trekken uit een spel van 52 kaarten ? De volgorde van trekken heeft geen belang en herhaling kan niet, dus hebben we te maken met een combinatie.

#mogelijke gevallen = C 7 52 = 52! 7! · 45! = 133784560

Welke gevallen zijn gunstig ?

Je weet dat 13 kaarten van de 52 harten zijn.

Of : je trekt vijf van de 13 harten en twee andere kaarten

Of : je trekt zes van de 13 harten en één andere kaart

Of : je trekt zeven van de 13 harten

Dus :

#gunstige gevallen = C 5 13 C 2 39 + C 6 13 C 1 39 + C 7 13 C 0 39 = 953667 + 66924 + 1716 = 1022307

Via de formule van Laplace vinden we de gevraagde kans:

P (A)= 1022307

133784560 ≈ 0,76%

4 Samenvatting

• Je kunt kansen berekenen met behulp van combinaties. Hiervoor gebruik je de formule van Laplace.

P ({ u i }) = P ( u i ) = 1 n =⇒ n i = 1 P ( u i ) = 1

Voor een gebeurtenis A met p elementen is de kans gelijk aan p n

Formule van Laplace :

P (A) = p n

P ( A) lees je als : de kans van A of de waarschijnlijkheid van A of de probabiliteit van A. De formule van Laplace wordt vaak anders opgeschreven :

P (A) = p n = aantalvoorAgunstigeuitkomsten aantalmogelijkeuitkomsten = #A #U

45 1 Telproblemen

5 Oefeningen

Een vaas bevat 24 blauwe en 16 groene knikkers. Michiel neemt er willekeurig en na elkaar 3 knikkers uit. Bereken eerst met terugleggen en nadien zonder terugleggen de kans op precies 2 groene knikkers. Gebruik voor beide gevallen een kansboom.

2 3 4 5

In een loterij met 5000 biljetten zijn er 250 prijzen. Wat is de kans :

a dat we met één biljet prijs hebben ?

b dat we met 2 biljetten twee prijzen hebben ?

c dat we met 2 biljetten minstens één prijs hebben ?

We trekken op aselecte wijze twee kaarten uit een spel van 52 kaarten zonder terugleggen. Bereken de kans :

a dat de tweede getrokken kaart een aas is ;

b dat de twee kaarten azen zijn.

Lise trekt willekeurig vier kaarten uit een spel van 52 kaarten. Bereken de kans :

a dat het vier harten zijn ;

b dat het twee heren en twee dames zijn ;

c dat het vier azen zijn ;

d dat het harten of azen zijn ;

e dat er geen aas bij is ;

f dat er minstens één aas bij is ;

g dat er hoogstens één aas bij is.

In een bak zitten tien rode, twaalf blauwe en acht gele knikkers. Op aselecte wijze trekt Robbe tegelijkertijd drie knikkers. Bereken de kans :

a dat het drie gele zijn ;

b dat het drie knikkers van een verschillende kleur zijn ;

c dat het drie knikkers van dezelfde kleur zijn ;

d dat twee knikkers dezelfde kleur hebben en de derde niet ;

e dat minstens twee knikkers een verschillende kleur hebben ;

f dat minstens twee knikkers eenzelfde kleur hebben.

46
1

Op een lottoformulier met 45 nummers moeten 6 nummers aangekruist worden. Naderhand worden op aselecte wijze de zes winnende nummers door loting aangewezen. Bereken de kans :

a op zes juiste cijfers ; b op precies drie juiste cijfers ; c op minstens drie juiste cijfers.

1 Telproblemen
6 8 9

Telproblemen

Ik ken de definitie van faculteit en kan n ! berekenen.

Ik ken het verschil tussen geordende en ongeordende keuzes.

Ik ken de productregel en kan die toepassen.

Ik ken de somregel en kan die toepassen.

Ik ken de complementregel en kan die toepassen.

Ik kan telproblemen bij geordende keuzes zonder herhaling oplossen.

Ik kan telproblemen bij ongeordende keuzes zonder herhaling oplossen.

Ik ken de driehoek van Pascal.

Ik ken het binomium van Newton en kan het toepassen.

Ik kan kansen berekenen met behulp van combinaties.

48 WAT MOET JE KENNEN EN KUNNEN ?
1 pagina
11
12
14
15
15
21
24
34
37
43

2 Kansverdelingen en toevalsveranderlijken

Het woord stochast heeft Griekse roots. Het is afgeleid van het woord stochasis (στoχασις ), wat letterlijk ‘gissing’ betekent. De letter P die je bij kansverdeling gebruikt, is de eerste letter van het Engelse ‘probability ’.

Statistiek wordt aan de lopende band gebruikt in het dagelijkse bedrijfsleven.

Zo zullen de Gentse fabrikanten van cuberdons (neuzen) een standaardafwijking toestaan van 2 gram. Om te achterhalen hoeveel cuberdons in een zakje moeten, zodat de kans meer dan 95% is dat de gemiddelde massa 15 gram is, heb je kansverdelingen nodig.

Kansverdelingen en toevalsveranderlijken

2.1 Toevalsveranderlijken

1 Discrete stochastische veranderlijken  51

2 Continue toevalsveranderlijken  54

3 Verwachtingswaarde van een discrete toevalsveranderlijke  57

4 Variantie en standaardafwijking van een discrete toevalsveranderlijke  58

5 Uniforme verdelingen  60

6 Samenvatting  63

7 Oefeningen  65

2.2 Rekenregels voor toevalsveranderlijken

1 Een toevalsveranderlijke vermeerderen of vermenigvuldigen met een constante 70

2 Som van twee onafhankelijke toevalsveranderlijken  71

3 Product van twee onafhankelijke toevalsveranderlijken  72

4 Toepassingen

5

50
72
De √n -wet  74
Samenvatting  76
Oefeningen  77 Wat moet je kennen en kunnen ? 82 2
6
7

2.1 Toevalsveranderlijken

Bij verschillende experimenten in de kansrekening (of statistiek) zijn we dikwijls niet zozeer geïnteresseerd in de uitkomst van een experiment maar eerder in een numerieke grootheid X die met die uitkomst geassocieerd wordt. Afhankelijk van de elementaire gebeurtenis u ∈ U krijg je een andere waarde X ( u ). Daardoor is X een toevalsveranderlijke of stochastische veranderlijke. De waarde ervan is immers onderhevig aan het toeval.

De term ‘stochast ’ is afgeleid van het Griekse woord voor gissen, raden, mikken. Daarom noemen we stochasten soms ook ‘random’-veranderlijken.

Een toevalsveranderlijke kan discreet of continu zijn.

Een discrete toevalsveranderlijke kan enkel een aantal welbepaalde waarden aannemen of is aftelbaar oneindig. Voorbeelden zijn het aantal meisjes in een gezin van drie kinderen, het aantal keren munt bij het opgooien van twee zuivere muntstukken …

Een continue toevalsveranderlijke kan alle waarden uit een interval aannemen. Voorbeelden van een dergelijke variabele zijn : een lukraak reëel getal tussen 0 en 1, de tijd in dagen tussen twee opeenvolgende pannes van een bepaalde machine in een productieproces …

Hoe aan elke uitkomst van een kansexperiment een getal verbonden kan worden, illustreren we nu met enkele voorbeelden.

1 Discrete stochastische veranderlijken

Voorbeeld 1 :

Wanneer je tweemaal een muntstuk opwerpt, is het aantal keren dat je munt gooit gelijk aan 0, 1 of 2. Wat is nu de kans op 0 keer munt, op 1 keer munt, op 2 keer munt ?

Het ‘tweemaal opgooien van het muntstuk’ noemen we een kansexperiment

Het ‘aantal keren munt’ noemen we de stochast of toevalsveranderlijke of kansvariabele en noteren we met de hoofdletter X .

De stochast ‘aantal keren munt’ kan in ons geval de waarden 0, 1 of 2 aannemen.

Om bij die verschillende waarden de bijbehorende kansen te kunnen berekenen, stellen we dit kansexperiment voor via een kansboom :

51 2 Kansverdelingen en toevalsveranderlijken
#M M M K M K K #K kans 2 0 1 4 1 2 1 2 1 2 1 2 1 2 1 2 1 4 1 4 1 4 1 1 1 1 0 2

Dat levert het volgende resultaat op.

In die tabel staat de verdeling van de verschillende kansen. Daarom noemen we die tabel de kansverdeling of kansfunctie van de toevalsveranderlijke ‘het aantal keren munt’. Merk op dat de som van alle kansen gelijk is aan 1.

Voorbeeld 2 :

Wanneer je twee dobbelstenen gooit, varieert het aantal geworpen ogen van 2 tot 12. Wat is de kans op elk van die mogelijkheden ?

Het ‘gooien van twee dobbelstenen’ is het kansexperiment.

Het ‘aantal geworpen ogen’ is de stochast of de toevalsveranderlijke X

Om de kansen te berekenen, bekijken we eerst het aantal mogelijkheden via een tabel.

De kansverdeling wordt :

Ook hier is de som van alle kansen gelijk aan 1.

Voorbeeld 3 :

In een vaas zitten drie gele, twee rode en één blauwe knikker. Kasper stelt aan Robbe het volgende voor : Robbe mag één knikker trekken. Is het een gele, dan betaalt Kasper aan Robbe 1 euro ; is het een rode, dan betaalt Robbe aan Kasper 2 euro ; is het een blauwe, dan betalen ze elkaar niets. Voor Robbe betekent dit dus dat hij ofwel 1 euro wint ofwel 2 euro verliest ofwel noch wint, noch verliest. Wat is de kans op elk van die mogelijkheden ?

Het ‘trekken van een knikker door Robbe’ is het kansexperiment.

De ‘winst van Robbe’ is de stochast of toevalsveranderlijke X .

52
AANTAL KEREN MUNT NOTATIE KANS 0 P( X = 0) 1 4 1 P( X = 1) 1 2 2 P( X = 2) 1 4
d1 d2 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12
AANTAL GEWORPEN OGEN NOTATIE KANS 2 P( X = 2) 1 36 3 P( X = 3) 2 36 4 P( X = 4) 3 36 5 P( X = 5) 4 36 6 P( X = 6) 5 36 7 P( X = 7) 6 36 8 P( X = 8) 5 36 9 P( X = 9) 4 36 10 P( X = 10) 3 36 11 P( X = 11) 2 36 12 P( X = 12) 1 36

Die situatie kunnen we omzetten in de volgende kansverdeling.

WINST VAN ROBBE

NOTATIE

toevalsveranderlijke / stochast

Een toevalsveranderlijke of stochast is een veranderlijke waarvan de waarde een numerieke uitkomst is van een toevalsverschijnsel of (kans)experiment.

Meestal gebruiken we een hoofdletter (X , Y , Z …) voor de toevalsveranderlijke en een kleine letter (x , y , z …) voor de waarde ervan.

Een toevalsveranderlijke kan discreet of continu zijn.

discrete toevalsveranderlijke

Een discrete toevalsveranderlijke X neemt een eindig aantal waarden x 1, x 2, … , xn aan. De kansverdeling of kansfunctie f voor X wordt gegeven door aan die uitkomsten kansen pi toe te kennen.

X :U → R : u i → X ( u i )= x i

kansfunctie f met voorschrift f ( x ) = P( X = x )

f ( xi ) = P( X = xi ) = pi

Die kansen pi moeten voldoen aan twee voorwaarden :

• 0 ⩽ pi ⩽ 1 voor elke i ∈ { 1, 2, 3, …, n }

• p 1 + p 2 + + pn = 1

In de beschrijvende statistiek wordt niet alleen met enkelvoudige frequenties, maar ook met cumulatieve frequenties gewerkt.

cumulatieve verdelingsfrequentie

Naast de kansfunctie f met f ( x ) = P( X = x ) definiëren we de cumulatieve verdelingsfunctie F met F ( x ) = P( X ⩽ x ).

Hieronder vind je de grafiek van zowel de kansfunctie f als van de cumulatieve verdelingsfunctie F voor voorbeeld 2 (het aantal geworpen ogen bij het gooien van twee dobbelstenen).

53 2
Kansverdelingen en toevalsveranderlijken
KANS –
P( X
–2) 2 6 = 1 3 0 P( X
0) 1 6 1 P( X = 1) 3 6 = 1 2
2
=
=
x y = f ( x ) 1 2 3 4 5 6 7 8 9 10 11 12 0,05 0,1 0,15 0,2 0 0 • • • • • • • • • • • x y = F ( x ) 1 2 3 4 5 6 7 8 9 10 11 12 13 0,2 0,4 0,6 0,8 1 0 0 •• •• •• •• •• •• •• •• •• •• •

2 Continue toevalsveranderlijken

Voorbeeld 1 :

Gegeven : het voorschrift van de normale verdeling met gemiddelde 4 en standaardafwijking 1.

f ( x )= 1 √2π e 1 2 ( x 4)2

P( 2 ⩽ X ⩽ 3,5) = 0,2857

De oppervlakte tussen de x -as en de kromme is 1.

We definiëren nu de kans voor de toevalsveranderlijke X binnen een zeker interval [ a , b ] als de oppervlakte tussen de x -as en de grafiek van de functie f in het interval [ a , b ]. Die kans is steeds positief omdat f ( x ) > 0 voor elke x . De som van alle kansen is gelijk aan 1, omdat de totale oppervlakte onder de grafiek van f gelijk is aan 1.

Omdat een toevalsveranderlijke alle waarden aanneemt in een interval spreken we van een continue toevalsveranderlijke. De functie f noemen we de kansdichtheidsfunctie van X

continue toevalsveranderlijke

Een continue toevalsveranderlijke X kan alle waarden uit een interval aannemen. De kansverdeling voor X wordt bepaald door aan deelintervallen [ a , b ] uit het gegeven interval de kans P( a ⩽ X ⩽ b ) toe te kennen, die gelijk is aan de oppervlakte binnen dit interval tussen de x -as en onder de grafiek van een functie f die voldoet aan :

• f ( x ) ⩾ 0 voor alle x ∈ [ a , b ]

• De totale oppervlakte onder de grafiek van f is gelijk aan 1. Die functie f wordt de kansdichtheidsfunctie van X genoemd.

Bij een continue toevalsveranderlijke is de kans op een enkelvoudige gebeurtenis gelijk aan nul.

M.a.w. : P( X = x ) = 0, zodat ook P( X ⩽ x ) = P( X < x )

Naast de kansdichtheidsfunctie f definiëren we de cumulatieve verdelingsfunctie F als F ( x ) = P( X ⩽ x ).

F ( x ) is de totale oppervlakte tussen de x -as en de grafiek van de kansdichtheidsfunctie f in het interval ] – ∞ , x ]

Voorbeeld 2 :

Gegeven :

Een continue toevalsveranderlijke X heeft als kansdichtheidsfunctie f met

f ( x )= 1 3 x + 2 3 als x ∈ [ 2,0[

f ( x )= 2 3 x + 2 3 als x ∈ [0,1]

Gevraagd :

a Verifieer dat f werkelijk een kansdichtheidsfunctie is.

b Bereken P 1 < X < 1 2

54

Oplossing :

a f is inderdaad een kansdichtheidsfunctie

• want voor alle x ∈ [ –2, 1] is f ( x ) ⩾ 0

• A ∆ABC = 1 2 3 2 3 = 1

bGrafischkunnenweP 1 < X < 1 2 voorstellenalsvolgendeoppervlakte:

De oppervlakte bestaat uit de som van twee trapezia.

Voor het linkertrapezium geldt :

b = f ( 1)= 1 3

B = f (0)= 2 3 h = 1 A 1 = 1 3 + 2 3 · 1 2 = 1 2

Zodat : P 1 < X < 1 2 = 1 2 + 1 4 = 3 4

Voor het rechtertrapezium geldt : b = f 1 2 = 1 3

B = f (0)= 2 3

55 2 Kansverdelingen en toevalsveranderlijken
x y
A B C
2 1 1 1 0
x y 2 1 1 1 0 A B C 0,5 A 1
2
A
2 A 2 = 1 3 + 2 3 1 2 2 = 1 4
h = 1

Voorbeeld 3 :

Gegeven : Een kogel wordt afgevuurd in een lange buis. Na verschillende weerkaatsingen doorboort de kogel een schietschijf met straal 1 die het andere uiteinde afsluit. Neem aan dat alle oppervlakken die even groot zijn, gelijke kansen hebben om getroffen te worden. De afstand van het trefpunt tot het middelpunt van de schijf neem je als toevalsveranderlijke X

Gevraagd : Bestudeer de kansverdeling van X

Oplossing :

X is een continue toevalsveranderlijke omdat alle waarden tussen 0 en 1 kunnen voorkomen. De kans dat het trefpunt tussen de afstanden a en b ( 0 < a < b < 1) valt, is (wegens de regel van Laplace) gelijk aan de oppervlakte van de cirkelring met stralen a en b gedeeld door de totale oppervlakte van de schijf.

56
a 1 b P (a X b ) = π b 2 a 2 π = b 2 a 2 Ookis F ( x ) = P ( X x ) = π x 2 π = x 2

3 Verwachtingswaarde van een discrete toevalsveranderlijke

Voorbeeld 1 :

Op het einde van een spelprogramma moet de winnaar aan een rad draaien dat verdeeld is in 12 sectoren die even groot zijn : 5 maal rood, 4 maal geel, 2 maal blauw en 1 maal groen. Bij rood ontvangt hij 600 euro, bij geel 1200 euro, bij blauw 3000 euro en bij groen 9900 euro. We noemen X het bedrag dat de spelleider moet uitbetalen aan de winnaar.

Stel de kansverdeling van X op en bepaal het bedrag dat gemiddeld moet worden uitbetaald.

Oplossing :

Theoretisch zou het uit te betalen bedrag bij 12 spelletjes het volgende zijn : (

600 5 + 1200 4 + 3000 2 + 9900 1) euro = 23 700 euro

Dat betekent gemiddeld per spel : 23700 12 euro = 1975euro.

Die gemiddelde waarde van 1975 euro is een theoretisch gemiddelde. Heel waarschijnlijk zal het effectief uitbetaalde gemiddelde na 12 spelletjes niet gelijk zijn aan 1975 euro.

De verwachte waarde 1975 euro betekent dat als je dit spelletje zeer veel (‘oneindig’) keer zou spelen, je dan gemiddeld per spelletje 1975 euro zou verdienen.

Dit resultaat vind je ook als volgt :

600 5 12 + 1200 4 12 + 3000 2 12 + 9900 1 12 euro = 1975euro

We zeggen dat het te verwachten bedrag (de ‘expected value ’) gelijk is aan 1975 euro. We noteren : E[ X ] = mX = 1975 euro.

verwachtingswaarde

Als X een discrete toevalsveranderlijke is die de waarden x 1, x 2, … , x n aanneemt met de kansen p 1, p 2, … , p n, dan is de verwachtingswaarde of het gemiddelde van X de som van de producten van die waarden met hun respectievelijke kans.

E [ X ] = µ X = x 1 p1 + x 2 p2 + ... + x n pn = n i = 1 x i pi

Opmerking :

m is in de theorie van de toevalsveranderlijken de tegenhanger van x , het gemiddelde van een steekproef in de beschrijvende statistiek. Om de nadruk op dit onderscheid te leggen, noemen we m het populatiegemiddelde en x het steekproefgemiddelde.

57 2 Kansverdelingen en toevalsveranderlijken
kleur xi pi = P( X = xi) rood 600 euro 5 12 geel 1200 euro 4 12 = 1 3 blauw 3000 euro 2 12 = 1 6 groen 9900 euro 1 12

Voorbeeld 2 :

In een casino wordt een gokspel met een dobbelsteen gespeeld. Is het aantal ogen oneven, dan krijg je 2 euro ; is het aantal ogen twee of vier, dan krijg je 3,5 euro ; is het aantal ogen zes, dan ontvang je 5 euro. De deelname aan het spel kost je 3 euro. Neem als veranderlijke X de winst of verlies die je maakt bij het spel. In een eerlijk spel is de inzet gelijk aan de gemiddelde winst of m = 0. Is dit een eerlijk spel ?

aantal ogen winst

1 ( 2 – 3) euro = – 1 euro

2 ( 3,5 – 3) euro = 0,5 euro

3 ( 2 – 3) euro = – 1 euro

4 ( 3,5 – 3) euro = 0,5 euro

5 ( 2 – 3) euro = – 1 euro

6 ( 5 – 3) euro = 2 euro

Voor de kansfunctie f met f ( x ) = P( X = x ) geldt :

Besluit : dit is een eerlijk spel.

4

Variantie en standaardafwijking van een discrete toevalsveranderlijke

variantie

De variantie van een toevalsveranderlijke is de verwachte gemiddelde kwadratische afwijking van de veranderlijke t.o.v. zijn gemiddelde.

De variantie van een toevalsveranderlijke X bereken je door de kwadraten van de afwijkingen van het gemiddelde te vermenigvuldigen met de bijbehorende kansen en daarna de producten op te tellen.

Notatie :

standaardafwijking

De standaardafwijking sX van X is de wortel uit de variantie.

= √Var ( X )

58
xi f (xi ) = P(X = xi ) –1 1 2 0,5 1 3 2 1 6
µ
1 1 2 + 0,5 1 3 + 2 1 6
0
Verwachtingswaarde :
=
=
Var ( X )
σ 2 X = E X µ X 2 = x 1 µ X 2 p1 + x 2 µ X 2 p2 + + x n µ X 2 pn = n i = 1 x i µ X 2 pi
=
σ
X

Opmerking :

s is in de theorie van de toevalsveranderlijken de tegenhanger van s , de standaardafwijking van een steekproef in de beschrijvende statistiek. Om de nadruk op dit onderscheid te leggen, noemen we s de populatiestandaardafwijking en s de steekproefstandaardafwijking

Voorbeeld :

In een snoepkraam worden zakjes snoep verkocht voor 2 euro, 3 euro, 5 euro en 8 euro. De ervaring leert dat 25% van de klanten een zakje van 2 euro koopt, 40% eentje van 3 euro, 20% eentje van 5 euro en 15% eentje van 8 euro.

Voor welk bedrag koopt een klant gemiddeld ? Bereken ook de standaardafwijking.

= 3,9euroen σ = √3,99euro ≈ 1,997euro

eigenschap

Een meer eenvoudige formule voor de berekening van σ 2 X is :

We illustreren die eigenschap met het voorbeeld van hierboven.

59 2 Kansverdelingen en toevalsveranderlijken
xi pi = P( X = xi ) xi · pi xi – m ( xi – m )2 · pi 2 euro 0,25 0,5 –1,9 0,9025 3 euro 0,40 1,2 –0,9 0,3240 5 euro 0,20 1,0 1,1 0,2420 8 euro 0,15 1,2 4,1 2,5215 m = 3,9 s2 = 3,99 µ
σ 2 X = E X 2 E2 [ X ] = n i = 1 x 2 i pi µ 2 X
xi pi x 2 i · p i 2 0,25 1,0 3 0,40 3,6 5 0,20 5,0 8 0,15 9,6 19,2 n
pi µ 2
2
i = 1 x 2 i
X = 19,2 – m
= 19,2 – 3,92 = 3,99 = s2

5 Uniforme verdelingen

a Uniforme discrete verdelingen

Voorbeeld :

We gooien met een gewone (onvervalste) dobbelsteen en nemen als toevalsveranderlijke X het aantal geworpen ogen.

Bestudeer de kansfunctie van X . Bereken het gemiddelde aantal ogen en de standaardafwijking.

De tabel van de functiewaarden bij ‘het aantal geworpen ogen met één dobbelsteen’ is :

Merk op dat alle x -waarden dezelfde kans hebben. Een dergelijke kansfunctie noemen we uniform.

Grafische voorstelling :

Dobbelstenen

Het woord dobbelsteen werd afgeleid van het Franse ‘doble’ wat dubbel betekent. Het oudste dobbelsteentje wordt toegeschreven aan een bordspel dat 5000 jaar geleden gespeeld werd in een regio die we nu Iran noemen. Het werd gemaakt uit een been van een dier, had de vorm van de huidige dobbelsteen en de ogen werden erin gekerfd.

Tot de eerste dobbelspellen behoorde het Egyptische Senet, waar gespeeld werd met stokjes die twee zijden hadden. Ook hadden ze (zie foto) dobbelstenen met meer dan 6 vlakken.

Bij de Grieken werd gebikkeld met dobbelstenen die vier zijden hadden. De Romeinen vonden dobbelen belangrijker dan wachtlopen.

Bij moeilijke beslissingen lieten ze het lot door de dobbelsteen beslissen. Gokspelen waren er echter verboden.

60
xi pi = P( X = xi ) 1 1 6 2 1 6 3 1 6 4 1 6 5 1 6 6 1 6
1 2 3 4 5 6

Het verwachte aantal ogen is :

De variantie is :

standaardafwijking

uniforme discrete verdeling

Een toevalsveranderlijke heeft een uniforme discrete verdeling als alle xi -waarden ( met i = 1, 2, …, n ) dezelfde kans hebben.

M.a.w. voor elke xi geldt dat Pi = P ( X = x i ) = 1 n

Karakteristieken :

Taak : – Wat is de verwachtingswaarde en variantie bij een viervlaksdobbelsteen? – Wat is de verwachtingswaarde en variantie bij een 8-vlaksdobbelsteen? – Wat is de verwachtingswaarde en variantie bij een 20-vlaksdobbelsteen?

61 2 Kansverdelingen en toevalsveranderlijken
µ
= 1 1 6 + 2 1 6 + 3 1 6 + 4 1 6 + 5 1 6 + 6 1 6 = 1 6 (1 + 2 + 3 + 4 + 5 + 6) = 7 2 = 3,5
σ 2 = E X 2 E2 [ X ] = 1 6 12 + 22 + 32 + 42 + 52 + 62 3,52 = 35 12
σ = 35 12 = √105 6
De
is :
µ = E [ X ] = 1 n · n i = 1 x i σ 2 = E X 2 E2 [ X ] = 1 n · n i = 1 x 2 i µ2

b Uniforme continue verdelingen

Voorbeeld :

Jan wil met de bus naar de sportclub. Hij weet niet wanneer er een bus is, maar hij weet wel dat er om de twintig minuten een bus vertrekt. Hoelang moet Jan gemiddeld wachten op de eerstvolgende bus ? We noemen X de tijd (in minuten) dat Jan moet wachten op de eerstvolgende bus. Bestudeer de kansfunctie van X .

In het meest gunstige geval heeft Jan onmiddellijk een bus, in het slechtste geval is de bus net vertrokken en moet hij 20 minuten wachten. Alle mogelijke tijdstippen in het interval [ 0, 20] zijn even waarschijnlijk.

Omdatdetotaleoppervlakteonderdegrafiekvandedichtheidsfunctie1moetzijn,isdehoogtevan derechthoekgelijkaan 1 20

Hetvoorschriftvandekansdichtheidsfunctie f wordtdus:

f ( x )=

uniforme continue verdeling

Een toevalsveranderlijke heeft een uniforme continue verdeling in het interval [ a , b ] als x slechts waarden kan aannemen in [ a , b ] met een constante kansdichtheid.

Het voorschrift van de kansdichtheidsfunctie f is : f ( x )=

Karakteristieken :

Antwoord :

Jan moet gemiddeld 10 minuten (met een standaardafwijking van 5,77 minuten) wachten op een bus.

62
x y 2 2 4 6 8 10 12 14 16 18 20 22 0,01 0,02 0,03 0,04 0,05 0,06 0 0
           0 ( x < 0) 1 20 (0 x 20) 0 ( x > 20)
           0 ( x < a ) 1 b a (a x b ) 0 ( x > b )
Wekunnenbewijzendat µ X = a + b 2 en σ X = b a √12 = b a 2√3 Inhetvoorbeeldis µ X = 0 + 20 2 = 10en σ X = 20 0 2√3 = 10√3 3 = 5,77.

6

Samenvatting

• Je kent de definitie van een toevalsveranderlijke of stochast.

Een toevalsveranderlijke of stochast is een veranderlijke waarvan de waarde een numerieke uitkomst is van een toevalsverschijnsel of (kans)experiment.

• Je kent de definitie van een discrete en continue toevalsveranderlijke.

Een discrete toevalsveranderlijke X neemt een eindig aantal waarden x 1, x 2, … , xn aan of is aftelbaar oneindig.

De kansverdeling of kansfunctie f voor X wordt gegeven door aan die uitkomsten kansen pi toe te kennen.

kansfunctie f met f ( x ) = P( X = x )

f ( x i ) = P( X = x i ) = p i

Die kansen p i moeten voldoen aan twee voorwaarden :

– 0 ⩽ p i ⩽ 1 voor elke i ∈ { 1, 2, …, n }

– p 1 + p 2 + + pn = 1

Naast de kansfunctie f definiëren we de cumulatieve verdelingsfunctie F met F ( x ) = P( X ⩽ x )

Een continue toevalsveranderlijke X kan alle waarden uit een interval aannemen.

De kansverdeling voor X wordt gegeven door aan deelintervallen [ a , b ] uit het gegeven interval de kans P( a ⩽ X ⩽ b ) toe te kennen, die gelijk is aan de oppervlakte binnen dit interval tussen de x -as en de grafiek van een functie f die voldoet aan :

– f ( x ) ⩾ 0 voor alle x ∈ [ a , b ] – De totale oppervlakte onder de grafiek van f is gelijk aan 1.

Die functie f wordt de kansdichtheidsfunctie van X genoemd.

Naast de kansdichtheidsfunctie f definiëren we de cumulatieve verdelingsfunctie F als F ( x ) = P( X ⩽ x ). Die is niets anders dan de totale oppervlakte tussen de x -as en de grafiek van de kansdichtheidsfunctie f in ] –∞, x ] .

• Je kent de definitie van verwachtingswaarde van een toevalsveranderlijke.

Als X een discrete toevalsveranderlijke is die de waarden x 1, x 2, … , xn aanneemt met de kansen p 1, p 2, … , pn, dan is de verwachtingswaarde of het gemiddelde van X de som van de producten van die waarden met hun respectievelijke kans.

E [ X ]= µX

• Je kent de definitie van variantie van een toevalsveranderlijke en je weet hoe je die variantie berekent. De variantie van een toevalsveranderlijke is de verwachte gemiddelde kwadratische afwijking van de variabele t.o.v. zijn gemiddelde.

Voor een discrete toevalsveranderlijke X geldt :

Var ( X )= σ 2 X = E X µX 2

63 2 Kansverdelingen en toevalsveranderlijken
= x 1 p1 + x 2 p2 + + x n pn = n i = 1 x i pi
= x 1 µX 2 p1 + x 2 µX 2 p2 + + x n µX 2 pn = n i = 1 x i µX 2 pi

• Je kent de definitie van de standaardafwijking van een toevalsveranderlijke. De standaardafwijking sX van X is de wortel uit de variantie.

σX = Var ( X )

Een meer eenvoudige formule voor de berekening van σ 2 X is : σ 2 X = E X 2 E2 [ X ] = n i = 1 x 2 i pi µ2 X

• Je kent de definitie en de karakteristieken van een uniforme discrete verdeling.

Een toevalsveranderlijke heeft een uniforme discrete verdeling als alle xi-waarden (met i = 1, 2, 3, …, n ) dezelfde kans hebben. M.a.w. voor elke xi geldt dat

Pi = P ( X = x i )= 1 n

Karakteristieken : µ = E [ X ]= 1 n n i = 1 x i

2 = E [ X 2 ] E2 [ X ] = 1 n n i = 1 x 2 i µ2

• Je weet wanneer een toevalsveranderlijke een uniforme continue verdeling heeft in een interval [ a, b ]. Een toevalsveranderlijke heeft een uniforme continue verdeling in het interval [ a, b ] als x slechts waarden kan aannemen in [ a , b ] met een constante kansdichtheid.

Het voorschrift van de kansdichtheidsfunctie f is :

f ( x )=

0 ( x < a ) 1 b a (a x b )

0 ( x > b )

Bovendien is : µ = a + b 2

= b a √12 = b a 2√3

64
σ
     
σ

7 Oefeningen

Een doos bevat 10 lampen : 4 werkende en 6 defecte. Iemand neemt één voor één een lamp uit de doos en test die. Hij gaat hiermee door tot hij een goede lamp te pakken heeft. Noem X het aantal te testen lampen om uiteindelijk een goede lamp te vinden.

a Bereken P( X = 1), P( X = 2), P( X = 3), P( X = 4), … , P( X = 7)

b Ga na of die uitkomsten een discrete kansfunctie voor X definiëren.

c Bereken de verwachtingswaarde en de variantie van X

In Vlaanderen zijn er in een periode van 14 dagen gemiddeld 3 dagen zon, 7 dagen bewolkt weer en 4 dagen regen. Een roomijsfirma wint 65 euro per dag bij zonnig weer, 10 euro bij bewolkt weer en verliest 15 euro bij regenweer. Bereken voor die firma de gemiddelde winst per dag.

Een vaas bevat 2 witte en 4 zwarte bollen. Vijf vrienden (A, B, C, D en E) trekken in de genoemde volgorde één bol uit de vaas zonder teruglegging. De eerste die een witte bol trekt, krijgt 200 euro. Bereken voor ieder de waarschijnlijke winst.

Op het einde van een spelprogramma mag de winnaar een lade openen van een kast met 16 laden. In 5 laden zit 1000 euro, in 4 laden 2000 euro, in 3 laden 4000 euro, in 2 laden 8000 euro, in 1 lade 16 000 euro en in de overblijvende lade niets. Stel het voorschrift van de kansfunctie op van het gewonnen bedrag en bepaal het bedrag dat gemiddeld moet worden uitbetaald.

In een theater zijn 1600 zitplaatsen. Voor een zitplaats is het normale tarief voor de voorstelling van vanavond 50 euro. 65-plussers betalen slechts 45 euro en wie onder 16 is 40 euro. Abonnees betalen voor de voorstelling 30 euro en met een culturele pas mag je binnen voor 35 euro.

a Bereken de gemiddelde prijs per effectief zitje als je weet dat 15% van de plaatsen ingenomen is door mensen die de volle 50 euro betalen, 20% door 65-plussers, 15% door min-zestienjarigen, 25% door abonnees en 20% met een culturele pas.

b Bereken de gemiddelde prijs per ingenomen zitje.

c Hoeveel was de totale opbrengst van de avond ?

In een schrijnwerkerij worden houten tafels gemaakt. Die tafels verschillen in kwaliteit, die wordt bepaald op basis van de afwerking en het aantal kwasten in het hout.

In de volgende tabel zie je de kans dat een tafel in een van de drie klassen valt.

klasse A klasse B klasse C

Per week maakt de schrijnwerkerij ongeveer 200 tafels. Hoe groot is de te verwachten omzet ?

2 65 Kansverdelingen en toevalsveranderlijken
65% 15% 20% prijs 1200 euro 850 euro 700 euro
kans
1 2 3
5 6
4

In een vaas zitten 16 knikkers : 10 rode en 6 blauwe. Je neemt willekeurig vier knikkers uit de vaas. Als toevalsveranderlijke X kies je het aantal getrokken blauwe knikkers. Bereken E[ X ] en Var( X )

Bij een correcte roulette hebben de 37 nummers van 0 tot en met 36 dezelfde kans. Een gokker zet 20 euro op nummer 6. Als zijn nummer uitkomt, ontvangt hij 36 maal zijn inzet. In het andere geval is hij zijn inzet kwijt. Welke gemiddelde winst mag hij per spel verwachten ?

Een spel bestaat uit 52 kaarten. We trekken willekeurig vier kaarten tegelijkertijd. De stochastische variabele X = de getalwaarde van het aantal getrokken azen. Bereken E[ X ] en Var( X )

In een bepaalde wijk valt gedurende een maand een aantal straatlantaarns uit. Dit aantal X heeft de volgende kansverdeling:

De hersteldienst gaat per maand op controle in de wijk en vervangt de defecte lampen. De kosten hierbij zijn : 50 euro vaste kost plus 10 euro per vervangen lamp. Stel K gelijk aan het bedrag te betalen aan de hersteldienst. Bereken E[ X ] en E[ K ]

Een bak bevat tien sleutels. Slechts één sleutel past op het slot van een gesloten deur. Stijn trekt lukraak een sleutel en gaat na of hij past. Past hij niet, dan trekt hij opnieuw een sleutel. De stochastische variabele X heeft als getalwaarde het aantal trekkingen vereist om de passende sleutel te vinden. Bereken E[ X ] en Var( X ) voor trekkingen zonder terugleggen.

Een vaas bevat 5 blauwe, 2 rode en 3 gele bollen. Jarne en Laure bedenken volgend spel. Er worden willekeurig drie bollen uit de vaas getrokken. Hebben de drie bollen dezelfde kleur, dan geeft Jarne Laure 5 euro ; hebben de drie bollen alle drie een verschillende kleur, dan geeft Jarne Laure 4 euro ; in alle andere gevallen geeft Laure Jarne 2 euro. Wie maakt op lange termijn winst ?

In een grabbelton zitten 20 doosjes : 8 lege doosjes, 4 doosjes met 5 euro, 3 doosjes met 10 euro, 2 doosjes met 20 euro, 2 doosjes met 50 euro en 1 doosje met 100 euro.

De winnaar van een spelprogramma mag één doosje uit de ton nemen.

Stel het voorschrift van de kansfunctie op van het te winnen bedrag en bepaal de verwachtingswaarde.

In een bak zitten acht enveloppen. In vier enveloppen zit een waardebon van 500 euro, in één enveloppe een waardebon van 1500 euro en in de overige drie enveloppen zit niets.

De winnaar van een spelprogramma mag blindelings drie enveloppen uit de bak trekken.

a Stel de kansverdeling op van het te winnen bedrag.

b Bereken de verwachtingswaarde van het te winnen bedrag.

66
x 0 1 2 3 4 5 P( X = x ) 0,15 0,25 0,30 0,15 0,10 0,05
7 8 9 10 11 12 13 14

Bij een spel wordt met vier munten gegooid. De inzet bedraagt 2 euro. Indien vier keer ‘munt’ verschijnt, win je 10 euro. Indien drie keer ‘munt’ verschijnt, win je x euro. In alle andere gevallen win je niets en ben je je inzet kwijt.

Bepaal de waarde van x zodat dit een eerlijk spel zou zijn.

Werp drie dobbelstenen en tel het totale aantal ogen. Indien dat groter is dan 11, dan krijg je 5 euro. Is dat niet het geval, dan betaal je 3 euro. Is dit een eerlijk spel ?

Levi heeft een spel bedacht. In een bak zitten 9 groene ballen, 3 blauwe ballen en 1 rode bal. Een speler mag geblinddoekt twee ballen nemen. Voor elke getrokken blauwe bal krijgt hij 2 euro en voor een getrokken rode bal 5 euro.

Natuurlijk wil Levi geen verlies maken. Wat is het bedrag (op 10 cent nauwkeurig) dat Levi minstens moet vragen aan zijn deelnemers om winst te maken?

Vijf jagers wachten geduldig aan de rand van een bos naast een pas gemaaid maïsveld op een prooi. Plots verschijnen er vijf fazanten op het maïsveld.

Elke jager kiest lukraak een fazant en schiet slechts één keer, waarbij je er vanuit mag gaan dat elke jager steeds raak schiet.

a Wat is de kans dat alle fazanten worden geschoten ?

b Wat is de kans dat slechts één fazant wordt geschoten ?

c Stel de kansverdeling op van het aantal geschoten fazanten.

d Hoeveel fazanten worden er gemiddeld geschoten ?

Gegeven : de kansdichtheidsfunctie van een continue stochastische variabele X wordt grafisch voorgesteld door :

2 67 Kansverdelingen en toevalsveranderlijken
0 1 2 3 a
: a Bepaal de waarde van de constante a. b Bereken P( 1 < X ⩽ 2) en P( 2 < X ⩽ 4) 15 16 17 18 * 19
Gevraagd

Gegeven : de kansdichtheidsfunctie van een continue stochastische variabele X wordt grafisch voorgesteld door : 0 1 2 3 4 5 6 a

Gevraagd :

a Bepaal de waarde van de constante a. b Bereken P( –2 ⩽ X ⩽ 1) en P( 2 ⩽ X ⩽ 5)

Gegeven : de kansdichtheidsfunctie van een continue stochastische variabele X wordt grafisch voorgesteld door :

Gevraagd :

a Bepaal de waarde van de constante b b Bereken P( –1 < X ⩽ 1)

Gegeven : de kansdichtheidsfunctie van een continue stochastische variabele X wordt grafisch voorgesteld door :

Gevraagd :

a Bepaal de waarde van de constante b .

b Bereken P( 0 ⩽ X ⩽ 1)

68
–2 1 3 b
–1
1 2
b 1 2
20 21 22

Kansverdelingen en toevalsveranderlijken

Gegeven : de kansdichtheidsfunctie van een continue stochastische variabele X wordt grafisch voorgesteld door :

Gevraagd :

a Bepaal de waarde van de constante c

b Bereken P( 1 ⩽ X ⩽ 5)

De kansdichtheidsfunctie van een continue stochastische variabele X wordt grafisch voorgesteld door de tekening rechts.

Gevraagd :

a Bepaal de waarde van de constante a

b Bereken P( 3 ⩽ X ⩽ 6)

Een continue toevalsveranderlijke X heeft als kansdichtheidsfunctie f met :

f ( x )= 1 9 als x ∈ [0,2[

f ( x )= 1 18 x als x ∈ [2,4[

f ( x )= 2 9 als x ∈ [4,6]

Gevraagd :

a Verifieer dat f werkelijk een kansdichtheidsfunctie is.

b Bereken P( 1 < X < 3)

c Bereken P( 3 ⩽ X ⩽ 5).

d Bereken P( 5 ⩽ X < 7)

2 69
3c 2c c –1 0123 45 6
1 2 3 4 5 6 7 8 9 a 3a 6a 0 0 • • • • x y • • • • • • • •
23
24 25

2.2 Rekenregels voor toevalsveranderlijken

1 Een toevalsveranderlijke vermeerderen of vermenigvuldigen met een constante

Rekenregel 1 :

Als X een toevalsveranderlijke is en a een constante, dan geldt voor de toevalsveranderlijke Y = X + a :

E[ Y ] = E[ X + a ] = E [ X ] + a mY = mX + a

Var( Y ) = Var( X + a ) = Var( X ) waaruit sY = sX

Voorbeeld :

Het klasgemiddelde van de laatste onlinetoets van aardrijkskunde was 8 op 20.

Door een fout bij de vraagstelling kon vraag 4 niet correct beantwoord worden. Daardoor krijgt iedereen 5 punten meer. Het klasgemiddelde zal dus met 5 punten stijgen, de spreiding σ blijft dezelfde.

Rekenregel 2 :

Als X een toevalsveranderlijke is en a een constante, dan geldt voor de toevalsveranderlijke Y = aX :

E[ Y ] = E[ aX ] = a E [ X ] mY = a mX

Var( Y ) = Var( aX ) = a 2Var( X ) waaruit sY = | a | sX

Voorbeeld :

Het gewicht van een snoepzakje is gemiddeld 150 gram met een standaardafwijking van 5 gram. Als we de eenheden omzetten naar milligram, dan zullen alle getallen met duizend vermenigvuldigd worden, ook het gemiddelde en de spreidingsmaten (waaronder σ).

70

2 Som van twee onafhankelijke toevalsveranderlijken

Rekenregel 3 :

Als X en Y twee onafhankelijke toevalsveranderlijken zijn, dan geldt voor de toevalsveranderlijke

Voorbeeld :

Bereken het gemiddelde aantal ogen en de standaardafwijking wanneer je met twee dobbelstenen gooit.

Oplossing 1 : rechtstreeks

De kansverdeling van het aantal geworpen ogen met twee dobbelstenen wordt gegeven door (zie blz. 52) :

Oplossing 2 : som van twee onafhankelijke toevalsveranderlijken

Het gooien met twee dobbelstenen kunnen we beschouwen als het gooien van een eerste dobbelsteen en het gooien van een tweede dobbelsteen onafhankelijk van de eerste.

Het gooien van één dobbelsteen heeft als karakteristieken (zie blz. 60) :

Het gooien van twee dobbelstenen onafhankelijk van elkaar heeft volgens rekenregel 3 als karakteristieken

71 2 Kansverdelingen en toevalsveranderlijken
Z = X
Y : E[ Z ] = E[ X + Y ] = E[ X ] + E[ Y ] mZ = mX + mY Var( Z ) = Var( X + Y ) = Var( X ) + Var( Y )
σZ = σ 2 X + σ 2 Y
+
waaruit
µX = 12 i = 2 x i pi = 2 1 36 + 3 2 36 + 4 3 36 + ... + 12 1 36 = 7 σ 2 X = 12 i = 2 x 2 i pi 72 = 4 · 1 36 + 9 · 2 36 + 6 · 3 36 + + 144 · 1 36 49 = 35 6 =⇒ σX = 35 6 = √210 6
µ
σ = √105 6
= 3,5
: µ = µ1 + µ2 = 3,5 + 3,5 = 7 σ = σ 2 1 + σ 2 2 = 105 36 + 105 36 = √210 6 aantal geworpen ogen notatie p i 2 P( X = 2) 1 36 3 P( X = 3) 2 36 4 P( X = 4) 3 36 5 P( X = 5) 4 36 6 P( X = 6) 5 36 7 P( X = 7) 6 36 8 P( X = 8) 5 36 9 P( X = 9) 4 36 10 P( X = 10) 3 36 11 P( X = 11)
36 12 P( X = 12)
36
2
1

Som van onafhankelijke toevalsveranderlijken :

Als X en Y twee onafhankelijke toevalsveranderlijken zijn met respectievelijk gemiddelde mX en mY en standaardafwijking sX en sY , dan geldt voor de toevalsveranderlijke T = aX + bY : µT = a µX + b µY

T = a 2 σ 2 X + b 2 σ 2 Y

3

Product van twee onafhankelijke toevalsveranderlijken

Als X en Y twee onafhankelijke toevalsveranderlijken zijn, dan geldt voor de toevalsveranderlijke Z = X Y : E[ Z ] = E[ X Y ] = E[ X ] E[ Y ] waaruit mZ = mX mY

We nemen de rekenregel aan zonder bewijs.

4 Toepassingen

Toepassing 1 : cilindervormige dozen

Een fabrikant maakt cilindervormige dozen bestaande uit de eigenlijke doos en een deksel dat eroverheen schuift. De diameter van de doos is normaal verdeeld met een gemiddelde van 9,8 cm en een standaardafwijking van 2 mm. Het deksel is eveneens normaal verdeeld met een gemiddelde diameter van 10,1 cm en een standaardafwijking van 1 mm. Hoe groot is de kans dat het deksel niet over de doos schuift?

Oplossing :

We nemen de diameter van de doos als toevalsveranderlijke X

Nu is X N( m = 98 mm, s = 2 mm)

Als toevalsveranderlijke Y nemen we de diameter van het deksel.

Dan is Y N( m = 101 mm, s = 1 mm)

Het deksel schuift niet over de doos als Y < X , m.a.w. als Y – X < 0.

We definiëren de toevalsveranderlijke T als T = Y – X T is ook normaal verdeeld met:

µT = µ Y µ X =(101 98) mm = 3mm

σT = σ 2 Y + σ 2 X = √1 + 4mm = √5mm

Het gevraagde wordt :

P ( Y < X )= P ( Y X < 0)

= P (T < 0)

= P Z < 0 3 √5

= P (Z < 1,34)

= 9,01%

Antwoord: de kans dat het deksel niet over de doos schuift, is 9%.

72
σ

Kansverdelingen en toevalsveranderlijken

Toepassing 2: zwemwedstrijd

Ella, Mirthe en Juna houden een zwemwedstrijd over een bepaalde afstand. Juna behaalt een zwemtijd van 1 min 54 s. Uit ervaring is geweten dat de tijd van Ella normaal verdeeld is met m = 2 min en s = 12 s. De zwemtijd van Mirthe is ook normaal verdeeld met m = 1 min 48 s en s = 6 s. Ella en Mirthe moeten nog zwemmen.

– Hoe groot is de kans dat Juna winnaar wordt ?

– Hoe groot is de kans dat Juna tweede wordt ?

– Hoe groot is de kans dat Mirthe voor Ella eindigt ?

Oplossing :

We nemen als toevalsveranderlijke X de zwemtijd van Ella.

Dan is X ~ N( m = 120 s, s = 12 s).

Als toevalsveranderlijke Y nemen we de zwemtijd van Mirthe.

Dan is Y ~ N( m = 108 s, s = 6 s).

Hoe groot is de kans dat Juna winnaar wordt ?

Juna is winnaar als haar tijd beter is dan die van Ella en als haar tijd beter is dan die van Mirthe.

P(Junawint) = P ( X > 114en Y > 114)

= P ( X > 114) · P ( Y > 114)

= P Z > 114 120 12 · P Z > 114 108 6

= P (Z > 0,5) · P (Z > 1)

= 0,6915 · 0,1587

= 0,1097 = 10,97%

Antwoord : de kans dat Juna wint is ongeveer 11%.

– Hoe groot is de kans dat Juna tweede wordt ?

Juna wordt tweede als zij beter is dan Ella maar minder goed dan Mirthe of als zij beter is dan Mirthe maar minder goed dan Ella.

P(Junaistweede)

= P ( X > 114en Y < 114) ofP ( X < 114en Y > 114)

= P ( X > 114en Y < 114)+ P ( X < 114en Y > 114)

= P ( X > 114) P ( Y < 114)+ P ( X < 114) P ( Y > 114)

= 0,6915 0,8413 + 0,3085 0,1587

= 0,6307 = 63,07%

Antwoord : de kans dat Juna tweede wordt, is ongeveer 63%.

Hoe groot is de kans dat Mirthe voor Ella eindigt ? Mirthe eindigt voor Ella als Y < X , m.a.w. als Y – X < 0.

We definiëren de toevalsveranderlijke T als T = Y – X.

T is normaal verdeeld met :

µT = µ Y µ X =(108 120) s = 12s

σT = σ 2 Y + σ 2 X = 62 + 122 s = √180s = 6√5s

Het gevraagde wordt nu : P ( Y < X )= P ( Y X < 0)

= P (T < 0)

= P Z < 0 + 12 6√5s

= P (Z < 0,89)

= 81,33%

Antwoord : de kans dat Mirthe voor Ella eindigt, is ongeveer 81%.

73 2

5

De √n -wet

X 1, X 2, … , X n zijn n onafhankelijke toevalsveranderlijken, elk met dezelfde kansverdeling met gemiddelde m en standaardafwijking s

Volgens de rekenregels uit 2.1 geldt nu : voor de som S van de uitkomsten :

S = X 1 + X 2 + + X n

µS = E [S ]= n E [ X i ]= n µ

σ 2 S = n σ 2 =⇒ σS = √n σ

voor het gemiddelde X van de uitkomsten :

X = 1 n S = 1 n ( X 1 + X 2 + ... + X n )

µ X = 1 n n µ = µ

σ 2 X = 1 n 2 n σ 2 = 1 n σ 2 =⇒ σ X = σ √n

Voorbeeld 1 :

Gegeven :

Een zak nootjes weegt gemiddeld 300 gram en heeft een standaardafwijking van 10 gram.

De zakken nootjes worden per 25 in een kartonnen doos verpakt.

Gevraagd :

a Bereken de gemiddelde massa en de standaardafwijking van de totale massa van die 25 zakken nootjes.

b Berekendeverwachtingswaarde µ X endestandaardafwijking σ X vandegemiddeldemassa X vandie 25zakkennootjes.

Oplossing :

a Noem de gezamenlijke massa van 25 zakken nootjes S .

Danis: µS = 25µ = 25 300 = 7500 en σS = √25 · σ = 5 · 10 = 50

Antwoord: µS = 7,5kgen σS = 50g

b Voor de gemiddelde massa van de 25 zakken nootjes geldt :

µ X = µ = 300 en σ X = σ √25 = 10 5 = 2

Antwoord: µ X = 300gen σ X = 2g

74

Voorbeeld 2 : spaghetti

Gegeven :

Een vulmachine die pakken spaghetti vult, staat ingesteld op een gemiddelde van 255 gram per pak. De inhoud van een willekeurig pak spaghetti mag worden beschouwd als een trekking uit een normale verdeling met verwachtingswaarde 255 en onbekende standaarddeviatie.

Bij nauwkeurig nawegen van een groot aantal pakken blijkt dat 15% van de pakken minder dan 250 gram bevat.

Gevraagd :

a Bereken de standaarddeviatie van het vulgewicht.

b Bereken de kans dat 25 pakken spaghetti gemiddeld minder dan 250 gram bevatten.

Oplossing :

We nemen als toevalsveranderlijke X de massa van een pak spaghetti. Dan is X ∼ N( m = 255 g, s = ? g).

a Blijkbaar geldt P( X < 250) = 15%, zodat :

P Z < 250 255 σ = 0,15 P Z < 5 σ = 0,15 5 σ = 1,036 σ = 5 1,036 = 4,8

Antwoord : s = 4,8 gram

b Het gemiddelde X van 25 pakken spaghetti is normaal verdeeld met :

µ X = µ X = 25

σ X = σ X √25 = 4,8 5 = 0,96

Hieruit volgt : P ( X < 250) = P Z < 250 255 0,96 = P (Z < 5,2) = 10 9 ≈ 0

Antwoord : de kans dat 25 pakken spaghetti gemiddeld minder dan 250 gram bevatten, is verwaarloosbaar klein.

75 2 Kansverdelingen
en toevalsveranderlijken

6

Samenvatting

• Je kent de rekenregel voor de som van twee onafhankelijke toevalsveranderlijken.

Als X en Y twee onafhankelijke toevalsveranderlijken zijn met respectievelijk gemiddelde mX en mY en standaardafwijking sX en sY, dan geldt voor de toevalsveranderlijke T = aX + bY :

µT = a µ X + b µ Y

σT = a 2 σ 2 X + b 2 σ 2 Y

• Je kent de rekenregels voor toevalsveranderlijken.

Als X een toevalsveranderlijke is en a een constante, dan geldt voor de toevalsveranderlijke Y = X + a :

E[ Y ] = E[ X + a ] = E[ X ] + a

mY = mX + a

Var( Y ) = Var( X + a ) = Var( X ) waaruit sY = sX

Dan geldt voor de toevalsveranderlijke Y = aX :

E[ Y ] = E[ aX ] = a E[ X ] mY = a mX

Var( Y ) = Var( aX ) = a 2Var( X ) waaruit sY = | a | sX

Als X en Y twee onafhankelijke toevalsveranderlijken zijn, dan geldt voor de toevalsveranderlijke

Z = X + Y :

E[ Z ] = E[ X + Y ] = E[ X ] + E[ Y ] mZ = mX + mY

Var( Z ) = Var( X + Y ) = Var( X ) + Var( Y ) waaruit σZ = σ 2 X + σ 2 Y

• Je kent de √n -wet.

Voor de som S van de uitkomsten :

S = X 1 + X 2 + + X n

µS = E [S ]= n E [ X i ]= n µ

σ 2 S = n σ 2 =⇒ σS = √n σ

Voor het gemiddelde X van de uitkomsten :

X = 1 n S = 1 n ( X 1 + X 2 + ... + X n )

µX = 1 n n µ = µ

σ 2 X = 1 n 2 n σ 2 = 1 n σ 2 =⇒ σX = σ √n

76

3 4 5 6

7 Oefeningen

P , Q en R zijn drie onafhankelijke stochasten verdeeld volgens N( m, s)

Geef de verdeling van volgende stochasten :

a P + Q c Q – R e P + 5 g R

b 2R d 3P + 4R f Q – m

Gegeven : X ∼ N( m = 9, s = 4)

Y ∼ N( m = 11, s = 3)

Z ∼ N( m = 14, s = 6)

Gevraagd :

a Bereken P( X + 2Y – Z > 20)

b Bepaal a zodat P( Z – 2X ⩾ Y + a ) = 26%

Gegeven : X ∼ N( m = 23, s = 6)

Y ∼ N( m = 38, s = 5)

Z ∼ N( m = 51, s = 8)

Gevraagd :

a Bereken P( 2X + 3Y – Z > 100)

b Bepaal a zodat P( 2X + 3Y < a + Z ) = 85%

Werp twee dobbelstenen : een rode en een blauwe. Het aantal ogen op de rode dobbelsteen noemen we X , het aantal ogen op de blauwe Y

a Stel M = max( X , Y ) en P = X · Y .

b Bepaal de kansverdeling van M en P en hun gemiddelde.

Een peer weegt gemiddeld 210 gram met een standaardafwijking van 16 gram.

De peren worden per zes verpakt. Wat is de gemiddelde massa en de standaardafwijking van een dergelijk pak (massa van de verpakking niet meegerekend) ?

Het alcoholpercentage van een fles wijn van een bepaalde wijnsoort is normaal verdeeld met m = 12,5% en s = 0,6%.

De flessen worden per 12 in een kartonnen doos verpakt.

a Bereken het gemiddelde alcoholpercentage en de standaardafwijking van één doos (= 12 flessen wijn).

b Bereken de verwachtingswaarde en de standaardafwijking van het gemiddelde alcoholpercentage van 24 flessen wijn.

2 77 Kansverdelingen en toevalsveranderlijken
σ
σ
h P µ
1 2

Bakker Bol verkoopt broden van 500 gram. De massa van die broden is normaal verdeeld met m = 510 gram en s = 15 gram.

a Wat is de kans dat je een brood van minder dan 500 gram koopt ?

b Wat is de kans dat de gemiddelde massa van 20 broden minder dan 500 gram is ?

De remafstanden X en Y van twee auto’s zijn normaal verdeeld en onafhankelijk van elkaar. Bij 60 km/h zijn de parameters respectievelijk :

X ∼ N( m = 22 m, s = 5 m) en Y ∼ N( m = 30 m, s = 8 m)

Twee automobilisten rijden met die wagens aan 60 km/h naar elkaar toe op een baan met één enkel rijvak.

Ze zien elkaar op slechts 60 m afstand. Bereken de kans dat ze niet botsen.

De resultaten (uitgedrukt in punten) van een toets biologie zijn normaal verdeeld met een gemiddelde van 25,5 op 40 en een standaardafwijking van 4,1 punten.

a Welk percentage van de leerlingen behaalde minder dan de helft ?

b Welk percentage van de leerlingen behaalde meer dan 80% ?

c Op Oscars rapport staat een score van 15,6 op 20. Behoort hij hiermee tot de 10% beste leerlingen voor biologie ?

Een practicumexamen chemie bestaat uit twee delen. Op het eerste deel bedroeg de gemiddelde score 18,2 op 30 met een standaardafwijking van 3,6 punten. Op het tweede deel bedroeg de gemiddelde score 17,7 op 30 met een standaardafwijking van 3,9 punten.

Beide delen mogen beschouwd worden als onafhankelijk van elkaar.

De punten worden herrekend naar 90 waarbij het tweede deel dubbel telt.

a Wat is het gemiddelde en wat is de standaardafwijking van de punten op 90?

b Wat is de kans dat iemand meer dan 60 op 90 behaalde?

Faruk en Jacob gaan naar dezelfde school. De lessen beginnen om 8.30 u.

Faruk neemt ’s morgens de bus van 8.10 u. die voor de schoolpoort stopt om 8.27 u. Die bus vertrekt steeds op tijd maar is gemiddeld 2 minuten te laat aan de schoolpoort met een standaardafwijking van 1 minuut.

Jacob komt met de wagen. Hij vertrekt steeds om 8.15 u. Zijn gemiddelde reistijd is 14 minuten met een standaardafwijking van 2 minuten.

In de veronderstelling dat beide variabelen normaal verdeeld zijn, bereken :

a de kans dat Faruk te laat is ;

b de kans dat Jacob te laat is ;

c de kans dat beiden te laat zijn ;

d de kans dat Jacob voor Faruk aankomt.

78
7 8 9 10 11

Laura volgt elke zaterdag acteerles in Antwerpen. Daarvoor neemt ze de trein om 9.25 u. die om 9.40 u. aankomt in Antwerpen. Daarna neemt ze de bus die om 9.45 u. vertrekt en om 9.56 u. stopt voor de toneelschool. De trein komt gemiddeld 1 minuut te laat aan in Antwerpen met een standaardafwijking van 3 minuten. Bereken, in de veronderstelling dat beide variabelen normaal verdeeld zijn, de kans dat Laura te laat komt in de acteerles die om 10.00 u. begint.

Bij de productie van assen zijn de diameters X normaal verdeeld met N( m = 12,64 mm ; s = 0,04 mm)

Bij de geboorde gaten zijn de diameters Y eveneens normaal verdeeld met N( m = 12,70 mm ; s = 0,03 mm).

a Wanneer er bij een willekeurig gat een willekeurige as geplaatst wordt, wat is dan de kans dat de as niet in het gat past ?

b We veronderstellen dat bij het boren van de gaten het gemiddelde kan veranderen zonder dat de standaardafwijking verandert. Op welke gemiddelde diameter moeten de gaten geboord worden opdat slechts 1% van de assen te dik zou zijn ?

Een vulapparaat deponeert jam in potten volgens een normale verdeling N( m = 506 cl, s = 3 cl).

De grootte van de glazen potten zelf is ook normaal verdeeld met N( m = 512 cl, s = 4 cl)

Hoe groot is de kans dat de jam bij het vullen niet in de glazen pot kan ?

Een bedrijf maakt schroeven en bijpassende moeren. De diameters van de schroeven zijn normaal verdeeld met m = 2,20 mm en s = 0,09 mm. Voor de diameters van de moeren geldt een normale verdeling met m = 2,40 mm en s = 0,12 mm. We nemen nu een willekeurige schroef en een willekeurige moer. Wat is de kans dat de schroef in de moer past? (Opmerking : de schroef past in de moer als de diameter van de schroef kleiner is dan de diameter van de moer).

De inhoud van pakjes thee is normaal verdeeld met m = 52 gram en s = 2 gram. We doen 12 pakjes in een doos. Hoe is de hoeveelheid thee in een doos met 12 pakjes verdeeld ?

2 79 Kansverdelingen en toevalsveranderlijken
12 13 14 15 16

De massa van een lading geplukte peren is normaal verdeeld met m = 120 gram en s = 20 gram. Willekeurig worden peren in zakken van 8 stukken gedaan. Hoe groot is de kans dat een zak met 8 peren meer dan 1 kg weegt ?

In een verlichtingselement werden op zeker tijdstip twee nieuwe lampen geplaatst. De brandduur van een lamp wordt weergegeven door de toevalsveranderlijke X die een normale verdeling volgt met m = 240 en s = 10.

Voor beide lampen wordt de brandduur bepaald. Hoe groot is de kans dat het verschil in levensduur tussen beide lampen meer is dan 20 uur ?

Bij een laboproef worden twee producten A en B met elkaar gemengd. Beide producten worden afgemeten met een maatlepel die voor beide producten een normale verdeling geeft van m = 10 gram en s = 0,5 gram.

a Hoe groot is de kans dat er in het mengsel meer van het product A dan van het product B voorkomt ?

b Hoe groot is de kans dat de hoeveelheid van product B minstens 1 gram hoger uitvalt dan de hoeveelheid van product A ?

c We gaan nu 100 gram van elke stof mengen. Product A hoeft niet afgepast te worden omdat er precies 100 gram in een verpakking zit. Hoe groot is de kans dat de hoeveelheid van product B (10 maatlepels) meer dan 104 gram bedraagt ?

d De proef mislukt als er minder dan 98 gram van product B aanwezig is. Bepaal de kans hierop.

Een bepaald product bestaat uit drie onderdelen A, B en C. De massa’s van de onderdelen A, B en C zijn normaal verdeeld met : A ∼ N( m = 80 gram, s = 2 gram)

B ∼ N( m = 245 gram, s = 2 gram)

C ∼ N( m = 35 gram, s = 1 gram)

Bij het monteren van een product worden willekeurig een onderdeel A, een onderdeel B en een onderdeel C gekozen. a Bepaal de kans dat een product meer dan 364 gram weegt.

b Hoe groot is de kans dat 10 willekeurig gekozen producten samen meer dan 3630 gram wegen ?

In een kousenfabriek worden machinaal sportkousen gemaakt. De lengte van de kousen is normaal verdeeld met een gemiddelde lengte van 45 cm en een standaardafwijking van 0,4 cm. Wanneer we nu twee kousen pakken om een paar te vormen, hoe groot is dan de kans dat het lengteverschil tussen die twee kousen meer dan 0,5 cm bedraagt?

De tijdsduur die een arts spendeert aan zijn patiënten tijdens zijn spreekuur op maandagochtend is normaal verdeeld met een gemiddelde van 14 minuten en een standaardafwijking van 4 minuten. Gewoonlijk behandelt hij 20 patiënten. In hoeveel gevallen zal de dokter, als hij om 8 uur begint en geen pauze neemt, pas na 13 uur kunnen lunchen ?

80
17 18 19 20 21 22

Voor het overbruggen van een beek worden houten balken aan elkaar gesjord. De breedte van de balken is normaal verdeeld met een gemiddelde van 34 cm en een standaardafwijking van 3 cm. Wat is de kans dat we met 12 balken toekomen als de beek 4 meter breed is ?

Om de pH-waarde van de bodem van een bepaalde akker te controleren, worden er 12 bodemmonsters genomen. De pH-waarde van een monster is normaal verdeeld met m = 6,8 en s = 0,6. Wat is de kans dat de 12 monsters een gemiddelde pH-waarde hebben van minstens 7 ?

Op de markt zijn de rode kolen in de aanbieding. Die rode kolen hebben een massa die normaal verdeeld is met een gemiddelde van 750 gram en een standaardafwijking van 70 gram.

a Laurien koopt één rode kool. Bereken de kans dat die een massa heeft tussen 700 en 900 gram.

b Jolien moet vandaag voor de voetbalploeg van Robbe koken. Ze besluit om rode kool met worst te maken. In totaal moet ze voor 14 personen eten klaarmaken. Ze wil voor iedereen 300 gram (niet-schoongemaakte) rode kool. Bereken de kans dat Jolien aan zes willekeurige rode kolen genoeg heeft.

In een fabriek worden koekjes gemaakt met een gemiddelde massa van 22 gram en een standaardafwijking van 4 gram. Een aantal koekjes wordt verpakt in een doos. Volgens de fabrikant is de gemiddelde massa van een koekje uit minstens 99% van de dozen minstens 20 gram. Hoeveel koekjes moet de fabrikant minstens in een doos steken ?

De cuberdons, ook bekend als ‘neuzekes’, in een snoepwinkel in Gent hebben een massa die normaal verdeeld is met een gemiddelde van 15 gram en een standaardafwijking van 2 gram. Hoeveel cuberdons moet je in een zakje steken om met 95% zekerheid te mogen beweren dat de gemiddelde massa van een cuberdon 14 gram is.

2 81
Kansverdelingen en toevalsveranderlijken
23 24 25 26 * 27 *

Kansverdelingen en toevalsveranderlijken 2

Ik weet wat een stochastische veranderlijke is en ik ken het verschil tussen een discrete en een continue toevalsveranderlijke.

Ik kan bij continue toevalsveranderlijken kansen grafisch bepalen.

Ik kan grafisch nagaan of een gegeven functie een kansdichtheidsfunctie voorstelt.

Ik weet wat de verwachtingswaarde van een toevalsveranderlijke betekent.

Ik weet wat de variantie en standaardafwijking van een toevalsveranderlijke betekenen.

Ik kan de verwachtingswaarde, de variantie en de standaardafwijking van een discrete toevalsveranderlijke berekenen.

Ik ken de definitie van een uniforme discrete verdeling en kan hiervan de karakteristieken berekenen.

Ik ken de definitie van een uniforme continue verdeling en kan hiervan de karakteristieken berekenen.

Ik ken de rekenregels voor toevalsveranderlijken en kan die in concrete situaties toepassen.

Ik ken de √n -wet en kan die in concrete situaties toepassen.

51

54

54

57

58

58

61

62

70

74

82 WAT MOET JE KENNEN EN KUNNEN ? pagina

3 Discrete verdelingen

Meer dan 1 miljard Kinder Surprise-eitjes worden er jaarlijks verkocht. En meer dan 300 miljoen daarvan worden geproduceerd in Aarlen.

Een lekker stukje chocolade wordt gecombineerd met een klein cadeautje. Die krijgen meestal een bepaald thema (smurfen, Disney, Happy Hippo …) . Maar het is niet omdat je 6 eitjes in het Disney-thema koopt, dat er daadwerkelijk ook 6 Disneycadeautjes in zitten. Stel dat de producent beslist om in 5 van de 6 eitjes een Disney-cadeau te stoppen. In het zesde eitje komt een neutraal geschenkje. Als je voor een feestje 24 eitjes koopt, hoeveel cadeautjes zul je dan ontvangen rond het Disney-thema ?

stock.adobe.com)
Ferrero © (Cloudy Design –

Discrete verdelingen

3.1 De binomiale verdeling

1 Bernoulli-experimenten  85

2 De binomiale verdeling  86

3 Karakteristieken van een binomiale verdeling  88

4 Binomiale verdeling met GeoGebra  88

5 Binomiale verdeling met TI-84  89

6 Hypergeometrische verdelingen  90

7 Samenvatting  91

8 Oefeningen  94

3.2 De centrale limietstelling

1 Probleemstelling  99

2 Binomiale verdelingen benaderen door normale verdelingen  100

3 Continuïteitscorrectie  101

4 Toepassing  102

5 Centrale limietstelling (CLS)  104

6 Steekproevenverdeling  105

7 Samenvatting  106

8 Oefeningen  107

84
3
Wat moet je kennen en kunnen ?
118

3.1 De binomiale verdeling

1 Bernoulli-experimenten

Voorbeeld :

In een vaas zitten 4 rode knikkers en 1 gele knikker. Jonas trekt willekeurig één knikker uit de vaas. Wat is de kans dat die knikker geel is ?

We stellen de kans op succes, het trekken van een gele knikker, voor door p

Danis p = 1 5 = 0,2.Dekansopmislukking,hettrekkenvaneenknikkerdienietgeelis,

isdan q = 1 p = 4 5 = 0,8.

Veel kansexperimenten hebben slechts twee uitkomsten :

– kop of munt bij het opgooien van een geldstuk ;

– winnen of niet winnen met een lot uit een tombola ;

– zes of geen zes gooien met een dobbelsteen ;

– juist of fout bij het aankruisen van een meerkeuzevraag ;

– defect of goed bij het controleren van de kwaliteit van geproduceerde goederen ; – goal of geen goal bij het nemen van een strafschop ;

Een van de twee uitkomsten noemen we succes ( s ) en de kans op succes stellen we gelijk aan p .

De andere uitkomst noemen we mislukking ( m ) of geen succes en de kans op mislukking stellen we gelijk aan q = 1 – p .

De kansverdeling die de toevalsveranderlijke X = ‘het aantal keer succes’ bij een dergelijk kansexperiment volgt, noemen we een bernoulliverdeling, die we algemeen kunnen voorstellen als :

Dergelijke kansexperimenten noemen we ook wel eens bernoulli-experimenten

Karakteristieken :

= 0 q + 1 p = p

85 3 Discrete verdelingen
–…
σ = 0 p 2 q + 1 p 2 p = p 2 q + q 2 p = pq p + q = √pq q 1 x i P( X = x i ) 0 q = 1 – p 1 p
µ

2

De binomiale verdeling

Voorbeeld 1 :

In een tas zitten 4 rode appels en 1 groene appel. Jonas neemt willekeurig één appel uit de tas, noteert welke kleur de appel heeft en legt die dan terug. Dat doet hij viermaal na elkaar.

Wat is de kans dat hij 4 maal, 3 maal, 2 maal, slechts eenmaal of geen enkele keer een groene appel nam ?

De mogelijke uitkomsten van dit kansexperiment zijn :

G,G,G,G

P(G,G,G,G) = P(G) · P(G) · P(G) · P(G) = 1 5 4 = 1 625

G,G,G,R-G,G,R,G-G,R,G,G-R,G,G,G

P(G,G,G,R) = P(G) P(G) P(G) P(R) = 1

P(G,G,G,R) = P(G,G,R,G) = P(G,R,G,G) = P(R,G,G,G)

Gaditna!

G,G,R,R-G,R,G,R-R,G,G,R-G,R,R,G-R,G,R,G-R,R,G,G

P(G,G,R,R) = P(G) · P(G) · P(R) · P(R) = 1 5 2 · 4 5 2 = 16 625

P(G,G,R,R) = P(G,R,G,R) = P(R,G,G,R) = P(G,R,R,G) = P(R,G,R,G) = P(R,R,G,G)

Gaditna!

G,R,R,R-R,G,R,R-R,R,G,R-R,R,R,G

P(G,R,R,R) = P(G) P(R) P(R) P(R) = 1 5 4 5 3 = 64 625

P(G,R,R,R) = P(R,G,R,R) = P(R,R,G,R) = P(R,R,R,G)

Gaditna!

R,R,R,R

P(R,R,R,R) = P(R) P(R) P(R) P(R) =

Dit resulteert in de volgende kansverdeling voor de toevalsveranderlijke X = het aantal genomen groene appels.

OmdatvolgenshetbinomiumvanNewtongeldt:

noemen we deze kansverdeling de binomiale kansverdeling

Het kanshistogram van die binomiale verdeling ziet er als volgt uit.

86
5
3 4 5 = 4 625
4 5 4
256 625
=
P ( X = 0)= 256 625 = 1 1 5 0 4 5 4 = 4 0 1 5 0 4 5 4 P ( X
1)= 4 64 625 = 4 1 5 1 4 5 3 = 4 1 1 5 1 4 5 3 P
6 16 625 = 6 1 5 2 4 5 2 = 4 2 1 5 2 4 5 2
)= 4 4 625 = 4 1 5 3 4 5 1 = 4 3 1 5 3 4 5 1
=
( X = 2)=
P ( X = 3
1 625 = 1 · 1 5 4 · 4 5 0 = 4 4 · 1 5 4 · 4 5 0
P ( X = 4)=
1 = 1 5 + 4 5 4 = 4 0 1 5 0 4 5 4 + 4 1 1 5 1 4 5 3 + 4 2 1 5 2 4 5 2 + 4 3 1 5 3 4 5 1 + 4 4 1 5 4 4 5 0
01234 45% 40% 35% 30% 25% 20% 15% 10% 5% 0%

Discrete verdelingen

binomiale verdeling

De binomiale verdeling is een discrete verdeling die een beschrijving geeft van het aantal successen dat kan optreden wanneer we een bernoulli-experiment een gegeven aantal keren ( n ) onafhankelijk van elkaar herhalen. Bij elke herhaling is er eenzelfde kans p op het behalen van een succes. De getallen n en p worden de parameters van de binomiale verdeling genoemd.

Een toevalsveranderlijke X die een binomiale verdeling met parameters n en p volgt, geven we aan met de notatie X ∼ B( n , p ).

Voor een binomiale verdeling met parameters n en p is de kans op i successen gelijk aan :

P ( X = i )= n i p i q n i

Immers,degebeurtenis X = i bestaatuitalleuitkomstendie i maalsucces ( s ) en n i maalgeensucces (m ) bevatten.Dataantalisgelijkaanhetaantalmanierenwaaropwe i elementenkunnenverdelenover n plaatsen. Datishetaantalcombinatiesvan i elementenuit n of n i Dekansopzo’nuitkomstmet i maalsuccesen n i maalgeensuccesis:

zodatP ( X = i )= n i p i · q n i

Voorbeeld 2 :

Hanna heeft haar les niet geleerd en net nu krijgt ze een toets met meerkeuzevragen tijdens de les Nederlands. Ze moet 20 vragen beantwoorden en bij elke vraag zijn er 4 keuzeantwoorden. Hanna is niet van plan de opgaven te lezen en maakt lukraak bij elke vraag een van de vier bolletjes zwart.

Wat is de kans dat Hanna meer dan zes vragen juist heeft ?

Wehebbenhierduidelijktemakenmeteenbinomialeverdelingmetparameters n = 20en p = 1 4 .

Dekansop i successenisgelijkaanP ( X = i )= 20 i 1 4 i 3 4 20 i

Hetgevraagdeisgelijkaan:

Ditkanooksnellerberekendwordenalsvolgt: P ( X > 6)= 1

Nuis:

Zodat:

87 3
i
s
... P ( s
m
·
P ( s , s ,..., s i , m , m ,..., m n
)= P ( s ) P (
)
) P (m ) P (
) ... P (m ) = p · p
· p · q · q · · q = p i · q n i
P
X
P ( X = 8)+ P ( X
)+ P ( X = 10)+ P ( X = 11)+ P ( X = 12)+ P ( X =
P
( X
)+ P ( X
)+ P ( X = 17)+ P ( X = 18)+ P ( X = 19)+ P
X
20
P ( X > 6)=
(
= 7)+
= 9
13)+
( X = 14)+ P
= 15
= 16
(
=
)
P ( X 6) = 1 (P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) + P ( X = 5) + P ( X = 6)) (1)
P
20 0 1 4 0 3 4 20
0,00317P ( X = 4
20 4 1 4 4 3 4 16
0,18969
1)= 20 1 · 1 4 1 · 3 4 19 = 0,02114P ( X = 5)= 20 5 · 1 4 5 · 3 4 15 = 0,20233 P ( X
20 2 1 4 2 3 4 18 = 0,06695P ( X = 6)= 20 6 1 4 6 3 4 14
0,16861
( X = 0)=
=
)=
=
P ( X =
= 2)=
=
P ( X = 3)= 20 3 · 1 4 3 · 3 4 17 = 0,13390
P ( X > 6) (1) = 1 0,78579 = 0,21421 = 21,4%

3

Karakteristieken van

een binomiale verdeling

Omdat een binomiale verdeling de som is van n onafhankelijke bernoulli-experimenten geldt :

µbinomiaal = n µBernoulli = n p

σbinomiaal = √n σBernoulli = √n √pq = √npq

Voorbeeld :

Een fabrikant van chips steekt in 7 op de 8 pakjes chips een dierenfiguurtje en in 1 op de 8 pakjes een Tarzanpoppetje. Voor een verjaardagsfeestje koop je 40 pakjes chips. Hoeveel Tarzanpoppetjes kun je verwachten en hoe groot is de standaardafwijking ?

We stellen X gelijk aan het aantal Tarzanpoppetjes.

Dan hebben we een binomiale verdeling met parameters n = 40en p = 1 8 of X ∼ B 40, 1 8 .

Het aantal te verwachten Tarzanpoppetjes is µ = np = 40 · 1 8 = 5

De standaardafwijking is s = √npq = 40 1 8 7 8 ≈ 2,09.

4 Binomiale verdeling met GeoGebra

Een bakker verkoopt taartjes waarbij er in 1 op de 5 gebakjes een koffieboon zit verstopt.

a Als Luka 24 taartjes bij die bakker koopt, wat is de kans dan dat er in juist 4 taartjes een koffieboon zit ?

b Als Luka 24 taartjes bij die bakker koopt, wat is de kans dat er in 4 taartjes of meer een koffieboon zit ?

c Hoeveel taartjes moet Luka kopen om meer dan 90% kans te hebben dat er in minstens 4 taartjes een koffieboon zit?

We hebben hier duidelijk te maken met een binomiale verdeling met parameters n = 24en p = 1 5

De kans op i keer succes is gelijk aan P ( X = i )= 24 i 1 5 i 4 5 24 i

a De kans op i keer succes bij een binomiale verdeling met parameters n en p bereken je als volgt:

P( X = i ) = BinomialeVerdeling ( n , p , i , false)

M.a.w. de kans op juist 4 taartjes met een koffieboon krijg je via :

P( X = 4) = BinomialeVerdeling ( 24, 0.2, 4, false) = 19,60%

Antwoord :

Als Luka 24 taartjes koopt, dan is de kans dat er in exact 4 taartjes een boon zit 19,60%.

b De kans op i keer succes of minder bij een binomiale verdeling met parameters n en p bereken je als volgt:

P( X ⩽ i ) = BinomialeVerdeling ( n , p , i , true)

M.a.w. de kans op minstens 4 taartjes met een koffieboon krijg je via :

P( X ⩾ 4) = 1 – P( X < 4)

= 1 – P( X ⩽ 3)

= 1 – BinomialeVerdeling ( 24, 0.2, 3, true)

= 73,61%

Antwoord :

Als Luka 24 taartjes koopt, dan is de kans dat er in 4 of meer taartjes een boon zit 73,61%.

88

c Als Luka n taartjes koopt, is de kans dat er bij 4 taartjes of meer een koffieboon zit gelijk aan : P( X ⩾ 4) = 1 – P( X ⩽ 3) = 1 – BinomialeVerdeling ( n , 0.2, 3, true)

Als die kans groter dan 90% moet zijn, dan moeten we n halen uit de ongelijkheid : 1 – BinomialeVerdeling ( n , 0.2, 3, true) > 0.9

Dat los je op als volgt :

Oplossen (1 – BinomialeVerdeling ( n , 0.2, 3, true) > 0.9, n )

Je krijgt het resultaat : { n < –5.57, n > 31.49}

Omdat n een natuurlijk getal moet zijn, is het antwoord 32.

Antwoord :

Luka moet minstens 32 taartjes kopen om meer dan 90% kans te hebben dat er in minstens 4 taartjes een boon zit.

5 Binomiale verdeling met TI–84

We hernemen het probleem van Luka en de koffiebonen (vorige blz.).

We hebben hier duidelijk te maken met een binomiale verdeling met parameters n = 24en p = 1 5

De kans op i successen is gelijk aan P ( X = i )= 24 i · 1 5 i · 4 5 24 i

a De kans op i keer succes bij een binomiale verdeling met parameters n en p bereken je als volgt : 2nd [ Distr] A : binompdf ( n , p , i ) ENTER

M.a.w. de kans op juist 4 taartjes met een koffieboon krijg je via binompdf ( 24, 0.2, 4)

P( X = 4) = binompdf ( 24, 0.2, 4) = 19,60%

Antwoord : als Luka 24 taartjes koopt, dan is de kans dat er in exact 4 taartjes een boon zit 19,60%.

2nd [ Distr] B : binomcdf ( n , p , i ) ENTER

b De kans op i keer succes of minder bij een binomiale verdeling met parameters n en p bereken je als volgt :

M.a.w. de kans op hoogstens 4 taartjes met een koffieboon krijg je via binomcdf ( 24, 0.2, 4)

P( X ⩽ 4) = binomcdf ( 24, 0.2, 4)

De kans op 4 taartjes of meer bereken je dan via :

P( X ⩾ 4) = 1 – P( X < 4) = 1 – P( X ⩽ 3) = 1 – binomcdf (24, 0.2, 3) = 73,61%

Antwoord : de kans dat er in 4 taartjes of meer een koffieboon zit, is 73,61%.

c Als Luka n taartjes koopt, is de kans dat er bij 4 taartjes of meer een koffieboon zit gelijk aan :

P( X ⩾ 4) = 1 – P( X ⩽ 3) = 1 – binomcdf (n , 0.2, 3)

Als die kans groter dan 90% moet zijn, dan moeten we n halen uit de ongelijkheid :

1 – binomcdf ( n , 0.2, 3) > 0,9 of nog : binomcdf ( n , 0.2, 3) < 0,1

Dit probleem kun je oplossen door binomcdf ( X , 0.2, 3) als functie te definiëren. Via 2nd [ table] ga je dan na voor welke gehele X de functiewaarde kleiner wordt dan 0,1.

Antwoord : Luka moet minstens 32 taartjes kopen om meer dan 90% kans te hebben dat er in minstens 4 taartjes een boon zit.

89 3 Discrete verdelingen

6 Hypergeometrische verdelingen

Voorbeeld 1 :

Gegeven :

In een speelgoedmand liggen 30 pakjes. In 20 pakjes zit een pluchen hondje en in de andere 10 een bal. Vijf kinderen mogen nu lukraak een pakje trekken.

Gevraagd :

Bestudeer de toevalsveranderlijke X = het aantal getrokken pluchen hondjes.

Oplossing :

Voor het eerste kind is de kans op het trekken van een pluchen hondje 2 3 , maar dit is niet meer zo voor het tweede kind. Dus dit is geen binomiale verdeling.

Voor het berekenen van de kansen maken we gebruik van de formule van Laplace uit de kansrekening.

P ( X = 2)=

We zeggen dat de toevalsveranderlijke X een hypergeometrische verdeling heeft met parameters n = 5, N 1 = 20 en N 2 = 10.

hypergeometrische verdeling

Als we een serie trekkingen doen uit een eindige populatie, dan hebben we te maken met een hypergeometrische verdeling. De populatie N is verdeeld in M elementen die een bepaald kenmerk vertonen en N – M , de rest, die dat kenmerk niet bezitten. Uit de populatie wordt een steekproef van n elementen genomen, zonder teruglegging. Vervolgens zijn we geïnteresseerd in het aantal elementen i dat uit de deelverzameling met M elementen afkomstig is.

Pi = P ( X = i )= M i N M n i N n met i = 0,1,..., n

µ = n M N σ 2 = n (N n )(N M ) M N 2 (N 1)

90
20 0 10 5 30 5 = 0,001768 P ( X = 3)= 20 3 10 2 30 5 = 0,359985 P
20
10 4 30 5
0,029472 P
20 4 10 1 30 5
0,339986
20 2 10 3 30 5 = 0,159993 P ( X = 5)= 20 5 10 0 30 5 = 0,108795
P ( X = 0)=
( X = 1)=
1
=
( X = 4)=
=

Voorbeeld 2 :

In een bokaal zitten 40 fruitsnoepjes : 14 met aardbeismaak, 10 met sinaasappelsmaak en 16 met citroensmaak.

Julie neemt lukraak zeven snoepjes uit de bokaal.

a Wat is de kans dat zij drie snoepjes met aardbeismaak heeft getrokken?

b Wat is de kans dat zij minder dan vijf snoepjes met aardbeismaak heeft getrokken?

Oplossing :

a De kans op i keer succes bij een hypergeometrische verdeling met parameters N , M en n bereken je met GeoGebra als volgt : P( X = i ) = Hypergeometrisch ( N , M , n , i , false)

M.a.w. de kans op juist drie snoepjes met aardbeismaak krijg je via P( X = 3) = Hypergeometrisch ( 40, 14, 7, 3, false) = 29,19%

b De kans op i keer succes of minder bij een hypergeometrische verdeling met parameters N , M en n bereken je met GeoGebra als volgt : P( X ⩽ i ) = Hypergeometrisch ( N , M , n , i , true)

M.a.w. de kans op minder dan vijf snoepjes met aardbeismaak krijg je via P( X < 5) = P( X ⩽ 4) = Hypergeometrisch ( 40, 14, 7, 4, true) = 96,07%

7 Samenvatting

• Je kent de begrippen bernoulliverdeling en bernoulli-experiment.

Een kansexperiment met slechts twee mogelijke uitkomsten (succes of mislukking) noemen we een bernoulli-experiment.

De kansverdeling die de toevalsveranderlijke X = ‘het aantal keer succes’ bij een dergelijk kansexperiment volgt, noemen we een bernoulliverdeling die we algemeen kunnen voorstellen als :

p

• Je kent de definitie van een binomiale verdeling.

De binomiale verdeling is een discrete verdeling die een beschrijving geeft van het aantal successen dat kan optreden wanneer we een bernoulli-experiment een gegeven aantal keren ( n ) onafhankelijk van elkaar herhalen. Bij elke herhaling is er eenzelfde kans p op het behalen van een succes. De getallen n en p worden de parameters van de binomiale verdeling genoemd. Een toevalsveranderlijke X die een binomiale verdeling met parameters n en p volgt, geven we aan met de notatie X ∼ B( n , p )

Voor een binomiale verdeling met parameters n en p is de kans op i successen gelijk aan :

P ( X = i )= n i p i q n i met p + q = 1

Karakteristieken van een binomiale verdeling : µ = n · p

= √npq

Een binomiale verdeling is de som van onafhankelijke bernoulliverdelingen.

• Als we een serie trekkingen doen uit een eindige populatie, dan hebben we te maken met een hypergeometrische verdeling. De populatie N is verdeeld in M elementen die een bepaald kenmerk vertonen en N – M , de rest, die dat kenmerk niet bezitten.

Uit de populatie wordt een steekproef van n elementen genomen, zonder teruglegging. Vervolgens zijn we geïnteresseerd in het aantal elementen i dat uit de deelverzameling met M elementen afkomstig is.

P ( X = i )= M i N M n i N n µ = n · M N σ 2 = n (N n )(N M ) M N 2 (N 1)

91 3 Discrete verdelingen
x
0
1
i P( X = x i )
q = 1 – p
σ

Jakob I Bernoulli

Het bernoulli-experiment in de kansrekening en de ongelijkheid van Bernoulli zijn beide naar een Bernoulli genoemd. Er zijn meer van zulke regels, formules of wetten waaraan later de naam Bernoulli is gegeven.

Omdat er minstens acht Bernoulli’s zijn geweest die hun sporen in de wiskunde en de natuurwetenschappen verdiend hebben, is het telkens weer de vraag welke Bernoulli vernoemd wordt.

Er bestaat zelfs een planetoïde met de naam ‘Bernoulli’ om Jakob I, Johann I en Daniël te eren.

Het eerder genoemde experiment en de ongelijkheid van Bernoulli zijn beide van Jakob I

Oorspronkelijk komt de familie Bernoulli uit Antwerpen. Toen ze om godsdienstige redenen in 1570 moesten vluchten voor Alva, zijn ze naar Frankfurt gegaan. Vanuit Frankfurt zijn er vertakkingen naar Hamburg, Keulen en Bazel.

De eerste Bernoulli’s waren handelaars in kruiden en specerijen. Vanaf de derde Bazelse generatie zijn ze in de wetenschap beland, voornamelijk in de wiskunde.

In een tijdsbestek van een eeuw hebben acht Bernoulli’s diverse takken van de wiskunde en de natuurkunde ontwikkeld. Ook waren bijna een eeuw lang (1699 –1790) altijd wel een of meer Bernoulli’s lid van de Franse Académie des Sciences in Parijs.

De Bernoulli’s hebben een plaats in de wetenschapsgeschiedenis die vergelijkbaar is met die van de familie Bach in de muziekgeschiedenis.

Jakob I raakt als eerste gefascineerd door de magie van getallen en figuren en vooral door oneindige processen. Die fascinatie wordt in de familie doorgegeven, van broer op broer, van oom op neef en van vader op zoon. Een stevige portie eerzucht maakt dat ze niet voor elkaar wilden onderdoen. Ook dat heeft de vooruitgang gestimuleerd.

Jakob I Bernoulli wordt omstreeks 27 december 1654 geboren in Bazel als zoon van Nicolaus Bernoulli en Margareta Schönhauer. Zijn vader wil dat Jakob geestelijke wordt, maar hij doet liever aan wiskunde. In 1671 rondt Jakob aan de Bazelse universiteit de opleiding aan de artes-faculteit af. Daarna gaat hij theologie studeren en in 1676 behaalt hij zijn licentiaatsdiploma (ongeveer ons doctoraat). Na de studie theologie studeert hij weer wiskunde en astronomie. Tot 1678 verblijft hij in Frankrijk om het werk van Descartes en zijn opvolgers te bestuderen. Een tweede wetenschappelijke reis in de jaren 1681–1682 brengt hem in Nederland, waar hij onder meer Hudde ontmoet. Het resultaat van zijn reizen is zijn theorie over kometen (1682) en een theorie over zwaartekracht. Kometen zijn volgens Jakob geen meteoren maar permanente sterren die een regelmatige koers hebben.

In 1683 gaat Jakob terug naar Bazel, waar hij aan de universiteit colleges verzorgt over de mechanica van vaste stoffen en vloeistoffen. Tijdens die colleges voert hij fysische experimenten uit, iets wat in Bazel niet eerder vertoond is.

In 1684 trouwt Jakob met Judith Stupanus, dochter van een rijke apotheker. Het paar krijgt een dochter (Verena, 1685) en een zoon (Nicolaus, 1687). Deze Nicolaus zal later schilder worden ; hij wordt wel Nicolaus ‘der Jüngere’ genoemd om hem te onderscheiden van zijn oom Nicolaus ‘der Altere’, die ook schilder was (zie stamboom).

Een jaar later verschijnt Jakobs eerste publicatie over waarschijnlijkheidsrekening.

92

De wiskundigen van de familie Bernoulli

Jakob (I) 1654–1705

Nicolaus (II) 1695–1726

Johann (I) 1667–1748

Daniel 1700–1782

Nicolaus (I) 1687–1759

Johann (II) 1710–1790

Johann (III) 1744–1807

Jakob (II) 1759–1789

Naar Jakob is het bernoulli-experiment genoemd. Dat is een kansexperiment met twee mogelijke uitkomsten : succes en mislukking. Stel, je hebt een kans p op succes, dan is de kans q op mislukking q = 1 – p. Als je het experiment n maal herhaalt, is de kans op i successen, P( X = i), gegeven door de binomiale verdeling:

P (X = i)= n i pi qn i

In 1687 wordt Jakob professor in de wiskunde aan de universiteit van Bazel. Zijn wiskundig werk bereikt een hoogtepunt in 1689 met het begin van de theorie over reeksen. Deze theorie publiceert hij in een serie van vijf korte verhandelingen die hij door studenten, onder meer door zijn neef Nicolaus I en door Jakob Hermann, laat verdedigen. In 1689 vindt hij in dit verband de ongelijkheid van Bernoulli : (1 + x)n > 1 + nx

De later naar hem genoemde lemniscaat ontdekt hij in 1694.

Delemniscaat:

In 1698 publiceert hij een essay over differentiaalrekening en de toepassing ervan in de meetkunde. Ook de differentiaalvergelijking van Bernoulli is van Jakob I (Acta Eruditorum 1696). De vergelijking luidt als volgt: y′ + p ( x) y = q ( x) yn Jakob is vanaf 1699 lid van de Franse Académie des Sciences in Parijs. Hij overlijdt in Bazel op 16 augustus 1705. Op zijn grafmonument staat een (onjuist getekende) logaritmische spiraal afgebeeld.

Na zijn dood geeft zijn neef Nicolaus I in 1713 zijn grote studie over waarschijnlijkheidsrekening uit, de Ars Conjectandi. Hierin komen Jakobs formulering en bewijs van de wet van de grote getallen voor.

93 3 Discrete verdelingen
, met x > 1, x = 0, n ∈ N0 \{1}
x y 6 4 2 2 4 6 4 2 2 4 0 0
x 2 + y 2 2 = a 2 x 2 y 2 met a = 4

8 Oefeningen

Een toevalsveranderlijke X volgt een binomiale verdeling met n = 8 en p = 0,35. Bereken :

a P( X = 0)

b P( X < 3)

c P( X ⩾ 4)

Een toevalsveranderlijke X volgt een binomiale verdeling met n = 16 en p = 0,44. Bereken :

a P( X = 0)

b P( X > 5)

c P( 4 ⩽ X < 8)

Een toevalsveranderlijke volgt een binomiale verdeling met verwachtingswaarde 6 en standaardafwijking 2. Bepaal P( X = 7)

Van de variabele X is gegeven : X ∼B( 26, p ) waarbij p < 0,5 en Var ( X )= 24 13 . Bereken p , E[ X ] en P( X > 5).

Op een expresweg zijn alle verkeerslichten zo geregeld dat zij 65% van de tijd op groen staan en 35% van de tijd op oranje of rood. Jonas neemt dagelijks die weg en passeert 7 verkeerslichten. Bereken de kans :

a dat hij vijfmaal kan doorrijden ;

b dat hij minstens viermaal kan doorrijden ; c dat hij minder dan viermaal kan doorrijden.

Je gooit 13 maal met een zuivere dobbelsteen. Bereken de kans om : a precies driemaal zes ogen te gooien ; b ten hoogste tweemaal zes ogen te gooien ; c minstens viermaal zes ogen te gooien.

In een bak zitten 6 groene en 9 rode knikkers. We trekken aselect en met teruglegging 5 keer een knikker uit de bak. Bereken de kans : a dat je tweemaal een groene en driemaal een rode knikker trekt ; b dat je minstens driemaal een groene knikker trekt ; c dat je ten hoogste tweemaal een rode knikker trekt.

Bij het toedienen van een geneesmiddel is er 15% kans op maagklachten als nevenwerking. Bereken de kans dat bij 10 willekeurige patiënten er minstens twee met maagklachten zijn.

Een machine produceert 15% slechte stukken. Wat is de kans dat bij een controle van 5 willekeurig gekozen stuks er :

a één slechte bij is ;

b geen slechte bij is ; c hoogstens twee slechte bij zijn ?

94
1 2 3 4 5 6 7 8 9

In een tombola wint 1 op de 5 loten een prijs.

a Wat is de kans dat Jonathan, die één lotje gekocht heeft, een prijs wint ?

b Wat is de kans dat Laura, die drie lotjes gekocht heeft, minstens één prijs wint ?

c Wat is de kans dat Kasper, die 8 lotjes gekocht heeft, meer dan 3 prijzen wint ?

d Wat is de kans dat Ellen, die 12 lotjes gekocht heeft, minder dan 3 prijzen wint ?

In een pretpark worden er op drie plaatsen (A, B en C) ijsjes verkocht. 20 kinderen kiezen lukraak een van die plaatsen om een ijsje te kopen. Bereken de kans dat minstens 6 van die kinderen een ijsje koopt bij kraam A.

Veronderstel dat bij de geboorte van een kind de kans op een jongen of een meisje even groot is. Bereken de kans dat er in een gezin met 4 kinderen 2 of 3 meisjes zijn.

De kans dat een basketter in de ring gooit bedraagt 0,85. Hoe groot is de kans dat hij 9 keer in de ring gooit bij 10 worpen ?

Bij 10 worpen naar de ring is de kans dat een basketter 9 maal scoort even groot als de kans dat hij 10 maal scoort. Bereken de kans op scoren.

Om te slagen in een test van 12 ‘waar of vals’-vragen moeten studenten 10 vragen juist beantwoorden. Welke kans van slagen heeft een student die niets van de stof weet en zomaar op goed geluk gokt ?

a Zoek de kans om minstens eenmaal 7 ogen te bekomen bij 2 worpen met twee dobbelstenen.

b Zoek de kans om minstens eenmaal 7 ogen te bekomen bij 3 worpen met twee dobbelstenen.

c Hoeveel worpen zijn er nodig opdat de kans groter zou zijn dan 95% ?

Hoeveel keer moet een geldstuk worden opgegooid opdat de kans op minstens vier keer munt groter is dan 97% ?

Een basketbalspeler heeft bij een vrije worp een trefkans van 65%. Hoeveel vrije worpen moet hij minstens nemen om met een kans van meer dan 95% minstens vier keer te scoren ?

Bij een interimkantoor zijn ze op zoek naar een groot aantal directiesecretarissen. Uit ervaring weten ze dat een kandidaat die zich komt melden voor een dergelijke baan slechts 15% kans heeft om uiteindelijk aanvaard te worden. Deze week meldden zich 20 kandidaten.

a Bereken de kans dat er minstens vijf van die kandidaten effectief aanvaard worden.

b Hoeveel kandidaten verwacht je dat er gemiddeld worden aanvaard ?

c Hoeveel kandidaten moeten zich melden om met 95% zekerheid te kunnen zeggen dat er minstens 5 aanvaard zullen worden ?

3 95 Discrete verdelingen
10 11 12 13 14 15 16 17 18 19

Bij een evaluatieproef worden 20 vragen gesteld. Naast elke vraag staan 4 mogelijke antwoorden vermeld, waarvan één het juiste is. Een proefpersoon kiest voor elke vraag lukraak een antwoord. De testscore wordt bepaald door voor elk goed antwoord een punt toe te kennen en voor elk verkeerd antwoord één derde van een punt af te trekken.

a Bereken de kans op een positieve testscore.

b Bereken de verwachtingswaarde van de testscore.

Op een examen worden 5 onafhankelijke vragen gesteld. Die vragen kunnen goed of slecht beantwoord worden waarvoor de punten 1 of 0 worden toegekend. De einduitslag vertoont dus discrete waarden van 0 tot 5.

Een leerling heeft zich zodanig voorbereid dat hij de kans 2 3 heeft om goed te antwoorden op de eerste drie vragen en de kans 1 2 om goed te antwoorden op de laatste twee vragen.

a Hoe ziet de kansverdeling van het eindcijfer eruit ?

b Teken het bijbehorende kanshistogram.

c Bereken de verwachtingswaarde en de standaardafwijking van het eindcijfer.

Een winkelier verkoopt bernoullilolly’s. Bij 20% van die lolly’s is lukraak een bon gevoegd die recht geeft op een gratis lolly.

a Hoe groot is de kans dat Stef, die 5 lolly’s koopt, er meer dan 5 krijgt ?

b Hoe groot is de kans dat Stef er juist 6 krijgt ?

Stef heeft zijn zakgeld van drie weken verbruikt met het kopen van lolly’s bij de winkelier en hij heeft nog geen enkele bon gehad. Hij vermoedt dus dat het oneerlijk gaat. Zijn vader rekent de kans op dit ongunstige resultaat (als het wel eerlijk gaat) uit en vindt 0,06872.

Dat is groter dan 5%, zodat er nog niets abnormaals gebeurd is.

Zij gaan samen naar de winkel, waar de vader zoveel lolly’s koopt dat hij er praktisch zeker (99%) van is dat er minstens één bon zal bij zijn.

c Hoeveel lolly’s kan Stef kopen met zijn zakgeld van één week ? d Hoeveel lolly’s moet de vader kopen ?

Een roker heeft 2 dozen met elk 10 lucifers op zak. Wanneer hij rookt, neemt hij een lucifer naar willekeur. Bereken de kans dat, wanneer hij de laatste lucifer uit een doos neemt, de andere doos nog juist één lucifer bevat.

De massa X van de zakken bloem (van 1 kg) van een fabrikant is normaal verdeeld N( m, s = 10 gram)

Regelmatig wordt de massa van die zakken gecontroleerd aan de hand van een willekeurige steekproef van 20 zakken. Bepaal de gemiddelde massa m die een zak moet hebben opdat bij een controle de kans om minstens één zak met een massa kleiner dan 1 kg te vinden, slechts 0,1% zou bedragen.

96
20 21 22 * 23 * 24

In een doos zitten 15 goede en 5 defecte lampen. Je neemt willekeurig 3 lampen uit de doos. Wat is de kans dat twee van de drie lampen defect is ?

In de koelkast staan 16 blikjes icetea, 12 blikjes cola, 14 blikjes Gini en 8 blikjes Canada Dry. Astrid neemt lukraak 15 blikjes uit de koelkast. Wat is de kans dat er nog minstens 10 blikjes cola in de koelkast staan ?

In een fruitmand liggen 12 sinaasappels en 14 appelen. Aster neemt willekeurig 8 stukken fruit uit de mand.

a Wat is de kans dat ze juist vijf appelen genomen heeft?

b Wat is de kans dat ze hoogstens vijf appelen genomen heeft?

c Wat is de kans dat ze minstens vijf appelen genomen heeft?

Bij een tombola mag je voor een bepaald bedrag een omslag trekken waarin eventueel een nummer zit dat verwijst naar een prijs. Er zijn negentig omslagen. Hiervan bevatten 20 omslagen een prijs ter waarde van 20 euro. Er zijn ook 5 omslagen die een prijs bevatten ter waarde van 50 euro. Amin koopt zes omslagen.

a Wat is de kans dat Amin geen enkele prijs heeft?

b Wat is de kans dat Amin zes prijzen heeft?

c Wat is de kans dat Amin vier omslagen getrokken heeft met een prijs ter waarde van 20 euro?

d Wat is de kans dat Amin minstens vier omslagen met een prijs getrokken heeft?

e Wat is de kans dat Amin één of twee omslagen met een prijs ter waarde van 50 euro heeft getrokken?

In een vaas zitten 7 rode en 5 groene bollen. Je neemt 3 bollen uit de vaas. Bereken de kans op 3 rode bollen : a met teruglegging van de getrokken bol ;

b zonder teruglegging van de getrokken bol.

In een vaas zitten 70 rode en 50 groene bollen. Je neemt 3 bollen uit de vaas. Bereken de kans op 3 rode bollen :

a met teruglegging van de getrokken bol ;

b zonder teruglegging van de getrokken bol.

3 97 Discrete verdelingen
25 26 27 28 29 30

Het bord van Galton (Brits ontdekkingsreiziger en wetenschapsman, 1822 –1911 ; zie ook blz. 36)

Het toestel bestaat uit een hellend vlak waarop zich pinnetjes bevinden zoals op de figuur hieronder wordt voorgesteld. Dit toestel doet wat denken aan een elementaire flipperkast, die bestaat uit een aantal pinnen in een driehoekig patroon. Hiertussen moeten knikkers hun weg zoeken om onderaan terecht te komen in een van de vakjes, die vanaf 0 genummerd zijn (zie figuur).

Als het Galtonbord goed gemaakt is, moet de knikker bij elke botsing met een pin evenveel kans hebben om naar links te gaan of naar rechts.

a Bepaal de kansverdeling van de stochast X , die het nummer aangeeft van het vakje waarin de knikker terechtkomt. Vul daartoe de onderstaande tabel aan.

b Teken het kanshistogram.

98
x i 0 1 2 3 4 5 6 7 8 P( X = x i )
31
172135352171 1615201561 15101051 14641 1331 121 11 1 18285670562881 102345678 x 7 6 5 4 3 2 1 0
Francis Galton

3.2 De centrale limietstelling

1 Probleemstelling

Voorbeeld 1 : 100 keer munt gooien

We gooien 100 keer een eerlijk geldstuk op. Hoe groot is de kans op meer dan 60 keer munt ?

Oplossing :

Dat is duidelijk een voorbeeld van een binomiale verdeling. Als X de kansvariabele ‘het aantal keren munt’ is, dan is X ∼B( n = 100, p = 0,5) en de gevraagde kans P( X > 60)

Met ICT is het berekenen van die kans niet moeilijk, maar manueel is het onbegonnen werk.

P ( X > 60)= P ( X = 61)+ P ( X = 62)+ + P ( X =

= 0,0176

Voorbeeld 2 : jaarlijks eetfestijn

De plaatselijke jeugdbeweging weet uit ervaring dat de kans dat een persoon die zich ingeschreven heeft voor het jaarlijkse eetfestijn niet komt opdagen, gelijk is aan 0,15. In het clubhuis zijn er 600 plaatsen beschikbaar. Er zijn dit jaar 680 inschrijvingen. Bereken de kans dat iedereen die komt opdagen een zitplaats krijgt.

Oplossing :

Dat is duidelijk een voorbeeld van een binomiale verdeling. Als X de kansvariabele ‘het aantal ingeschreven personen dat komt opdagen’ is, dan is X ∼B( n = 680, p = 0,85) en de gevraagde kans P( X ⩽ 600)

Ook hier is het berekenen van die kans met ICT niet moeilijk. Manueel is dit onbegonnen werk.

P ( X 600) = 1 P ( X > 600)

= 1 (P ( X = 601) + P ( X = 602) + ... + P ( X = 680)) = 1 680 601 p 601 q 79 +

ICT = 0,9935

99 3 Discrete verdelingen
= 100 61 p 61 q 39 + 100 62 p 62 q 38 + + 100 100 p 100 q 0 ICT
100)
680 680
680 602 p 602 q 78 + ... +
p 680 q 0

2 Binomiale verdelingen benaderen door normale verdelingen

Blijkbaar wordt het rekenwerk bij binomiale verdelingen moeilijker naarmate n groter wordt.

Hieronder zie je de binomiale verdeling grafisch voorgesteld voor verschillende waarden van n en p

n = 60, p = 0,5

Met die grafische voorstellingen zien we duidelijk dat naarmate n groter wordt, de grafiek van de binomiale verdeling meer en meer gelijkenis vertoont met de grafiek van een normale verdeling.

Als n voldoende groot is, dan mag de binomiale verdeling met parameters n en p benaderd worden door de normale verdeling met µ = np en σ = √npq

De vraag die zich hierbij stelt, is : ‘Wat bedoelen we met n voldoende groot ?’

In de praktijk wordt de binomiale verdeling vervangen door een normale zodra n ⩾ 20 en np ⩾ 5 en nq ⩾ 5.

100
70% 60% 50% 40% 30% 20% 10% 0% 01243 5 n = 5, p = 0,1 40% 35% 30% 25% 20% 15% 10% 5% 0% 01243 5 n = 5, p = 0,3 35% 30% 25% 20% 15% 10% 5% 0% 01243 5 n = 5, p = 0,5 30% 25% 20% 15% 10% 5% 0% 05101520 n = 20, p = 0,1 25% 20% 15% 10% 5% 0% 05101520 n = 20, p = 0,3 20% 15% 10% 5% 0% 05101520 n = 20, p = 0,5 18% 16% 14% 12% 10% 8% 6% 4% 2% 0% 0102030405060 n = 60, p = 0,1 12% 10% 8% 6% 4% 2% 0% 0102030405060 n = 60, p = 0,3 12% 10% 8% 6% 4% 2% 0% 0102030405060

3 Continuïteitscorrectie

Voorbeeld 1 :

We hernemen voorbeeld 1 van pagina 99, m.a.w. we gooien 100 keer een eerlijk geldstuk op. Hoe groot is de kans op het gooien van meer dan 60 keer munt ?

Omdat n = 100 voldoende groot is en zowel np = 50 > 5 en n ( 1 – p ) = nq = 50 > 5, mogen we deze binomiale

verdeling X ∼B( n = 100, p = 0,5) benaderen door een normale verdeling X ′ ∼N( m = 50, s = 5)

Er bestaat echter nog een essentieel verschil tussen een kansvariabele die binomiaal of normaal verdeeld is. Een binomiale kansvariabele neemt uitsluitend discrete waarden aan, een normale kansvariabele volgt een continue verdeling en kan in principe elke reële waarde uit een interval aannemen.

Zo is de binomiale kans P( X = i ) ( 0 ⩽ i ⩽ n ) meestal niet nul.

De normale kans P( X ′ = i ) is steeds nul omdat bij een continue verdeling de kans op een enkelvoudige gebeurtenis steeds nul is.

P ( X = 7)= P (6,5 X < 7,5)

P ( X > 7)= P ( X 7,5)

P ( X 7)= P ( X 6,5)

P ( X < 7)= P ( X < 6,5)

P ( X 7)= P ( X < 7,5)

De binomiale kans P( X = i ) benader je door de normale kans P( i – 0,5 ⩽ X ′ < i + 0,5) te bepalen.

Analoog benader je : de binomiale kans Pb( X > i ) door de normale kans Pn( X ′ > i + 0,5) en de binomiale kans Pb( X ⩾ i ) door de normale kans Pn( X ′ ⩾ i – 0,5).

De oplossing van voorbeeld 1 met behulp van de normale verdeling wordt :

Pb ( X > 60) ≈ Pn ( X 60,5)= P Z 60,5 50 5 = P (Z 2,1)= 1,79%

Dit is een vrij goede benadering van de oplossing 1,76% die we bekomen hebben door de binomiale verdeling rechtstreeks toe te passen.

Voorbeeld 2 :

Omdat de kans op een enkelvoudige gebeurtenis bij continue variabelen gelijk is aan nul, spelen de gelijkheidstekens in de rechterkolom geen rol.

Deze kleine correctie die noodzakelijk is wanneer een discrete kansvariabele benaderd wordt door een continue kansvariabele, noemen we de continuïteitscorrectie

Hernemen we ook het tweede voorbeeld van pagina 99, dan mogen we hier de binomiale verdeling X ∼B ( n = 680, p = 0,85) benaderen door de normale verdeling X ′ ∼ N( m = 578, s = 9,31) omdat n voldoende groot is en zowel np ⩾ 5 als nq ⩾ 5.

Pb ( X 600)= Pn ( X < 600,5)

= P Z < 600,5 578 9,31

= P (Z < 2,417)

= 99,22%

Dit is een vrij goede benadering van de oplossing 99,35% die we bekomen hebben door de binomiale verdeling rechtstreeks toe te passen.

101 3 Discrete verdelingen
discreet −→ continu

4 Toepassing

Toepassing 1 : bloembollen

Van een bloemensoort is bekend dat 5% van de bollen niet opkomt. De bollen worden verpakt in dozen van 8 stuks met de garantie dat minstens 7 van de 8 bollen zullen opkomen.

a Bereken de kans dat van een doos alle bollen opkomen.

b Bereken de kans dat een aselect gekozen doos de gegarandeerde eigenschap niet heeft.

c Een handelaar levert ook maxidozen die 160 bollen bevatten. Hij garandeert dat minstens 150 van de 160 bollen opkomen. Bereken de kans dat bij een willekeurige maxidoos de garantie niet wordt gehaald.

Oplossing :

a Als X de kansvariabele ‘het aantal opgekomen bollen’ is, dan is X binomiaal verdeeld met n = 8 en p = 0,95.

Het gevraagde is gelijkwaardig met P ( X = 8)= 8 8 (0,95)8 (0,05)0 = 66,34%

b Een doos heeft de gegarandeerde eigenschap niet als P( X < 7).

P ( X < 7)= 1 P ( X 7)

= 1 (P ( X = 7)+ P ( X = 8))

= 1 8 7 (0,95)7 (0,05)1 8 8 (0,95)8 (0,05)0

= 1 0,27933 0,66342

= 5,7%

c n = 160 is voldoende groot, daarbij is np = 152 > 5 en nq = 8 > 5. We mogen dus de binomiale kansvariabele X ∼B( n = 160, p = 0,95) benaderen door de normale X ∼N( m = 152, s = 2,757).

P ( X < 150)= 1 P ( X < 149,5)

= P Z < 149,5 152 2,757

= P (Z < 0,9068)

= 18,23%

102

Toepassing 2: Pinguïn-roomijs IJsproducent Pinguïn produceert 2,94 miljoen hoorntjes roomijs. De hoeveelheid ijs die in een hoorntje gedaan wordt, is bij benadering normaal verdeeld. Op de verpakking staat dat het 125 ml ijs bevat. In werkelijkheid zal dat zelden exact 125 ml zijn.

Pinguïn stelt het vulgemiddelde van de vulmachine in op 129,8 ml zodat er gemiddeld dus 129,8 ml ijs in de hoorntjes terechtkomt. De standaardafwijking van de hoeveelheid ijs die in de hoorntjes terechtkomt is 2,2 ml.

a Bereken hoeveel hoorntjes er naar verwachting tussen 124 en 126 ml ijs bevatten. Geef je antwoord in duizenden hoorntjes nauwkeurig.

Oplossing : X ∼N( m = 129,8 ml, s = 2,2 ml)

P( 124 < X < 126) = 0,037869

0,037869 ⋅ 2 940 000 = 111 335

Nederlandse centrale staatsexamens, VWO B1 2005-11

Antwoord : 111,3 duizend hoorntjes zullen tussen de 124 en 126 ml ijs bevatten.

Als Pinguïn het vulgemiddelde zou instellen op 125 ml, dan zou de helft van de hoorntjes minder dan 125 ml ijs bevatten. De overheid eist echter dat hooguit 5% van de hoorntjes minder dan 125 ml ijs bevat.

b Toon aan dat Pinguïn met zijn instelling van de vulmachine aan de eis van de overheid voldoet.

Oplossing : P( X < 125) = 0,01456 = 1,46%

Antwoord : 1,46% < 5%. Daarmee wordt aan de eis van de overheid voldaan.

Pinguïn kan zijn vulgemiddelde lager instellen en toch aan de eis van de overheid blijven voldoen. Bij elk lager vulgemiddelde blijft de standaardafwijking 2,2 ml. Het instellen van zo’n lager vulgemiddelde levert bij 2,94 miljoen hoorntjes een aardige besparing op aan de hoeveelheid roomijs die ze moeten produceren. De productiekosten van het roomijs bedragen 0,73 euro per liter.

c Bereken hoeveel euro Pinguïn maximaal kan besparen.

Oplossing : X ∼ N (µ = ?, σ = 2,2ml)

P ( X < 125)= 5%

P Z < 125 µ σ = 0,05

125 µ 2,2 = 1,644 µ = 128,62

De winst bedraagt : (129,8 ml – 128,62 ml) 2 940 000 = 3 469 200 ml = 3469,2 l

In euro uitgedrukt : 3469,2 ⋅ 0,73 = 2532,52

Antwoord : De firma kan maximaal 2532,52 euro besparen.

103 3 Discrete verdelingen

5 Centrale limietstelling (CLS)

De benadering van de binomiale verdeling door een normale verdeling als n voldoende groot is, is eigenlijk de toepassing van een belangrijke stelling uit de statistiek : de centrale limietstelling. Die stelling luidt als volgt :

centrale limietstelling

Voor n gegeven kansvariabelen X 1, X 2, … , X n die onderling onafhankelijk zijn en dezelfde verdeling volgen elk met hun eigen gemiddelde mi en standaardafwijking si , geldt wanneer n voldoende groot is.

enook

Die benadering werd ontdekt in 1718 door Abraham de Moivre (1667–1754) voor p = 0,5. De stelling zelf werd bewezen door Pierre-Simon Laplace (1749–1827) en in 1812 gepubliceerd en is beter bekend als de stelling van Lindeberg–Lévy.

Toepassing :

10 752 leerlingen deden onlangs mee aan een Vlaamse wiskundewedstrijd. Hun resultaten (op 150) vind je terug in onderstaand staafdiagram. De gemiddelde score bedroeg 78 punten met een standaardafwijking van 17 punten.

2030405060708090100110120130140150

Omdat de individuele score van een leerling op zo’n wedstrijd afhangt van zoveel factoren (intelligentie, geziene leerstof, emotionele toestand van het ogenblik …) kunnen we uit de centrale limietstelling besluiten dat alle scores van alle deelnemers aan de wiskundewedstrijd normaal verdeeld zullen zijn met hetzelfde gemiddelde en dezelfde standaardafwijking.

Taak :

Neem een willekeurig eindrapport van de VWO en ga na of de grafiek van de scores van de deelnemers inderdaad jaar na jaar een normale verdeling volgt.

104
X normaalverdeeldmet µ = n i = 1 µi σ = n i = 1 σ 2 i
Als X = X 1 + X 2 + ... + X n danis
X
1 n ( X 1 + X 2 + + X n ) danis X normaalverdeeldmet µ = 1 n n i = 1 µi σ = 1 n n i = 1 σ 2 i
Als
=
100 0 200 400 600 800 1000 1200 1400

6 Steekproevenverdeling

Om informatie over een onbekende populatie te krijgen, moet je steekproeven trekken. Elke steekproef levert je informatie over de onbekende populatie. Zo kun je van elke steekproef die je genomen hebt het steekproefgemiddelde en de standaardafwijking berekenen. Als je steekproeven neemt van gelijke grootte en bijvoorbeeld van elke genomen steekproef het gemiddelde berekent, dan vormen die gemiddelden een steekproevenverdeling. Die steekproevenverdeling is, als je voldoende steekproeven neemt wegens de centrale limietstelling, normaal verdeeld.

Voorbeeld :

Gegeven is de verzameling van de eerste 1000 natuurlijke getallen. We doen hieruit 30 aselecte trekkingen van 40 getallen en bepalen hiervan steeds het gemiddelde.

Trekking 1 :

We vinden voor de waarden van de dertig gemiddelden:

We stellen die gemiddelden voor op een QQ-plot.

We stellen vast dat de steekproefgemiddelden inderdaad normaal verdeeld zijn.

105 3 Discrete verdelingen
518,1 472,8 515,3 468,6 469,4 499,0 587,2 446,8 540,5 515,2 529,5 460,1 523,1 595,6 494,0 509,3 461,7 457,9 538,3 471,7 487,4 464,7 535,2 546,0 488,0 593,3 472,1 506,5 505,8 515,5

7

Samenvatting

• Je kent de eigenschap i.v.m. de benadering van een binomiale verdeling door een normale verdeling. Als n voldoende groot is, dan mag de binomiale verdeling met parameters n en p benaderd worden door de normale verdeling met µ = np en σ = √npq (In de praktijk wordt de binomiale verdeling vervangen door een normale zodra n ⩾ 20 en np ⩾ 5 en nq ⩾ 5.)

• Je weet wat een continuïteitscorrectie is.

De continuïteitscorrectie is de kleine correctie die noodzakelijk is wanneer een discrete kansvariabele benaderd wordt door een continue kansvariabele.

• Je kent de centrale limietstelling.

Voor n gegeven kansvariabelen X 1, X 2, … , X n die onderling onafhankelijk zijn en dezelfde verdeling volgen elk met hun eigen gemiddelde mi en standaardafwijking si , geldt wanneer n voldoende groot is.

Als X = X 1 + X 2 + + X n danis X normaalverdeeldmet µ =

enook

Als X = 1 n ( X 1 + X 2 + ... + X n ) danis X normaalverdeeldmet

• Je kunt voor een voldoende grote steekproefgrootte een steekproevenverdeling benaderen door een normaalverdeling door middel van de centrale limietstelling.

Jarl Waldemar Lindeberg (Helsinki 1876 –1932) en Paul Lévy (Parijs 1886 – 1971)

Net zoals pakweg de methode van Gauss-Jordan wordt de centrale limietstelling vooral gelinkt aan twee wiskundigen : Jarl Lindeberg en Paul Lévy (zelfs al waren nog andere collega’s erbij betrokken, zoals Bernstein en Kolmogorov).

Jarl Lindeberg werd in een onderwijsfamilie geboren en had al op jonge leeftijd een talent voor wiskunde.

Zijn loopbaan speelde zich volledig af in de universiteit van Helsinki: eerst studeerde hij er, daarna werd hij er prof. Hij publiceerde er al in 1920 zijn eerste werk over de centrale limietstelling. Na Lindebergs dood wist de Zweedse wiskundige Harald Cramér een leuke anekdote te vertellen over zijn vriend en de mooie boerderij die hij bezat : als aan Lindeberg gevraagd werd waarom hij zo weinig met wetenschap bezig was, zei hij dat hij eigenlijk landbouwer was; als gevraagd werd waarom zijn boerderij er wat verwaarloosd bij lag, was zijn antwoord dat professor zijn een echte job was …

Paul Lévy was de man die als eerste een volledig bewijs publiceerde van de veralgemeende centrale limietstelling, dat gebeurde in 1937. Ook hij werd in een (wiskundige) onderwijsfamilie geboren. Hij kwam in de École Polytechnique in Parijs terecht, waar hij een reeks proefschriften uitbracht. Als hij er in 1920 professor werd, kwam hij in aanraking met kansrekening, waarmee hij vooral bekend zou worden.

106
n i = 1 µi σ = n i = 1 σ
i
2
= 1 n n i = 1 µi σ = 1 n n i = 1 σ 2 i
µ

8 Oefeningen

Opmerking vooraf :

Ga bij elke opgave na of n voldoende groot is om de binomiale verdeling te mogen benaderen door een normale verdeling.

Je kunt de opgave dan op twee manieren oplossen : eenmaal als binomiale (met ICT) en eenmaal als een normale benadering van de binomiale met continuïteitscorrectie.

Een autobuslijn loopt over 12 kruispunten waar verkeerslichten zijn geplaatst. Als we aannemen dat de kans om bij groen licht aan te komen 45% bedraagt, bereken dan de kans om 0, 1, 2, … , 12 maal groen licht te hebben.

Maak de berekening zowel met de binomiale verdeling als de normale verdeling.

Een partij goederen bevat volgens de garantiebepalingen van de fabrikant hoogstens 2% defecte exemplaren. Hoe groot is de kans op meer dan 100 defecte exemplaren in een steekproef van 4000 stuks ?

Een machine vervaardigt 10% af te keuren stukken. Bereken de kans dat in een steekproef van 300 stuks er :

a hoogstens 25 af te keuren stukken zijn ; b tussen de 30 en de 40 af te keuren stukken zijn ; c 50 of meer af te keuren stukken zijn.

Kristallen wijnglazen zijn per 400 verpakt in een houten kist. Gemiddeld zijn er bij het uitpakken 0,6% gebroken. Bereken de kans dat in een kist minder dan 2 glazen gebroken zijn.

Een fabriek produceert 12 000 microchips per dag. Ze worden in dozen van 80 stuks aan de groothandel verkocht. Uit ondervinding weet de fabriek dat er dagelijks 480 chips geproduceerd worden met een defect.

a Bepaal de kans dat een levering van 4 dozen aan een groothandelaar hoogstens 10 defecte chips bevat.

b Wanneer bij doorverkoop aan de kleinhandel de chips per acht verkocht worden, wat is dan de kans dat er minstens 1 chip defect is ?

3 107 Discrete verdelingen
1 2 3 4 5

In een wetenschappelijke bibliotheek is de dikte van de boeken normaal verdeeld met m = 2,5 cm en s = 0,4 cm. Bereken de kans dat :

a de dikte van een boek tussen 2 cm en 3 cm ligt ; b er op 6 boeken minstens 3 en hoogstens 5 boeken dikker zijn dan 2 cm ; c er op 40 boeken minstens de helft dikker is dan 2 cm.

Appelen worden verpakt in kisten van 250 stuks.

a Als uit ondervinding geweten is dat er 15% uitval is, bereken dan de kans dat een kist minstens 40 slechte appelen bevat.

b Nog steeds in de veronderstelling dat er 15% uitval is, bereken dan de kans dat als er vijf willekeurige kisten gecontroleerd worden, juist twee kisten elk minstens 40 slechte appelen bevatten.

Als we uit een partij computeronderdelen er 150 aan een test onderwerpen, hoe groot is dan de kans om meer dan 27 en minder dan 36 uitvallers aan te treffen als bekend is dat de partij 3 uitvallers op elke 10 onderdelen bevat ?

De massa van een snoepje is normaal verdeeld met gemiddelde waarde 4 gram en standaarddeviatie 0,5 gram.

a Bepaal de kans dat een zakje van 50 snoepjes minder weegt dan 190 gram. Het zakje zelf weegt 4 gram.

b Bepaal de kans dat er op 10 snoepjes juist 6 zijn waarvan de massa ligt tussen 3,8 gram en 4,2 gram.

c Bepaal benaderend de kans dat er op 100 snoepjes minstens 37 en hoogstens 57 zijn waarvan de massa begrepen is tussen 3,8 en 4,2 gram.

Bij het overseinen van een bericht in morse is de kans dat een teken goed ontvangen wordt 95%.

a Hoe groot is de kans dat een woord van 6 tekens goed wordt ontvangen ?

b Hoe groot is de kans dat een bericht van 300 tekens meer dan 10 foute tekens bevat ?

c Hoe groot is de kans dat van 50 woorden van 6 tekens meer dan 10 woorden niet goed ontvangen zijn ?

De plaatselijke hobbyclub organiseert een uitstapje naar zee en huurt een bus met 64 zitplaatsen. De club telt 85 leden en uit ervaring weten ze dat de kans dat iemand meegaat op uitstap 65% is. Bereken de kans dat je zitplaatsen te kort hebt.

Onder alle personen die een plaats reserveren bij een vliegtuigmaatschappij komen er 4% niet opdagen.

De maatschappij weet dat en verkoopt 154 tickets voor 150 plaatsen. Hoe groot is de kans dat alle passagiers een plaats hebben ?

Los de oefening op door middel van de normale verdeling, maar toon eerst aan dat de normale verdeling hier als benadering van de binomiale verdeling gebruikt mag worden.

108
6 7 8
9 10 11 12

De ervaring heeft geleerd dat de kans dat een chauffeur van een stadsbus betrokken raakt bij minstens één verkeersongeval binnen het komende jaar 0,2 is. Een verzekeringsmaatschappij verzekert 100 buschauffeurs. Hoeveel is de kans dat minder dan 25 van die 100 verzekerden in het komende jaar betrokken raken bij minstens één ongeval ? Los de oefening op door middel van de normale verdeling, maar toon eerst aan dat de normale verdeling hier als benadering van de binomiale verdeling gebruikt mag worden.

Bij ruim 30% van de auto’s zijn de remmen niet juist afgesteld. Wat is de kans dat bij een controle van 250 wagens meer dan 85 wagens worden aangetroffen met slecht afgestelde remmen ?

Los de oefening op door middel van de normale verdeling.

De kans dat een persoon na vaccinatie immuun is, bedraagt 90%. Wat is de kans dat na vaccinatie van 500 personen er meer dan 460 immuun zijn ?

Los de oefening eerst op m.b.v. de binomiale verdeling en daarna m.b.v. de normale verdeling.

Een veestapel van 150 dieren is blootgesteld aan een infectie. De veearts weet uit ervaring dat een dier in dit geval een kans van 0,4 heeft om ziek te worden. Bereken de kans dat meer dan de helft van de dieren ziek wordt. Los de oefening eerst op m.b.v. de binomiale verdeling en daarna m.b.v. de normale verdeling.

De kans dat iemand nevenreacties krijgt bij een bepaald geneesmiddel is 0,001. Indien het geneesmiddel toegediend wordt aan 5000 personen, zoek dan de kans dat : a juist 10 personen nevenreacties zullen vertonen (m.b.v. de binomiale verdeling) ; b meer dan 10 personen nevenreacties zullen vertonen (m.b.v. de normale verdeling).

Simuleer 35 aselecte steekproeven uit een normale verdeling met gemiddelde 210 en standaardafwijking 8. Bereken van elke steekproef het gemiddelde en stel die gemiddelden voor op een QQ-plot.

3 109 Discrete verdelingen
13 14 15 16 17 18

21

Oefeningen uit de Nederlandse centrale staatsexamens bron : alleexamens.nl

Ter gelegenheid van een jubileum organiseert een grote universiteit een loterij. Elke student krijgt één lot. Er vinden twee trekkingen plaats. Bij de eerste trekking wordt bepaald op welke nummers een hoofdprijs van 500 euro valt. Die nummers worden teruggedaan en uit het totaal worden vervolgens de nummers getrokken waarop een troostprijs van 100 euro valt. Op 5% van de loten valt een prijs van 500 euro en op 20% van de loten een prijs van 100 euro. Op één lot kan dus zowel een hoofd- als een troostprijs vallen.

Thomas is een van de studenten die zo’n lot gekregen heeft.

a Bereken de kans dat Thomas minstens één prijs wint.

Een studentenvereniging bestaande uit 20 studenten spreekt af dat ieder lid het gewonnen prijzengeld in de clubkas stort. Aan het eind van het studiejaar zal er dan een activiteit georganiseerd worden die betaald wordt met het prijzengeld.

b Bereken de kans dat minstens acht leden van de studentenvereniging in de prijzen vallen.

c Bereken hoeveel prijzengeld de studentenvereniging bij de twee trekkingen naar verwachting zal winnen.

VWO B1 2003-II

Een transportonderneming brengt elke dag over een vast traject verse vlaaien van Limburg naar Twente.

De tijd die daarvoor nodig is, is normaal verdeeld met een gemiddelde van 2,5 uur en een standaardafwijking van een kwartier.

De vlaaien moeten om half negen afgeleverd zijn.

Enerzijds wil de directeur de loonkosten van de chauffeur beperken door hem niet te vroeg te laten vertrekken. Anderzijds kan de directeur zich niet permitteren om op meer dan 5% van de dagen de vlaaien te laat af te leveren.

a Bereken, in minuten nauwkeurig, hoe laat de chauffeur moet vertrekken.

Op zijn dagelijkse ritten is het de chauffeur opgevallen dat er door veel automobilisten veel te hard gereden wordt op de stukken waar de maximumsnelheid van 120 km per uur geldt. Hij is er dan ook niet verbaasd over dat bij een controle blijkt dat 13% van de automobilisten harder rijdt dan 137 km per uur. Neem aan dat de gereden snelheid normaal verdeeld is met een gemiddelde snelheid van 126 km per uur.

b Bereken hoeveel procent van de automobilisten zich aan de maximumsnelheid houdt.

VWO B1 2003-II

Het gewicht van volwassen Nederlanders is bij benadering normaal verdeeld met gemiddelde 76 kg en standaardafwijking 10 kg. Bij een onderzoek worden 1200 personen gewogen.

a Bereken de verwachtingswaarde van het aantal proefpersonen met een gewicht tussen 66 en 86 kg.

b Bereken de kans dat van twee willekeurig gekozen personen er één zwaarder is dan 82 kg en één lichter dan 82 kg.

VWO B1 2005-I

110
19 20

De diameter van de verschillende euromunten is normaal verdeeld.

Zo hebben de munten van 1 euro een gemiddelde diameter van 23,25 mm met een standaardafwijking van 0,10 mm.

a Bereken hoeveel procent van de munten van 1 euro een diameter heeft van meer dan 23,40 mm.

De diameter van de munt van 2 euro is gemiddeld 25,75 mm.

Een automaat is zo nauwkeurig afgesteld dat een munt van 2 euro wordt geweigerd als die meer dan 0,40 mm van het gemiddelde afwijkt. In de automaat worden 10 000 willekeurige munten van 2 euro gedaan.

De automaat weigert daarvan 3 munten met een te kleine diameter en ook 3 munten met een te grote diameter.

b Bereken op grond van deze gegevens de standaardafwijking van de diameter van de munt van 2 euro. Geef je antwoord in 2 decimalen.

HAVO A 2003-II

In een datingshow op televisie maken drie jongens (Richard, Sander en Tim) en drie meisjes (Kathy, Lisa en Maaike) kennis met elkaar. Tijdens de show geven ze antwoord op allerlei vragen van de presentator. Op die manier komen ze iets over elkaar te weten. Na beantwoording van de vragen kiest elke jongen één meisje en elk meisje één jongen, zonder te laten zien wie ze kiezen. Na afloop worden de keuzes bekendgemaakt en wanneer een jongen en een meisje elkaar hebben gekozen, hebben ze een kort, luxueus reisje gewonnen om elkaar (nog) beter te leren kennen. In deze opgave gaan we ervan uit dat de jongens en de meisjes willekeurig kiezen, dus ieder heeft een even grote kans om gekozen te worden. Dan is de kans dat een jongen een bepaald meisje kiest dus 1 3 . Maaike is bang dat alle televisiekijkers zien dat ze door niemand wordt gekozen. Ze vraagt zich af hoe groot de kans is dat minstens een van de drie jongens haar kiest.

a Bereken deze kans.

De organisator van de datingshow moet de kosten van de show in de gaten houden. De luxueuze reisjes zijn erg duur. Toch is het mogelijk dat er in de show drie reisjes worden gewonnen, omdat er drie ‘stelletjes’ zijn die elkaar gekozen hebben. Dat kan op verschillende manieren gebeuren. Eén daarvan is : Richard en Kathy kiezen elkaar, Sander en Lisa kiezen elkaar en Tim en Maaike kiezen elkaar.

b Schrijf alle mogelijke manieren op waarbij er precies drie stelletjes gevormd worden.

Het kost de organisatie elke keer 4000 euro wanneer er door een stelletje een reisje wordt gewonnen. Je kunt berekenen hoe groot de kans is dat er in de show stelletjes worden gekozen.

c Bereken deze kansen :

aantal stelletjes 0 1 2 3 kans

d Bereken de verwachtingswaarde van het bedrag dat de organisatie per show kwijt is aan reisjes.

Het is gunstig voor de kijkcijfers als er in elke show één of meer stelletjes worden gevormd. In de tabel hierboven zie je dat dit niet altijd het geval is.

e Bereken de kans dat in de eerste drie shows van het seizoen in totaal slechts één stelletje wordt gevormd.

HAVO A 2009-I

3 111 Discrete verdelingen
22 23

In een fabriek worden plastic zakken gevuld met suiker. De vulmachine staat afgesteld op 510 gram. Neem aan dat het gewicht van de zakken suiker normaal verdeeld is met een gemiddelde van 510 gram en een standaardafwijking van 4 gram.

a Bereken hoeveel procent van alle zakken een gewicht minder dan 500 gram zal hebben.

Om de kwaliteit van het vulproces te bewaken, wordt elk uur een aselecte steekproef van 5 zakken suiker genomen. Van deze steekproef wordt het totale gewicht berekend.

b Bereken de kans dat het totale gewicht van de steekproef minder is dan 2525 gram.

De bij de controles gebruikte zakken worden in een bak gelegd om ze later met de hand in dozen te verpakken.

Aan het eind van een dag liggen er 50 zakken in de bak. Daarvan hebben er 30 een Nederlandse opdruk en 20 een Arabische opdruk (bestemd voor de export).

Een werknemer zet twee dozen voor zich, een voor de Nederlandse zakken en een voor de Arabische. In elke doos passen 10 zakken. Hij pakt telkens aselect een zak uit de bak en doet die in de goede doos. Zodra hij een doos vol heeft, plakt hij die dicht en neemt hij zo nodig een nieuwe.

c Bereken de kans dat hij na 10 zakken al een doos vol heeft.

VWO A(bezem) 2001-I

Een restaurant van een warenhuis bestelt een grote partij perssinaasappels voor de bereiding van vers fruitsap. De sinaasappels worden aangevoerd in volle dozen van 50 stuks.

De ervaring leert dat ongeveer een van de honderd sinaasappels beschimmeld is.

M.a.w. je mag ervan uitgaan dat de kans op een beschimmelde sinaasappel 0,01 is.

Voor een groot glas fruitsap zijn drie sinaasappels nodig. Een medewerker neemt aselect drie sinaasappels.

a Bereken de kans dat er precies één beschimmelde sinaasappel bij zit.

b Bereken de kans dat er in een doos geen enkele beschimmelde sinaasappel zit.

Bij een kwaliteitscontrole worden vijf volle dozen sinaasappels gecontroleerd. Een doos is ‘in orde’ als er geen enkele beschimmelde sinaasappel in zit. Als vier of vijf van de dozen niet in orde zijn, wordt de partij afgekeurd.

c Bereken de kans dat de partij wordt afgekeurd.

Een sinaasappel levert na het persen gemiddeld 8 cl sap op. De hoeveelheid sap per sinaasappel is normaal verdeeld met een standaardafwijking van 1,5 cl.

d Bereken hoeveel procent van de sinaasappels in een volle doos een hoeveelheid sap geeft die minder dan 1 cl van het gemiddelde afwijkt.

HAVO B1 2001-I

112
24

Pringles zijn vooral een succes geworden door de beroemde koker waarin je de chips wel vijftien maanden kunt bewaren. Pringles worden onder andere verkocht in kokers van 88 stuks. Op de verpakking staat dat er 165 gram in zit.

De chips wegen per stuk natuurlijk niet allemaal precies hetzelfde. We nemen aan dat het gewicht van een Pringles-chip normaal verdeeld is met een gemiddeld gewicht van 1,89 gram en een standaardafwijking van 0,06 gram. Deze chips moeten volgens de producent een bepaald minimumgewicht hebben. Toch kan het gebeuren dat geproduceerde chips lichter zijn dan het minimumgewicht. Dat te lichte deel vormt 0,2% van het geproduceerde totaal.

a Bereken het minimumgewicht dat een chip volgens de producent moet hebben.

Ook van het merk Lay’s worden chips in kokers gedaan. In Shanghai worden kokers verkocht waarin 92 stuks zitten en waarbij op de verpakking een inhoud van 180 gram staat. Het gewicht van een Lay’s-chip is ook normaal verdeeld. Een Lay’s-chip weegt gemiddeld 1,97 gram met een standaardafwijking van 0,08 gram. Ongeveer 35% van de Lay’s-chips weegt meer dan 2 gram. Iemand beweert dat het percentage Pringles-chips die meer dan 2 gram wegen meer dan tien keer zo klein is als het percentage Lay’s-chips die meer dan 2 gram wegen.

b Onderzoek met een berekening of deze bewering juist is.

Zowel bij een koker Pringles als bij een koker Lay’s kan het gebeuren dat de inhoud minder weegt dan het aantal gram dat op de verpakking staat.

c Bereken van welk merk de kans daarop het kleinst is.

VWO A 2014-I

In de oceanen leven tot een diepte van zo’n 100 meter lantaarnvisjes. Ze worden zo genoemd vanwege hun lichtuitstraling waarmee ze elkaar op grote diepte in het donker kunnen herkennen. Bij een bepaalde soort lantaarnvisjes is de lengte van volwassen exemplaren bij benadering normaal verdeeld met een gemiddelde van 5,50 cm en een standaardafwijking van 0,45 cm.

a Bereken hoe lang een volwassen lantaarnvisje dat bij de 10% langste volwassen lantaarnvisjes van deze soort hoort, minimaal is.

b Bereken hoeveel procent van de volwassen lantaarnvisjes van deze soort een lengte heeft die minder dan 20% afwijkt van de gemiddelde lengte.

In de oceanen drijven veel plastics rond. In deze plastics zitten giftige stoffen die een bedreiging vormen voor het milieu omdat ze in de voedselketen terecht kunnen komen. De meeste plastics vergaan namelijk niet, maar vallen uiteen in ragfijne stukjes. Deze niet-afbreekbare stukjes plastic kunnen via het plankton in de maag van de lantaarnvisjes terechtkomen. Uit onderzoek is gebleken dat 35% van de lantaarnvisjes plastic in hun maag heeft. Er worden 500 lantaarnvisjes gevangen.

c Bereken de kans dat minstens 170 van die lantaarnvisjes plastic in hun maag hebben.

HAVO A 2013-I

3 113 Discrete verdelingen
26 27

Halverwege het jaar 2010 werd in Nederland besloten om de maximumsnelheid op de snelweg – waar dat mogelijk is – te verhogen van 120 naar 130 km per uur. Er kwam kritiek op het besluit. In de Nederlandse media werd gemeld dat bij een verhoging naar 130 km per uur automobilisten pas bij 139 km per uur een boete zouden krijgen. De meetapparatuur van de verkeerspolitie kan de snelheid van een auto niet exact meten. Daarom wordt een foutmarge gehanteerd.

Stel dat een automobilist rijdt met een snelheid van v km per uur. De snelheid die dan gemeten wordt, is bij benadering normaal verdeeld met een gemiddelde van v km per uur en een standaardafwijking van 0,0095 v km per uur.

De kans dat iemand ten onrechte een boete krijgt waar een maximum van 130 km per uur geldt, moet heel klein zijn, namelijk maximaal 0,0001. Stel dat iemand 130 km per uur rijdt. De standaardafwijking van de gemeten snelheid is dan 1,235.

a Bereken vanaf welke snelheid een boete gegeven wordt.

In werkelijkheid wordt op wegen met een maximumsnelheid van 130 km per uur de boete pas bij een gemeten snelheid van 139 km per uur gegeven. Van 20 automobilisten die allemaal precies 138 km per uur rijden, waar de maximumsnelheid 130 km per uur is, wordt onafhankelijk van elkaar de snelheid gemeten.

b Bereken hoeveel van hen naar verwachting een boete zullen krijgen.

Om op zijn werk te komen, rijdt Johan een stuk over de A32 waar een maximumsnelheid van 130 km per uur geldt. Op dat stuk rijdt hij altijd 139 km per uur omdat hij denkt dat hij dan nog geen boete zal krijgen. Ga ervan uit dat de kans dat een automobilist bij 139 km per uur op deze weg een boete krijgt bij een snelheidsmeting 0,5 is.

De afgelopen 10 werkdagen is zijn snelheid elke dag één keer gemeten.

c Bereken de kans dat dit minder dan 5 boetes op zal leveren.

HAVO A 2013-II

114
28

In 2013 was er een onderzoek naar de woordenschat van mensen in Nederland en Vlaanderen. Iedereen kon meedoen met het onderzoek door een test te doen op internet. Bij deze test kreeg een deelnemer 100 willekeurig gekozen woorden te zien uit een lijst van 50 000 bestaande Nederlandse woorden en 20 000 door de onderzoekers verzonnen 'nepwoorden'. Van elk woord moest worden aangegeven of het een bestaand woord is of niet. Het aantal nepwoorden in een test is (bij benadering) binomiaal verdeeld. Marieke heeft de test gedaan.

In haar test zaten 37 nepwoorden.

a Bereken de kans dat in een test van 100 woorden 37 of meer nepwoorden voorkomen.

Na afloop van de test wordt een score toegekend. Hiervoor worden volgende zaken berekend :

• het percentage bestaande woorden dat de deelnemer (terecht) als bestaand aanmerkt ; dat percentage, afgerond op gehelen, noemen we A;

• het percentage nepwoorden dat de deelnemer (ten onrechte) als bestaand aanmerkt; dat percentage, afgerond op gehelen, noemen we B.

• Vervolgens geldt : score = A – B.

Bij haar test van totaal 100 woorden heeft Marieke van de bestaande woorden in de test er 56 herkend. Van de 37 nepwoorden heeft ze er 5 ten onrechte als bestaand bestempeld.

b Laat met een berekening zien dat Marieke een score van 75 had voor de test.

Eind oktober 2013 was de test 572 146 keer gemaakt door 368 798 verschillende deelnemers. Er waren dus (flink wat) deelnemers die de test meer dan eens gedaan hadden. Uit onderzoek bleek dat de deelnemers in drie groepen verdeeld konden worden :

• de proevers : deze deelnemers maakten de test één keer ;

• de ambitieuzen : deze deelnemers maakten de test 2–10 keer ;

• de doorzetters : deze deelnemers maakten de test meer dan 10 keer.

De verdeling van deze groepen over het totale aantal deelnemers was : proevers 76%, ambitieuzen 21% en doorzetters 3%.

Voor een vervolgonderzoek worden willekeurig 15 van die 368 798 deelnemers gekozen.

c Bereken de kans dat die groep 2, 3 of 4 ambitieuzen bevat.

A 2015-II

Een bedrijf produceert plastic verpakkingsmateriaal. Daar wordt onder andere buisfolie gemaakt. Buisfolie wordt verwerkt tot plastic zakken. Bij de productie van de buisfoliezakken moet de breedte binnen nauwe grenzen blijven.

De streefwaarde is 715 mm.

Om het risico te beperken dat de zakken te smal zijn, wordt de gemiddelde breedte ingesteld op 715,6 mm.

Neem aan dat de breedte normaal verdeeld is met s = 0,5 mm.

Bij de productie van buisfoliezakken voor een bepaalde afnemer is vastgelegd dat het tolerantiegebied het gebied is waar de breedte van de zakken maximaal 1 mm van de streefwaarde van 715 mm afwijkt.

a Bereken het percentage van de partij zakken dat buiten dat tolerantiegebied ligt.

Men vindt het productieproces voor een andere afnemer van buisfoliezakken acceptabel als hoogstens 2,5% van de zakken breder is dan 716 mm. Hiervoor moet de standaardafwijking wel veranderen. Het is mogelijk de machine zo in te stellen dat de gemiddelde breedte niet verandert maar de standaardafwijking wel.

b Bereken op welke waarde de standaardafwijking moet worden ingesteld.

3 115 Discrete
verdelingen
VWO
29 30

Bij het bedrijf komt het verzoek binnen om een spoedorder te verwerken van 23 750 kg buisfolie. Die bestelling moet binnen een week geleverd worden.

Op basis van eerdere gegevens gaat de leiding ervan uit dat het gewicht in kg van de buisfolie die per week geproduceerd wordt normaal verdeeld is met µ = 28 000 en σ = 3300.

c Toon hiermee aan dat de kans dat het bedrijf de weekproductie van 23 750 kg niet haalt ongeveer 9,9% is.

Er bestaat dus een kans van 9,9% dat het bedrijf de weekproductie niet haalt. Het bedrijf kan zodoende met 90,1% zekerheid de spoedorder uitvoeren.

Voor die spoedorder van 23 750 kg buisfolie wordt een prijs van € 2,15 per kg gerekend als die binnen die week geleverd wordt. Als dat echter niet lukt, dan haakt de klant af en kan het bedrijf een boete van € 50 000 verwachten. De partij buisfolie kan dan nog wel te zijner tijd afgemaakt worden en aan een andere klant worden verkocht voor € 0,50 per kg.

Het is nu de taak van het management om de risico’s af te wegen en een keuze te maken of ze deze spoedorder al dan niet zullen accepteren.

d Bereken de verwachtingswaarde van de opbrengst voor het bedrijf als ze de spoedorder accepteren.

VWO A 2016-II

Je zou het misschien niet denken, maar 60 jaar geleden had nog nooit iemand van de frikandel gehoord. In Nederland werd hoogstens een knakworst gegeten voor de lekkere trek. Jan Beckers uit België bracht daar in 1959 verandering in. Hij ontwikkelde een soort langwerpige gehaktbal die tijdens het frituren niet uit elkaar viel : de frikandel. Als ingrediënten gebruikte hij een nog altijd geheime mix van kippen- en varkensvlees, specerijen en andere smaakmakers.

De door Beckers ontworpen snack werd een enorm succes. Zijn fabriek produceert ongeveer 1,15 miljoen frikandellen per dag, waarvan de helft is bestemd voor de Nederlandse markt, waar ze zo’n 600 miljoen frikandellen per jaar eten.

a Bereken hoeveel procent van de in Nederland gegeten frikandellen afkomstig is van de fabriek van Beckers.

Wie een frikandel in de snackbar koopt, krijgt hoogstwaarschijnlijk een exemplaar van 18,5 centimeter en 85 gram. Dat is de zogenoemde ‘original’. Het gewicht van die frikandellen is bij benadering normaal verdeeld met een gemiddelde van 85,0 gram en een standaardafwijking van 2,4 gram.

b Bereken hoeveel gram de 10% zwaarste frikandellen minimaal wegen.

Beckers produceert ook wat kleinere frikandellen voor verkoop in de supermarkt. Het gewicht van die frikandellen is ook weer bij benadering normaal verdeeld. Ze wegen gemiddeld 70,0 gram.

Volgens de Warenwet mag slechts 2% van die frikandellen minder dan 65,5 gram wegen.

c Bereken de maximaal toegestane standaardafwijking waarbij aan de eis van de Warenwet wordt voldaan.

In een doos zitten 12 frikandellen. Van die 12 frikandellen zijn er 4 lichter dan 70 gram. Iemand pakt willekeurig 4 frikandellen uit de doos.

d Bereken de kans dat er precies één frikandel lichter dan 70 gram bij dat viertal zit.

HAVO A 2011-II

116
31

Een boomkweker koopt een grote partij jonge sparrenboompjes. Uit onderzoek is bekend dat de lengte van jonge sparrenboompjes bij benadering normaal verdeeld is met een gemiddelde van 25 cm en dat 5% van de boompjes korter is dan 20 cm. De partij jonge sparrenboompjes is te beschouwen als een aselecte steekproef.

a Hoeveel procent van de boompjes is naar verwachting langer dan 30 cm?

b Bereken de standaardafwijking van de lengteverdeling van jonge sparrenboompjes. Geef je antwoord in twee decimalen nauwkeurig.

De kweker neemt steeds aselect 40 boompjes en plant ze in één rij.

c Bereken de kans dat in zo'n rij precies één boompje korter is dan 20 cm. Rond je antwoord af op twee decimalen.

Na een aantal jaren wordt een groot aantal van die sparrenboompjes voor de kerstverkoop gerooid. Je kunt er nu van uitgaan dat de lengte van die partij bomen bij benadering normaal verdeeld is met een gemiddelde van 145 cm en een standaardafwijking van 15 cm.

d Bereken de kans dat een aselect gekozen boom uit die partij een lengte heeft die ligt tussen 140 cm en 170 cm. Rond je antwoord af op twee decimalen.

De bomen worden ingedeeld in twee prijsklassen, namelijk kleine bomen van € 10 per stuk en grote bomen van € 15 per stuk. De kweker wil dat de te verwachten opbrengst per 100 bomen € 1300 is.

e Bereken bij welke lengte de grens tussen de beide prijsklassen dan moet liggen. Rond je antwoord af op hele centimeters.

HAVO B1 2003-I

3 117 Discrete verdelingen
32

Discrete verdelingen 3

Ik weet wat een bernoulli-experiment is en kan hiervan de karakteristieken berekenen.

Ik weet wat een binomiale verdeling is en kan hiervan de karakteristieken berekenen.

Ik kan binomiale verdelingen in concrete situaties toepassen.

Ik weet wat een hypergeometrische verdeling is en kan die in concrete situaties toepassen.

Ik ken het verschil tussen trekkingen met of zonder teruglegging.

Ik kan onder bepaalde voorwaarden binomiale verdelingen benaderen door een normale verdeling.

Ik weet wat continuïteitscorrectie betekent.

Ik ken de betekenis van de centrale limietstelling.

Ik kan een steekproevenverdeling benaderen door een normaalverdeling met de centrale limietstelling.

85

86

88

90

90

100

101

104

105

118 WAT MOET JE KENNEN EN KUNNEN ? pagina

Betrouwbaarheidsintervallen en toetsen van hypothesen

We schakelen even over naar de verkiezingen … Redacties van kranten of tv-zenders houden niet enkel van peilingen voor de verkiezingen maar evenzeer van exitpolls, live opgenomen bij de stemlokalen.

Stel dat bij een peiling aan 2000 Vlamingen gevraagd werd voor welke partij ze zouden stemmen voor het Europees Parlement. Hiervan geven 514 ondervraagden als antwoord ‘partij A’. Dankzij betrouwbaarheidsintervallen kun je berekenen dat er 95% kans is dat tussen de 23,8% en 27,6% van de Vlamingen zal kiezen voor partij A (en zo kun je inschatten wie uiteindelijk deze zitjes in Brussel zal invullen).

4 © European Union 2019 – Source:EP

Betrouwbaarheidsintervallen en toetsen van hypothesen

4.1 Betrouwbaarheidsintervallen

1 Inleiding  121

2 Betrouwbaarheidsinterval voor μ (σ gekend)  122

3 Toepassingen  126

4 Betrouwbaarheidsinterval voor p 128

5 Toepassingen  132

6 Samenvatting  133

7 Oefeningen  134

4.2 Toetsen van hypothesen

1 Inleiding  139

2 Werkwijze  139

3 Eenzijdige of tweezijdige toetsen  142

4 Toetsingsprocedure via grenswaarden  143

5 P-waarde  144

6 Toetsingsprocedure via de P-waarde  145

7 Toepassingen  146

8 Samenvatting  152

9 Oefeningen  155

120
Wat
160 4
moet je kennen en kunnen ?

4.1 Betrouwbaarheidsintervallen

1 Inleiding

Het kernconcept van alle statistische inferentie is immers de steekproefverdeling.

De voorbereidingen uit de voorbije hoofdstukken stellen ons in staat om de belangrijkste taak van een statisticus aan te vatten : uit gegevens van een goede steekproef (EAS) besluiten trekken over de populatie (= inferentie).

Het volgende hoofdstuk behandelt de statistische inferentie : formele methoden voor het trekken van conclusies uit correct geproduceerde gegevens.

Schematisch gesproken wensen we uit het bijzondere veralgemeende uitspraken te maken over het geheel. Onmiddellijk stellen zich verschillende problemen. Hoe kunnen we zinvol te werk gaan ? Wat bepaalt de betrouwbaarheid ? Hoe kunnen we dat kwantitatief meten ?

Het op een geldige wijze veralgemenen van gegevens uit beperkte steekproeven naar grotere populaties is een onmisbaar element in de methodologie van het wetenschappelijk onderzoek.

Er wordt soms beweerd dat je met statistiek alle kanten uit kan, dat niets uitgesloten kan worden. Het antwoord hierop is dat statistiek enkel probeert het gezond verstand te leiden in zaken van onzekerheid.

De statistische inferentie gebruikt de taal van de kansrekening om te beschrijven hoe betrouwbaar de conclusies zijn. Meestal echter wordt de inferentiële statistiek gekenmerkt door een heel eigen problematiek. Het verloop van het volgende deel is dan ook min of meer opgebouwd rond twee fundamentele vragen : hoe bepaal ik een betrouwbaarheidsinterval en hoe kan ik een hypothese testen ?

De methoden van statistische toetsing zijn vooral ontwikkeld door Karl Pearson, Aylmer Fisher, Egon Pearson, Jerzy Neyman en Abraham Wald. Je zal meer vernemen over deze statistici in de historische nota’s van dit hoofdstuk.

121 4 Betrouwbaarheidsintervallen en toetsen van hypothesen

2 Betrouwbaarheidsinterval voor μ (σ gekend)

a Betrouwbaarheidsinterval voor het steekproefgemiddelde x

Inleiding :

Gegeven is een normaal verdeelde toevalsveranderlijke met gemiddelde µ = 220 en standaardafwijking σ = 14.

X ∼ N (µ = 220, σ = 14)

We nemen hieruit een steekproef van 65 stuks en berekenen hiervan het steekproefgemiddelde x .

Wegens de √n -wet kunnen we dit steekproefgemiddelde beschouwen als een enkelvoudige aselecte steekproef (EAS) uit volgende verdeling:

X s ∼ N µ s = µ = 220, σs = σ √n = 14 √65

Gevraagd wordt om een 95%-betrouwbaarheidsinterval rond het gemiddelde µ op te stellen waarbinnen we dit steekproefgemiddelde mogen verwachten. We moeten dus a zodanig bepalen dat :

P (µ a < X s <µ + a )= 95%

Omwille van de symmetrie wordt dat :

P ( X s <µ + a )= 95% + 5% 2 = 97,5%

Omgezet naar de standaardnormale verdeling krijgen we:

= 0,975 P Z < a √n σ = 0,975 a √n σ = 1,96 a = 1,96 σ √n

Besluit :

214216218220222224226 a = 0,95

Als we een steekproef nemen van 65 stuks uit de gegeven normaal verdeelde toevalsveranderlijke, dan hebben we 95% kans dat het steekproefgemiddelde zich bevindt in het interval

µ 1,96 σ √n , µ + 1,96 σ √n = 220 1,96 14 √65 ,220 + 1,96 14 √65 =[216,60;223,40].

Het getal 1,96 hangt samen met de kans, de betrouwbaarheid van het interval en noteren we als z a = z 95% = 1,96.

122
 
σ √
  
P 
Z < µ + a µ
n

Betrouwbaarheidsintervallen en toetsen van hypothesen

Algemeen :

Wanneer we een steekproef nemen van n stuks uit een normaal verdeelde toevalsveranderlijke X ∼ N( µ, σ), dan kunnen we met a% betrouwbaarheid stellen dat het steekproefgemiddelde gelegen is in het interval

Enkele veel gebruikte waarden voor za :

b Simulatie met GeoGebra

Met het commando ToevalsgetalNormaal( µ , σ) kun je in GeoGebra een enkelvoudige aselecte steekproef (EAS) simuleren uit een normaal verdeelde toevalsveranderlijke X ∼ N( µ, σ).

We simuleren een steekproef met grootte 65 uit een normaal verdeelde grootheid X ∼ N( µ = 220, σ = 14), berekenen hiervan het gemiddelde en gaan na of dat gemiddelde zich bevindt in het 95%-betrouwbaarheidsinterval [ 216,6 ; 223,4]

Wanneer je nu op Ctrl-R duwt, wordt alles opnieuw berekend en simuleer je zo een nieuwe steekproef. Je hebt slechts 5% kans of 1 kans op 20 dat het steekproefgemiddelde buiten het betrouwbaarheidsinterval valt.

Merk op dat heel wat enkelvoudige steekproeven wel buiten het betrouwbaarheidsinterval vallen. Kun je dat verklaren ?

123 4
µ z a σ √n , µ + z a σ √n
a 80% 90% 95% 98% 99% za 1,28 1,65 1,96 2,33 2,58

c Betrouwbaarheidsinterval voor het populatiegemiddelde µ

Gegeven is een normaal verdeelde toevalsveranderlijke waarvan we het gemiddelde niet kennen maar wel de standaardafwijking σ

We willen nu via een steekproef (grootte n ) een interval opstellen waarbinnen het populatiegemiddelde zich met een zekere betrouwbaarheid (a %) bevindt.

We weten het volgende : x ∈

Hieruit volgt :

met een betrouwbaarheid van a %.

Conclusie :

Nemen we een steekproef met grootte n uit een normaal verdeelde toevalsveranderlijke waarvan we de standaardafwijking kennen, dan kunnen we met een betrouwbaarheid van a % stellen dat het populatiegemiddelde zich bevindt in het interval

Opmerkingen :

Is de standaardafwijking niet gekend, dan gelden die formules niet. In plaats van de standaardnormale verdeling voor het bepalen van za gebruiken we dan de t -verdeling van student. Maar dat valt buiten het bereik van deze cursus.

100% zeker ben je nooit, de betrouwbaarheid is ‘slechts’ a %. Vandaar ook dat je steeds bij een betrouwbaarheidsinterval het betrouwbaarheidspercentage moet vermelden.

– Een andere steekproef geeft een ander steekproefgemiddelde en dus een ander betrouwbaarheidsinterval. Dat noemen we in de statistiek steekproefvariabiliteit

124
µ z a σ √n , µ
z a σ √n
+
µ z a · σ √n x µ + z a · σ √n z a σ √n x µ z a σ √n z a σ √n µ x z a σ √n z a · σ √n µ x z a · σ √n x z a σ √n µ x + z a σ √n µ ∈ x z a · σ √n , x + z a · σ √n meteenbetrouwbaarheidvan a %
: µ ∈ x z a σ √n , x + z a σ √n

Betrouwbaarheidsintervallen en toetsen van hypothesen

d Kansmodellen versus verklarende statistiek

KANSMODEL

Een kansmodel stelt ons in staat om informatie te verstrekken over de eigenschappen van een steekproef.

VOORBEELD: met een waarschijnlijkheid van a %

VERKLARENDE STATISTIEK

In de verklarende statistiek gaan we omgekeerd te werk. Uit de informatie van een steekproef proberen we iets te weten te komen over een kenmerk van de populatie, zoals het populatiegemiddelde of de populatieproportie.

VOORBEELD: met een waarschijnlijkheid van a %

e Foutenmarge versus betrouwbaarheid en steekproefgrootte

De foutenmarge op het betrouwbaarheidsinterval wordt gegeven door

Die hangt af van enerzijds de steekproefgrootte en anderzijds de waarschijnlijkheid of betrouwbaarheid a

Bij vaste steekproefgrootte (vaste n ) heeft het verhogen van het betrouwbaarheidsinterval het verhogen van de foutenmarge tot gevolg, het betrouwbaarheidsinterval wordt breder.

Bij vaste betrouwbaarheid (vaste a ) heeft het vergroten van de steekproefomvang het verkleinen van de foutenmarge tot gevolg, het betrouwbaarheidsinterval wordt smaller.

– Bij een vaste foutenmarge kun je de betrouwbaarheid verhogen door de steekproefomvang te vergroten.

125 4
x ∈ µ z a σ √n , µ + z a σ √n
µ ∈ x z a · σ √n , x + z a · σ √n
f a ,n = z a σ √n

3 Toepassingen

Toepassing 1 :

Een vulmachine met een standaardafwijking van 7 gram vult potjes met abrikozenconfituur.

De kwaliteitscontroleur wil met een zekerheid van 90% een betrouwbaarheidsinterval opstellen waarbinnen het gemiddelde gewicht van één potje abrikozenconfituur zich bevindt.

Daarvoor neemt hij een steekproef van 36 potjes en bepaalt hij daarvan het steekproefgemiddelde:

Op basis van die steekproef kan hij met een betrouwbaarheid van 90% stellen dat het gemiddelde van één potje abrikozenconfituur zich bevindt in het interval :

µ ∈ 408,295gram;412,145gram

Je kunt dit betrouwbaarheidsinterval onmiddellijk berekenen in GeoGebra met het commando :

ZIntervalGemiddelde ( x , σ , n , a %)

ZIntervalGemiddelde < lijst >, σ , a %

126
∈ x z a · σ √n , x + z a · σ √n ⇐⇒ µ ∈ 410,22 1,65 · 7 √36 ;410,22 + 1,65 · 7 √36
µ
⇐⇒

Betrouwbaarheidsintervallen en toetsen van hypothesen

Toepassing 2 : verstrooid

De kwaliteitscontroleur van de firma Daenens is soms verstrooid. Zo moest hij onlangs de dikte van metalen staafjes nameten die geproduceerd worden door een bepaalde machine. De dikte van de metalen staafjes is normaal verdeeld met s = 0,3 mm. In zijn verslag stond dat op basis van een steekproef van 225 stuks de gemiddelde dikte zich heel waarschijnlijk bevond tussen 3,1484 mm en 3,2516 mm. Hij vergat echter wel te vermelden op welk betrouwbaarheidsniveau. Bepaal dit betrouwbaarheidsniveau.

Oplossing :

De betrouwbaarheid halen we uit de breedte van het betrouwbaarheidsinterval.

2 z a σ √n = 3,2516 3,1484 = 0,1032

=⇒ 2 z a = 0,1032 σ √n = 0,1032 √225 0,3 = 5,16

=⇒ z a = 5,16 2 = 2,58

=⇒ a = 99%

Toepassing 3 : lekkere chocopasta

Een vulmachine voor potjes chocopasta moet worden geijkt. Uit ervaring weten we dat de inhoud van de potjes chocopasta die door dit type machine worden geleverd, een standaardafwijking heeft van 12 gram. Hoeveel potjes chocopasta moet je wegen om de gemiddelde inhoud tot op 0,5 gram nauwkeurig te kunnen bepalen met een betrouwbaarheid van 95% ?

Oplossing :

De foutenmarge bedraagt 0,56 gram, m.a.w. :

z a

√n 0,5

=⇒ z a σ 0,5 √n met z a = z 95% = 1,96

=⇒ √n 1,96 12 0,5 = 47,04

=⇒ n 2212,76

Antwoord :

Je moet minstens 2213 potjes chocopasta wegen.

127 4
σ

4 Betrouwbaarheidsinterval voor p

a Schatten van parameters

Statistisch onderzoek heeft dikwijls tot doel om via een steekproef informatie te verkrijgen over de waarde van een zekere grootheid : het aantal af te keuren producten bij een lopende band, de inhoud van een machinaal gevuld pakje koffie enz.

De steekproef wordt getrokken uit een populatie waarbij een populatievariabele beschreven kan worden door een zekere verdelingsfunctie. De parameters van die functie (zoals p , m of s) zijn karakteristiek voor de grootheid die we onderzoeken.

Op grond van het waarnemingsmateriaal van de steekproef zullen we een grootheid proberen te construeren die ons een schatting van de onbekende parameter oplevert. Dergelijke grootheid noemen we een schatter

Afspraak : Een schatter duiden we meestal aan met een ‘hoedje’.

Zo wordt p geschat met een schatter p , m wordt geschat met een schatter , s wordt geschat met een schatter

Algemeen :

De onbekende parameter ‡ wordt geschat met een schatter

Bij het bepalen van een schatter eisen we meestal dat de verwachtingswaarde van de schatter gelijk is aan de onbekende populatieparameter. M.a.w. dat E ( ) = ‡.

Een dergelijke schatter noemen we een zuivere schatter

Indien er meerdere zuivere schatters mogelijk zijn, kiezen we die met de kleinste spreiding.

Een efficiënte schatter is een zuivere schatter met minimale standaardafwijking.

Een schatter wordt consistent genoemd wanneer zijn standaardafwijking kleiner wordt naarmate de steekproef groter wordt.

Voorbeeld :

Je wenst de gemiddelde inhoud m van machinaal gevulde pakjes koffie te schatten d.m.v. steekproeven van n pakjes koffie. Dan is X een goede schatter voor m omdat : • E ( X )= E X 1 + X 2 + + X n n = 1 n E ( X 1 )+ E ( X 2 )+ + E ( X n ) = 1 n

M.a.w. X is zuiver

• Je kunt nagaan dat ook de mediaan een zuivere schatter is, doch een grotere standaardafwijking heeft dan X , zodat X ook een efficiënte schatter is.

• Er geldt ook : σ X = σ √n ,zodat σ X kleiner wordt naarmate n groter wordt. M.a.w. X is consistent

128
n µ = µ

Betrouwbaarheidsintervallen en toetsen van hypothesen

b Betrouwbaarheidsinterval voor de steekproefproportie

Inleiding :

Bij een fabrikant van elektrische toestellen heeft 12% van de geproduceerde broodroosters een defect. Een consumentenorganisatie is van plan 60 broodroosters te controleren op een defect. Bepaal als fabrikant een waarschijnlijkheidsinterval rond p waarbinnen de door de consumentenorganisatie gevonden p met 95% zekerheid zal liggen.

Oplossing :

De kans dat een geproduceerde broodrooster defect is, is 12%. M.a.w. p = 0,12. We kennen aan de te controleren n = 60 broodroosters een getal xi toe, xi = 1 als de i -de broodrooster defect is en xi = 0 in het andere geval.

Desteekproefproportie p =

60 isnormaalverdeeldmet µ = 1 n np = p = 0,12en σ = 1 n np (1 p )= p · (1 p ) n = 0,042

met p = gekendepopulatieproportie n = steekproefgrootte

Een 95 %-waarschijnlijkheidsinterval waarbinnen p ligt wordt dan gegeven door :

[ m – z 95%s ; m + z 95%s]

= [ 0,12 – 1,96 · 0,042 ; 0,12 + 1,96 · 0,042]

= [ 0,03768 ; 0,20232]

= [ 3,8% ; 20,2%] p –1,96 s p p +1,96 s mogelijke waarden voor = p (1 – p ) n 95% s

Algemeen :

Wanneer een kenmerk in de populatie voorkomt met proportie p , dan is de steekproefproportie p van een steekproef (EAS) van omvang n bij benadering normaal verdeeld (indien n voldoende groot) met

µp = p en σp = p (1 p ) n en dan wordt a %-waarschijnlijkheidsinterval waarbinnen p ligt, gegeven door p z a · p (1 p ) n , p + z a · p (1 p ) n

129 4
x 1 + x 2 + + x n n = x 1 + x 2 + + x 60
p

c Simulatie met GeoGebra

We simuleren het productieproces van broodroosters waarbij 12% een defect vertoont. We doen een steekproef van 60 broodroosters en gaan na of de steekproefproportie in het 95%-waarschijnlijkheidsinterval [ 3,8%; 20,2%] ligt.

Simulatie van een controle van één broodrooster:

ToevalsgetalBinom( 1, 0.12)

0 : toaster is OK

1 : toaster is defect

Simulatie van een controle van 60 broodroosters :

Wanneer je nu op Ctrl-R duwt, wordt alles opnieuw berekend en simuleer je zo een nieuwe steekproef. Je hebt slechts 5% kans of 1 kans op 20 dat het steekproefgemiddelde buiten het betrouwbaarheidsinterval valt.

130

Betrouwbaarheidsintervallen en toetsen van hypothesen

d Betrouwbaarheidsinterval voor de populatieproportie p

Gegeven is een binomiaal verdeelde toevalsveranderlijke waarvan we de populatieproportie niet kennen. We willen nu via een voldoende grote steekproef (grootte n ) een interval opstellen waarbinnen het populatiegemiddelde zich met een zekere betrouwbaarheid (a %) bevindt.

We weten dat :

p ∈ p z a · p (1 p ) n , p + z a · p (1 p ) n met een betrouwbaarheid van a %

Hieruit volgt:

a p (1 p ) n p

(1 p ) n p z a p (1 p ) n p p + z a p (1 p ) n

Omdat we p niet kennen, benaderen we σ = p (1 p ) n door σ = p 1 p n , zodat : p z a p 1

meteenbetrouwbaarheidvan

We nemen dus een steekproef met grootte n uit een binomiaal verdeelde toevalsveranderlijke waarvan we de populatieproportie niet kennen, dan kunnen we met een betrouwbaarheid van a % stellen dat de populatieproportie zich bevindt in het interval:

131 4
z a · p
n p p z a · p (1 p
n z a · p
) n p p z a · p (1 p ) n
p z a · p (1 p ) n p p + z a · p (1 p ) n
(1 p )
)
(1 p
z
p z a p
p
a p 1 p n ⇐⇒
 
p 1 p n , p + z a p 1 p n  
p n p
+ z
p ∈
p z a
a %
 
p n  
p ∈
p z a p 1 p n , p + z a p 1

5 Toepassingen

Toepassing 1 : verpakking

Speelgoedfabrikant Illusie wil een nieuw gadget op de markt brengen. Bij het lanceren van een nieuw product is de verpakking echter zeer belangrijk. Omdat er getwijfeld wordt tussen twee versies van verpakkingen (V en W), wordt bij een aselecte steekproef van 1400 potentiële consumenten gevraagd welke verpakking zij verkiezen.

640 kiezen verpakking V, 470 kiezen verpakking W en de overige 290 hebben geen uitgesproken mening.

Geef een 95%-betrouwbaarheidsinterval voor de populatieproportie die V verkiest.

Oplossing :

n = 1400 290 = 1110 = hetaantalconsumentenmeteenmening

p = 640 1110 = 0,5766 = desteekproefproportiedieverpakkingVverkiest

Een95%-betrouwbaarheidsintervalvoordepopulatieproportie p dieverpakkingVverkiest,is:

p z a p (1 p ) n , p + z a p (1 p ) n

=[0,5766 0,0291;0,5766 + 0,0291]

=[0,5475;0,6056]

≈ [54,8%;60,1%]

Je kunt dit betrouwbaarheidsinterval onmiddellijk berekenen in GeoGebra met het commando :

ZProportieSchatting p , n , a %

ZProportieSchatting (640/1110,1110,0.95) = [54,75%;60,56%]

Wanneer je de betrouwbaarheid opdrijft, vermindert de nauwkeurigheid en verbreedt het betrouwbaarheidsinterval. Het is dus zinloos om 100% betrouwbaarheid na te streven.

Toepassing 2 : tablets in huis

We schatten dat ongeveer 70% van de Vlaamse gezinnen beschikt over een tablet. Welke grootte van steekproef moeten we nemen om de werkelijke proportie met een waarschijnlijkheid van 99% te kennen met een foutenmarge kleiner dan 1% ?

Oplossing :

n = ?:desteekproefgrootteisonbekend p = 0,7 = degeschatteproportie

z a = z 99% = 2,58

1%fout = foutkleinerdan0,01of

Antwoord :

Om de werkelijke proportie met een waarschijnlijkheid van 99% en een foutenmarge kleiner dan 1% te kennen, moet de steekproefgrootte minstens gelijk zijn aan 13 979.

n > 13978,44

132
a p (1 p ) n
2,58 · 0,7 0,3 n < 0,01 1,1823 √n <
z
< 0,01
0,01
n > 118,23

6

Samenvatting

• Je weet dat een schatter een grootheid is die een schatting geeft van een onbekende parameter van een verdelingsfunctie van een steekproef.

• Je weet wat de begrippen zuivere schatter, efficiënte schatter en consistente schatter betekenen.

Bij het bepalen van een schatter eisen we meestal dat de verwachtingswaarde van de schatter gelijk is aan de onbekende populatieparameter. Een dergelijke schatter noemen we een zuivere schatter.

Een efficiënte schatter is een zuivere schatter met minimale standaardafwijking.

Een schatter wordt consistent genoemd wanneer zijn standaardafwijking kleiner wordt naarmate de steekproef groter wordt.

• Je kent het verschil tussen een puntschatting en een intervalschatting.

We spreken van een puntschatting als voor de onbekende parameter van de betrokken variabele één bepaalde waarde als schatting wordt aangegeven.

In plaats van één enkele waarde te geven voor de onbekende parameter, is het meestal verstandiger een gebied aan te geven waarin de parameter waarschijnlijk ligt. Dit gebied noemen we een schattingsinterval of betrouwbaarheidsinterval voor de onbekende parameter.

De kans op een goede schatting noemen we de betrouwbaarheid van het interval.

• Je kent de eigenschappen i.v.m. betrouwbaarheidsintervallen voor proporties.

Wanneer een kenmerk in de populatie voorkomt met proportie p , dan is de steekproefproportie p van een steekproef van omvang n bij benadering normaal verdeeld

(indien n voldoende groot) met µp = p en σp = p (1 p ) n en dan wordt een a %-waarschijnlijkheidsinterval waarbinnen p ligt, gegeven door p z a · p (1 p ) n , p + z a · p (1 p ) n

Omgekeerd: wanneer een steekproef voldoende groot is en een kenmerk in de steekproef voorkomt met steekproefproportie p , dan wordt een a %-betrouwbaarheidsinterval voor de populatieproportie gegeven door p z a p (1 p ) n , p + z a p (1 p ) n

• Je kent de eigenschappen i.v.m. de betrouwbaarheidsintervallen voor m als s gekend is. Is een variabele verdeeld met gemiddelde m en standaardafwijking s, dan is het steekproefgemiddelde X van een steekproef met steekproefgrootte n normaal verdeeld met karakteristieken p z

1 p

p (1 p ) n en dan wordt een a %-waarschijnlijkheidsinterval waarbinnen X ligt, gegeven door

Omgekeerd: uit een steekproef met steekproefgrootte n van een normaal verdeelde grootheid met gekende standaardafwijking en geschatte steekproefgemiddelde x , wordt een a %-betrouwbaarheidsinterval voor het populatiegemiddelde gegeven door de formule:

133 4
Betrouwbaarheidsintervallen en toetsen van hypothesen
a
µ z a σ √n , µ + z a σ √n .
a · p (
) n , p + z
·
x z a σ √n , x + z a σ √n

7 Oefeningen

Een machine vult pakjes koffie. De inhoud van de pakjes is normaal verdeeld met standaardafwijking s = 16 gram. De kwaliteitscontroleur neemt een steekproef van 1000 pakjes en zet die op een weegschaal.

Ze hebben een totale massa van 509,5 kg.

Geef een 99%-betrouwbaarheidsinterval voor de gemiddelde massa van één pakje koffie.

Een machine kan schroeven van verschillende lengte produceren. We weten dat de standaardafwijking telkens dezelfde is en gelijk is aan 0,08 mm.

Bij een steekproef van 400 schroeven vinden we een gemiddelde lengte van 6,03 mm.

Geef een 95%-betrouwbaarheidsinterval voor de verwachte lengte m

De wintergerst in Vlaanderen is geoogst. Hieronder vind je de opbrengst (in ton = 1000 kg) van 40 velden van 1 ha groot. Geef een 95%-betrouwbaarheidsinterval voor de gemiddelde opbrengst van een veld wintergerst in Vlaanderen dit oogstjaar van 1 ha groot. De opbrengst per ha is normaal verdeeld met σ = 0,72 ton.

De tijdsduur van een laboratoriumproef bij studenten is normaal verdeeld met σ = 14 minuten. Hieronder staat de tijdsduur (in minuten) gemeten bij een groep van 48 studenten. Geef een 98%-betrouwbaarheidsinterval voor de gemiddelde tijdsduur van deze laboratoriumproef bij studenten.

134
9,28 7,44 7,17 8,34 7,94 8,58 9,43 7,88 8,76 8,33 9,27 8,44 8,89 8,19 7,22 8,08 8,94 8,97 7,95 9,85 8,68 8,58 10,01 9,46 7,83 7,91 8,99 7,99 9,29 8,73 8,01 9,26 8,65 8,61 9,08 8,75 8,72 7,72 8,79 8,77
92 102 81 81 77 74 97 67 69 77 93 96 104 67 111 106 60 67 77 75 67 57 65 75 97 49 87 64 65 76 78 72 98 84 78 81 93 72 67 79 84 81 94 92 63 97 78 82 1 2 3 4

Betrouwbaarheidsintervallen en toetsen van hypothesen

Een vulmachine met standaardafwijking σ = 8 ml vult flessen met olie. 54 flessen worden nagewogen. Bepaal op basis van deze steekproef een 99%-betrouwbaarheidsinterval voor de gemiddelde inhoud van een fles olie.

Hoeveel groter moet een steekproef zijn als je een

betrouwbaarheidsinterval wil halveren in de breedte ?

Als je weet dat de massa van een lading granny smiths normaal verdeeld is met een standaardafwijking van 17 gram, hoeveel appelen moet je dan wegen om de gemiddelde massa tot op 10 gram nauwkeurig te bepalen met een betrouwbaarheid van 95% ?

De massa van machinaal vervaardigde taartjes is normaal verdeeld met een standaardafwijking s = 4 gram.

Xander weegt 100 taartjes en komt tot een gemiddelde massa van 141 gram. Kasper weegt 200 taartjes en heeft een gemiddelde massa van 147 gram. Jonas ten slotte weegt 300 taartjes en vindt een gemiddelde van 143 gram. Bepaal op basis van die gegevens een 95%-betrouwbaarheidsinterval voor de gemiddelde massa van één taartje.

De tijd nodig om één bepaalde handeling uit te voeren, is normaal verdeeld met een standaardafwijking van 36,36 s. Als je weet dat op basis van een steekproef met steekproefgrootte 400, de gemiddelde tijd zich bevindt in het interval [ 7 m 58 s ; 8 m 4 s], wat was dan het betrouwbaarheidsniveau ?

Een machine vult zakjes rijst. De inhoud van de zakjes is normaal verdeeld met standaardafwijking s = 17 gram.

De kwaliteitscontroleur neemt een steekproef van 333 zakjes en zet die op een weegschaal. Ze hebben een totale massa van 82,584 kg. Geef een 97 %-betrouwbaarheidsinterval voor de gemiddelde massa van één zakje rijst.

4 135
97,4 106,1 96,4 98,5 98,6 110,6 89,5 109,1 102,6 95,2 101,0 90,2 108,9 93,0 100,6 95,0 110,9 94,5 88,6 95,0 98,6 87,3 92,6 114,8 83,4 99,0 97,4 110,2 96,9 106,6 91,3 102,9 97,4 103,5 100,2 95,3 110,5 94,2 94,5 101,7 98,3 100,6 109,7 78,0 109,5 95,7 114,2 83,1 94,4 99,4 102,6 98,2 95,6 106,4
5 6 7
8 9 10

Een onderzoeksbureau vraagt 620 Vlaamse jongeren van 17 en 18 jaar die de voorbije week tv hebben gekeken, naar het aantal kijkuren. Ze vinden een gemiddelde van 10,15 uur. Uit ervaring weten ze dat de standaardafwijking 6,82 uur bedraagt. Geef een 99%-betrouwbaarheidsinterval voor het gemiddelde aantal kijkuren per week.

Geef een 90%-betrouwbaarheidsinterval voor het aantal schadevorderingen in een verzekeringskantoor in het volgende jaar indien je weet dat er op de 8400 verzekeringspolissen dit jaar 7% schadevorderingen waren.

Uit de populatie studenten van een bepaalde richting aan een universiteit wordt aselect een steekproef van 80 studenten genomen.

Hierbij bleken er 43 meisjes te zijn.

Geef een 95%-betrouwbaarheidsinterval voor de fractie meisjes in die richting.

Bij een controle van een steekproef van 400 lampen werden 45 slechte lampen gevonden.

Vind op grond hiervan een 95%-betrouwbaarheidsinterval voor het percentage slechte lampen in de hele populatie.

Van 300 lukraak gekozen Amerikaanse kiezers verklaren er 170 te zullen stemmen op presidentskandidaat W.

a Bereken voor het volledige kiesdistrict het 95%- en 99%-betrouwbaarheidsinterval voor de proportie kiezers van die kandidaat.

b Hoeveel kiezers moeten we polsen om met 99% zekerheid te kunnen zeggen dat de kandidaat verkozen wordt ?

136
11 12 13 14 15

Een koeriersbedrijf doet een kwaliteitsonderzoek naar de fractie orders die binnen de afgesproken leveringstermijn wordt uitgevoerd.

Bij 240 orders bleken er 204 binnen de leveringstermijn uitgevoerd te zijn.

a Geef een 99%-betrouwbaarheidsinterval voor de fractie orders die op tijd uitgevoerd zijn.

b Hoeveel orders moeten onderzocht worden om een interval voor de fractie p te krijgen dat hoogstens 0,03 breed is ?

Betrouwbaarheidsintervallen en toetsen van hypothesen

Een firma fabriceert kogellagers om te exporteren. De kwaliteitscontroleur doet een steekproef van 50 lagers.

Hieronder zie je het resultaat van de controlekaart (0 is ‘OK’, 1 is ‘niet OK’).

Bepaal op basis van die steekproef het percentage kogellagers dat niet aan de vereiste kwaliteitsnormen voldoet met een betrouwbaarheid van 90%.

18 van de school een hond als huisdier heeft.

Aaron wil weten welk percentage leerlingen

Hij besluit een aselecte steekproef te nemen van 70 leerlingen en hen gewoon te vragen of ze al dan niet een hond als huisdier hebben. Hieronder zie je het resultaat van zijn onderzoek (0 is geen hond, 1 is wel een hond).

Bepaal op basis van die steekproef het percentage leerlingen met een betrouwbaarheid van 97% dat thuis een hond als huisdier heeft.

4 137
0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0
16
17
0 0 1 0 0 0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0

In het magazijn van firma X komt een lading printplaten (voor computers) binnen. Kwaliteitscontroleur Adriaan neemt een steekproef van 120 printplaten, controleert ze en constateert dat er 13 slechte bij zijn. Kwaliteitscontroleur Brigitte neemt onafhankelijk van Adriaan ook een steekproef van 120 printplaten en constateert 9 defecte.

a Bepaal op basis van de controle van Adriaan een 95%-betrouwbaarheidsinterval voor het percentage slechte printplaten in die levering.

b Bepaal op basis van de controle van Brigitte een 95%-betrouwbaarheidsinterval voor het percentage slechte printplaten in die levering.

c Bepaal op basis van de controle van Adriaan en Brigitte samen een 95%-betrouwbaarheidsinterval voor het percentage slechte printplaten in die levering.

Een school telt 1654 leerlingen. Via een steekproef wil de school te weten komen hoeveel procent van deze populatie een voorstander is van het wijzigen van een bepaalde regel in het schoolreglement. Hoe groot moet de steekproef zijn om de fractie ‘voorstanders van wijziging’ te leren kennen met een nauwkeurigheid van 4% gebaseerd op 95% betrouwbaarheid ?

Tip : bij ongekende p stellen we p = 0,5 ; verklaar waarom.

In de spaarpot van Kasper zitten enkel Belgische euromunten van 2 euro. Jonas wil nu weten hoeveel geld er in de spaarpot van Kasper zit zonder het geld effectief te tellen. Hij haalt 40 munten uit de spaarpot en vervangt ze door Franse euromunten van 2 euro. Nadien schudt hij de spaarpot zodat de Franse munten voldoende gemengd zijn met de Belgische en haalt hij opnieuw 40 munten uit de spaarpot. Van de 40 munten blijken er 6 Franse bij te zijn. Geef een 90%-betrouwbaarheidsinterval voor het bedrag dat in de spaarpot van Kasper zit.

Van 480 lukraak gekozen kiezers verklaren er 255 te zullen stemmen op kandidaat Y.

a Bereken voor het hele kiesdistrict het 95%-betrouwbaarheidsinterval voor de proportie kiezers van die kandidaat.

b Hoeveel kiezers moeten we polsen om met 95% zekerheid te kunnen zeggen dat de kandidaat verkozen wordt ?

138
19 20 21
22

4.2 Toetsen van hypothesen

1 Inleiding

Betrouwbaarheidsintervallen vormen een van de twee meest gangbare types van formele statistische inferentie. Zij zijn toepasbaar wanneer het doel is een populatieparameter te schatten.

Het tweede type inferentie richt zich op een heel ander doel: het beoordelen van het door de data verschafte bewijsmateriaal ten gunste van een of andere bewering over de populatie. Hypothese- of significantietoetsen zijn, o.a. in de politiek, de economie, de medische en chemische wereld, een veelgebruikte statistische techniek. Ze worden vaak aangewend om een gevestigde norm eventueel te weerleggen, bijvoorbeeld om aan te tonen dat een nieuw geneesmiddel een betere kans biedt op genezing dan het klassieke geneesmiddel.

Het is een techniek die toelaat conclusies te trekken over een hele populatie gebaseerd op steekproefgegevens, conclusies waarvan we niet zeker zijn maar waarvan we het risico op een verkeerde uitspraak onder controle hebben. In de volgende paragrafen zullen we deze techniek toelichten met een paar voorbeelden en hierbij aandacht besteden aan de typische statistische denkwijze.

2 Werkwijze

Voorbeeld :

Een fabrikant van metalen cilinders beweert dat de buitendiameter van de cilinders normaal verdeeld is met m = 11,6 cm en s = 0,4 cm. De laatste tijd komen er van de klanten nogal wat klachten dat sommige van de cilinders te breed zijn; volgens hen is de gemiddelde buitendiameter groter dan 11,6 cm.

Om geen klanten te verliezen en om zeker te zijn dat de productie goed verloopt, besluit de fabrikant een steekproef te nemen van 25 cilinders. Die steekproef levert een gemiddelde buitendiameter van 11,7 cm op. Wat moet de fabrikant hieruit besluiten ?

Het formuleren van de hypothese

Over de grootte van de buitendiameters van de metalen cilinders zijn twee hypothesen naar voren gebracht.

H 0 : m = 11,6 cm, de nulhypothese

H 1 : m > 11,6 cm, de alternatieve hypothese

Toetsen betekent beslissen, namelijk beslissen of een vooraf geformuleerde uitspraak (een hypothese) als juist of als onjuist moet worden beschouwd. De uitspraak waarvan de juistheid wordt onderzocht, noemen we de nulhypothese

Als we op basis van verzamelde gegevens (bijvoorbeeld een steekproef) concluderen dat de nulhypothese niet geloofwaardig is, aanvaarden we het andere geformuleerde standpunt: de alternatieve hypothese

Het nagaan of een bewering kan kloppen op basis van een steekproef, noemen we een hypothese- of significantietest.

139 4
toetsen van hypothesen
Betrouwbaarheidsintervallen en

De toetsingsgrootheid

Na het formuleren van de hypothese stellen we een grootheid op waarmee de toets wordt uitgevoerd. Bij dit voorbeeld kiezen we als stochast X : de gemiddelde grootte van de buitendiameter van 25 metalen cilinders.

Als H 0 juist is, is X normaal verdeeld met µ = 11,6en σ = 0,4 √25 = 0,08 √n -wet

Kritieke zone of verwerpingsgebied

Op grond van de kansverdelingen kunnen we overgaan tot het opstellen van een beslissingsschema, waarin voor iedere waarde van X wordt aangegeven welke beslissing wordt genomen.

De verzameling van waarden van X , waarvoor H 0 wordt verworpen ten gunste van H 1, noemen we de kritieke zone of het verwerpingsgebied V. De complementaire verzameling, dit is de verzameling van waarden van X waarvoor we H 0 niet verwerpen, noemen we het aanvaardingsgebied A.

Om tot een verdeling te komen in een verwerpingsgebied en een aanvaardingsgebied is een criterium nodig. Dit wordt gegeven door een kans α : de kans op een fout van de eerste soort (verwerpingsfout).

Fouten

bij de toetsing – de keuze van α

De volgende situaties kunnen optreden : beslissing op grond van de steekproef H 0 niet verwerpen H 0 verwerpen werkelijke situatie

H 0 is waar juiste beslissing 1 – α fout van de eerste soort α

H 1 is waar fout van de tweede soort b juiste beslissing 1 – b

In twee gevallen komen we tot een juiste uitspraak, in twee gevallen tot een foutieve. De consequenties van de twee soorten fouten zijn echter over het algemeen niet gelijkwaardig. Een fout van de eerste soort is meestal ernstiger dan een fout van de tweede soort. Het beoordelen van de ernst van beide fouten is echter een taak van de fabrikant, niet van de statisticus.

De grootte van de kans op een fout van de eerste soort, behorend bij een bepaald kritiek gebied, duiden we aan met α en noemen we het significantieniveau

P (H0 verwerpen | H0 waaris)= α,hetsignificantieniveau

De keuze van α wordt meestal vooraf bepaald en is een zaak die van externe factoren afhangt en van de vraag hoe schadelijk het is de nulhypothese ten onrechte te verwerpen. In de praktijk kiezen we meestal α = 10%, α = 5% of α = 1%.

140
x y 11,3 11,4 11,5 11,6 11,7 11,8 11,9 1 2 3 4 5 0 g r A V

Betrouwbaarheidsintervallen en toetsen van hypothesen

De grootte van de kans op een fout van de tweede soort (doorlatingsfout), behorend bij een bepaald kritiek gebied, duiden we aan met b

P (H0 nietverwerpen | H1 waaris)= β

De kans dat H 0 wordt verworpen terwijl H 1 juist is, bedraagt 1 – b en noemen we het onderscheidingsvermogen

P (H0 verwerpen | H1 waaris)= 1 β ,hetonderscheidingsvermogen

Veronderstel even dat het productieproces van de metalen cilinders H 0 inderdaad verkeerd is en m = 11,8.

Dan kunnen we de fout van de tweede soort visueel voorstellen als volgt :

y

Uit de bovenstaande grafiek leid je het volgende af : verklein je de kans op een fout van de eerste soort, dan vergroot je de kans op een fout van de tweede soort.

Oplossing van het voorbeeld

De fabrikant besluit om de kans op een type I-fout kleiner dan 5% te houden. Hij besluit dus om de nulhypothese te verwerpen op het 5%-significantieniveau of α = 0,05.

De (rechter)grenswaarde g r van het aanvaardingsgebied is in dit geval :

P ( X g r )= α

P ( X g r )= 0,05

1 P ( X < g r )= 0,05

P ( X < g r )= 0,95 ICT g r = 11,7316

Dat betekent dat de fabrikant de nulhypothese blijft aanvaarden zolang de gemiddelde buitendiameter van een steekproef van 25 cilinders kleiner is dan g r = 11,73 cm.

V = [ 11,73 ; +∞[ Zie grafiek op de vorige bladzijde.

A = ] 0, 11,73[

De gevonden waarde was hier 11,7 < g r . 11,7 ∈ A, dus de fabrikant aanvaardt de nulhypothese en zal het productieproces niet bijsturen. Dat betekent echter niet dat de nulhypothese juist is.

141 4
x
11,4 11,5 11,6 11,7 11,8 11,9 12 1 2 3 4 5 0 α β

3 Eenzijdige of tweezijdige toetsen

Voorbeeld :

In het vorige voorbeeld is de fabrikant zijn productieproces pas gaan toetsen na een klacht van zijn klanten, die beweerden dat de gemiddelde buitendiameter van de cilinders groter was dan 11,6 cm.

Een goede fabrikant wacht niet op klachten en doet preventief zelf regelmatig een aantal steekproeven om de kwaliteit van zijn product na te gaan. Bij een slechte productie zijn er nu echter twee mogelijkheden. Ofwel zijn de gemiddelde buitendiameters te breed, ofwel zijn de gemiddelde buitendiameters te smal.

Het formuleren van de hypothese

Over de grootte van de buitendiameters van de metalen cilinders gelden nu de volgende twee hypothesen:

H 0 : m = 11,6 cm, de nulhypothese. Het productieproces werkt normaal.

H 1 : m ≠ 11,6 cm, de alternatieve hypothese. Het productieproces is verstoord en levert buitendiameters die ofwel breder ofwel smaller zijn dan 11,6 cm.

Wanneer we enkel groter dan (>) of kleiner dan (<) formuleren bij de alternatieve hypothese, spreken we van een eenzijdige toets. In het andere geval spreken we van een tweezijdige toets.

Geval 1 : H 0 : m = µ0 versus H 1 : µ > µ0 rechts eenzijdige toets

Geval 2 : H 0 : m = µ0 versus H 1 : µ < µ0 links eenzijdige toets

Geval 3 : H 0 : m = µ0 versus H 1 : µ ≠ µ0 tweezijdige toets

De toetsingsgrootheid

Na het formuleren van de hypothese stellen we, net zoals in het vorige geval, een grootheid op waarmee de toets wordt uitgevoerd. We kiezen als stochast X de gemiddelde grootte van de buitendiameter van n (= de grootte van de steekproef) metalen cilinders.

Als H 0 juist is, dan is X normaal verdeeld met m = 11,6 en s = 0,4 √n

De fabrikant besluit ook hier een steekproefgrootte van 25 stuks te nemen, m.a.w. X is normaal verdeeld met m = 11,6 en s = 0,08.

Kritieke zone of verwerpingsgebied

De fabrikant besluit om ook hier de kans op een type I-fout kleiner dan 5% te houden. De nulhypothese wordt dus verworpen op het 5%-significantieniveau, m.a.w. α = 0,05.

De grenswaarden g l en g r van het aanvaardingsgebied zijn in dit geval :

P ( X g l )= P ( X g r )= 1 2 α

P ( X g l )= 0,025 en P ( X g r )= 0,025

P ( X g l )= 0,025 en P ( X < g r )= 0,975 ICT

g l = 11,44 en g r = 11,76

142

Betrouwbaarheidsintervallen en toetsen van hypothesen

Dat betekent : als de fabrikant bij een aselecte steekproef van 25 stuks als gemiddelde buitendiameter een waarde vindt gelegen in het interval [ g l , g r ] = [ 11,44 ; 11,76], dan zal hij de nulhypothese aanvaarden.

Wanneer de productielijn correct is afgesteld, dan heeft hij immers 95% ( = 1 – α) betrouwbaarheid dat de gevonden gemiddelde waarde in dit interval ligt (100% zekerheid is er nooit).

Vindt hij een waarde binnen dit interval, dan wil dat niet zeggen dat de productielijn correct is afgesteld. Er bestaat immers nog altijd een zekere kans b dat hij zich vergist.

Vindt hij een waarde buiten dit interval, dan wil dat evenmin zeggen dat de productielijn foutief is afgesteld. Er bestaat immers nog altijd een zekere kans α dat hij zich vergist.

Taak : herneem dit voorbeeld met n = 64 en α = 0,01.

4 Toetsingsprocedure via grenswaarden

– Formuleer een nulhypothese H 0 en een alternatieve hypothese H 1

– Bepaal de toetsingsgrootheid.

Bepaal de steekproefomvang n . In de voorbeelden en opgaven is n meestal gegeven, in de praktijk zullen we n vaak moeten kiezen.

Kies een waarde voor α, de kans op een fout van de eerste soort. Ook hier zal de waarde van α in de voorbeelden en opgaven gegeven zijn, maar zullen we in de praktijk moeten overwegen op welk significantieniveau we wensen te testen.

– Bepaal het kritieke gebied (en de bijbehorende grenswaarden) uit de verdeling van de toetsingsgrootheid onder H 0.

– Bepaal de steekproefuitkomst van de toetsingsgrootheid en bekijk met behulp van het kritieke gebied of de nulhypothese al dan niet moet worden verworpen.

143 4
x y 11,3 11,4 11,5 11,6 11,7 11,8 11,9 1 2 3 4 5 0 • 11,44 2,5% • 11,76 2,5% V A V

Toets voor het gemiddelde m van een normale verdeling :

links eenzijdige toetstweezijdige toetsrechts eenzijdige toets nulhypothese en alternatieve hypothese

Toets omtrent de populatieproportie : links eenzijdige toetstweezijdige toetsrechts eenzijdige toets

nulhypothese en alternatieve hypothese

verwerpen als

5 P-waarde

Voorbeeld :

We hernemen de situatie van de klanten die klagen en de steekproef van 25 cilinders die een gemiddelde buitendiameter x van 11,7 cm oplevert.

We kunnen nu de situatie omdraaien en ons de vraag stellen : ‘Wat is de kans in een normale situatie op een gemiddelde buitendiameter van 11,7 cm of groter ?’ Op basis van die kans, P -waarde genoemd, wordt dan een beslissing genomen.

Het formuleren van de hypothese

Ook hier wordt een nulhypothese versus een alternatieve hypothese geformuleerd. We nemen net zoals bij het beginprobleem :

H 0 : m = 11,6 cm, de nulhypothese

H 1 : m > 11,6 cm, de alternatieve hypothese

144
H0 : µ = µ0 H1 : µ<µ0 H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ>µ0 P X g α P X g l 1 2 α P X g r 1 2 α P X g α H0 verwerpen als X g X g l of X g r X g g α gl gr α 2 α 2 g α
H0 : p = p 0 H1 : p < p 0 H0 : p = p 0 H1 : p = p 0 H0 : p = p 0 H1 : p > p 0 P ( X k ) α P ( X k ) 1 2 α P ( X l ) 1 2 α P ( X l ) α H0
X k X k of X l X l k α k l α 2 α 2 l α

Betrouwbaarheidsintervallen en toetsen van hypothesen

De toetsingsgrootheid

Na het formuleren van de hypothese stellen we, net zoals in de vorige gevallen, een grootheid op waarmee de toets wordt uitgevoerd. We kiezen als stochast X ook hier de gemiddelde grootte van de buitendiameter van 25 (= de grootte van de steekproef) metalen cilinders.

Onder H 0 is X normaal verdeeld met µ = 11,6en σ = 0,4 √n = 0,08

Berekenen van de P -waarde

Het waargenomen gemiddelde x is nu 11,7 cm. We stellen ons de vraag hoe groot de kans is om onder H 0 een gemiddelde waarde groter of gelijk aan x te vinden. P -waarde = P = P X x

= P X 11,7

= 1 P X < 11,7 ICT = 0,1056 = 10,56%

Via GeoGebra kan dit ook rechtstreeks met het commando

ZTestGemiddelde ( x , s, n , m0, ">").

Oplossing van het voorbeeld

We verwerpen, zoals in de vorige gevallen, de nulhypothese op het 5%-significantieniveau. We stellen dus α = 0,05.

In het voorbeeld is P = 0,1056 > α = 0,05.

Dat betekent dat in meer dan 10% van de gevallen bij een steekproef van 25 stuks, de gemiddelde diameter groter zal zijn dan 11,7 cm. Die situatie is niet zo uitzonderlijk en bijgevolg aanvaarden we de nulhypothese die stelt dat het productieproces zodanig is opgesteld dat de gemiddelde diameter van de cilinders 11,6 cm is.

6 Toetsingsprocedure via de P-waarde

– Formuleer een nulhypothese H 0 en een alternatieve hypothese H 1

– Bepaal de toetsingsgrootheid.

– Bepaal de steekproefomvang n en kies een waarde voor α.

– Bepaal de P -waarde van de steekproef.

– Vergelijk de P -waarde met α en ga na of de nulhypothese al dan niet moet worden verworpen.

145 4

Toets van het gemiddelde :

links eenzijdige toets

tweezijdige toets rechts eenzijdige toets

nulhypothese en alternatieve hypothese

verwerpen als

Toets omtrent de populatieproportie :

links eenzijdige toets

tweezijdige toets rechts eenzijdige toets

nulhypothese en alternatieve hypothese

7 Toepassingen

Toepassing 1 : balletjes in een vaas

Gegeven : Kasper steekt 7 balletjes in een vaas. Hij gaat nu bij Jonas en laat hem raden uit twee mogelijkheden : ofwel zitten er 2 blauwe en 5 gele balletjes in de vaas ( H 0), ofwel zitten er 5 blauwe en 2 gele balletjes in de vaas ( H 1). Jonas mag wel eerst twee balletjes uit de vaas halen. Jonas trekt twee balletjes (zonder teruglegging) uit de vaas en besluit voor H 0 te kiezen zodra er een geel balletje bij zit.

Gevraagd :

Bereken α, de kans op een fout van de eerste soort. Bereken b, de kans op een fout van de tweede soort.

Oplossing :

P (H0 aanvaarden | H0 waaris) Laplace =

C 2 7 = 10 + 10 21 = 20 21 dus:1 α = 20 21

P (H0 verwerpen | H0 waaris)= α = 1 20 21 = 1 21

P (H0 aanvaarden | H1 waaris) Laplace =

= 1 + 10 21 = 11 21 dus: β = 11 21

P (H0 verwerpen | H1 waaris)= 1 β = 1 11 21 = 10 21

Antwoord : De kans op een fout van de eerste soort is 1 21 , de kans op een fout van de tweede soort 11 21

Taak : herneem de opgave indien de trekking gebeurt met teruglegging.

146
H0
µ
µ
H
H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ>µ0 P
Is
Is
P
H
:
=
0
1 : µ<µ0
= P ( X x )
x <µ,danis P = 2 · P ( X x )
x >µ,danis P = 2 P ( X x )
= P ( X x )
0
P α P α P α
H0 : p = p 0 H1
p < p 0 H0 : p = p 0 H1 : p = p 0 H0 : p = p 0 H1 : p > p 0 P
Is
Is
P
p ) H
P α P α P α
:
= P ( X p )
p < p ,danis P = 2 P ( X p )
p > p ,danis P = 2 · P ( X p )
= P ( X
0 verwerpen als
2 5 C 0
C
C
C
5 +
1 5
1 2
C 2 2 C 0 5 + C 1 2 C 1 5 C 2 7

Betrouwbaarheidsintervallen en toetsen van hypothesen

Toepassing 2 : de dobbelsteencontrole

We twijfelen eraan of een bepaalde dobbelsteen al dan niet verzwaard is zodat de kans op een zes hoger is dan 1 6

We gooien 900 keer met de dobbelsteen en noteren 180 keer een zes. Wat is je besluit bij α = 0,05 ?

Oplossing :

– formuleren van de hypothesen

H0 :dedobbelsteenisnietverzwaard: p = 1 6

H1 :dedobbelsteenisverzwaard: p > 1 6

Dit is een rechts eenzijdige toets van fracties.

de toetsingsgrootheid

X = het aantal keren zes in de steekproef.

X isbinomiaalverdeeldB (n = 900, p = 1 6 ).

– methode 1 : via grenswaarden

We bepalen de rechtergrenswaarde (via ICT) van het aanvaardingsgebied bij α = 5%.

P ( X k ) 0,05

P ( X < k ) > 0,95

ICT k = 169

Dat betekent dat, wanneer het aantal zessen in onze steekproef kleiner dan of gelijk zou zijn aan 168, de nulhypothese wordt aanvaard. Bedraagt het aantal zessen 169 of meer, dan wordt ze verworpen.

In ons geval is 180 ⩾ k = 169 en wordt de nulhypothese dus verworpen. Wij vermoeden (zeker zijn we immers nooit) dat de dobbelsteen inderdaad verzwaard is.

– methode 2 : via de P -waarde

Dat kan rechtstreeks met GeoGebra via het commando ZTestProportie (p , n , p , ">").

P-waarde = 0,0036 < α = 0,05

Omdat de kans om 180 keer van de 900 keer zes te werpen met een ‘normale’ dobbelsteen zeer klein is, namelijk 0,36%, verwerpen we H 0. Wij denken dat de dobbelsteen verzwaard is.

Taak :

Toon aan dat PropZtest geen rekening houdt met de continuïteitscorrectie. Bereken de P -waarde met behulp van de definitie (en vergeet niet de continuïteitscorrectie toe te passen).

147 4

Toepassing 3 : kwaliteitscontrole

In een bedrijf moet de kwaliteitsmanager de kwaliteit van een product nagaan. Verschillende klanten melden een uitval van ongeveer 7% terwijl de productieverantwoordelijke in zijn rapporten hoogstens 3% uitval geeft.

Indien het percentage ongeveer 7% is, moeten ze om het verlies aan cliënteel tegen te gaan, dringend ingrijpen. Dat betekent echter ook dat de productieband gedurende een halve dag moet worden stilgelegd om alle productiemachines te controleren en correct af te stellen. Bedraagt de uitval 3% of minder, dan kunnen ze de productie laten zoals die was.

De manager besluit een aselecte steekproef te trekken en zijn conclusie te baseren op het aantal uitvallers dat hij vindt. Veronderstel dat de steekproef een omvang heeft van 400 en dat zich daartussen 19 uitvallers bevinden. Tot welke conclusie komt hij ? ( α = 1%)

Veronderstel dat de klanten effectief gelijk hebben en het percentage uitval 7% bedraagt. Bereken dan de kans op een fout van de tweede soort.

Oplossing :

– formuleren van de hypothesen

H 0 : de meestergast heeft gelijk : p = 0,03

H 1 : de klanten hebben gelijk : p > 0,03

Dit is een rechts eenzijdige toets van fracties.

– de toetsingsgrootheid

X = het aantal uitvallers in de steekproef.

X isbinomiaalverdeeldB (n = 400, p = 0,03)

methode 1 : via grenswaarden

We bepalen (via ICT) de rechtergrenswaarde bij α = 1%.

P ( X k ) 0,01

P ( X < k ) > 0,99 ICT k = 21

Dat betekent dat, wanneer het aantal uitvallers in onze steekproef kleiner dan of gelijk zou zijn aan 20, de nulhypothese wordt aanvaard. Bedraagt het aantal uitvallers 21 of meer, dan wordt ze verworpen.

In ons geval 19 < k = 21 en wordt de nulhypothese dus aanvaard. De fabrikant geeft aan de versie van de productieverantwoordelijke de voorkeur. Het verwerpingsgebied is dus [ 21, 400]

21 0 A V 400

148

Betrouwbaarheidsintervallen en toetsen van hypothesen

methode 2 : via de P -waarde

P -waarde = P = 0,0201 > α = 0,01

Omdat de kans op 19 uitvallers of meer in een steekproef van 400 stuks onder H 0 toch nog rond de 2% draait, aanvaarden we H 0 en denken we dat de productieverantwoordelijke gelijk heeft.

Taak : toon aan dat op het 5%-significantieniveau de productieverantwoordelijke ongelijk krijgt.

– berekenen van b in de veronderstelling dat p = 0,07

X is nu binomiaal verdeeld onder B( n = 400, p = 0,07)

We benaderen die door de normale verdeling met gemiddelde µ = np = 28en σ = np (1 p )= √26,04 ≈ 5,103.

β = P ( X < k ) = P ( X < 21) ICT = 0,09768 ≈ 9,8%

Toepassing 4 : Nederlanders op vakantie

Deze ochtend stond in een krantenartikel : ‘30% van de kampeerders langs de Lesse zijn Nederlanders ’.

Thomas besloot die bewering tweezijdig te gaan testen op een significantieniveau van 5%, nam zijn rugzak en trok een dagje richting Ardennen. Tegen het einde van de dag had hij een aantal campings bezocht en telde hij 61 Nederlanders op een totaal van 157 kampeerders. Welke conclusie deelde hij ’s avonds aan zus Ellen mee ?

Oplossing : –

formuleren van de hypothesen

H 0 : de krant heeft gelijk : p = 0,3

H 1 : de krant heeft ongelijk : p ≠ 0,03

Dit is een tweezijdige toets van fracties.

149 4

de toetsingsgrootheid

X = het aantal Nederlandse kampeerders in de steekproef.

X is binomiaal verdeeld B( n = 157, p = 0,3).

Omdat n groot is, mogen we deze binomiale verdeling benaderen door de normale verdeling met gemiddelde µ = np = 47,1en σ = np (1 p )= √32,97 ≈ 5,742.

– methode 1 : via grenswaarden

We bepalen de grenswaarden bij α = 5%.

P ( X k )= P ( X l )= α 2

=⇒

=⇒

P ( X k )= 0,025

P ( X l )= 0,025

P ( X k )= 0,975

P ( X l )= 0,025

ICT =⇒ l = 35,85 k = 58,35

Dat betekent dat, wanneer het aantal Nederlandse kampeerders in onze steekproef binnen het interval [ 36, 58] ligt, de nulhypothese wordt aanvaard. Ligt het aantal uitvallers buiten dit interval, dan wordt ze verworpen.

In ons geval is 61 ∉ [ 36, 58] en wordt de nulhypothese dus verworpen. Omdat 61 rechts van het interval ligt, zal Thomas ’s avonds aan Ellen vertellen dat dit percentage volgens hem niet klopt en vermoedelijk hoger ligt.

0 V A V 150 4758

36

– methode 2 : via de P -waarde

P -waarde = 0,0155 < α = 0,05

Dus : H 0 wordt verworpen.

150 –

Betrouwbaarheidsintervallen en toetsen van hypothesen

Toepassing 5 : werking geneesmiddel

Een fabrikant van geneesmiddelen garandeert dat een medicijn in minstens 85% van de gevallen werkt. In een steekproef van 300 personen blijken er 238 personen te zijn waarbij het middel werkte. Kan de fabrikant gelijk hebben met zijn garantie ?

( α = 0,01)

Oplossing :

– formuleren van de hypothesen

H 0 : het middel werkt in 85% van de gevallen : p = 0,85

H 1 : het middel werkt in minder dan 85% van de gevallen : p < 0,85

Dit is een links eenzijdige toets van fracties.

– de toetsingsgrootheid

X = het aantal personen waarbij het medicijn werkt.

X is binomiaal verdeeld met B( n = 300, p = 0,85)

Omdat n groot is, mogen we deze binomiale verdeling benaderen door de normale verdeling met gemiddelde

µ = np = 255en σ = np (1 p )= √38,25 ≈ 6,185.

– methode 1: via grenswaarden

We bepalen de linkergrenswaarde bij α = 1%.

P ( X k )= 0,01 ICT =⇒ k = 240,61

Dat betekent dat, wanneer het aantal personen in de steekproef waarbij het medicijn werkt, groter dan of gelijk zou zijn aan 241, de nulhypothese aanvaard wordt.

In dit geval is 238 < 241 en wordt de nulhypothese verworpen.

– methode 2: via de P-waarde

P -waarde = 0,003 < α = 0,01, m.a.w. H 0 wordt verworpen.

151 4
0 A V 300 241

8

Samenvatting

• Je kent de werkwijze om een hypothese te toetsen.

– De hypothese formuleren.

De uitspraak waarvan de juistheid wordt onderzocht, noemen we de nulhypothese.

Als we op basis van verzamelde gegevens concluderen dat de nulhypothese niet geloofwaardig is, aanvaarden we het andere geformuleerde standpunt : de alternatieve hypothese.

– De toetsingsgrootheid vaststellen.

– De kritieke zone of het verwerpingsgebied bepalen.

Op grond van de kansverdelingen kunnen we overgaan tot het opstellen van een beslissingsschema, waarin voor iedere waarde van X wordt aangegeven welke beslissing wordt genomen.

De verzameling van waarden van X , waarvoor H0 wordt verworpen ten gunste van H 1, noemen we de kritieke zone of het verwerpingsgebied.

De complementaire verzameling, dit is de verzameling van waarden van X waarvoor we H 0 niet verwerpen, noemen we het aanvaardingsgebied.

• Je kent het verschil tussen een fout van de eerste soort (H0 is waar en H0 verwerpen) en een fout van de tweede soort (H1 is waar en H0 niet verwerpen).

beslissing op grond van de steekproef H 0 niet verwerpen H 0 verwerpen

H 0 is waar juiste beslissing 1 – α fout van de eerste soort α

werkelijke situatie

H 1 is waar fout van de tweede soort b juiste beslissing 1 – b

• Je kent het verschil tussen een eenzijdige en een tweezijdige toets.

links eenzijdige toetstweezijdige toetsrechts eenzijdige toets nulhypothese en alternatieve hypothese

152
H0 : µ = µ0 H1 : µ<µ0 H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ>µ0 P X g α P X g l 1 2 α P X g r 1 2 α P X g α H0 verwerpen als X g X g l of X g r X g g α gl gr α 2 α 2 g α

en toetsen van hypothesen

links eenzijdige toetstweezijdige toetsrechts eenzijdige toets

nulhypothese en alternatieve hypothese

• Je kent de betekenis van de P-waarde : de kans om onder H0 een gemiddelde waarde groter of gelijk aan het waargenomen gemiddelde te vinden.

links eenzijdige toets

tweezijdige toets rechts eenzijdige toets

nulhypothese en alternatieve hypothese

nulhypothese en alternatieve hypothese

0 verwerpen als

links eenzijdige toets tweezijdige toets rechts eenzijdige toets

• Je kunt hypothesen toetsen via de grenswaarden en via de P-waarde.

153 4
Betrouwbaarheidsintervallen
H0 : p = p 0 H1 : p < p 0 H0 : p = p 0 H1 : p = p 0 H0 : p = p 0 H1 : p > p 0 P ( X k ) α P ( X k ) 1 2 α P ( X l ) 1 2 α P ( X l ) α H0 verwerpen als X k X k of X l X l k α k l α 2 α 2 l α
H0 : µ = µ0 H1 : µ<µ0 H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ>µ0 P = P
X x
Is x <µ
P = 2 · P
X x ) Is x >µ
P = 2 P ( X x ) P = P ( X x ) H0
P α P α P α
(
)
,danis
(
,danis
verwerpen als
H0 : p = p 0 H1 : p < p 0 H0 : p = p 0 H1 : p = p 0 H0
p = p 0 H1
p
p 0 P
Is
Is
=
P = P
p ) H
α P α P α
:
:
>
= P ( X p )
p < p ,danis P = 2 P ( X p )
p > p ,danis P
2 P ( X p )
( X
P

Abraham Wald (1902-1950), grondlegger van de statistische beslissingstheorie

Abraham Wald werd in 1902 geboren in een Joodse familie in Hongarije. Omdat hij op zaterdag (sabbat) geen les mocht volgen van zijn ouders, werd hij niet toegelaten op school. Abraham Wald kreeg thuis onderricht van enkele leden van de familie, die bekwame leraars waren.

Na WO I werd een deel van Hongarije aan Roemenië gegeven, hieronder ook de geboortestad Cluj van Abraham Wald. Wald werd toegelaten tot de universiteit van Cluj, waar hij werd opgemerkt wegens zijn uitzonderlijke wiskundige begaafdheid.

In 1927 ging hij studeren aan de universiteit van Wenen, waar hij in 1931 onder de supervisie van Karl Menger doctoreerde met een werk over meetkunde. In het Wenen van de jaren 30 was er voor een jonge Joodse man geen mogelijkheid om een academische positie te verwerven, hoe getalenteerd hij ook was. Om een beetje financiële zekerheid te hebben nam Wald de betrekking van wiskundeleraar aan bij Karl Schlesinger, een bekende Oostenrijkse bankier en economist. Tussen 1931 en 1937 publiceerde hij 21 documenten over meetkunde, die Menger beschreef als ‘... deep, beautiful and of fundamental importance ’, en 10 documenten over economie en econometrie.

Toen in 1938 de Nazi’s Oostenrijk binnenvielen, kwam het leven van de Joodse geleerde in gevaar. The Cowles Commission nodigde hem uit naar de Verenigde Staten om daar onderzoek op het gebied van econometrie te verrichten. In de zomer van 1938 verliet Wald Oostenrijk om in de Verenigde Staten te gaan wonen. Op die manier ontsnapte hij als enige van zijn familie aan de gaskamers van Auschwitz.

Van 1938 tot 1941 studeerde hij als lid van de Carnegie Corporation statistiek aan de Columbia University in New York. In 1941 werd hij verbonden als lector aan die universiteit en hij bleef er bij de staf tot aan zijn dood. Ondertussen werkte hij ook mee aan militaire projecten met de Statistical Research Group van de Columbia University. Hij gebruikte zijn kennis van de statistiek om voor de U.S. Navy een methode te ontwikkelen die nuttige informatie gaf over de kwetsbaarheid van verschillende delen van een vliegtuig door het afweergeschut. Wald en zijn team ontwikkelden een basistheorie : ‘sequential probability ratio test (SPRT)’, nu bekend als betrouwbaarheidsinterval.

In Wenen legde Wald zich vooral toe op zuivere wiskunde, meestal meetkunde, en op econometrie. Zijn belangrijkste werk echter ligt in de statistiek. Hij ontwikkelde een veralgemening van het probleem Gamblers Ruin, dat een belangrijke rol speelt in de statistiek en bij gokspelen in het casino. Hij was de eerste die het probleem van ‘toetsen van hypothesen’ oploste. De meeste vondsten publiceerde hij in Annals of Mathematical Statistics (1939) en in Sequential Analysis (1947)

Niet alleen als statisticus maar ook als leraar had Abraham Wald een belangrijke invloed : ‘he was a master at deriving complicated results in amazingly simple ways ’. De notities die de studenten namen tijdens zijn colleges aan de Columbia University werden wegens hun uitzonderlijke helderheid gebruikt door de studenten in de statistiek van verschillende andere universiteiten in de Verenigde Staten.

Aan zijn schitterende carrière kwam abrupt een einde. In 1950 ontving hij een uitnodiging van de Indiase regering om lezingen over statistiek te geven in dat land. Tijdens zijn tournee in India kwam Wald samen met zijn vrouw om bij een vliegtuigcrash. Zijn laatste werk in verband met de statistische beslissingstheorie was het monumentale Statistical Decision Functions (1950)

154
Abraham Wald

Betrouwbaarheidsintervallen en toetsen van hypothesen

9 Oefeningen

Een fabrikant van lampen beweert dat de lampen een gemiddelde brandduur van 1800 uur hebben met een standaardafwijking van 120 uur. Om het gemiddelde te toetsen, nemen we een steekproef van 80 stuks. De steekproef levert een gemiddelde waarde van 1750 uur. Heeft de fabrikant gelijk of niet ? ( toets eenzijdig α = 0,05)

Een fotostudio wenst een partij flitslampjes te kopen. In de partij mogen niet meer dan 6% slechte lampjes voorkomen. Om de kwaliteit van de lampjes te controleren, nemen ze een steekproef van 100 stuks. Hierin bevinden zich 8 slechte lampjes. Wordt de partij goedgekeurd of niet ? ( α = 5%)

Een muntstuk wordt 160 keer geworpen en we verkrijgen 101 keer munt. Is dat normaal ? (toets tweezijdig α = 5%)

Een fabrikant van lightproducten beweert dat zijn producten slechts 140 calorieën bevatten (met een standaardafwijking van 20 calorieën) per pakje van 200 gram. Bij een serie controleproeven heeft de consumentenbond 20 pakjes onderzocht. Die 20 pakjes bleken gemiddeld een voedingswaarde van 155 calorieën te bevatten.

Toets of de fabrikant gelijk kan hebben met zijn uitspraak ( α = 1%)

Een kweker heeft een aardbeienveld. De opbrengst X in gram per plant is normaal verdeeld met m = 240 gram en s = 60 gram.

In een poging om een hogere opbrengst per plant te bekomen, test de aardbeienkweker op een proefveldje een nieuwe bemestingsmethode uit. Wat blijkt ?

De 16 planten op het proefveldje leveren gemiddeld 260 gram op ( s nog steeds 60 gram)

Toets of de bemestingsmethode overtuigende resultaten heeft opgeleverd. Kies α = 0,05 en toets tweezijdig.

In een medisch labo worden capsules machinaal gevuld met een bepaalde vloeistof. Wanneer de machine correct staat afgesteld, is de inhoud van de capsules te beschouwen als een normaal verdeelde kansvariabele X met gemiddeld 8 ml vloeistof en standaardafwijking 0,3 ml. Om aan de kwaliteitsnormen te voldoen, zou er in elke capsule tussen 7,3 ml en 8,7 ml vloeistof moeten zitten.

a Hoeveel % van de capsules voldoet aan de kwaliteitsnorm, in de veronderstelling dat de machine correct staat afgesteld ?

b Regelmatig wordt de afstelling van de vulmachine gecontroleerd. Een steekproef van 36 capsules levert een gemiddelde inhoud van 8,5 ml. Toets of de machine nog correct is ingesteld of niet. Toets tweezijdig en kies α = 1%.

4 155
1 2
3 4 5 6

Uit marktonderzoek weten we dat 30% van de jongeren de frisdrank ‘Basiclimits’ kent en soms koopt. Na een spetterende promotiecampagne wordt een aselecte steekproef van 225 jongeren genomen om na te gaan hoeveel van hen de frisdrank soms koopt. Dat zijn er 84. Toets (eenzijdig) met α = 5% of de promotiecampagne effect heeft gehad.

Bij de vorige gemeenteraadsverkiezingen haalde de partij van de burgemeester 32% van de stemmen. Een jaar voor de volgende verkiezingen wil de burgemeester de populariteit van zijn partij nagaan. Uit een enquête, uitgevoerd bij 400 aselect gekozen stemgerechtigde inwoners van de gemeente, blijkt dat er 98 achter de partij van de burgemeester staan, 252 staan niet achter de partij en 50 inwoners hebben (nog) geen mening. Toets met α = 10% of de burgemeester nog even populair is als bij de vorige verkiezingen.

Een fabrikant brengt een exclusief parfum op de markt in flesjes van 200 ml. De vulmachine vult de flesjes waarvan de inhoud normaal verdeeld is met standaardafwijking s = 5 ml en een gemiddelde van m = 204 ml. Regelmatig neemt de fabrikant een steekproef van 25 flesjes en controleert hij de inhoud. Als het gemiddelde toeneemt, dan gaat dat ten koste van zijn winstmarge. Anderzijds kost een te laag gemiddelde hem op termijn klanten.

a Hoeveel % van de flesjes bevat minstens 200 ml, in de veronderstelling dat de machine correct staat afgesteld ?

b Wanneer een steekproef een gemiddelde inhoud van 202 ml oplevert, wat is dan de conclusie van de fabrikant op het 5%-significantieniveau ?

c Wanneer een steekproef een gemiddelde inhoud van 202 ml oplevert, wat is dan de conclusie van de fabrikant op het 1%-significantieniveau ?

Op de lopende band van een montagebedrijf is de assembleertijd van een stuk in minuten normaal verdeeld met een gemiddelde van m = 32 minuten en s = 6 minuten. Het afdelingshoofd beweert dat na een interne reorganisatie de assembleertijd is teruggedrongen naar een gemiddelde van m = 28 minuten en zelfde s. Die bewering wordt getoetst door de assembleertijd van 16 stuks op te meten. Om 16 stuks te assembleren was een totaaltijd nodig van 468 minuten.

a Toets tweezijdig met α = 5% of de reorganisatie zinvol was.

b Toets eenzijdig met α = 5% of de bewering van het afdelingshoofd juist is.

In een fabriek worden assen vervaardigd waarbij de gemiddelde diameter ingesteld wordt op 7,6 mm. De diameters van de geproduceerde assen zijn normaal verdeeld met standaardafwijking 0,4 mm. Ter controle nemen ze een steekproef van 50 assen en ze vinden als gemiddelde een waarde van 7,4 mm. Indien de diameters te veel afwijken, dan wordt het productieproces stopgezet. Ga na, met α = 1%, of het productieproces zal worden stopgezet.

Het percentage geproduceerde onderdelen die niet aan de kwaliteitsnorm voldoen in het productieproces van een bepaalde afdeling, bedraagt 6%. Het afdelingshoofd heeft het vermoeden dat het gros van deze afgekeurde producten op een maandag zijn geproduceerd. Om na te gaan of dit effectief zo is, besluit hij uit de productie van afgelopen maandag een steekproef te nemen van 100 onderdelen. Hij vindt 9 onderdelen die niet aan de norm voldoen. Mag hij besluiten dat er ’s maandags inderdaad meer slechte onderdelen worden geproduceerd ? ( Neem α = 0,05)

156
7 8 9 10 11 12

Betrouwbaarheidsintervallen en toetsen van hypothesen

Een horeca-uitbater overweegt om de prijs van zijn consumpties met 30 eurocent te verhogen. Hij denkt dat deze maatregel hem 4% aan cliënteel zal kosten. Om zeker te zijn, doet hij een enquête bij een aselecte steekproef van 50 van zijn klanten. Vier klanten beweren dat ze inderdaad van zaak zouden veranderen bij een dergelijke prijsstijging. Is de inschatting van de uitbater juist ? ( Neem α = 0,1)

Een kwaliteitscontroleur van voedselketen ‘Smac Limits’ controleert onder andere de temperatuur van een geserveerd kopje koffie. Als norm geldt dat die in minstens 90% van de gevallen hoger moet zijn dan 55 °C. Bij een aselecte steekproef van 40 kopjes koffie bleek slechts in 33 gevallen de temperatuur in orde. Onderzoek of de uitslag van de steekproef bij een significantieniveau van 5% voldoende reden vormt om aan te nemen dat de norm niet gehaald wordt.

In een fabriek worden balken geproduceerd die een massa van 12,4 ton moeten kunnen dragen. De productie is zodanig ingesteld dat de balken gemiddeld een massa van 12,7 ton aankunnen met een standaardafwijking van 200 kg.

a Hoeveel % van de balken heeft een draagkracht van minder dan 12,4 ton ?

b Dagelijks wordt een steekproef genomen van 16 balken en wordt hun draagkracht getest. Als we een significantieniveau van 2% wensen, bepaal dan de minimale gemiddelde draagkracht die deze steekproef moet hebben vooraleer het productieproces wordt bijgesteld.

c Dankzij nieuwe technologieën zijn ze erin geslaagd om de draagkracht van de balken te verhogen. De fabrikant denkt dat zijn balken nu een gemiddelde massa van 13,1 ton aankunnen (bij eenzelfde standaardafwijking).

Een steekproef bij 25 balken levert een gemiddelde draagkracht op van 13,01 ton. Kan de fabrikant met die gegevens zijn vermoeden staven op het 5%-significantieniveau ? En op het 1%-significantieniveau ?

Maarten beweert dat hij bij het voetballen 3 op de 4 penalty’s raak schiet. Jonathan denkt dat hij pocht en telt het aantal succesvolle penalty’s van Maarten in de afgelopen maand. Dat waren er 10 op de 17. Kan Maarten gelijk hebben ? ( Neem α = 5%)

Het gemiddelde slaagpercentage bij eerstejaarsstudenten in een onderwijsrichting aan een bepaalde faculteit bedraagt 57%.

Een middelbare school beweert dat zij haar leerlingen beter voorbereidt op die richting, want het voorbije academiejaar slaagden 10 van de 13 van hun leerlingen die aan de faculteit begonnen. Test de bewering van de middelbare school op het 5%-significantieniveau.

Een fabrikant vermoedt dat de vulmachine in zijn atelier afgesteld staat op minimaal 103 gram met een standaardafwijking van 4 gram. In werkelijkheid staat de machine afgesteld op 100 gram (eveneens met standaardafwijking 4 gram).

a Als de fabrikant (eenzijdig) de gemiddelde waarde van 16 stuks gaat testen op het 5%-significantieniveau, hoe groot bedraagt dan de fout van de tweede soort ?

b Als de fabrikant gaat testen op het 1%-significantieniveau, hoe groot is dan het onderscheidingsvermogen ?

c De fabrikant doet nu een steekproef van 16 stuks en vindt een gemiddelde waarde van 101 gram. Wat is zijn besluit op het 1%-significantieniveau ?

d Krijgt hij hetzelfde besluit als een steekproef van 25 stuks ook een gemiddelde waarde van 101 gram zou opleveren ?

4 157
13 14 15
16 17 18

a Kasper gooit 200 maal met twee dobbelstenen en haalt 11 maal dubbel 6. Hij vermoedt dat de dobbelstenen zijn verzwaard. Toets op een significantieniveau van 10% of hij gelijk heeft of niet.

b Jonas gooit 120 maal met twee (andere) dobbelstenen. Hierbij gooit hij 23 keer als som 7.

Toets op een significantieniveau van 5% of de dobbelstenen zuiver zijn of niet.

c Ook Xander test twee dobbelstenen. Bij 160 worpen zijn er 14 worpen bij lager dan 6.

Toets op een significantieniveau van 8% of dit normaal is of niet.

Opmerking : toets a eenzijdig, b en c tweezijdig.

Een fruitteler beweert dat een partij appelen gemiddeld minstens 215 gram weegt met een standaardafwijking van 10 gram. Warre neemt lukraak 25 appelen uit de bakken en weegt ze na. De gemeten waarden (in gram) zijn:

Gelooft hij de fruitteler betreffende de gemiddelde massa van zijn appelen op het 5%-significantieniveau ? (Warre veronderstelt dat de waarde voor de standaardafwijking inderdaad juist is.)

Een woordvoerder van de Vlaamse regering beweert bij het voorstellen van de nieuwe begroting dat 65% van de Vlaamse bevolking achter de huidige regering staat. Een politicus van de oppositie beweert dat dit heel wat minder is. Beide beweringen worden getoetst door 100 willekeurig gekozen personen hun mening te vragen.

Bij welke aantallen voorstanders van de regering verwerp je de bewering van de woordvoerder van de regering ? Neem significantieniveau α = 0,05.

In een krantenartikel is te lezen dat 38% van de Belgische huishoudens een vaatwasser bezit.

Om die bewering te toetsen, wordt willekeurig een steekproef van 120 Belgische gezinnen genomen. Hierbij zijn er 33 gezinnen met een vaatwasser. Is de bewering van het krantenartikel juist of niet ?

( Neem α = 0,05.)

Een koekjesfabrikant stopt om de verkoop te stimuleren in een aantal dozen een waardebon.

De fabrikant beweert dat de helft van de dozen een waardebon bevat.

Hij gaat de hypothese H 0 : p = 0,5 ; H 1 : p ≠ 0,5 testen door een steekproef van 50 dozen te nemen.

a Stel de beslissingsregel op bij α = 0,05.

b Stel dat de steekproef 20 dozen met een waardebon bevat. Test je hypothese met behulp van de P-waarde.

158
220 225 192 195 199 201 204 206 224 221 222 193 203 203 210 208 207 223 197 202 206 214 209 211 205
19 20 21 22 23

Een gezaghebbend tijdschrift publiceert dat het geboortegewicht in Vlaanderen normaal verdeeld is met een gemiddelde van 3,3 kg en een standaardafwijking van 0,55 kg. Een gynaecoloog heeft de indruk dat het gemiddelde geboortegewicht in zijn kliniek groter is dan 3,3 kg. Om zijn hypothese te toetsen houdt hij gegevens bij van dertig kinderen. De gynaecoloog vindt voor het gemiddelde van zijn steekproef 3,483 kg. Mag hij op basis van dit resultaat besluiten dat het gemiddelde geboortegewicht in zijn kliniek groter is dan 3,3 kg ? ( Neem α = 0,05.)

Betrouwbaarheidsintervallen en toetsen van hypothesen

In een rapport van het ministerie van Landbouw wordt gesteld dat de inenting van dieren met een bepaald geneesmiddel bij 40% van de ingeënte dieren levensgevaarlijke neveneffecten veroorzaakt. De firma zelf beweert dat de kans op neveneffecten slechts 20% bedraagt. Een kippenhouder met ongeveer 4000 ingeënte kippen, raadpleegt zijn veearts om een steekproef uit te voeren onder zijn kippen ter controle van het optreden van de neveneffecten. De veearts voert een controle uit op 50 kippen en vindt er 15 met neveneffecten. Wat is zijn besluit op het 5%-significantieniveau ?

Volgens het etiket op een fles wijn bedraagt het alcoholpercentage van die wijnsoort 13%. In werkelijkheid is het alcoholpercentage van een willekeurige fles wijn natuurlijk niet precies 13%. In de ene fles is het percentage groter en in de andere fles kleiner dan 13%. Neem aan dat het alcoholpercentage van de totale hoeveelheid wijn normaal verdeeld is met m = 13% en standaardafwijking s = 0,6%. Om na te gaan of de aanduiding op het etiket klopt, onderzoekt de voedingsmiddeleninspectie 24 flessen van deze wijnsoort. De steekproef levert een gemiddeld alcoholpercentage van 12,71% op. Wat besluit de inspectie op het 1%-significantieniveau ?

Bakker Bol beweert dat zijn broden 800 gram wegen ( s = 18 g). Een kritische consument gelooft dat niet zonder meer en weegt een paar broden. Ze zijn alle lichter dan 800 gram. Maar dat is nog niet genoeg bewijsmateriaal. De klant besluit om dertig broden te kopen. De gemeten waarden (in gram) zijn :

Is er voldoende bewijsmateriaal om een klacht in te dienen op het 1%-significantieniveau ?

4 159
795 790 812 782 789 785 815 802 799 780 809 805 781 791 779 801 803 804 782 787 806 794 777 781 784 787 788 803 808 789
24 25 26 27

Betrouwbaarheidsintervallen en toetsen van hypothesen 4

Ik ken het verschil tussen een steekproefgemiddelde en het populatiegemiddelde.

Ik kan een betrouwbaarheidsinterval voor het populatiegemiddelde berekenen aan de hand van een steekproefgemiddelde.

Ik weet hoe ik het betrouwbaarheidsniveau van een betrouwbaarheidsinterval kan verhogen.

Ik ken de betekenis van betrouwbaarheidsniveau van een betrouwbaarheidsinterval.

Ik ken het verschil tussen een steekproefproportie en de populatieproportie. 129

Ik kan een betrouwbaarheidsinterval voor de populatieproportie berekenen aan de hand van een steekproefproportie.

Ik weet dat een andere steekproef kan leiden tot een ander betrouwbaarheidsinterval.

Ik weet wat de foutenmarge is bij een gegeven betrouwbaarheidsinterval.

Ik kan via de steekproefgrootte de foutenmarge tot een gewenst niveau bepalen.

Ik ken het verschil tussen de nulhypothese en de alternatieve hypothese en ik kan een hypothese formuleren.

Ik weet wat een toetsingsgrootheid is.

Ik ken de betekenis en het belang van het significantieniveau bij het toetsen van een hypothese.

Ik ken de betekenis van kritieke zone of verwerpingsgebied.

Ik weet welke fouten bij het toetsen van een hypothese kunnen voorkomen.

Ik ken het verschil tussen een fout van de eerste en van de tweede soort.

Ik ken de definitie van onderscheidingsvermogen.

Ik ken het verschil tussen een eenzijdige en een tweezijdige toets.

Ik kan een hypothese omtrent het gemiddelde toetsen via de toetsingsprocedure via grenswaarden.

Ik kan een hypothese omtrent proporties toetsen via de toetsingsprocedure via grenswaarden.

Ik kan een hypothese omtrent het gemiddelde toetsen via het berekenen van de P-waarde.

Ik kan een hypothese omtrent proporties toetsen via het berekenen van de P-waarde.

132

132

139

140

140

140

140

140

141

142

143

143

144

145

160 WAT MOET JE KENNEN EN KUNNEN ? pagina
123
124
124
127
131
131

Werken met grote datasets 5

In dit hoofdstuk zul je leren grote datasets te analyseren met behulp van statistische software in functie van een statistisch onderzoek. Met een ‘grote dataset’ wordt bedoeld: een dataset van minstens enkele honderden gegevens.

Je kunt zelf de statistische software kiezen. Het is wel aangewezen dat die in staat is om een CSV-bestand in te lezen. CSV staat voor comma separated values. Een CSV-bestand is een tekst-tabel-bestand dat statistische gegevens bevat gescheiden door een komma. Om zicht te krijgen op de dataset is het aangewezen om eerst enkele grafische voorstellingen te maken.

Werken met grote datasets

5.1 Voorbeeld 1 : bevolking naar woonplaats, nationaliteit, burgerlijke staat, leeftijd en geslacht

1 De data  163

2 Statistische software  164

3 De dataset verkennen en analyseren  164

5.2 Voorbeeld 2 : NBA

1 De data  166

2 Statistische software  167

3 De dataset verkennen en analyseren  167

5.3 Onderzoeksopdrachten 170

162
5

5.1 Voorbeeld 1 : bevolking naar woonplaats, nationaliteit, burgerlijke staat, leeftijd en geslacht

1 De data

Op het internet vind je recente datasets met statistische gegevens. Een interessante site is de website https://statbel.fgov.be/nl/open-data, de website van het Belgische statistiekbureau.

De bestanden van het statistiekbureau zijn meestal beschikbaar in twee formaten : als CSV-bestand (TXT-formaat) en als Excelbestand.

Het bestand “bevolking naar woonplaats, nationaliteit, burgerlijke staat, leeftijd en geslacht” anno 2023 bevat 474 210 gegevens met volgende rubrieken :

• CD-gemeente : een numerieke code voor elke gemeente

• TX-gemeente : de naam van de gemeente

• CD-provincie : een numerieke code voor elke provincie

• TX-provincie : de naam van de provincie

• CD-gewest : een numerieke code voor elk gewest

• TX-gewest : Vlaams Gewest (2), Waals Gewest (3) of Brussels Hoofdstedelijk Gewest (4)

• CD-geslacht : mannelijk (M) of vrouwelijk (F)

• CD-nationaliteit : BEL of ETR

• TX-nationaliteit : Belg of niet-Belg

• CD-burg.staat : een numerieke code

• TX-burg.staat : ongehuwd (1), gehuwd (2), weduwstaat (3) of gescheiden (4)

• CD-leeftijd

• MS-aantal : aantal personen die aan de vorige criteria voldoen

Op het ogenblik dat we deze dataset hebben gedownload, ging dit over een totaal van 11 697 557 personen.

163 5 Werken met grote datasets

2 Statistische software

Met de programma’s Excel en GeoGebra kun je heel eenvoudig data visualiseren. Wie iets meer wilt, vindt op het internet heel wat (gratis) statistische software waarmee je datasets kunt verkennen en analyseren.

Wij brachten dit voorbeeld grafisch in beeld met behulp van Excel.

3 De dataset verkennen en analyseren

Eenmaal je de gegevens hebt (de data) en een keuze gemaakt hebt met welk programma je de gegevens gaat verwerken (de software), moet je onderzoeksvragen stellen.

– Wat wil ik visualiseren?

– Welke verbanden zijn interessant?

– Welke karakteristieken heb ik nodig voor verder onderzoek?

– Zijn er hypothesen die ik wil onderzoeken?

Voorbeeld 1 : een histogram met het aantal inwoners en hun burgerlijke staat per provincie

Data :

Histogram :

164

Voorbeeld 2 : leeftijdscurve van de inwoners met respectievelijk de Belgische en niet-Belgische nationaliteit van het Brussels Hoofdstedelijk Gewest

165 5 Werken met grote datasets

5.2

Voorbeeld 2 : NBA

1 De data

Op de website https://www.kaggle.com/datasets?fileType=csv kun je heel wat interessante datasets terugvinden.

Het bestand “NBA Players Stats season 2023” bevat 539 datalijnen en 30 kolommen met volgende gegevens:

• de naam van de basketballer

• de positie van de speler in het spel

• de afkorting van het team waar de speler momenteel voor speelt

• de leeftijd van de speler

• het totale aantal wedstrijden die de speler heeft gespeeld in dit seizoen

• het totale aantal gewonnen wedstrijden van de speler

• het totale aantal verloren wedstrijden van de speler

• het totale aantal minuten dat de speler heeft gespeeld in dit seizoen

• het totale aantal punten gemaakt door de speler

• het totale aantal velddoelpunten gemaakt door de speler

• het percentage succesvolle velddoelpunten gemaakt door de speler

• het totale aantal driepunters gemaakt door de speler

• het percentage geslaagde driepunters gemaakt door de speler

• het totale aantal gemaakte vrije worpen door de speler

• het totale aantal vrije worpen geprobeerd door de speler

• het percentage geslaagde vrije worpen gemaakt door de speler

• het totale aantal aanvallende rebounds gemaakt door de speler

• het totale aantal verdedigende rebounds gemaakt door de speler

• het totale aantal rebounds (offensief + defensief) gemaakt door de speler

• het totale aantal assists gemaakt door de speler

• het totale aantal balbewegingen gemaakt door de speler

• het totale aantal steals gemaakt door de speler

• het totale aantal blocks gemaakt door de speler

• het totale aantal persoonlijke fouten gemaakt door de speler

• het totale aantal NBA-fantasiepunten gemaakt door de speler

• het totale aantal double-doubles gemaakt door de speler

• het totale aantal triple-doubles gemaakt door de speler

• het totale verschil tussen de score van het team van de speler en de score van de tegenstander terwijl de speler in het spel is

166

2 Statistische software

Voor de verwerking van de data kozen we voor het gratis softwarepakket JASP. Je vindt het op de website https://jasp-stats.org

3 De dataset verkennen en analyseren

Met zo’n veelheid aan gegevens kun je heel wat visualiseren en analyseren. We geven een paar voorbeelden.

Voorbeeld 1 : leeftijd van de spelers

We maken een histogram van de leeftijd van de spelers. We vragen ons af of de leeftijd normaal verdeeld is, daarom tekenen we ook een QQ-plot.

Besluit :

Uit de QQ-plot blijkt dat de leeftijd bij benadering normaal verdeeld is met een gemiddelde van 26 jaar en een standaardafwijking van 4 jaar. De jongste speler is 19 jaar en de oudste speler is 42 jaar.

167 5 Werken met grote datasets

Voorbeeld 2 : totaal aantal punten gemaakt door de speler (PTS)

Hiervan maken we een histogram en een boxplot.

Besluit : Het gemiddelde aantal punten is 523. We zien dat er spelers zijn die veel meer punten scoorden (zie boxplot) want er zijn duidelijk uitschieters zichtbaar.

168

Voorbeeld 3 : totaal aantal balbewegingen gemaakt door de speler (TOV)

We willen de karakteristieken afhankelijk van de positie van de speler. We willen ook een 95%-betrouwbaarheidsinterval voor het gemiddelde.

• C = center

• G = guard

• F = forward

• PF = power forward

• PG = point guard

• SF = small forward

• SG = shooting guard

Besluit :

De afkortingen waarvan sprake duiden op de positie van een speler op het veld:

We kunnen met een betrouwbaarheid van 95% stellen dat een shooting guard een gemiddeld aantal balbewegingen doet variërend van 68 tot 92.

169 5 Werken met grote datasets

5.3 Onderzoeksopdrachten

Het bestand “verkeersslachtoffers 20xx” op de website van het Belgische statistiekbureau https://statbel.fgov.be/nl/open-data bevat meer dan 80 000 gegevens met o.a. volgende items:

• DT-dag : datum van het ongeval

• DT-uur : uur van het ongeval

• CD-weekdag : numerieke code dag van de week

• TX-weekdag : dag van de week (1 = maandag)

• MS : aantal slachtoffers

• CD-omgeving : numerieke code omgeving

• TX-omgeving : omgeving (bv. 1 = binnen bebouwde kom)

• CD-slachtoffer : numerieke code slachtoffer

• TX-slachtoffer : slachtoffer (bv. 5 = fietser)

• CD-voertuig : numerieke code voertuig

• TX-voertuig : voertuig (bv. 4 = lichte vrachtauto)

• CD-wegtype : numerieke code wegtype

• TX-wegtype : wegtype (bv. 2 = gewestweg)

• CD-tijdstip : numerieke code tijdstip van de dag

• TX-tijdstip : tijdstip van de dag (bv. 1 = bij klaarlichte dag)

• CD-leeftijdsgroep : numerieke code leeftijdsgroep

• TX-leeftijdsgroep : leeftijdsgroep (bv. 3 = 10 tot 14 jaar)

• CD-gemeente : numerieke code gemeente

• TX-gemeente : naam van de gemeente

• CD-provincie : numerieke code provincie

• TX-provincie : naam provincie

• CD-geslacht : numerieke code geslacht (1 = M ; 2 = V)

• TX-geslacht : geslacht

Verken deze dataset en maak gepaste grafische voorstellingen.

Het bestand “verkeersongevallen 20xx” op de website van het Belgische statistiekbureau https://statbel.fgov.be/nl/open-data bevat meer dan 40 000 gegevens.

a Beschrijf de variabelen.

b Verken de dataset en maak gepaste grafische voorstellingen.

Kies een dataset op de website https://www.kaggle.com/datasets?fileType=csv en analyseer het met JASP.

170
1 2 3

Bijlage 1 : statistiek met GeoGebra

Kansverdelingen

DE NORMALE VERDELING

Gegeven : X ∼ N ( m = 30, s = 4)

P( X ⩽ a ) = Normaal ( m, s, a )

P( X ⩽ 33) = Normaal ( 30, 4, 33) = 77,34%

P( X ⩽ a ) > b ⟹ a = InverseNormaal ( m, s, b )

P( X ⩽ a ) > 40% ⟹ a = InverseNormaal ( 30, 4, 0.40) = 28,99

DE

HYPERGEOMETRISCHE VERDELING

In een vaas zitten 12 balletjes, 5 gele en 7 blauwe. We trekken zonder teruglegging 3 balletjes.

X = aantal getrokken gele balletjes

N = 12 ; M = 5 ; n = 3

P( X = i ) = Hypergeometrisch ( N, M, n, i, false)

P( X = 2) = Hypergeometrisch ( 12, 5, 3, 2, false) = 31,82%

P( X ⩽ i ) = Hypergeometrisch ( N, M, n, i, true)

P( X ⩽ 2) = Hypergeometrisch ( 12, 5, 3, 2, true) = 95,45%

P( X ⩽ a ) > b ⟹ a = InverseHypergeometrisch ( N, M, n, b)

P( X ⩽ a ) > 80% ⟹ a = InverseHypergeometrisch ( 12, 5, 3, 0.90) = 2

Betrouwbaarheidsintervallen

BETROUWBAARHEIDSINTERVAL VOOR m ( s gekend)

Bij het nawegen van 180 pakjes pasta vinden we een steekproefgemiddelde van 252 gram.

Bepaal een 95%-betrouwbaarheidsinterval als je weet dat s = 7 gram.

ZIntervalGemiddelde ( x , s, n, a %)

ZIntervalGemiddelde ( 252, 7, 180, 0.9) = [ 251.14, 252.86]

Toetsen van hypothesen

BEREKENEN VAN DE P-WAARDE VOOR m ( s gekend)

ZTestGemiddelde ( x , s, n, m0, staart) staart is : “<”, “>” of “ ≠ ”

DE BINOMIALE VERDELING

Gegeven : X ∼ B ( n = 8, p = 0,3)

P( X = i ) = BinomialeVerdeling ( n, p, i, false)

P( X = 4) = BinomialeVerdeling ( 8, 0.3, 4, false) = 13,61%

P( X ⩽ i ) = BinomialeVerdeling ( n, p, i, true)

P( X ⩽ 4) = BinomialeVerdeling ( 8, 0.3, 4, true) = 94,20%

P( X ⩽ a ) > b ⟹ a = InverseBinomiaal ( n, p, b )

P( X ⩽ a ) > 90% ⟹ a = InverseBinomiaal ( 8, 0.3, 0.90) = 4

BETROUWBAARHEIDSINTERVAL VOOR DE POPULATIEPROPORTIE p

Bij controle van 600 elektrische toestellen uit een geleverde partij blijken er 19 defect te zijn. Bereken op basis van deze steekproef een 90%-betrouwbaarheidsinterval voor de hele partij.

ZProportieSchatting ( p , n, a %)

ZProportieSchatting ( 19 / 600, 600, 0.90) = [ 1.99% ; 4.34%]

BEREKENEN VAN DE P-WAARDE VOOR DE POPULATIEPROPORTIE p

ZTestProportie ( p , n, p, staart) staart is : “<”, “>” of “ ≠ ”

171 5 Werken met grote datasets

Bijlage 2: de standaardnormale verdeling

Tabel

2,7

3,9

172
F( z ) = P( Z ⩽ z )
0,000,010,020,030,040,050,060,070,080,09
0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490 0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524 0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327 0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891 1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91308 0,91466 0,91621 0,91774
0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169 2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
0,99180 0,9202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361 2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
: z
0,0
0,1
0,3
0,5
1,4
1,5
1,7
1,8
1,9
2,0
2,2
2,3
2,4
2,6
0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736 2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807 2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861 3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99896 0,99900 3,1 0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929 3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950 3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965 3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976 3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99981 0,99982 0,99983 0,99983 3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989 3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99992 3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997 z

Oplossingen

1.1 Inleiding (blz. 17)

n = 12 of n = 13 of n = 14

173 Oplossingen
d1440 e720 f6 32495102400
5
6
7
8
9
10
11
12 13 a 10 000 d 96 b 5040 e 168 c 120 f 210 14 a 720 b 3750 15 8 16 a 19 b 6 17 15 18 30 19 15 20 E 21 D 22 C 23 B 1.2
zonder herhaling (blz. 27) 1 360 2 30 3 60 4 210 5 a 27 216 d 2562 b 13 776 e 6216 c 5376 f 7686 6 24 7 3 628 800 8 a 2 d 120 b 6 e 720 c 24 9 24 10 24 11 a 39 916 800 b 479 001 600 12 239 500 800
1a35280 b175560 c 1 56
4
a 48 b 11
b 20
12
minimaal 6 letters
4608
minstens 4 desserts
144 12
Telproblemen
174 13 1680
a 720 c 6 b 120 d 0
a 720 c 144 b 240 d 96
18
19
20 10
216 g 3 108 105
433 620
42 354 312 k 362 340
740 22 20 475 23 21 24 a 64 b 20 c 50 25 a 56 b 35 26 15 27 a 45 b 28 c 39 28 a 924 b 420 c 714 29 7 893 600 30 3 991 680 31
471
770 32 180 33 a 12 650 b 7805 34 840 840 35 61
36
37 a 720 c 96 b 120 d 72 38 a 210 b 315 39 a 252 b 7062 c 1654 40 a 1568 c 2240 e 18 235 b 180 d 20 475 41 a 139 708 800 b 3 991 680 42 92 43 107 520 44 1440 45 a 201 801 600 b 1 907 942 400 46 144 47 a 720 b 279 999 720 48 a 286 b 4253 c 1 399 860 49 a 280 b 147e plaats 50 C
14
15
16 a combinatie d combinatie b variatie e permutatie c combinatie 17 a 28 b 210
20
10
21 a 6 849
b 7 043 796 h
c 752 343 570 i 272 250 d 4 887 036 j 1296 e
f 6 031
a 735
b 12 870 c 9 465 511
880
twaalfde plaats

1.3 De driehoek van Pascal en het binomium van Newton (blz. 41)

1 a a 4 4a 3 b + 6a 2 b 2 4ab 3 + b 4

b32 x 5 + 80 x 4 + 80 x 3 + 40 x 2 + 10 x + 1

c x 4 8 x 3 y + 24 x 2 y 2 32 xy 3 + 16 y 4

d a 16 8a 14 c + 28a 12 c 2 56a 10 c 3 + 70a 8 c 4

56a 6 c 5 + 28a 4 c 6 8a 2 c 7 + c 8

e x 5 5 2 x 4 + 5 2 x 3 5 4 x 2 + 5 16 x 1 32

f x 6 6 x 5 y 2 + 15 x 4 y 4 20 x 3 y 6 + 15 x 2 y 8

6 xy 10 + y 12

g16 x 4 96 x 3 y + 216 x 2 y 2 216 xy 3 + 81 y 4

h a 5 + 10a 4 b 40a 3 b 2 + 80a 2 b 3 80ab 4 + 32 b 5

i729 1458 x + 1215 x 2 540 x 3 + 135 x 4 18 x 5 + 1 x 6

j8√2a 7 + 56√3a 6 b + 252√2a 5 b 2

+ 420√3a 4 b 3 + 630√2a 3 b 4 + 378√3a 2 b 5 + 189√2ab 6 + 27√3 b 7

k x 5 32 + 5 x 4 8 + 5 x 3 + 20 x 2 + 40 x + 32

l y 7 + 7 y 5 + 21 y 3 + 35 y + 35 y + 21 y 3 + 7 y 5 + 1 y 7

m56 24√5

n a 2 + 4a √a + 6a + 4√a + 1

o256 x 8 256 x 7 y + 112 x 6 y 2 28 x 5 y 3 + 35 8 x 4 y 4 7 16 x 3 y 5 + 7 256 x 2 y 6 1 1024 xy 7 + 1 65536 y 8

2 a 126 b 5

b 10626a 20 x 12

c70 x 3 y 4

d 35a 4 2 b 2

3a4 1 + a 2 (3a 4 + 16a 2 + 16)

b144 3 √4 + 1120 + 672 3 √2

c58√2

d2a 5 + 80a 3 + 160a

4a1120 x 4 b 495 16 x 8

c160 x √ x d3360 x 2 e 9√ x 32 f13440 x 2

g7505784

h14 x 2

5 a 1 d 729 b 350 e 10–15

c 2n f 1

1.4 Kansen berekenen met behulp van combinaties (blz. 46)

1metterugleggen:28,8%;zonderterugleggen:29,15%

2 a 5% b 0,25% c 9,75% 3a 1 3 b 1 221

4a 11 4165 b 36 270725 c 1 270725 d 4 595 e 194580 270725 f 15229 54145 g 263764 270725 5a 2 145 b 48 203 c 99 1015 d 676 1015 e 916 1015 f 155 203

6a 1 8145060 b 182780 8145060 c 194130 8145060

175 Oplossingen

7 a 4 17

b 26 51

c 65 153 d 16 153 e 32 153

8 a 10 57 b 20 57

9 a 1 735471 b 5 22287

2.1 Toevalsveranderlijken (blz. 65)

1 aP ( X = 1)= 2 5 ;P ( X = 2)= 4 15 ;P ( X = 3)= 1 6 ; P ( X = 4)= 2 21 ;P ( X = 5)= 1 21 ;P ( X = 6)= 2 105 ;

P ( X = 7)= 1 210

cE [ X ]= 2,2;Var ( X )= 1,76

2 14,64 euro

3 A : 66,66 euro

B : 53,33 euro

C : 40 euro

D : 26,66 euro

E : 13,33 euro

4 3562,50 euro

5 a 37,75 euro

b 39,93 euro

c 60 700 euro

6 209 500 euro

7 E [ X ]= 3 2 ;Var ( X )= 3 4

8 20 37 euro ≈−0,54euro

9 E [ X ] = 0,3077 ; Var ( X ) = 0,2673

10 E [ X ] = 1,95 (lampen) ; E [ K ] = 69,50 (euro)

11 E [ X ] = 5,5 ; Var ( X ) = 8,25

12 Laure wint op lange termijn.

13 µ = 14,50 euro

14 b µ = 1312,50 euro

15 x = 5,50 euro

16 Dit is geen eerlijk spel.

17 4,80 euro 18a 24 625 b 1 625 c

d3,3616

19a 2 3 b 50%;33,3% 20a 2 9 b 1 9 ; 11 18 21a2 b 7 12

22a 5 2 b 15 32

23a 1 12 b 2 3

24a 1 32 b 15 32

25b 1 4 c 5 12 d 2 9

176
x i 0 1 2 3 4 5 pi 0 1 625 60 625 300 625 240 625 24 625

2.2 Rekenregels voor toevalsveranderlijken (blz. 77)

1 a X ∼ N (2µ, √2 σ )

b X ∼ N (2µ,2σ )

c X ∼ N (0, √2 σ )

d X ∼ N (7µ,5σ ) e X ∼ N (µ + 5, σ ) f X ∼ N (0, σ )

2a37,46%

4bkansverdelingvan

( X , Y )

0,12%

177 Oplossingen
g
µ σ
h
X ∼ N
,1
X ∼ N (0,1)
b 8,28
3 a 66,73% b 130,57
µ
36 2 2 36 3 2 36 4 3 36 5 2 36 6 6 36 8 2 36 9 1 36 10 2 36 x 1 pi 12 4 36 15 2 36 16 1 36 18 2 36 20 2 36 24 2 36 25 1 36 30 2 36 36 1 36 µp
49 4 = 12,25
10 a m = 53,6
s
8,6 b 22,84% 11 a 15,9% c 4,9% b 30,9% d 50% 12 37% 13 a 11,5% b 12,76 mm 14 11,5% 15 90,9% 16
17
18
19
21
22
23
24
25 a 74,6% b 96% 26 22 27 11
M = max
x i 1 2 3 4 5 6 pi 1 36 3 36 5 36 7 36 9 36 11 36
= 161 36 = 4,47 kansverdelingvan P = X Y x 1 pi 1 1
=
5 µ = 1260 gram ; s = 39,2 gram 6 a µ = 12,5% ; s = 0,17% b µ = 12,5% ; s =
7 a 25% b 0,14% 8 80% 9 a 8,99% b 5,64% c ja
;
=
N ( µ = 624 gram ; σ = 7 gram)
24%
15,7%
a 50% c 0,6% b 7,9% d 10,3% 20 a 9,1% b 0,08%
37,7%
13,2%
78%
12,4%

3.1 De binomiale verdeling (blz. 94)

1 a 3,2% b 42,8% c 29,4%

2 a 0,01% b 90,2% c 56,1% 3 16,8%

4 p = 1 13 ;E [ X ]= 2;P ( X > 5)= 4,54%

5 a 29,8% b 80% c 20%

6 a 21,4% b 62,8% c 15,8%

7 a 34,56% b 31,74% c 31,74%

8 45,57%

9 a 39,15% b 44,37% c 97,34%

10 a 20% c 20,3% b 48,8% d 55,8% 11 70,3% 12 62,5% 13 34,7%

14 a p = 10 11 15 1,9%

16 a 30,6% b 42,1% c minstens 17 worpen

17 minstens 14 keer

18 minstens 10 keer

19 a 17% b 3 c minstens 59 kandidaten 20 a 1,4% b –10

1,08 22 a 67,23% c 4 b 32,77% d minstens 21

23 18,5%

24 1025,6 gram

25

3.2 De centrale limietstelling (blz. 107)

178
21c µ = 3; σ
13,16% 26 21,72% 27 a 28,19% b 84,49% c 43,71% 28 a 13,27% b 0,028% c 1,88% d 4,81% e 29,59% 29 a 19,85% b 15,91% 30 a 19,85% b 19,49% 31 a x 0 1 2 3 4 5 6 7 8 P ( X = x ) 1 256 8 256 28 256 56 256 70 256 56 256 28 256 8 256 1 256
1 X ~ B ( n = 12 ; p = 0,45) Y N ( µ = np = 5,4 ; σ = √npq = 1,723) i P ( X = i ) P ( i – 0,5 ⩽ Y < i + 0,5) 0 0,00077 0,00192 1 0,00752 0,00957 2 0,03385 0,03437 3 0,09233 0,0889 4 0,16996 0,16564 5 0,2225 0,22243 6 0,21238 0,21526 7 0,14895 0,15014 8 0,07617 0,07546 9 0,0277 0,02733 10 0,0068 0,00713 11 0,00101 0,00134 12 0,00007 0,00018 2 1%

3 a binomiaal : 19,5% ; normaal : 19,3% b binomiaal : 41,4% ; normaal : 42,8% c binomiaal : 0,02% ; normaal : 0,009%

binomiaal : 30,8% ; normaal : 28%

5 a binomiaal : 26,4% ; normaal : 25,6% b binomiaal : 27,9% ; normaal : / ( n < 20)

6 a 78,9% b 48,8% c

7 a binomiaal : 35,5% ; normaal : 36,2%

binomiaal : 34%

binomiaal : 4,2% ; normaal : 4,4% 9 a 0,004% b 4,2% c 11,7%

:

4000 euro

8%

a 0,62% b 0,26% c 0,29% 25 a 2,94% c 8,3% b 60,5% d 49,5% 26 a 1,717 gram b bewering is juist c bij Pringles

a 4,20%

30 a 21,25% c 9,89% b 0,20 d 42 241,86

31 a 35% c 2,19 g b 88,08 g d 45,25%

32 a 5% b 3,04 c 27,06% d 58,28%

e 141,20

179 Oplossingen
4
99,99%
b
8
normaal
81,1% 11 binomiaal : 1,6%
normaal : 1,8% 12 86,3% 13 87% 14 7,4% 15
5,5% ; normaal : 5,9% 16 binomiaal : 0,52% ; normaal : 0,49% 17 a 1,8% b 0,7% 19 a 23,2% b 7,05% c 800 euro 20
35 minuten b 27% 21 a 819 b 40% 22 a 6,68% b 0,12 mm 23
kans 156 729 423 729 144 729 6 729
27 a 6,08 cm b 98,55% c 69,6% 28 a 134,6 km/h b m = 4,456 c 37,7% 29
10 a binomiaal
73,5% b binomiaal : 88,8% ; normaal : 88,3% c binomiaal : 80,9% ;
:
;
binomiaal :
a 5 uur
a 70,4% b 6 mogelijkheden c aantal stelletjes 0 1 2 3
d
e
24
b 75 c 66,37%

4.1 Betrouwbaarheidsintervallen (blz. 134)

1 [ 508,2 gram ; 510,8 gram]

2 [ 6,022 mm ; 6,04 mm]

3 [ 8,3464 ton ; 8,7926 ton]

4 [ 75,47 min ; 84,87 min]

5 [ 96,19 ml ; 101,79 ml]

6 4 7 12

8 [ 143,7 gram ; 144,3 gram]

9 90%

10 [ 245,98 gram ; 250,02 gram]

11 [ 9,44 uur ; 10,86 uur]

12 [ 550, 626]

13 [ 42,8% ; 64,7%]

14 [ 8,2% ; 14,3%]

15 a [ 51,1%; 62,3%]; [ 49,3% ; 64,0%]

b 300 kiezers

16 a [ 79,1% ; 90,9%]

b 3772 orders

17 [ 5,93% ; 22,07%]

18 [ 15,61% ; 38,68%]

19 a [ 5,27% ; 16,39%]

b [ 2,79% ; 12,21%]

c [ 5,52% ; 9,17%]

20 601

21 [ 330 euro, 1404 euro]

22 a [ 48,66% ; 57,59%]

b 690 kiezers

4.2 Toetsen van hypothesen (blz. 155)

1 Nulhypothese ( H0 : µ = 1800 uur) wordt niet aanvaard ; de fabrikant heeft ongelijk.

2 Nulhypothese ( H0 : p = 0,06) wordt aanvaard ( P = 0,2 > α = 0,05) ; de partij wordt goedgekeurd.

3 Nulhypothese ( H0 : p = 0,5) wordt niet aanvaard ( P = 0,0009 < α = 0,05) ; muntstuk is niet normaal.

4 Nulhypothese ( H0 : µ = 140 cal) wordt niet aanvaard, de fabrikant heeft ongelijk.

5 Nulhypothese ( H0 : µ = 240 gram) wordt aanvaard, de bemestingsmethode overtuigt niet.

6 a 98% b Nulhypothese ( H0 : µ = 8 ml) wordt niet aanvaard, de machine is waarschijnlijk niet correct afgesteld.

7 Nulhypothese ( H0 : p = 0,3) wordt niet aanvaard ( P = 0,008 < α = 0,05) , de promotiecampagne heeft effect gehad.

8 Nulhypothese ( H0 : p = 0,32) wordt niet aanvaard ( P = 0,054 < α = 0,1) , de partij van de burgemeester is minder populair.

9 a 78,8%

b Nulhypothese ( H0 : µ = 204 ml) op 5%-niveau wordt niet aanvaard.

c Nulhypothese ( H0 : µ = 204 ml) op 1%-niveau wordt aanvaard.

10 a Nulhypothese ( H0 : µ = 32 minuten) wordt niet verworpen, men kan zich terecht afvragen of de reorganisatie zinvol was.

b Nulhypothese ( H0 : µ = 28 minuten) wordt aanvaard, de bewering van het afdelingshoofd kan juist zijn.

11 Nulhypothese ( H0 : µ = 7,6 mm) wordt niet aanvaard, het productieproces wordt stopgezet.

12 Nulhypothese ( H0 : p = 0,06) wordt aanvaard ( P = 0,103 > α = 0,05) , er worden op maandag meer slechte onderdelen geproduceerd.

180

13 Nulhypothese ( H0 : p = 0,04) wordt niet aanvaard ( P = 0,07 < α = 0,1) , de inschatting van de uitbater is niet juist.

14 Nulhypothese ( H0 : p = 0,9) wordt aanvaard ( P = 0,056 > α = 0,05) , de norm wordt gehaald.

15 a 6,7%

b 12,597 ton

c Nulhypothese ( H0 : µ = 13,1 ton) verwerpen op 5%-niveau ; aanvaarden op 1%-niveau.

16 Nulhypothese ( H0 : p = 0,75) wordt aanvaard ( P = 0,06 > α = 0,05) , Maarten kan gelijk hebben.

17 Nulhypothese ( H0 : p = 0,57) wordt aanvaard ( P = 0,07 > α = 0,05) , de leerlingen van die school presteren niet significant beter dan het gemiddelde.

18 a 8,8%

b 75%

c De fabrikant denkt nog steeds dat de machine goed is afgesteld.

d De fabrikant besluit dat de machine niet goed is afgesteld.

19 a Nulhypothese H0 : p = 1 36 wordt niet

aanvaard ( P = 0,0096 < α = 0,1) , de dobbelstenen zijn verzwaard.

b Nulhypothese H0 : p = 1 6 wordt aanvaard

( P = 0,46 > α = 0,05) , de dobbelstenen zijn zuiver.

c Nulhypothese H0 : p = 10 36 wordt niet aanvaard ( P = 7,7 10– 8 < α = 0,08) , het resultaat is niet normaal.

20 Nulhypothese ( H0 : µ = 215 gram) wordt niet aanvaard, Warre gelooft de fruitteler niet.

21 Bij 57 of lager

22 a H0 : p = 0,5 wordt niet aanvaard bij 18 of minder bonnen.

b H0 : p = 0,5 wordt aanvaard.

( P = 0,157 > α = 0,05)

23 Nulhypothese ( H0 : p = 0,38) wordt niet aanvaard ( P = 0,009 < α = 0,05) , de bewering van het krantenartikel is niet juist.

24 Nulhypothese ( H0 : µ = 3,3 kg) wordt niet aanvaard. Het gemiddelde geboortegewicht ligt vermoedelijk hoger.

25 Nulhypothese ( H0 : p = 0,20) wordt niet aanvaard ( P = 0,038 < α = 0,05) , de firma heeft ongelijk.

26 Nulhypothese ( H0 : p = 0,13) wordt niet aanvaard, de aanduiding op het etiket klopt niet.

27 Nulhypothese ( H0 : µ = 800 gram) wordt aanvaard, er is niet voldoende bewijsmateriaal om een klacht in te dienen.

181 Oplossingen

Trefwoordenregister

√n -wet 74

A alternatieve hypothese 139

B Bernoulli 92 bernoulli-experiment 85 bernoulliverdeling 85 betrouwbaarheidsinterval 122 binomiale coëfficiënten 37 binomiale kansverdeling 86 binomium van Newton 37, 40 boomdiagram 9, 14 bord van Galton 36, 98

C centrale limietstelling 104 CLS 104 combinatie 12, 24 combinatoriek 10 complement 15 complementregel 10, 15 consistente schatter 128 continue toevalsveranderlijke 51, 54 continuïteitscorrectie 101 cumulatieve verdelingsfrequentie 53

D datasets 163 differentiaalvergelijking van Bernoulli 93 discrete toevalsveranderlijke 51, 53 doorlatingsfout 141 driehoek van Pascal 9, 34 duivenhokprincipe 10

E eenzijdige toets 142 efficiënte schatter 128

F faculteit 11 formule van Laplace 43 formule van Stifel-Pascal 35 foutenmarge 125

G Galton 36, 98

H hypergeometrische verdeling 90 hypothesetoetsen 139

I inclusie-exclusieprincipe 9

K kansexperiment 51 kansfunctie 52 kansvariabele 51 kansverdeling 52 kritieke zone 140

L Laplace 43 lemniscaat 93 Lévy 106 Lindeberg 106

N n-faculteit 11 nulhypothese 139

O onderscheidingsvermogen 141 ongelijkheid van Bernoulli 93

P Pascal 36 permutatie 23 populatiegemiddelde 57 populatiestandaardafwijking 59 productregel 9, 14 productverzameling 14

P -waarde 144

182

S schatter 128 significantieniveau 140 significantietoetsen 139 somregel 9, 15 standaardafwijking 58 steekproefgemiddelde 57 steekproefstandaardafwijking 59 steekproefvariabiliteit 124 steekproevenverdeling 105 stelling van Lindeberg-Lévy 104 Stifel 35 stochast 51, 53 stochastische veranderlijke 51

T

toevalsveranderlijke 51, 53 tweezijdige toets 142

U uniforme continue verdeling 62 uniforme discrete verdeling 61

V variantie 58 variatie 12, 21 venndiagram 9 vermenigvuldigingsregel 9 verwachtingswaarde 57 verwerpingsfout 140 verwerpingsgebied 140

W Wald 154 wegendiagram 9

Z zuivere schatter 128

183 Trefwoordenregister
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.