Pienter 5 & 6 (editie 2023) Statistiek en kansrekenen

Page 1


VA

© N IN


IN Statistiek en kansrekenen

©

VA

N

Derde graad D/A

Liesbeth Huys Dirk Taecke MET MEDEWERKING VAN Etienne Goemaere Tom Van der Auwera Martine Verrelst Stephan Wellecomme


Via www.ididdit.be heb je toegang tot het onlineleerplatform bij Pienter derde graad. Activeer je account aan de hand van de onderstaande code en accepteer de gebruiksvoorwaarden. Kies je ervoor om je aan te melden met je Smartschool-account, zorg er dan zeker voor dat je e-mailadres aan dat account gekoppeld is. Zo kunnen we je optimaal ondersteunen.

IN

Let op: deze licentie is uniek, eenmalig te activeren en geldig voor een periode van 2 schooljaren. Indien je de licentie niet kunt activeren, neem dan contact op met onze klantendienst.

VA

N

Fotokopieerapparaten zijn algemeen verspreid en vele mensen maken er haast onnadenkend gebruik van voor allerlei doeleinden. Jammer genoeg ontstaan boeken niet met hetzelfde gemak als kopieën. Boeken samenstellen kost veel inzet, tijd en geld. De vergoeding van de auteurs en van iedereen die bij het maken en verhandelen van boeken betrokken is, komt voort uit de verkoop van die boeken. In België beschermt de auteurswet de rechten van deze mensen. Wanneer u van boeken of van gedeelten eruit zonder toestemming kopieën maakt, buiten de uitdrukkelijk bij wet bepaalde uitzonderingen, ontneemt u hen dus een stuk van die vergoeding. Daarom vragen auteurs en uitgevers u beschermde teksten niet zonder schriftelijke toestemming te kopiëren buiten de uitdrukkelijk bij wet bepaalde uitzonderingen. Verdere informatie over kopieerrechten en de wetgeving met betrekking tot reproductie vindt u op www.reprobel.be. Ook voor het digitale lesmateriaal gelden deze voorwaarden. De licentie die toegang verleent tot dat materiaal is persoonlijk. Bij vermoeden van misbruik kan die gedeactiveerd worden. Meer informatie over de gebruiksvoorwaarden leest u op www.ididdit.be. © Uitgeverij VAN IN, Wommelgem, 2023

De uitgever heeft ernaar gestreefd de relevante auteursrechten te regelen volgens de wettelijke bepalingen. Wie desondanks meent zekere rechten te kunnen doen gelden, wordt verzocht zich tot de uitgever te wenden.

©

Credits p. 8 verhouding van vrouwen en mannen in het Europees Parlement © Europees Parlement, p. 8 aantal fietsers in Kortrijk © Stad Kortrijk, p. 8 loonkloof per leeftijdsgroep © VRT, p. 17 cocaïnesporen in het afvalwater in Antwerpen © VRT, p. 17 evolutie van het aantal ziekenhuisbevallingen in Vlaanderen © VRT, p. 22 types personen © HLN, p. 22 gezondheid 45-plussers © NOS, p. 23 peiling Brexit © Daily Mail, p. 26, 46, 80, 128, 158 en 174 vragen JWO en VWO © Vlaamse Wiskunde Olympiade vzw, p. 48 mediaan brutosalaris © VRT, p. 48 top 5 best verkochte videogames © VRT, p. 65 Ivy League-schools in Amerika © Washington Post, p. 74 etiket met schoenmaat © ithanyakorn / Shutterstock, p. 82 postzegel Blaise Pascal © catwalker / Shutterstock, p. 108 kantoor Nationale Loterij © Werner Lerooy / Shutterstock, p. 125 Suske en Wiske © Jarretera / Shutterstock, p. 172 huiswerk © Kamil Zajaczkowski / Shutterstock Eerste druk 2023 ISBN 978-94-647-0085-5 D/2023/0078/111 Art. 603763/01 NUR 120

Ontwerp cover: KaaTigo Ontwerp binnenwerk: fikfak Tekeningen: Dirk Vandamme Zetwerk: Crius Group


Inhoudsopgave 4

Hoe werk je met iDiddit?

6

Hoofdstuk 1

Verzamelen van gegevens

7

Hoofdstuk 2

Verwerken van gegevens

27

Hoofdstuk 3

Statistische kengetallen

47

Hoofdstuk 4

Kansrekening

Hoofdstuk 5

De normale verdeling

Hoofdstuk 6

Correlatie en causaliteit

©

VA

N

IN

Hoe werk je met Pienter?

81

129 159


Hoe werk je met Pienter? Elk hoofdstuk start met een inhoudsopgave en een cartoon. Dat geeft je een eerste indruk van het hoofdstuk.

HOOFDSTUK 5 I DE NORMALE VERDELING

4.1.4 Het principe van de statistische stabiliteit Als je met een (onvervalste) dobbelsteen gooit, dan weet je dat je ‘één kans op zes’ hebt om bijvoorbeeld 5 ogen te gooien. Maar wat betekent ‘één kans op zes’? Zul je dan iedere 6 worpen één keer 5 ogen gooien? Zeker niet!

Bij het begin van elk hoofdstuk maak je aan de hand van een realistische inleiding of een kort onderzoek Met ICT kun je het experiment ‘gooien met een onvervalste kennis met het eenvoudig onderwerp dobbelsteen’ simuleren. dat aan bod zal komen. 5.1

5.1

Kansdichtheidsfunctie

130

5.2

De normale kansdichtheidsfunctie

133

5.3

Berekeningen met de normale verdeling 136

5.4 De standaardnormale verdeling 5.5

140

Niet alle gegevens zijn normaal verdeeld 147

Studiewijzer

157

Pienter problemen oplossen

158

Simulatie met Excel

Kansdichtheidsfunctie

In een bepaalde cel kiest Excel zelf random een getal van 1 tot en met 6. Je kunt willekeurig naar onder en naar rechts doorvoeren.

Als je een bakje aardbeien koopt van 500 g, dan bevat het bakje zelden exact 500 g. Je kunt moeilijk een aardbei in stukken snijden. Een aselecte steekproef bij 500 bakjes aardbeien leverde de volgende frequentietabel op. massa (g)

ni

fi

[478, 482[

3

0,60 %

[482, 486[ 12 Simulatie met GeoGebra [486, 490[ 28

2,40 %

25,00 %

IN

5.1.1 Symmetrische verdeling

21,60 %

20,00 %

5,60 %

19,00 %

18,40 %

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

129

relatief aantal bakjes

[490, 494[ experimenten 59 11,80 % Je laat het aantal (n) toenemen en bepaalt telkens, op 0,01 % nauwkeurig, 15,00 % de relatieve frequentie van [494, 498[ 92 de gebeurtenis 18,40 % A: ‘5 ogen gooien’.

750

1 000

5,80 %

2 3

4

[518, 522[

[514, 518[

[510, 514[

[498, 502[

[494, 498[

[490, 494[

[486, 490[

massa (g) 500 100,00 % De frequentiedichtheid is dus de relatieve frequentie per eenheid. _ •x =Bereken de frequentiedichtheid de frequentietabel. Me = voor elke klasse van modale klasse = Naarmate het aantal herhaalde experimenten stijgt, zal de relatieve frequentie De steekproef levert een symmetrische verdelingwaarde op. van een gebeurtenis steeds meer een bepaalde benaderen. mi i i Jemassa ziet dat(g) het gemiddelde enfde mediaanfdaan elkaar gelijk zijn en in de modale klasse liggen. De oppervlakte van het gedeelte van het histogram0,06 links van de verticale rechte x = 500 f.d. [478, 482[ 480 0,60 % van de statistische stabiliteit Deze wetmatigheid is het principe of is gelijk aan de oppervlakte rechts ervan. de wet van de grote aantallen. [482, 486[ 484 2,40 % 0,05 Als gegroepeerde gegevens symmetrisch verdeeld zijn 490[ 488 er5,60 In[486, de zijn statistiek bestaat ook een wet van kleine aantallen. Alsze je over weinig gegevens dan het gemiddelde en de% mediaan aande elkaar gelijk en liggen beschikt, dan zal een afwijkend gegeven daar een grote invloed op hebben, in het 494[ midden van [490, 492de modale 11,80 klasse. % 0,04 waardoor je gemakkelijk verkeerde besluiten trekt.

VA

Algemeen

0,40 %

N

1

[482, 486[

[478, 482[

Besluit

Stap voor stap kom je meer te weten over wiskunde in het dagelijks leven.

2,00 %

0,60 %

0,00 % De frequentiedichtheid van een 2,00 klasse%in een gegroepeerde frequentietabel is [514, 518[ 10 hetmerk quotiënt van de relatieve frequentie en de klassenbreedte. Wat op? [518, je 522[ 2 0,40 %

[506, 510[

Definitie

12,40 %

[502, 506[

5.1.2

11,80 %

[498, 502[ 108 21,60 % 10,00 % n 50 100 200 300 500 [502, 506[ 95 19,00 % 5,60 % Frequentiedichtheid en kansdichtheid nA [506, 510[ 62 12,40 % 5,00 % 2,40 % f (%) A [510, 514[ 29 5,80 % Frequentiedichtheid

Je leert formuleren in definities, eigenschappen, rekenregels of besluiten. Je leert ook eigenschappen bewijzen.

[494, 498[ 496 18,40 % GeoGebra Een voorbeeld: je bent een week in Spanje geweest en het regende vijf van de zeven dagen.

[510, 514[

3

REEKS A

4

5

512

5,80 %

0,01

eenvoudige toepassingen 0

[514, 518[

516

2,00 %

[518, 522[

520

0,40 %

14

Tot welke soort verdeling (symmetrisch S, rechtsscheef R, linksscheef L) m (g) histogrammen aanleiding? geven de volgende

REEKS B Naast debasisniveau tabel zie je het bijhorende dichtheidshistogram en de frequentiepolygoon.

6

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

MAANDELIJKS KLEDINGBUDGET VAN 2 000 PERSONEN 36,50 %

35,00 % Die frequentiepolygoon is een type lijndiagram die de punten (m i , fd i) met elkaar verbindt

op de horizontale as. REEKS C en die aansluit verdiepingsniveau

30,00 % 25,00 %

• Hoe kun je uit de frequentiedichtheid van een klasse de relatieve frequentie van die klasse

©

130

40,00 %

Oefeningen zijn genummerd per hoofdstuk berekenen? en aangeduid met een verticale streep. Wat is de grafische betekenis van die berekening?

19,00 %

20,00 % 15,00 %

9,50 %

7,50 %

7,00 % 4,00 %

5,00 %

Op iDiddit vind je extra oefeningen.

2,00 %

0,00 % [0, 100[

r r

L

r

1,00 %

S

r

0,50 %

[100, 200[ [200, 300[ [300, 400[ [400, 500[ [500, 600[ [600, 700[ [700, 800[ [800, 900[ [900, 1 000[

budget in euro

• Bereken de standaardafwijking met ICT: s =

In de marge worden soms pictogrammen Schat hoeveel procent van de gegevens hoogstens één keer de standaardafwijking afwijken gebruikt. Hieronder vind je hun betekenis. van het gemiddelde. Rond af op 1 %.

DIAMETER VAN 160 KOGELLAGERS

25,00 %

relatief aantal kogellagers

ICT

S R 13,00 %

10,00 %

21,25 %

20,00 %

16,25 %

15,63 %

15,00 %

Duidt aan wanneer je bij het onlinelesmateriaal ICT-hulpmiddelen vindt om in te zetten, L bv. Excel, GeoGebra … 10,63 %

10,00 %

5,00 %

0,00 %

R

10,00 %

8,13 %

7,50 %

5,63 %

5,00 %

r r

[20,0; 20,1[ [20,1; 20,2[ [20,2; 20,3[ [20,3; 20,4[ [20,4; 20,5[ [20,5; 20,6[ [20,6; 20,7[ [20,7; 20,8[ [20,8; 20,9[

Interessante weetjes of achtergrondinformatie herken je aan een kader met vraagteken. STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

131

diameter in mm

DUUR VAN DE ZWANGERSCHAP BIJ 10 000 VROUWEN 40,00 %

37,66 %

35,00 % relatief aantal vrouwen

1

2

relatief aantal personen

6

0,03 Na elk stuk je [498,theorie 502[ 21,60 %meteen Daaruit besluiten500 datkun Spanje een land is met veeloefenen. regen, is een verkeerde statistische methode. Oefeningen [502, 506[ 504 zijn 19,00even % Niet alle oefeningen moeilijk. 0,02 86 STATISTIEK I HOOFDSTUK 4 I KANSREKENING [506, 510[ 508 12,40reeksen: % Ze zijn opgedeeld in drie REEKS A

474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524

5

30,00 % 25,00 % 20,00 %

18,58 % 16,01 %

15,00 % 10,00 %

9,83 %

8,87 %

S

r

R

r

L

r


Je leerkracht zal telkens aangeven wat precies voor jou van toepassing is.

STUDIEWIJZER Verzamelen van gegevens 1.1

voor de leerling

Wat is statistiek KENNEN

voor de leerkracht

–  + –  +

Statistiek is de wetenschap die zich bezighoudt met het verzamelen, ordenen, verwerken, ontleden en verklaren van gegevens (‘data’) en dat met de bedoeling om inzicht te krijgen in verschijnselen in de samenleving, de natuur ... Statistiek leert je ook kritisch denken over hoe betrouwbaar bepaalde uitspraken zijn.

KUNNEN

–  + –  +

KENNEN

–  + –  +

Op het einde van elk hoofdstuk vind je alles wat je moet kennen en kunnen bijeengebracht in een studiewijzer. Dat is een ideale leidraad om je samenvatting te maken.

Statistische terminologie toepassen.

1.2 Verzamelen van gegevens

IN

De objecten (personen, dieren, goederen waaroverde je informatie wenst, ‘Pienter problemen oplossen’. Het is aan jou om aan de hand Elk hoofdstuk sluit af…) met rubriek zijn de elementen van het onderzoek. De verzameling die wordt onderzocht steekproef. van heuristieken enis deprobleemoplossend denken de problemen op te lossen. Een kenmerk of eigenschap van een element noem je een veranderlijke of variabele. De hoedanigheden of getallen die je verkrijgt na een statistisch onderzoek zijn de gegevens of data.

Categorische gegevens beschrijven een hoedanigheid die je niet kunt tellen of meten. • Niet-geordende categorische gegevens hebben geen natuurlijke ordening. • Geordende categorische gegevens hebben een natuurlijke ordening.

VAN IN Plus Soms is het handig dat je extra lesinformatie of een videofragment zelf kunt bekijken of beluisterenKUNNEN op je smartphone. Als je dit icoon ziet, open dan de VAN IN Plus-app en scan de –  + –  + pagina. Het onderscheid maken tussen de elementen van een onderzoek, de steekproef, Numerieke gegevens zijn het resultaat van telling en metingen. • Discrete numerieke gegevens beperken zich tot een aantal waarden. • Continue numerieke gegevens zijn reële waarden tussen bepaalde grenzen.

variabele en de data. VAN INdePlus

De soorten gegevens opsommen en toepassen.

N

Bij een onderzoek nagaan welke soort gegevens worden gebruikt.

1

VA

2 3

4 5

6

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

©

24


Het onlineleerplatform bij Pienter derde graad Mijn lesmateriaal Hier vind je alle inhouden uit het boek, maar ook meer, zoals Excelbestanden, filmpjes, GeoGebra-toepassingen, extra oefeningen ...

IN

Extra materiaal Bij bepaalde stukken theorie of oefeningen kun je extra materiaal openen. Dat kan een bijkomend audio- of videofragment zijn, een woorden- of begrippenlijst, een extra bron of een leestekst. Kortom, dit is materiaal dat je helpt om de leerstof onder de knie te krijgen.

Adaptieve oefeningen In dit gedeelte kun je de leerstof inoefenen op jouw niveau. Hier kun je vrij oefenen of de oefeningen maken die de leerkracht voor je heeft klaargezet.

N

Opdrachten Hier vind je de opdrachten die de leerkracht voor jou heeft klaargezet.

VA

Evalueren Hier kan de leerkracht toetsen voor jou klaarzetten.

Resultaten Wil je weten hoever je al staat met oefenen, opdrachten en toetsen? Hier vind je een helder overzicht van al je resultaten.

©

Notities Heb je aantekeningen gemaakt bij een bepaalde inhoud? Via je notities kun je ze makkelijk terug oproepen.

Meer weten? Ga naar www.ididdit.be


HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

Wat is statistiek

8

1.2

Verzamelen van gegevens

10

1.3 1.4

IN

1.1

Populatie en steekproef

12

Misleidende statistiek

21 24

Pienter problemen oplossen

26

©

VA

N

Studiewijzer

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

7


1.1

Wat is statistiek

1.1.1

Herhaling

N

IN

In het dagelijkse leven kom je veel in contact met statistiek. Denk maar aan enquêtes, tabellen met cijfers, grafieken … Je ziet ze bijvoorbeeld in onlinetijdschriften en -kranten, in wetenschappelijke boeken, op de radio en op de televisie.

5.000

1,97%

1,44%

Consumptieprijsindex (CPI)

Gezondheidsindex

07/2022

01/2022

07/2021

01/2021

07/2020

01/2020

07/2019

01/2019

07/2018

01/2018

07/2017

01/2017

0,74%

07/2016

01/2016

0,56%

07/2015

01/2015

Se

M

Maand

Som Totaal afgeschafte treinen

0,34%

07/2014

2

‘2

p

‘2

ei

n

Ja

p

Se

ei

M

2

2

‘2

1

‘2

1

‘2

‘2

n

Ja

Se

1

0

‘2

p

‘2

ei

M

n

‘2

0

0

0

2,44%

2,13% 2,05%

01/2014

1.000

07/2013

2.000

01/2013

VA

3.000

Ja

11,27% 11,25%

Inflatie (%)

4.000

Inflatie 12% 11% 10% 9% 8% 7% 6% 5% 4% 3% 2% 1% 1,11% 0% –1% –2%

Jaargemiddelde CPI

Loonkloof per leeftijdsgroep

−4 %

−3 %

−2 %

−1 %

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

3%

35-44 jaar

4,5 %

45-54 jaar

4,4 %

55-64 jaar

8,5 %

©

25-34 jaar

1

Bron: Statbel

2

Definitie

3

Statistiek Statistiek is de wetenschap die zich bezighoudt met het verzamelen, ordenen, verwerken, ontleden en verklaren van gegevens (‘data’) en dit met de bedoeling om een inzicht te krijgen in verschijnselen in de samenleving, de natuur ... Statistiek leert je ook kritisch denken over hoe betrouwbaar bepaalde uitspraken zijn.

4 5 6

8

10 %

−0,1 %

Jonger dan 25

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS


1.1.2 Doel van statistiek Statistisch onderzoek kun je onderverdelen in twee grote categorieën. beschrijvende statistiek

verklarende statistiek

• verzamelen van informatie • verwerken en voorstellen van informatie (ordenen in tabellen, voorstellen in grafieken) • analyseren van informatie (kenmerkende maten bepalen zoals gemiddelde, mediaan, spreiding van de gegevens ...)

• nagaan van de betrouwbaarheid van de informatie • formuleren van conclusies

IN

Statistiek is overal aanwezig in het dagelijks leven en is voor de maatschappij van groot belang. De economie, de politiek, de wetenschappen, de sport ... Ze zijn ondenkbaar zonder gebruik te maken van statistische gegevens. Hoe zouden families hun budget beheren, hoe zou een land bestuurd worden, hoe zou je verschillende prestaties op gebied van school, sport … met elkaar vergelijken zonder gebruik te maken van statistiek?

N

In de statistiek worden veel numerieke berekeningen gemaakt. Dat rekenwerk is echter een hulpmiddel en geen doel. Het doel van de statistiek is het verwerven van inzicht vanuit getallen en die verwerken in een context. Het getal 77 heeft op zich geen betekenis als je niet weet dat het bijvoorbeeld gaat om de massa van een volwassen man en dat die massa in kilogram is. De context geeft dus betekenis aan de getallen.

VA

In België publiceert de Algemene Directie Statistiek (Statbel) bijna dagelijks nieuwe cijfergegevens over bevolking, samenleving, economie en financiën, industrie, diensten, handel en vervoer, landbouw ...

Zoek op de site van Statbel het antwoord op de volgende vragen. • Wat is de meest recente consumptieprijsindex?

• Wat is de populairste voornaam bij de geboorte van een jongen in het Vlaams Gewest?

©

• Hoeveel bedroeg de gemiddelde jaartemperatuur in Ukkel tijdens het voorbije jaar?

• Hoeveel procent van de Belgische bevolking leeft in het Brussels Hoofdstedelijk Gewest?

Ook de Vlaamse overheid levert heel wat cijfermateriaal via Statistiek Vlaanderen. De Europese Unie heeft ook haar eigen statistisch bureau: Eurostat.

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

9


1.2

Verzamelen van gegevens

1.2.1 Elementen, veranderlijken en gegevens In de statistiek verzamel je gegevens door kenmerken van elementen te onderzoeken. stappen in een statistisch proces

benamingen

↓ Er wordt een verzameling elementen samengesteld die aan het onderzoek zullen deelnemen. ↓

De objecten (personen, dieren, goederen ...) waarover je informatie wenst, zijn de elementen van het onderzoek.

IN

Je wenst informatie in te winnen over een, door het toeval bepaald, verschijnsel.

De verzameling elementen die wordt onderzocht is de steekproef.

In een statistisch onderzoek worden eigenschappen van elementen nagegaan.

Een kenmerk of eigenschap van een element noem je een veranderlijke of variabele.

↓ De hoedanigheden of getallen die je verkrijgt na een statistisch onderzoek zijn de gegevens of data. Die vormen een gegevensverzameling.

N

Bij het onderzoek worden hoedanigheden of getallen verzameld. ↓

VA

De gegevens worden verwerkt in tabellen en diagrammen. Je berekent statistische kentallen.

Om de gegevens te verwerken gebruik je frequentietabellen, diagrammen, centrummaten en spreidingsmaten.

Voorbeeld

lengte

schoenmaat

favoriete hobby

kleur ogen

Marie

167 cm

38

basketbal

groen

Jef

175 cm

43

gamen

blauw

Stefanie

170 cm

40

ballet

bruin

Rune

165 cm

39

vissen

groen

©

leerling

1

2 3 4 5 6

10

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS


1.2.2 Soorten gegevens categorische gegevens VIDEO

numerieke gegevens Zijn het resultaat van tellingen en metingen.

Beschrijven een hoedanigheid, die je niet kunt tellen of meten. Die gegevens noem je ook kwalitatieve gegevens. Niet-geordende categorische gegevens hebben geen natuurlijke ordening.

Die gegevens noem je ook kwantitatieve gegevens. Discrete numerieke gegevens beperken zich tot een aantal waarden.

Geordende categorische gegevens hebben een natuurlijke ordening.

Voorbeeld veranderlijke: Voorbeeld veranderlijke: aantal kinderen lengte van een vrouw, in een gezin; in cm; gegevens: 0,1 ... gegevens: 152, 176 ...

IN

Voorbeeld veranderlijke: Voorbeeld veranderlijke: favoriete sport; score op een attituderapport; gegevens: basketbal, gegevens: zeer goed, dans, hockey … goed, …, zeer slecht.

Continue numerieke gegevens zijn reële waarden tussen bepaalde grenzen.

Voorbeelden

Vink het soort gegevens aan in de volgende voorbeelden.

nietgeordend categorisch

N

veranderlijke

gegevens

geordend categorisch

discreet numeriek

continu numeriek

aantal ogen bij het gooien van een dobbelsteen

VA favoriete artiest

levensduur (in h) van lampen

aantal verkeersongevallen per jaar in een stad

©

kledingmaten

Opmerking Soms worden kwalitatieve gegevens gekwantificeerd, zoals in onderstaand voorbeeld. Ik heb voldoende inspraak in de werking van de school.

helemaal niet akkoord = 1

eerder niet akkoord = 2

eerder akkoord = 3

1

2

3

4

volledig akkoord = 4

In dit geval zijn de getallen niet meer dan codes voor de geordende categorische gegevens.

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

11


1.3

Populatie en steekproef

1.3.1 Voorbeeld

VIDEO

Definitie

Je wilt de mening weten van Vlaamse leerkrachten over het al dan niet inkorten van de zomervakantie. Alle Vlaamse leerkrachten vormen de populatie. Het is onbegonnen werk om de mening van alle leerkrachten op te vragen en te verwerken. Daarom besluit je om 5 000 Vlaamse leerkrachten te ondervragen. Die 5 000 leerkrachten noem je de steekproef. Populatie en steekproef

IN

De volledige verzameling elementen waarover je informatie wilt verkrijgen, is de populatie. Een steekproef is een deelverzameling van de populatie die wordt onderzocht. Je trekt een steekproef uit de populatie. Het is de bedoeling dat je vanuit de steekproef een zo volledig mogelijk, representatief beeld verkrijgt voor de volledige populatie.

Als je een steekproef trekt van 5 000 Vlaamse leerkrachten, met welke factoren moet je rekening houden? Geef 4 voorbeelden.

N

De besluiten die je trekt uit een steekproef, gelden voor de volledige populatie. Daarom moet je een goede kijk hebben op de samenstelling van de populatie zelf en die goed definiëren.

VA

1.3.2 Het trekken van een steekproef

Om gegevens te verzamelen kun je mensen, dieren, voorwerpen … bestuderen. Je kunt databanken raadplegen of metingen doen. Bij mensen worden vaak enquêtes afgenomen. De ondervraagde mensen noemt men de respondenten.

©

De 3 meest voorkomende vormen van enquêtes zijn: • de schriftelijke enquête (vaak via internet), • het persoonlijk interview, eventueel via de telefoon, • de panelmethode, waarbij een vaste groep mensen ondervraagd wordt over allerlei onderwerpen (kijkgewoonten, gezinsbudget ...). soort enquête

schriftelijke enquête

1

2

persoonlijk interview

3 4 5

panelmethode

6

12

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

voordeel

nadeel


1.3.3 Representatieve steekproef Opdat de gegevens die verkregen zijn uit een steekproef op een verantwoorde manier zouden kunnen worden veralgemeend naar de volledige populatie, moet de steekproef: • een voldoende grote omvang hebben. Wat is ‘voldoende’? Dat hangt af van de aard van de populatie en van het onderzoek zelf. De grootte van de steekproef hangt ook vaak af van de beschikbare financiële middelen. • een getrouwe weergave zijn van de populatie, met andere woorden representatief zijn.

IN

Er bestaan verschillende methodes om een representatieve steekproef te trekken. Let wel, je hebt nooit 100 % garantie dat de steekproef representatief is voor de populatie. aselecte (lukrake) steekproef

selecte (gerichte) steekproef

systematische steekproef

Elk element van de steekproef wordt bij toeval gekozen. Elk element heeft evenveel kans om opgenomen te worden in de steekproef.

De populatie wordt verdeeld in deelgroepen, verhoudingsgewijs samengesteld vanuit die populatie. Vervolgens wordt binnen elke deelgroep een aselecte steekproef getrokken.

De steekproefelementen worden ‘systematisch’ uit de populatie gekozen. Bijvoorbeeld: elke 5 minuten wordt een product van de montageband genomen voor onderzoek.

N

Voorbeeld: Welke soort steekproef werd hier getrokken?

VA

In een middelbare school met 400 leerlingen (150 leerlingen eerste graad, 130 leerlingen tweede graad en 120 leerlingen derde graad) wil de directie de mening van de leerlingen weten over het afschaffen van de frisdrankautomaten. Ze besluit om een steekproef te nemen van 80 leerlingen. • De leerlingen van de school krijgen elk een nummer (van 1 tot 400) en uit deze 400 nummers worden er willekeurig 80 geloot.

• Uit elke klas wordt de leerling met klasnummer 5 en 10 ondervraagd.

©

• Er worden willekeurig 30 leerlingen van de eerste graad gekozen, 26 van de tweede graad en 24 van de derde graad

1.3.4 De respons Het aantal mensen dat antwoordt op een enquête noemt men de respons. Het aantal mensen dat wel gevraagd wordt om aan een onderzoek of enquête deel te nemen, maar weigert of niet antwoordt, is de non-respons. Beide waarden worden meestal uitgedrukt in procent. Non-respons kan de waarde van een onderzoek in belangrijke mate verminderen of zelfs volledig tenietdoen.

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

13


1.3.5 Steekproeffouten Bij het samenstellen van een steekproef kunnen fouten optreden. Opportunistische steekproef

IN

Een Waregemse journalist wil onderzoeken wat de favoriete voetbalploeg van de Jupiler Pro League is bij de Vlaamse jongeren tussen 15 en 18 jaar. Hij stelt een enquête op en verstuurt die naar alle leerlingen van de tweede en derde graad van de Waregemse scholen. Waarom is deze steekproef niet representatief?

De steekproef werd op een gemakkelijke en goedkope manier samengesteld. Dat noem je een opportunistische steekproef. Selectiebias

N

Een masterstudent diergeneeskunde wil voor zijn masterproef onderzoeken hoeveel huisdieren jaarlijks op controle gaan naar de dierenarts. Hij selecteert enkel eigenaren van honden. Waarom is deze steekproef niet representatief?

VA

Dat is een voorbeeld van selectiebias: de getrokken steekproef is geen goede weerspiegeling van de populatie. Selectiebias komt voor op twee mogelijke manieren: wanneer er een verkeerde steekproef wordt gekozen of wanneer er personen uit de steekproef uitvallen. Bias betekent vertekening. Er is sprake van bias als externe factoren de uitkomsten van het gevoerde onderzoek negatief beïnvloeden en onbetrouwbaar maken. Dat kan zich in elke fase van het statistisch onderzoek voordoen en verschillende vormen aannemen, zoals respons-bias. Daarbij hebben de respondenten de neiging om onnauwkeurige antwoorden te geven in enquêtes. Non-responsbias treedt op als een deelnemer zich terugtrekt vooraleer het onderzoek is afgerond. Onderzoekersbias doet zich voor als de onderzoeker de onderzoeksvragen laat beïnvloeden door zijn of haar verwachtingen en persoonlijke gevoelens.

©

Neutrale context

Als je een enquête afneemt, moet de context zo neutraal mogelijk zijn. Zou jij eerlijk je mening geven op de vraag ‘Wat vind je van de werking van de politie in jouw stad’ aan een politieagent in uniform? Non-respons

1

Enquêtes die afgenomen worden op basis van vrijwillige respons, brengen de representativiteit in gevaar. Vrijwillige respons wil zeggen dat de ondervraagde zelf kan beslissen om al dan niet deel te nemen aan de enquête.

2 3

Daarbij duiken er twee problemen op. Vaak is de non-respons groot; mensen willen meestal geen enquêtes invullen als er geen beloning aan vasthangt. Mensen met een uitgesproken positieve of negatieve mening zijn het meest gemotiveerd om een enquête in te vullen. Dat beïnvloedt de resultaten.

4 5 6

14

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS


Oefeningen REEKS A 1

Geef van de volgende onderzoeken de populatie en de steekproef. a) Een modewinkel wil weten wat zijn klanten van de service vinden. Daarom krijgt elke kopende klant in de maand maart een enquête via mail toegestuurd. • populatie: • steekproef:

• populatie: • steekproef:

IN

b) Als kwaliteitscontrole worden bij een fabrikant van diepvriesfrieten elk uur 30 frietjes afgebakken en geproefd door de kwaliteitsdienst.

c) Het tijdschrift Klasse wil weten hoe leerlingen van secundaire scholen staan tegenover alcoholgebruik. Ze ondervraagt daarom alle leerlingen tussen 16 en 18 jaar in Brusselse scholen. • populatie:

N

• steekproef:

d) NADO Vlaanderen voert de dopingcontroles uit voor Vlaamse wielerwedstrijden. Voor de Ronde van Vlaanderen controleert ze de 1e, 11e, 21e, 31e … renner in het eindklassement. • populatie:

VA

• steekproef:

Over welk soort gegevens gaat het?

In Gent staat een mooi herenhuis uit 1960 (a) te koop. De gevel is in het lichtblauw (b) geschilderd. Het huis telt 4 slaapkamers (c), 2 badkamers en 1 ruime zolder. De tuin is eerder aan de kleine kant en meet 4 bij 5 m (d). De keuken is recent gerenoveerd en is voorzien van een nieuwe inductiekookplaat met een A+ label (e). De vraagprijs is 750 000 euro (f).

©

2

(a)

(d)

(b)

(e)

(c)

(f)

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

15


3

Over welk soort steekproef gaat het? a) Bij een onderzoek naar vandalisme in een bepaalde wijk, ondervraagt de politie alle bewoners die een veelvoud van vijf in hun huisnummer hebben.

b) Bij een onderzoek naar de gemiddelde lengte van een zonnebloem in Zuid-Frankrijk heeft een onderzoeker duizend zonnebloemen gemeten op honderd verschillende bloemenkwekerijen.

IN

c) In een fabriek werken 45 werknemers. De directie wil graag de mening weten over de netheid in de fabriek. Elke werknemer krijgt een nummer. De winnende lottocijfers bepalen welke 7 werknemers ondervraagd worden.

d) In een bedrijf werken 150 arbeiders, 40 bedienden en 10 managers. De CEO wil een onderzoek voeren over de tevredenheid van zijn werknemers en besluit om willekeurig 15 arbeiders, 4 bedienden en 1 manager te ondervragen.

4

Is de steekproef groot genoeg? Motiveer je antwoord.

N

a) Sciensano, het federale onderzoekscentrum voor de volksgezondheid, wil weten of er een bepaalde buitenlandse ziekte in ons land voorkomt. Die ziekte komt bij 0,01 % van de bevolking voor. Sciensano onderzoekt daarvoor vijfhonderd Belgen.

VA

b) De uitbater van een escaperoom wil weten welke leeftijdscategorie het vaakst voorkomt. Hij neemt in een willekeurig weekend een steekproef van 35 bezoekers en bevraagt de leeftijd.

©

c) In een autofabriek werken 7 000 werknemers. De directie wil een enquête afnemen bij zijn werknemers over de veiligheid op het werk. Ze besluit om 70 werknemers te ondervragen.

5

1

2

Je wilt een onderzoek voeren naar de vrijetijdsbesteding van de Belgen en trekt daarvoor een selecte steekproef. Geef 5 criteria waarmee je de representativiteit van je steekproef zult bevorderen.

3

4

5

6

16

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS


REEKS B 6

Antwerpen topt opnieuw lijst van Europese steden met cocaïnesporen in afvalwater Uit een studie van het Europese Waarnemingscentrum voor Drugs en Drugsverslaving (EMCDDA) blijkt dat er nergens in Europa meer cocaïnesporen worden aangetroffen in het afvalwater dan in Antwerpen. Daarmee blijft Antwerpen op de eerste plaats staan in de lijst. De onderzoekers hebben waterstalen uit 104 Europese steden in 21 landen onderzocht op sporen van vijf illegale stimulerende middelen (cocaïne, amfetamine, methamfetamine, ecstasy en ketamine) en cannabis. ©VRTNWS

a) Wie heeft dit onderzoek uitgevoerd?

IN

b) Geef de populatie van dit onderzoek.

c) Geef de steekproef van dit onderzoek. d) Geef de variabele van dit onderzoek.

Op vrt.be stond onderstaand diagram over de evolutie van het aantal ziekenhuisbevallingen in Vlaanderen over de periode 2012-2022.

N

7

Evolutie van het aantal ziekenhuisbevallingen in Vlaanderen

80.000

VA

75.000

70.000

65.000

60.525

60.000

55.000

50.000

45.000

©

40.000 2012

2013

2014

2015

2016

2017

2018

2019

2020

2021

2022

a) Geef de populatie van dit onderzoek.

b) Geef de steekproef van dit onderzoek. c) Geef de variabele van dit onderzoek. d) Welke soort variabele werd onderzocht? STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

17


8

Geef van de volgende onderzoeken de mogelijke gegevens. Over welk soort gegevens gaat het? Geef een mogelijke omschrijving van de populatie. Welke soort steekproef is aangewezen? a) het geboortegewicht van baby’s in Vlaanderen • gegevens: • soort gegevens: • populatie:

b) de bloedgroep van de Belgen • gegevens: • soort gegevens: • populatie: • soort steekproef:

IN

• soort steekproef:

c) de inhoud van een flesje bier dat van een automatische vulmachine komt • gegevens:

N

• soort gegevens: • populatie:

• soort steekproef:

VA

d) de tevredenheid van de leerlingen van de school over het nieuwe schoolreglement • gegevens:

• soort gegevens: • populatie:

• soort steekproef:

e) het aantal kinderen van gezinnen die in de Benelux wonen • gegevens:

©

• soort gegevens: • populatie:

• soort steekproef:

f) het favoriete merk van auto waarmee de Vlaming rijdt

1

• gegevens:

2

• soort gegevens:

3

• populatie:

4

• soort steekproef:

5 6

18

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS


Uit het ledenbestand van een kleine fitnesszaak blijkt dat ze 45 leden heeft onder de 18 jaar, 72 tussen de 18 en de 25 en 54 leden ouder dan 25. De zaakvoerder wil een representatieve steekproef trekken van 45 leden. Hoeveel leden uit elke leeftijdscategorie moet hij ondervragen?

10

Een lokale radiozender beweert dat een op de twee mensen dagelijks naar zijn programma’s luistert. Waarom neem je die bewering het best met een flinke korrel zout?

11

Om de vraag te beantwoorden of ouders, als ze mochten kiezen, nog kinderen zouden willen, houdt een populair dagblad (dat wekelijks 792 000 lezers bereikt) een enquête. Er komen 80 reacties waaruit blijkt dat 30 % geen kinderen meer zou willen. Geef 3 redenen waarom het verkregen percentage niet betrouwbaar is.

VA

N

IN

9

‘Bij dopingcontroles zijn er dit jaar meer positieve gevallen dan vorig jaar.’ Kun je hieruit besluiten dat er meer personen zijn die doping gebruiken?

13

‘Nooit eerder bliezen zo weinig chauffeurs positief tijdens bobcampagne’, kon je lezen in een krant op 3 februari 2023. ‘Tijdens de bob-wintercampagne van afgelopen winter had slechts 1,8 % van de gecontroleerde personen te veel gedronken.’ Welke bedenkingen kun je maken over dit krantenartikel?

©

12

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

19


14

Een onderzoeksbureau wil de mening weten van Vlamingen over het invoeren van de wegentaks op de autosnelwegen. Waarom zijn de volgende steekproeven niet representatief? a) In De Panne wordt een groot aantal toeristen op de zeedijk naar hun mening gevraagd.

15

IN

b) De reizigers op de IC-trein richting Antwerpen om 14 h worden ondervraagd.

Zijn de volgende steekproeven representatief? Zijn de steekproeven op een selecte manier getrokken? Verklaar telkens je antwoord.

N

a) Er wordt onderzoek gedaan naar het aantal uren schermtijd van leerlingen van het eerste middelbaar van een bepaalde school. Enkel de leerlingen die in de avondstudie blijven, worden ondervraagd.

VA

b) Er wordt onderzoek gedaan naar de hoeveelheid cola in een blikje van 33 cl. Van alle geproduceerde blikken wordt steeds het 15e blikje gewogen.

©

c) Er wordt onderzoek gedaan naar de tevredenheid van abonnees van een telecommunicatiebedrijf, door alle klanten die naar de helpdesk bellen te ondervragen.

d) Een winkelier van bakproducten doet onderzoek naar hoe tevreden zijn klanten zijn over de kwaliteit van zijn producten. Hij heeft een fysieke winkel en een onlineshop. Hij ondervraagt elke 10e klant die een onlinebestelling plaatst en elk uur de 5e klant die naar zijn fysieke winkel komt.

1

2 3 4 5 6

20

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS


1.4

Misleidende statistiek Mensen en bedrijven gebruiken misleidende statistieken om hun standpunten in een goed daglicht te zetten. De data worden meestal op een correcte manier verzameld, maar in de manier van weergeven zitten fouten. Voorbeeld 1 Een Britse gezondheidsorganisatie onderzocht in 2022 de gemiddelde lichaamslengte van volwassen mannen en stelde de resultaten voor in het onderstaande diagram.

IN

Wat kun je besluiten uit de grafiek?

Average male height per country 6’0’’ 5’11’’ 5’10’’ 5’9’’ 5’8’’ 5’7’’ 5’6’’ 5’5’’ 5’4’’

N

5’3’’ 5’2’’

Waarom is deze grafiek zo misleidend?

5’1’’ 5’0’’

USA

India

Indonesia

VA

The Netherlands UK

Voorbeeld 2

De grafiek toont de gemiddelde aardolieprijzen (in euro).

8,1%

©

3,9%

1,86

1,6%

1,89

1,79

augustus 2022

Waarom is deze grafiek misleidend?

1,72

september 2022

oktober 2022

november 2022

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

21


Oefeningen REEKS A 16

Een diëtiste beweert dat haar dieet de beste resultaten oplevert en publiceert onderstaande grafiek op haar website. Welke grafische ingrepen hebben ervoor gezorgd dat het effect van het dieet spectaculairder lijkt dan het in werkelijkheid is? gewicht in kg 115

105 100 95 90 85

aantal maanden 1

6

15

In Het Laatste Nieuws kon je op 22 april 2023 onderstaand diagram terugvinden.

N

17

IN

110

VA

a) Wat valt er op?

b) Geef een mogelijke verklaring.

‘Nederlandse 45-plussers ervaren hun gezondheid slechter dan de Nederlandse jongeren.’ Dat lijkt onderstaand diagram jou te vertellen. Maar waarom is dit diagram misleidend?

©

18

1

2 3 4 5 6

22

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS


Op 3 april 2016 publiceerde de Daily Mail onderstaande grafiek. Ze toont de uitkomst van een peiling van een andere krant (The Observer) over de Brexit. De Daily Mail probeert zijn lezers te manipuleren. Op welke manier gebeurt dat?

IN

19

REEKS B 20

De tabel geeft de slaagpercentages aan de universiteit volgens studiegroep en geslacht, voor een groep van 10 000 meisjes en evenveel jongens. (Bron: prof. H. Callaert, Centrum voor Statistiek, Universiteit Hasselt) meisjes

N

studiegroep

jongens

geslaagden

inschrijvingen

geslaagden

medisch

4 584

50,00 %

4 000

49,00 %

humaan

5 000

41,00 %

2 400

40,00 %

exact

416

62,02 %

3 600

60,56 %

TOTAAL

10 000

46,00 %

10 000

51,00 %

VA

inschrijvingen

a) Waarom lijken deze cijfers elkaar tegen te spreken?

©

b) Welke besluiten kun je in werkelijkheid trekken uit de tabel?

c) Is ‘exacte wetenschappen’ de ‘gemakkelijkste’ studiegroep?

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

23


STUDIEWIJZER Verzamelen van gegevens 1.1

voor de leerling

Wat is statistiek KENNEN

voor de leerkracht

–  + –  +

Statistiek is de wetenschap die zich bezighoudt met het verzamelen, ordenen, verwerken, ontleden en verklaren van gegevens (‘data’) en dat met de bedoeling om inzicht te krijgen in verschijnselen in de samenleving, de natuur ... Statistiek leert je ook kritisch denken over hoe betrouwbaar bepaalde uitspraken zijn.

KUNNEN

–  + –  +

1.2 Verzamelen van gegevens

IN

Statistische terminologie toepassen.

KENNEN

–  + –  +

De objecten (personen, dieren, goederen …) waarover je informatie wenst, zijn de elementen van het onderzoek. De verzameling die wordt onderzocht is de steekproef. Een kenmerk of eigenschap van een element noem je een veranderlijke of variabele. De hoedanigheden of getallen die je verkrijgt na een statistisch onderzoek zijn de gegevens of data.

N

Categorische gegevens beschrijven een hoedanigheid die je niet kunt tellen of meten. • Niet-geordende categorische gegevens hebben geen natuurlijke ordening. • Geordende categorische gegevens hebben een natuurlijke ordening. Numerieke gegevens zijn het resultaat van telling en metingen. • Discrete numerieke gegevens beperken zich tot een aantal waarden. • Continue numerieke gegevens zijn reële waarden tussen bepaalde grenzen.

VA

KUNNEN

Het onderscheid maken tussen de elementen van een onderzoek, de steekproef, de variabele en de data. De soorten gegevens opsommen en toepassen.

©

Bij een onderzoek nagaan welke soort gegevens worden gebruikt.

1

2 3 4 5 6

24

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

–  + –  +


voor de leerling

1.3 Populatie en steekproef KENNEN

voor de leerkracht

–  + –  +

De volledige verzameling elementen waarover je informatie wilt verkrijgen, is de populatie. Een steekproef is een deelverzameling van de populatie die wordt onderzocht. Een representatieve steekproef is een steekproef die • een voldoende grote omvang heeft; • een getrouwe weergave van de volledige populatie is en dus representatief is. Een aselecte (lukrake) steekproef is een steekproef waarbij elk element van de steekproef bij toeval gekozen wordt. Elk element heeft evenveel kans om opgenomen te worden in de steekproef.

IN

Een selecte (gerichte) steekproef is een steekproef waarbij de populatie wordt verdeeld in deelgroepen, verhoudingsgewijs samengesteld vanuit die populatie. Vervolgens wordt binnen elke deelgroep een aselecte steekproef getrokken. Een systematische steekproef bestaat uit steekproefelementen die ‘systematisch’ uit de populatie worden gekozen.

De ondervraagde mensen die antwoorden bij een steekproef noemt men de respons. Het aantal mensen dat weigert of niet antwoordt, is de non-respons. Steekproeffouten bij het samenstellen van een steekproef zijn: • opportunistische steekproef, • selectiebias, • verkeerde context, • non-respons.

N

KUNNEN

–  + –  +

Het verschil geven tussen een populatie en steekproef. Een representatieve steekproef herkennen.

De kenmerken van een representatieve steekproef opsommen. De verschillende soorten steekproefmethodes herkennen.

VA

Bij een populatie de juiste soort steekproefmethode voorstellen. Steekproeffouten herkennen.

1.4 Misleidende statistiek

KENNEN

–  + –  +

©

Kritisch omgaan met besluiten die uit een steekproef worden getrokken.

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

25


Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?

❑ filter

❑ schets

❑ patroon

❑ schema/tabel

❑ kennis

❑ vereenvoudig

❑ logisch nadenken

❑ gok verstandig

❑ ...

IN

❑ concreet materiaal

1. Merlijn schrijft tachtig keer het woord ABRACADABRA op en gebruikt daarbij telkens de laatste letter A als de eerste letter van het volgende woord. Hij schrijft dus ABRACADABRABRACADABRABRACADABRA … Wat is de tachtigste letter die hij opschrijft? A) A

B) B

C) C

D) D

E) R

N

JWO, editie 2022-2023, tweede ronde

©

VA

2. Deze twaalf tandenstokers vormen samen vier vierkanten. Maak van de vier vierkanten drie vierkanten door slechts drie tandenstokers te verplaatsen. Let op: je mag geen tandenstokers breken. Je moet elke tandenstoker gebruiken, alle vierkanten moeten even groot zijn en de vierkanten moeten met elkaar verbonden zijn.

3. Drie buren leggen de oogst van hun moestuin samen. • Annelies had drie tomaten en x paprika’s. • Boudewijn had y tomaten en drie wortels. • Claudia had vier tomaten, vijf paprika’s en z wortels. Na het verdelen heeft iedereen drie tomaten, twee paprika’s en vier wortels en is er geen overschot. Waaraan is x + y + z gelijk?

1

2 3 4

A) 4

5

B) 6

C) 8

VWO, editie 2015-2016, eerste ronde

6

26

STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS

D) 10

E) 12


HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

Verwerken van categorische gegevens

2.2

Verwerken van niet-gegroepeerde numerieke gegevens

2.3

28

IN

2.1

32

Verwerken van gegroepeerde

numerieke gegevens

37 45

Pienter problemen oplossen

46

©

VA

N

Studiewijzer

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

27


2.1

Verwerken van categorische gegevens

2.1.1 Frequentietabel Bij een aselecte steekproef wordt van 60 mensen de bloedgroep bepaald. De resultaten vind je in de tabel met ruwe gegevens. O

O

A

B

O

A

O

A

O

O

A

O

O

A

O

O

A

O

A

A

A

A

O

AB

O

A

O

A

O

O

A

O

A

O

A

AB

O

O

O

B

A

O

B

O

B

O

A

O

A

A

O

A

B

A

O

A

O

A

O

IN

A

Je krijgt een duidelijker beeld door een frequentietabel op te stellen.

bloedgroep

ni

fi

• Hoeveel mensen hebben bloedgroep A of B?

VA

A

N

De eerste kolom bevat de verschillende gegevens van de variabele ‘bloedgroep’. De volgorde speelt geen rol. In de tweede kolom tel je het aantal keer dat elk gegeven (in dit voorbeeld de verschillende soorten bloedgroep) voorkomt. Dat is de absolute frequentie ni . De som van de absolute frequenties is gelijk aan de omvang van de steekproef n. In de derde kolom bereken je tot slot het relatief aantal keer dat elk gegeven voorkomt, ook wel de relatieve frequentie fi genoemd. De som van de relatieve frequenties is gelijk aan 100 %.

B

• Van hoeveel mensen van jouw klas mag je verwachten dat ze bloedgroep AB hebben?

AB O

totaal

Definitie

Absolute en relatieve frequentie

De absolute frequentie n i van een gegeven is het aantal keer dat het gegeven x i voorkomt.

©

De relatieve frequentie f i is het quotiënt van de absolute frequentie en de omvang n van de steekproef: f i = ___i . n bloedgroep

1 1

2 3 4 5 6

28

antigeen antigeen antilichamen antilichamen mag bloed A B A B doneren aan

O

universele donor

A

A, AB

B

B, AB

AB

AB

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

Je bloedgroep wordt bepaald door het al dan niet aanwezig zijn van bepaalde moleculen (‘antigenen’ en ‘antilichamen’) op de rode bloedcellen in je bloed. Er zijn vier bloedgroepen: A, B, O en AB. Je hebt een positieve resusfactor als het D-antigeen aanwezig is of een negatieve resusfactor als dat antigeen er niet is.


2.1.2 Een frequentietabel opstellen met ICT Met Excel

IN

Open op iDiddit het bestand ‘BLOEDGROEP.xlsx’ en ga als volgt te werk.

Je vindt de frequentietabel ook terug in het bestand ‘BLOEDGROEP (frequentietabel).xlsx’. Met GeoGebra

Frequentietabel opstellen met GeoGebra

N

2.1.3 Grafische voorstellingen Je kunt categorische gegevens op verschillende manieren grafisch voorstellen. Je kunt er zelf voor kiezen om de absolute frequentie of de relatieve frequentie te gebruiken. Het staafdiagram en cirkeldiagram

BLOEDGROEP VAN 60 MENSEN

VA aantal personen

32 28 24 20 16 12 8 4 0

BLOEDGROEP VAN 60 MENSEN

29

24

5

A

48,33 %

40,00 %

2

B AB bloedgroep

A B AB O

8,33 %

O

3,33 %

BLOEDGROEP VAN 60 MENSEN

aantal personen

©

De dotplot

32 28 24 20 16 12 8 4 0

29 24

5 A

B

2 bloedgroep

AB

O

Grafische voorstellingen met Excel en GeoGebra STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

29


Oefeningen REEKS A

ICT

1

Een directeur van een school wil, bij de opmaak van de uurroosters, alle leerkrachten één vrije dag toekennen. Aan 40 van de 110 leerkrachten van de school wordt gevraagd hun favoriete vrije dag aan te duiden. a) Vervolledig de frequentietabel.

c) Mogen de 40 leerkrachten willekeurig gekozen worden?

vrije dag

n ​​ ​ i​​​

​​f​ i​​​

ma

12

di

4

IN

b) Hoeveel procent kiest niet voor een verlenging van het weekend?

wo

do

4

vr

9

totaal

N

d) Hoeveel leerkrachten uit de volledige populatie kiezen voor een vrije dag op vrijdag?

2

Een chef-kok heeft van de laatste 45 gasten die bij hem biefstuk aten, bijgehouden of ze hun steak liever bleu (bijna rauw), saignant, à point of bien cuit wilden. In het onderstaande staafdiagram vind je de resultaten.

VA

ICT

©

aantal eters

BAKWIJZE VAN DE STEAK

20 18 16 14 12 10 8 6 4 2 0

bleu

bakwijze

​​n​ i​​​

bleu

1

saignant

1

à point

bien cuit

totaal

2 3 4 5

​​f​ i​​​

saignant

30

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

bien cuit

a) Vervolledig de frequentietabel. b) Welke bakwijze wordt het meest gekozen? c) Hoeveel procent kiest voor saignant? d) Hoeveel eters kiezen voor bleu of saignant?

d) Hoeveel procent kiest niet voor bien cuit?

6

à point


REEKS B

ICT

3

Aan 45 meisjes en evenveel jongens werd gevraagd welk ontbijt ze nemen. Er was keuze tussen niet ontbijten (N), ontbijtgranen (G), brood (B), fruit (F) en melkproducten (M). MEISJES

JONGENS

N

G

B

B

N

F

M

G

N

B

G

N

N

B

M

N

G

B

G

M

F

N

G

B

N

F

M

N

B

G

F

M

N

B

N

F

M

N

G

G

B

F

G

B

G

N

N

B

G

N

B

F

M

N

B

G

B

F

G

N

B

M

N

G

B

N

B

M

B

N

G

N

F

B

G

F

M

B

G

N

F

N

G

B

G

N

N

M

B

IN

G

a) Stel met ICT een frequentietabel op voor de meisjes en de jongens. ​​n​ i​​​

N

G

B

F

M

​​f​ i​​​

ontbijt jongens

​​n​ i​​​

N

G

B

F

N

ontbijt meisjes

M

​​f​ i​​​

VA

b) Hoeveel procent neemt geen ontbijt?

c) Welk soort ontbijt is even populair bij de meisjes als bij de jongens? d) Welk ontbijt nemen de meisjes het vaakst? e) Hoeveel meer jongens dan meisjes kiezen voor een ontbijt met melkproducten?

60,00 % 50,00 % aantal (in %)

©

f) Maak een gepaste grafische voorstelling voor de relatieve frequentieverdeling, waarop de cijfers voor de meisjes, de jongens en de totalen af te lezen zijn.

40,00 % 30,00 % 20,00 % 10,00 % 0,00 %

N

G

B soort ontbijt

F

M

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

31


2.2

Verwerken van niet-gegroepeerde numerieke gegevens

2.2.1 Frequentietabel Aan 90 mensen die hun rijbewijs B kwamen afhalen aan het gemeenteloket, werd gevraagd na hoeveel keer ze geslaagd waren voor het praktisch rijexamen. 1

1

5

1

2

3

1

4

2

1

2

3

1

1

3

1

2

5

1

2

3

1

2

2

1

4

1

1

2

1

1

1

3

6

2

1

2

3

1

2

1

2

1

1

3

2

1

1

4

1

2

2

3

4

1

1

5

1

3

4

1

1

5

1

2

3

1

2

1

3

2

4

1

3

1

5

6

1

2

1

1

2

4

1

2

1

4

1

3

IN

2

VA

N

Je stelt een frequentietabel op om de gegevens te ordenen. De eerste kolom bevat de verschillende waarden xi van de onderzochte variabele. In de tweede kolom tel je hoe vaak elk verschillend gegeven voorkomt, ni . De som van die frequenties is gelijk aan de omvang n van de steekproef. In de derde kolom wordt de relatieve frequentie fi berekend (in procent). De som is gelijk aan 100 %. In de kolom met de cumulatieve absolute frequentie cni noteer je hoe vaak een getal voorkomt dat kleiner dan of gelijk is aan de waarde x i . In de laatste kolom bereken je de cumulatieve relatieve frequentie cfi , het quotiënt van de cumulatieve absolute frequentie en de omvang van de steekproef. xi

ni

fi

cni

cfi

1

2 3

4

• Hoeveel mensen behaalden onmiddellijk hun rijbewijs?

• Hoeveel procent van de ondervraagden had minstens 4 pogingen nodig?

5

©

6

totaal

• Geef de betekenis van de cumulatieve relatieve frequentie van het waarnemingsgetal 4.

1 1

2

Definitie

3 4 5 6

32

Cumulatieve absolute en relatieve frequentie De cumulatieve absolute frequentie cni van het waarnemingsgetal xi is het aantal keer dat een getal voorkomt dat kleiner dan of gelijk is aan xi : cni = n1 + n2 + ... + ni . De cumulatieve relatieve frequentie cfi is het quotiënt van de cumulatieve absolute frequentie en cn de omvang van de steekproef: cfi = ____i . n

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS


2.2.2 Een frequentietabel opstellen met ICT Met Excel

IN

Open het bestand ‘RIJBEWIJS.xlsx’ en ga als volgt te werk.

Je vindt de frequentietabel ook terug in het bestand ‘RIJBEWIJS (frequentietabel).xlsx’.

Frequentietabel opstellen met GeoGebra

N

2.2.3 Grafische voorstellingen

VA

Je kunt numerieke gegevens op verschillende manieren grafisch voorstellen. Je kunt er zelf voor kiezen om de absolute frequentie of de relatieve frequentie te gebruiken. Voor een cumulatief staaf- of lijndiagram gebruik je de cumulatieve absolute of cumulatieve relatieve frequentie.

HET PRAKTISCH RIJEXAMEN

50,00 % 45,00 %

44,44 %

40,00 %

percentage geslaagden

©

Het staafdiagram

35,00 % 30,00 %

24,44 %

25,00 % 20,00 %

14,44 %

15,00 %

8,89 %

10,00 %

5,56 %

5,00 % 0,00 %

2,22 % 1

2

3 4 aantal pogingen tot slagen

5

6

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

33


Het lijndiagram HET PRAKTISCH RIJEXAMEN 44 40 36 32 aantal geslaagden

28 24 20 16 12

IN

8 4 0

1

2

3 4 aantal pogingen tot slagen

De dotplot

5

6

HET PRAKTISCH RIJEXAMEN

45 40

N

40

30 25

22

20

VA

aantal geslaagden

35

15

13

10

8

5

5 0

1

2

2 3

4

5

6

aantal pogingen tot slagen

1 1

2

HET PRAKTISCH RIJEXAMEN 88 83 75

90

62 40

1

2 3 4 5 aantal pogingen tot slagen

6

3 4

Grafische voorstellingen met Excel en GeoGebra

5 6

34

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

cumulatieve relatieve frequentie

90 80 70 60 50 40 30 20 10 0

©

cumulatief aantal geslaagden

Het cumulatief staaf – en lijndiagram

100,00 % 90,00 % 80,00 % 70,00 % 60,00 % 50,00 % 40,00 % 30,00 % 20,00 % 10,00 % 0,00 %

HET PRAKTISCH RIJEXAMEN

1

2

3 4 5 aantal pogingen tot slagen

6


Oefeningen REEKS A 4

Aan 90 Vlaamse gezinnen werd gevraagd naar het aantal kinderen. Je ziet een lijndiagram. AANTAL KINDEREN BIJ VLAAMSE GEZINNEN 30

27 23

20 15 10

15 10

10 3

5 0

IN

aantal gezinnen

25

1

0

1

2

3

4 5 aantal kinderen

a) Vervolledig de frequentietabel.

0 1 2 3

fi

VA

4

ni

7

1 8

cni

cfi

N

xi

6

0

5

6 7

8

©

b) Eén op de zes gezinnen heeft juist

kinderen.

c) Hoeveel procent van de gezinnen heeft 2 of 3 kinderen? d) Hoeveel gezinnen hebben hoogstens 1 kind? e) Welk deel van de gezinnen heeft minstens 3 kinderen? f) Iets meer dan de helft van de gezinnen heeft

of

kinderen.

g) Geef, op basis van de frequentietabel, twee voorbeelden om aan te tonen dat de steekproef het best niet veralgemeend wordt naar heel Vlaanderen.

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

35


REEKS B 5

In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten werden enkel heren tussen 165 cm en 195 cm ondervraagd. 41

42

39

42

40

43

44

41

43

44

42

41

38

41

43

42

43

45

40

43

42

39

41

43

46

42

41

42

43

42

40

45

41

43

42

41

40

43

42

45

43

42

43

41

46

47

43

42

45

40

42

38

42

46

48

44

41

44

43

45

43

41

47

41

44

41

46

47

43

45

a) Stel met ICT een frequentietabel op. ​​x​ i​​​

​​n​ i​​​

​​f​ i​​​

38

39

40

IN

ICT

c​ n ​ ​ i​​​

​c​f​ i​​​

45

46

47

48

41 42 43

VA

44

N

b) Wat is de meest voorkomende schoenmaat?

©

c) Als de steekproef representatief zou zijn, hoeveel mannen op 5 000 zouden dan die meest voorkomende schoenmaat hebben?

d) Hoeveel ondervraagde heren hebben een schoenmaat 44 of 45?

1

1

2

e) Hoeveel procent heeft hoogstens 40 als schoenmaat?

3

f) Wat is de ‘kans’ om een man aan te treffen met een schoenmaat groter dan 44?

4 5

g) Teken met ICT een staafdiagram voor de enkelvoudige absolute frequentieverdeling.

6

h) Teken met ICT een cumulatief lijndiagram voor de cumulatieve relatieve frequenties. 36

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS


2.3

Verwerken van gegroepeerde numerieke gegevens

2.3.1 Frequentietabel Onderzoek naar de massa, in gram, van de boekentas bij 80 leerlingen van de derde graad leverde de volgende resultaten op. Hun boekentas wordt op 10 gram nauwkeurig gewogen. VIDEO

7 930 6 620 9 180 6 960 8 340 10 080 5 800 7 740 8 060 7 560 8 290 7 810 8 600 7 020 9 360 7 860 7 990 9 580 6 290 7 200 8 470 9 800 7 990 6 010 7 430 8 010 6 030 7 970 7 180 8 070 8 110 7 990 7 030 5 320 8 610 7 770

IN

9 860 6 570 7 050 8 860 9 970 7 660 9 370 7 910 7 330 8 710 6 240 7 510

6 230 8 140 8 730 8 220 8 860 5 390 8 010 8 950 6 150 8 950 7 830 9 460 9 330 8 600 8 720 6 730 7 340 8 030 8 520 8 110 8 090 6 280 5 480 8 790 7 470 5 650 8 350 9 120 7 960 8 100 6 800 7 190

Omdat er te veel verschillende (continue) waarnemingsgetallen zijn, worden ze in klassen gegroepeerd. ​​m​ i​​​

​​n​ i​​​

​​f​ i​​​

​c​n​ i​​​

​c​f​ i​​​

[5 300, 5 900[ 5 600

5

6,25 %

[5 900, 6 500[ 6 200

7

8,75 %

[6 500, 7 100[

6 800

8

10,00 %

• Een klasse is een interval dat gesloten is in zijn ondergrens en open in zijn bovengrens. 5 6,25 % Bijvoorbeeld: de klasse [​​ 5 900, 6 500 [​​. 12 15,00 % De grenzen van de klasse noem je 20 25,00 % de klassengrenzen.

[7 100, 7 700[

7 400 10

12,50 %

30

37,50 %

[7 700, 8 300[ 8 000 24

30,00 %

54

67,50 %

[8 300, 8 900[ 8 600 13

16,25 %

[8 900, 9 500[ 9 200

8

10,00 %

[9 500, 10 100[ 9 800

5

6,25 %

N

klasse

VA

• Het klassenmidden ​​m​  i​​​ is het gemiddelde van de klassengrenzen van de i-de klasse. 67 83,75 % Bijvoorbeeld: het midden van de klasse 6 500 = 6 200​. ​​[5 900, 6 500 [​​ is ______________    ​​  5 900 + ​ 75 93,75 % 2 Het klassenmidden wordt gebruikt bij 80 100 % berekeningen en grafische voorstellingen.

80 100,00 %

• De klassenbreedte is het verschil tussen de bovengrens en de ondergrens van de klasse. Je kiest voor alle klassen een gelijke klassenbreedte. Bijvoorbeeld: de breedte van de klasse [​​ 5 900, 6 500 [​​is 6 500 – 5 900 = 600.

©

• Een gegeven kan maar tot één klasse behoren. Het kleinste gegeven behoort tot de eerste klasse en het grootste gegeven tot de laatste klasse. • Het aantal klassen is minimaal 5 en maximaal 15. • De klassenfrequentie ​​n​ i​​​ van de i-de klasse is het aantal waarnemingsgetallen dat tot die klasse behoort. • De andere begrippen zijn analoog als bij een niet-gegroepeerde frequentietabel.

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

37


Opmerking • Als je werkt met een gegroepeerde frequentietabel krijg je een verlies van informatie. Er zijn bijvoorbeeld 5 gegevens die tot de klasse [5 300, 5 900 [ horen, maar wat die gegevens exact zijn, is niet zichtbaar. • Soms ligt een klassenindeling vast vanuit de aard van de gegevens. Als je bijvoorbeeld met leeftijden werkt, is het logisch om bijvoorbeeld een klassenbreedte 10 te gebruiken. Enkele vragen

IN

• Beschrijf welke soort steekproef je zelf zou uitvoeren in dit onderzoek.

• Hoeveel boekentassen wegen tussen 7 100 g en 8 900 g? • Drie op de tien boekentassen weegt tussen

en

• Een kwart van de boekentassen weegt minder dan

.

.

• Hoeveel boekentassen wegen meer dan 8 300 g?

N

• Geef de betekenis van de cumulatieve relatieve frequentie van de vierde klasse.

2.3.2 Een frequentietabel opstellen met ICT Met Excel

VA

Om de klassenfrequenties te bepalen, gebruik je de functie INTERVAL(gegevensmatrix, interval_verw). Die functie telt van een geselecteerd gebied (de gegevensmatrix) hoeveel elementen in een interval ]a, b] liggen, waarbij a en b twee opeenvolgende getallen zijn van de intervalverwijzing.

©

Omdat men in de statistiek met intervallen van de vorm [a, b [ werkt, moet je een hulpkolom gebruiken: per klasse voer je de werkelijke klassenbovengrenzen (w.k.b.) in.

1 1

Open het bestand ‘BOEKENTAS.xlsx’ en

ga als volgt te werk.

• Selecteer de cellen C15 tot en met C22. • Formule: =INTERVAL(A1:L7;G15:G22). • Druk op Shift + Ctrl + Enter.

• Het resultaat van de telling komt in de geselecteerde cellen te staan.

Je vindt de frequentietabel ook terug in het bestand ‘BOEKENTAS(frequentietabel).xlsx’.

2 3 4

Frequentietabel opstellen met GeoGebra

5 6

38

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS


2.3.3 Grafische voorstellingen

VIDEO

Je kunt gegroepeerde gegevens op een aantal manieren grafisch voorstellen. Je kunt er zelf voor kiezen om de absolute frequentie of de relatieve frequentie te gebruiken. Voor een ogief gebruik je de cumulatieve absolute of cumulatieve relatieve frequentie. Het histogram Een histogram is een staafdiagram waarbij: • de staven tegen elkaar getekend zijn; • de klassen uitgezet zijn op de horizontale as; • de hoogte van elke rechthoek de (relatieve) frequentie van een klasse toont.

IN

BOEKENTASSEN VAN LEERLINGEN VAN DE DERDE GRAAD 30,00 %

32,00 %

aantal in procent

28,00 % 24,00 % 20,00 %

16,25 %

16,00 % 12,00 % 8,00 %

6,25 %

8,75 %

10,00 %

10,00 %

6,25 %

4,00 % 0,00 %

12,50 %

[5 300, 5 900[ [5 900, 6 500[ [6 500, 7 100[ [7 100, 7 700[ [7 700, 8 300[ [8 300, 8 900[ [8 900, 9 500[ [9 500, 10 100[

N

massa in gram

De frequentiepolygoon

​​m​ i​​​

​​n​ i​​​

​​f​ i​​​

[4 700, 5 300[

5 000

0

0,00 %

[5 300, 5 900[

5 600

5

6,25 %

[5 900, 6 500[

6 200

7

8,75 %

[6 500, 7 100[

6 800

8

10,00 %

[7 100, 7 700[

7 400

10

12,50 %

[7 700, 8 300[

8 000

24

30,00 %

[8 300, 8 900[

8 600

13

16,25 %

[8 900, 9 500[

9 200

8

10,00 %

[9 500, 10 100[

9 800

5

6,25 %

10 400

0

0,00 %

©

VA

klasse

[10 100, 10 700[

Een frequentiepolygoon is een gebroken lijn die de roosterpunten (​​​m​  i​​  , ​n​  i​​ ​)​​​​ of (​​​m​  i​​  , ​f​  i​​ ​)​​​​ verbindt en die aansluit op de horizontale as in de punten (a, 0) en (b, 0). Daarbij is a het klassenmidden van de klasse die de eerste klasse van de steekproef voorafgaat en b het klassenmidden van de klasse die op de laatste klasse van de steekproef volgt. Op die manier ontstaat een veelhoek of polygoon.

BOEKENTASSEN VAN LEERLINGEN VAN DE DERDE GRAAD

26 24 22

aantal boekentassen

20 18 16 14 12 10 8 6 4 2 0

5 000

5 600

6 200

6 800

7 400 8 000 massa in gram

8 600

9 200

9 800

10 400

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

39


Het ogief cfi

bi

0

0,00 %

5 300

5

6,25 %

5 900

12

15,00 %

6 500

20

25,00 %

7 100

30

37,50 %

7 700

54

67,50 %

8 300

67

83,75 %

8 900

75

93,75 %

9 500

80

100,00 %

10 100 ↑

Een ogief is een gebroken lijn die de roosterpunten (​​a​ 1​​​, 0) en (​​b​ i​​​  , ​c​n​ i​​​  ) of (​​b​ i​​​  , ​c​f​ i​​​  ) met elkaar verbindt. Daarbij is ​​a​ 1​​​de klassenondergrens van de eerste klasse en ​​ b​ i​​​ de klassenbovengrens van de i-de klasse. Bij deze grafische voorstelling wordt de cumulatieve frequentie van elke klasse dus toegekend aan de klassenbovengrens van de klasse. De klassenondergrens ​​a​ 1​​​van de eerste klasse is de klassenbovengrens van de klasse voorafgaand aan de eerste klasse van de steekproef. Die klasse geef je de cumulatieve frequentie 0 of 0 %.

IN

cni

BOEKENTASSEN VAN LEERLINGEN VAN DE DERDE GRAAD

100,00 % 90,00 %

60,00 % 50,00 % 40,00 %

N

70,00 %

VA

cumulatieve relatieve frequentie

80,00 %

30,00 % 20,00 % 10,00 %

0,00 % 5 300

5 900

6 500

7 100

7 700

8 300

8 900

9 500

massa in gram

Maak gebruik van het ogief om de volgende vragen op te lossen.

©

• Hoeveel procent van de boekentassen weegt minder dan 8 kg? • Hoeveel moet een boekentas wegen om tot de 20 % zwaarste boekentassen te behoren?

• Hoeveel procent van de boekentassen weegt tussen de 5,3 en 6,5 kg?

1 1

Grafische voorstellingen met Excel en GeoGebra

2 3 4 5 6

40

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

10 100


Oefeningen REEKS A 6

114 leerlingen studeerden vorig jaar af aan onze school. Hun procentuele jaartotalen voor het vak wiskunde vind je in het histogram. JAARTOTAAL WISKUNDE 35 30 26

24

25 20

IN

aantal leerlingen

30

15

9

10 5

5 0

5

9

4

1

1

[40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[ [65, 70[ [70, 75[ [75, 80[ [80, 85[ [85, 90[ jaartotaal (in %)

a) Geen enkele leerling behaalde      of meer.

N

b) Hoeveel leerlingen zijn gedelibereerd voor wiskunde?

c) Hoeveel procent van de leerlingen behaalde tussen 60 % en 70 %?

VA

d) Hoeveel leerlingen behaalden meer dan 75 %?

Van 49 bezoekers aan de Zonnegloed werd de leeftijd gevraagd. Het resultaat is weergegeven in onderstaand ogief.

cumulatief relatief aantal bezoekers

AANTAL BEZOEKERS

©

7

100 % 90 % 80 % 70 % 60 % 50 % 40 % 30 % 20 % 10 % 0 % 0% 5

100,00 % 89,80 % 79,59 %

63,27 %

40,82 %

30,61 %

16,33 %

15

25

35

leeftijd

45

55

65

75

a) Geen enkele bezoeker was jonger dan     jaar. b) Hoeveel procent van de bezoekers is ouder dan 55 jaar? c) Hoeveel bezoekers behoren tot de leeftijdsklasse [​​​ ​​25, 35​[​​​​? STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

41


REEKS B 8

Een conservenfabrikant krijgt klachten over de netto-inhoud van zijn blikken met erwtjes, die volgens de verpakking 1 l zou moeten bedragen. Daarom laat hij een steekproef uitvoeren. Om de 100 blikjes wordt er eentje van de lopende band genomen. In totaal wordt zo van 40 blikjes de inhoud, in ml, bepaald. 985

996

990

1 004

1 003

1 006

1 005

997

999

1 000

991

981

982

1 003

1 015

1 001

998

1 012

1 023

997

996

1 015

1 027

1 011

994

1 020

981

1 005

977

988

1 000

987

990

999

1 013

IN

ICT

988

998

1 009

1 003

a) Over welk soort steekproef gaat het? b) Stel een frequentietabel op met ICT. eerste klasse: laatste klasse:

N

c) Geef de betekenis van de cumulatieve relatieve frequentie van de vierde klasse.

d) Hoeveel procent bevat te weinig erwtjes?

e) Hoeveel blikjes bevatten tussen 980 ml en 1 020 ml?

VA

f) Stel de enkelvoudige absolute frequentieverdeling voor met een histogram.

g) Teken een frequentiepolygoon voor de enkelvoudige relatieve frequenties. h) Stel de cumulatieve relatieve frequentieverdeling voor met een ogief. i) Los de vragen op met behulp van het ogief.

• Hoeveel procent bevat minder dan 985 ml?

©

• Hoeveel blikjes bevatten meer dan 1 012 ml?

• Welk deel van de blikjes bevat tussen 993 ml en 1 007 ml?

1 1

• Hoeveel moet een blikje bevatten om tot de lichtste 25 % te behoren?

2

3 4

• Vanaf welke inhoud behoort een blikje tot de zwaarste 10 %?

5

6

42

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

992


De tabel bevat de procentuele jaartotalen voor het vak wiskunde van de 114 leerlingen die vorig jaar aan onze school afstudeerden. 63

56

82

45

62

67

70

76

52

88

61

67

46

71

66

64

80

59

64

77

71

58

81

47

78

66

64

75

53

72

84

73

63

54

69

61

64

71

70

80

65

46

67

72

75

61

69

62

62

84

61

54

69

74

75

66

77

71

66

65

70

69

68

44

66

65

64

63

52

61

71

82

60

74

65

66

71

70

72

74

76

73

57

61

65

69

73

67

61

65

62

63

IN

9

69

67

65

66

68

75

71

70

67

64

63

60

80

66

72

81

45

70

73

61

64

69

N

a) Stel een frequentietabel op. eerste klasse:

laatste klasse:

VA

b) Hoeveel leerlingen zijn niet geslaagd voor wiskunde?

c) Hoeveel procent van de leerlingen behaalde tussen 60 % en 70 %? d) Hoeveel procent van de leerlingen behaalde minder dan 75 %? e) Teken een frequentiepolygoon voor de enkelvoudige absolute frequenties. f) Stel de cumulatieve relatieve frequentieverdeling voor met een ogief. g) Los de vragen op met behulp van het ogief.

©

• Vanaf hoeveel procent behoorde een leerling tot het ‘betere kwart’? • Je behaalt onderscheiding als je jaartotaal tussen 67,5 % en 75 % ligt. Hoeveel leerlingen kunnen aanspraak maken op deze graad?

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

43


REEKS C 10

Een brouwer doet een aselecte steekproef om te weten te komen of de machines die de bierflesjes vullen, voldoende nauwkeurig werken. Op de etiketten van de bierflesjes staat dat de netto-inhoud 33 cl is. Van 50 flesjes wordt de inhoud, in cl, gecontroleerd. 32,6

33,3

32,5

33,2

34,5

31,8

35

34,4

33

34

31,7

34,3

32,9

32,5

33,6

33,1

34,2

31,4

32,6

34,6

34,9

33,4

31,6

34,5

35,1

35,3

34,1

34,2

31,1

36

34,2

32,7

34,6

32,2

33,8

34,4

31,7

35,6

33,9

32,1

33,7

32,3

33,7

31,9

33,5

32,6

33

34,8

35,7

32,8

a) Stel een frequentietabel op met ICT. eerste klasse: laatste klasse:

IN

ICT

b) Hoeveel procent van de flesjes bevat te weinig bier? c) Hoeveel flesjes bevatten minstens 35 cl?

N

d) Hoeveel procent van de flesjes bevat tussen 32 cl en 34 cl?

e) Teken een histogram voor de enkelvoudige absolute frequentieverdeling. f) Teken een frequentiepolygoon voor de enkelvoudige relatieve frequenties.

VA

g) Stel de cumulatieve relatieve frequentieverdeling voor met een ogief. h) Los de vragen op met behulp van het ogief.

• Hoeveel procent van de flesjes bevat meer dan 32,5 cl? • Hoeveel moet een flesje bevatten om tot de 20 % minst gevulde flesjes te behoren?

©

• Hoeveel procent van de flesjes heeft een inhoud die minstens 0,8 cl afwijkt van wat op het etiket staat?

1 1

2 3 4 5 6

44

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS


STUDIEWIJZER Verwerken van gegevens voor de leerling

2.1 Verwerken van categorische gegevens KENNEN

voor de leerkracht

–  + –  +

De absolute frequentie ​​n​  i​​​van een gegeven is het aantal keer dat het gegeven voorkomt. De relatieve frequentie ​​f​  i​​​is het quotiënt van de absolute frequentie en de omvang ​n​  ​​ van de steekproef: ​​f​  i​​ = ​ ___i ​​. n

KUNNEN

–  + –  +

Een frequentietabel voor kwalitatieve gegevens opstellen en interpreteren.

IN

Grafische voorstellingen maken van de frequentieverdeling: dotplot, staafdiagram en cirkeldiagram.

2.2 Verwerken van niet-gegroepeerde numeriek gegevens KENNEN

–  + –  +

N

De absolute frequentie ​​n​  i​​​ van het waarnemingsgetal ​​x​  i​​​is het aantal keren dat dat gegeven voorkomt. De relatieve frequentie ​​f​  i​​​is het quotiënt van de absolute frequentie en de omvang ​n​  ​​ van de steekproef: ​​f​  i​​ = ​ ___i ​​. n

De cumulatieve absolute frequentie ​cn ​ ​  i​​​ van het waarnemingsgetal ​​x​  i​​​is het aantal keer dat een getal voorkomt dat kleiner dan of gelijk is aan ​​x​  i​​​  ; ​c​n​  i​​ = ​n​  1​​ + ​n​  2​​+ ... + ​n​  i​​​  . De cumulatieve relatieve frequentie ​c​f​  i​​​is het quotiënt van c​n​  i​​ de cumulatieve absolute frequentie en de omvang van de steekproef: ​c​f​  i​​ = ____ ​   ​ ​. n

VA

KUNNEN

–  + –  +

Een frequentietabel voor niet-gegroepeerde numerieke gegevens opstellen en interpreteren. Grafische voorstellingen maken van de frequentieverdeling: dotplot, staafdiagram, lijndiagram, cumulatief staafdiagram en cumulatief lijndiagram.

2.3 Verwerken van gegroepeerde numerieke gegevens KENNEN

–  + –  +

Het klassenmidden ​​m​ i​​​is het gemiddelde van de klassengrenzen van de i-de klasse.

©

De klassenfrequentie ​​n​ i​​​ van de i-de klasse is het aantal waarnemingsgetallen dat tot die klasse behoort.

KUNNEN

–  + –  +

Een frequentietabel voor gegroepeerde numerieke gegevens opstellen en interpreteren.

Grafische voorstellingen maken van de frequentieverdeling: histogram, frequentiepolygoon en ogief.

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS

45


Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?

❑ filter

❑ schets

❑ patroon

❑ schema/tabel

❑ kennis

❑ vereenvoudig

❑ logisch nadenken

❑ gok verstandig

❑ ...

IN

❑ concreet materiaal

1. In een vaas zitten twee kleuren knikkers: groen en geel. Het percentage groene knikkers is 16 % en het aantal gele is 63. Hoeveel knikkers van elke kleur zitten in de vaas?

VA

N

2. Anika schrijft de getallen 1 tot en met 8 in de cirkels van onderstaand diagram, zodat geen twee rechtstreeks verbonden cirkels opeenvolgende getallen bevatten. Hoeveel bedraagt de som van de twee getallen in de gekleurde cirkels?

B) 5

©

A) 3

C) 7

D) 9

E) 11

JWO, editie 2022-2023, tweede ronde

1

3. Een stapelbare tuinstoel is 90 cm hoog. Een stapel van zes tuinstoelen is 150 cm hoog. Hoe hoog is een stapel van tien tuinstoelen?

1

2 3 4 5 6

46

STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS


HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

Centrummaten

48

3.2

Kwartielen

61

3.3

IN

3.1

Spreidingsmaten

65 78

Pienter problemen oplossen

80

©

VA

N

Studiewijzer

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

47


3.1

Centrummaten Doorsnee voltijds werkende Vlaming verdient 3 300 euro bruto per maand

IN

VIDEO

VA

N

April 2023: kouder, natter en minder zon dan normaal

Top 5 best verkochte pc- en console videogames in België voor het jaar 2022

Bijna helft van de Belgen komt moeilijk rond

©

1

FIFA 23

2

3

4

5

Call of Duty: MWII

Grand Theft Auto V

Elden Ring

FIFA 22

Bron: Business AM

1

2

Om tot de bovenstaande besluiten te komen, gebruikt men kenmerkende getallen die het centrum van een gegevensrij weergeven, ook wel centrummaten genoemd. De meest gekende centrummaat is het (rekenkundig) gemiddelde, maar ook de mediaan en de modus zijn veelgebruikte statistische kengetallen om het centrum van een verdeling te beschrijven. Op die manier kun je verschillende statistische onderzoeken met elkaar vergelijken.

3 4 5 6

48

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


3.1.1 Het gemiddelde Ruwe gegevens Definitie

(Rekenkundig) gemiddelde _ Het gemiddelde x van een rij numerieke gegevens x 1, x 2, ..., x n is de som van die gegevens gedeeld door het aantal gegevens: x + x 2 + ... + x n _ _____________ x= 1 n

Opmerkingen

Voorbeeld

IN

• Het gemiddelde heeft dezelfde eenheid als de waarnemingsgetallen (cm, kg ...). • Je rondt het gemiddelde af op één cijfer meer na de komma dan de oorspronkelijke gegevens.

De tabel bevat het aantal tot het verkeer toegelaten nieuwe personenauto’s voor de periode 2015-2022 in België. jaar

2015

2016

2018

2019

2020

2021

2022

553 692 557 487 557 970 439 038 392 769 374 597

N

aantal nieuwe 506 284 546 142 personenwagens

2017

VA

Bereken het gemiddeld aantal nieuwe personenwagens per jaar.

Met ICT – Excel:

©

Open het bestand ‘AUTO.xlsx’.

GeoGebra

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

49


Niet-gegroepeerde frequentietabel Stel dat er k verschillende waarnemingsgetallen x i (x 1, x 2, ..., x k) zijn met respectievelijke frequenties n i (n 1, n 2, ..., n k). Formule

 x + n 2  x 2 + ... + n k  x k _ n________________________ x= 1 1 n Voorbeeld

ni

0

1

1

4

2

3

3

6

4

7

5

2

totaal

• Bereken het gemiddelde.

• Als je score boven het gemiddelde ligt, behoor je dan automatisch tot de ‘betere helft’ van de klas?

N

x i (punten op 5)

IN

De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas.

Met ICT – Excel:

©

VA

Open het bestand ‘WISKUNDE.xlsx’.

GeoGebra

1

2

3 4 5 6

50

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


Gegroepeerde frequentietabel Stel dat er k klassen zijn met respectievelijk klassenmiddens m i (m, m 2, ..., m k) en klassenfrequenties n i (n 1, n 2, ..., n k). Formule

 m 1 + n 2  m 2 + ... + n k  m k _ n__________________________ x≈ 1 n

Merk op dat deze berekening een benadering is voor het gemiddelde, omdat je met de klassenmiddens werkt en niet met de werkelijke gegevens. Voorbeeld

IN

Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige per maand krijgt. Hij ondervraagt daarvoor 100 jongeren. mi

ni

[0, 5[

2,5

1

[5, 10[

7,5

8

[10, 15[

12,5

7

[15, 20[

17,5

20

[20, 25[

22,5

10

[25, 30[

N

• Bereken het gemiddelde.

zakgeld (in euro)

[30, 35[ [35, 40[ [40, 45[

25

32,5

10

37,5

15

42,5

2

47,5

2

VA

[45, 50[

27,5

• Wat is de betekenis van dit getal?

totaal

Met ICT – Excel:

©

Open het bestand ‘ZAKGELD.xlsx’.

GeoGebra STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

51


Eigenschappen van het gemiddelde eigenschap

voorbeeld De resultaten van een sporttest kun je zowel weergeven op 20 als op 100:

Als je alle waarnemingsgetallen met eenzelfde factor (≠ 0) vermenigvuldigt, dan wordt ook het gemiddelde met die factor vermenigvuldigd.

leerling

resultaat op 20

resultaat op 100

1

12

60

2

16

80

3

14

70

IN

Bereken het gemiddelde voor het resultaat op 20:

Bereken het gemiddelde voor het resultaat op 100:

Het gemiddelde maandloon is 1 654,20 euro. Iedereen krijgt 25 euro opslag per maand. Het nieuwe gemiddelde maandloon wordt

N

Als je bij elk waarnemingsgetal eenzelfde constante term optelt, dan wordt die term ook bij het gemiddelde opgeteld.

De som van de afwijkingen van alle waarnemingsgetallen ten opzichte van het gemiddelde is 0.

​​x​  i​​​

_ x​​ ​  i ​​ – ​ x ​​

10

12

14

16

18

–4

–2

0

2

4

_ met x​​  ​ = 14​

VA

De positieve en de negatieve afwijkingen ten opzichte van het gemiddelde heffen elkaar op.

Voor- en nadelen van het gemiddelde

Het gemiddelde houdt rekening met alle gegevens en is zeer geschikt bij wetenschappelijk onderzoek.

Voorbeeld

©

De tabel toont het aantal kinderen van 16 gezinnen. 2

1

3

0

2

1

4

3

0

9

1

2

2

3

0

1

Het gemiddelde is

1

Hoeveel gezinnen hebben minder kinderen dan het gemiddelde?

2

Er is één gezin met veel meer kinderen dan het gemiddelde. Verwijder de ‘uitschieter’ en

3

bereken opnieuw het gemiddelde:

4

Hoeveel waarnemingsgetallen liggen nu onder het gemiddelde?

5

6

Besluit: 52

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

.


3.1.2 De mediaan Ruwe gegevens Definitie

Mediaan

n+1. De mediaan Me van een gerangschikte rij met n getallen is het getal met rangorde _____ 2 De mediaan is • het middelste waarnemingsgetal als n oneven is; • het rekenkundig gemiddelde van de twee middelste waarnemingsgetallen als n even is.

Voorbeeld 1: n is oneven

IN

Er zijn evenveel waarnemingsgetallen kleiner dan of gelijk aan de mediaan als groter dan of gelijk aan de mediaan.

De eigenaar van een buurtwinkel noteert gedurende één week het aantal klanten per dag. De aantallen zijn al gerangschikt. Bepaal de mediaan. 15

28

35

36

39

40

, dus Me =

.

N

De mediaan is het getal met rangorde

66

Betekenis:

Voorbeeld 2: n is even

VA

Een hockeyploeg telt het aantal gemaakte doelpunten tijdens 8 wedstrijden. De gegevens staan al gerangschikt van klein naar groot. Bepaal de mediaan. 0

0

0

1

1

2

2

4

De mediaan is het getal met rangorde

. Je neemt het gemiddelde van de getallen

met rangorde

.

dus Me =

©

Betekenis:

en

Met ICT – Excel: Open het bestand ‘AUTO.xlsx’.

GeoGebra

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

53


Niet-gegroepeerde frequentietabel De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas. ​​x​  i​​​ (punten op 5)

​​n​  i​​​

c​ ​n​  i​​​

0

1

Om de mediaan te bepalen, gebruik je de cumulatieve frequentieverdeling.

1

4

De mediaan is het getal met rangorde

2

3

3

6

4

7

5

2

totaal

dus Me =

IN

Betekenis:

Met ICT – Excel:

GeoGebra

N

Er is geen specifieke formule om de mediaan te berekenen in een niet-gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.

Gegroepeerde frequentietabel

VA

Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren.

m ​​ ​  i​​​

​​n​  i​​​

c​ ​n​  i​​​

[0, 5[

2,5

1

[5, 10[

7,5

8

[10, 15[

12,5

7

[15, 20[

17,5

20

[20, 25[

22,5

10

[25, 30[

27,5

25

[30, 35[

32,5

10

[35, 40[

37,5

15

4

[40, 45[

42,5

2

5

[45, 50[

47,5

2

6

totaal

©

zakgeld (in euro)

1

2

3

54

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

Om de mediaan te bepalen, gebruik je de cumulatieve frequentieverdeling. De mediaan is het getal met rangorde en ligt dus in de klasse       . Je noemt die klasse de mediaanklasse. Je neemt het midden van de mediaanklasse als eerste benadering voor de mediaan. Dus       . Betekenis:


De mediaan bepalen via de klassenmiddens is niet nauwkeurig genoeg. Een betere benadering krijg je via het ogief. Je bepaalt de 50 %-grens. 100 %

96 %

98 %

100 %

81 %

80 % 71 %

70 % 60 % 50 %

46 %

40 %

36 %

30 % 20 %

16 % 9%

10 % 0%

0%

1%

0

5

IN

cumulatieve relatieve frequentie

90 %

Me

10

15

20

25

30

35

40

45

50

zakgeld (in euro)

Me Met ICT – Excel:

VA

GeoGebra

N

Er is geen specifieke formule om de mediaan te berekenen in een gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.

Voor- en nadelen van de mediaan

• Neem opnieuw het voorbeeld van het aantal kinderen van 16 gezinnen. 0

0

0

1

1

1

1

2

2

2

2

3

3

3

4

9

Me: getal met rangorde:

©

Betekenis mediaan:

_ x=

⇒ Me =

De mediaan is, door zijn gedefinieerde centrale ligging, niet gevoelig voor uitschieters.

• Voor een toets wiskunde behaalden 15 leerlingen van een klas de volgende punten. 6

6

6

6

6

6

6

7

7

7

9

9

10

10

Me: getal met rangorde:

6

⇒ Me =

De mediaan houdt enkel rekening met de rangorde van de gegevens, niet met de waarde van de gegevens boven of onder de mediaan. STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

55


3.1.3 De modus Definitie

Modus De modus Mo is het gegeven met de grootste frequentie. De modale klasse is de klasse met de grootste frequentie. Opmerkingen • Het kan voorkomen dat een rij waarnemingsgetallen 2 modi heeft. Je noemt dat een bimodale steekproef. • Zijn er 3 of meer getallen met eenzelfde grootste frequentie, dan wordt de modus (of modale klasse) niet gedefinieerd.

IN

Voorbeeld 1

De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas. ​​n​  i​​​

0

1

1

4

2

3

3 4 5

Mo =

6

Betekenis:

7

2

23

VA

totaal

Bepaal de modus.

N

x​​ ​  i​​​ (punten op 5)

Voorbeeld 2

Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. ​​m​  i​​​

​​n​  i​​​

[0, 5[

2,5

1

[5, 10[

7,5

8

[10, 15[

12,5

7

[15, 20[

17,5

20

[20, 25[

22,5

10

[25, 30[

27,5

25

[30, 35[

32,5

10

[35, 40[

37,5

15

[40, 45[

42,5

2

[45, 50[

47,5

2

©

zakgeld (in euro)

1

2

3 4 5 6

totaal 56

100

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

Bepaal de modale klasse =       Betekenis:


Met ICT – Excel: Als je beschikt over een tabel met ruwe gegevens, dan gebruik je de functie ‘=MODUS.ENKELV(...)’. Beschik je niet over zo’n tabel, dan is er geen specifieke formule om de modus te berekenen.

GeoGebra

Voor- en nadelen van de modus • Het aantal huisdieren van een klas van 14 leerlingen is: 0

1

1

2

2

2

2 _ x=

Mo =

Betekenis:

1

1

2

3

3

6

IN

0

Me =

De modus is niet vatbaar voor uitschieters.

• De resultaten op 10 van een toets aardrijkskunde van een klas van 13 leerlingen zijn:

10 Mo =

5

6

7

8

10

10

10

10

10

9

_ x=

VA

Betekenis:

5

N

4

Me =

De modus ligt niet centraal in de gegevens en zegt dus weinig over het midden van de gegevens.

• Van een klas werd de oogkleur genoteerd. grijs

blauw

groen

groen

blauw

grijs

bruin

bruin

bruin

bruin

groen

grijs

bruin

blauw

bruin

©

Mo:

Het gemiddelde en de mediaan kun je niet bepalen, de modus wel. De modus kan dus ook gebruikt worden voor categorische gegevens.

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

57


Oefeningen REEKS A De tabel bevat de leeftijden van de dansers in een dansgroep. Bepaal de centrummaten en geef de betekenis. 16

17

18

18

18

19

20

De frequentietabel geeft het aantal geboren biggen per zeug weer in een bepaalde boerderij.

aantal biggen

5

6

7

8

9

10

11

ni

3

6

2

7

8

7

5 juist

fout

a) De helft van de zeugen krijgt hoogstens/minstens 9 biggen.

b) Het meest voorkomend aantal biggen per zeug is 6.

c) Het gemiddeld aantal biggen per zeug is 8,3.

© 3

totaal

Juist of fout? Vink aan en verbeter indien fout.

VA

2

16

IN

15

N

1

Jason speelt darts. In de frequentietabel vind je het aantal punten per worp van zijn laatste oefenspel. Punten per worp

[0, 10[

[10, 20[

[20, 30[

[30, 40[

[40, 50[

[50, 60[

4

7

3

4

1

2

mi ni

1

Bereken zijn gemiddelde werpscore.

2

3 4 5 6

58

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


REEKS B

ICT

4

In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. 41 42 42 40 43 42 43

42 41 39 45 42 38 41

39 38 41 41 43 42 47

42 41 43 43 41 46 41

40 43 46 42 46 48 44

43 42 42 41 47 44 41

44 43 41 40 43 41 46

41 45 42 43 42 44 47

43 40 43 42 45 43 43

44 43 42 45 40 45 45

IN

a) Bereken het gemiddelde en geef de betekenis.

b) Bepaal de mediaan en geef de betekenis.

c) Bepaal de modus en geef de betekenis.

Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘2 vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). De tabel bevat de maten van de hemden die in één week zijn verkocht in een kledingzaak.

N

5

maat

36

37

38

39

40

41

42

43

44

45

46

ni

5

10

17

20

26

22

16

8

5

2

3

c) De helft van de hemden heeft hoogstens maat

.

VA

ICT

a) Welke maat komt het meeste voor?

b) Bereken de gemiddelde maat.

6

Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. gewicht [1 100, 1 400[ [1 400, 1 700[ [1 700, 2 000[ [2 000, 2 300[ [2 300, 2 600[ [2 600, 2 900[ [2 900, 3 200[ [3 200, 3 500[ [3 500, 3 800[ [3 800, 4 100[ [4 100, 4 400[ [4 400, 4 700[ totaal

©

ICT

ni 1 3 2 7 13 28 41 35 19 8 4 2 163

a) Bereken het gemiddelde geboortegewicht. b) De helft van de pasgeborenen heeft een geboortegewicht van minstens/hoogstens

. (Los op via een ogief.)

c) De meeste voorkomende gewichtsklasse is

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

.

59


7

Hamza scoort op 3 testen chemie een gemiddelde van 75%. Als hij voor de laatste 3 testen 100% zou halen, wat is dan zijn nieuwe gemiddelde?

Bepaal a en b zodat het gemiddelde 30 en de mediaan 31 is. 5

10

18

25

_ Vul de rij getallen aan zodat Me = 4,5; x​​  ​ = 5​en Mo = 2.

2

REEKS C

ICT

10

45

b

9

N

9

40

a

IN

8

Het ogief toont gegevens over de duur van een menselijke zwangerschap. 100 %

100 %

93 %

80 %

VA

cumulatieve relatieve frequentie

90 %

81 %

70 %

60 %

60 % 50 % 40 %

35 %

30 % 20 %

3%

230

©

10 % 0% 0% 220

16 %

6%

240

250

260

270

aantal dagen

a) De helft van de zwangerschappen duurt korter dan       . b) Bepaal de modale klasse en geef de betekenis.

1

2

c) Bereken het gemiddelde en geef de betekenis.

3 4

5

6

60

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

280

290

300


3.2 Definitie

Kwartielen Kwartielen

n + 1 . (25 % van de gegevens ligt links van Q .) Het eerste kwartiel Q 1 is het getal met rangorde _____ 1 4 n + 1 . (50 % van de gegevens ligt links van Q .) Het tweede kwartiel Q 2 is het getal met rangorde _____ 2 2 ( ) 3  n + 1 Het derde kwartiel Q 3 is het getal met rangorde ________. (75 % van de gegevens ligt 4 links van Q3.) • De kwartielen verdelen de gegevensrij in 4 delen met evenveel waarnemingsgetallen. • Het tweede kwartiel Q2 is de mediaan Me.

25 %

25 %

25 %

IN

25 %

Ruwe gegevens Voorbeeld:

Aan 16 gezinnen werd het aantal kinderen gevraagd. 0

0

1

1

1

1

2

2

2

2

3

3

3

4

9

N

0

• Q 1 heeft rangorde Betekenis:

VA

• Q 2 heeft rangorde Betekenis:

• Q 3 heeft rangorde Betekenis:

⇒ Q1 = ⇒

Q2 =

Q3 =

Met ICT – Excel:

©

Open het bestand ‘AUTO.xlsx’.

GeoGebra STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

61


Niet-gegroepeerde frequentietabel Voorbeeld De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas. Je bepaalt de kwartielen via de 25 %-grens, de 50 %-grens en de 75 %-grens.

x​​ ​  i​​​ (punten op 5)

​​n​  i​​​

c​ n ​ ​  i​​​

​c​f​  i​​​

0

1

1

1

4

5

Betekenis:

2

3

8

3

6

14

4

7

21

5

2

23

totaal

23

IN

​​Q​  1​​ =​    ​​Q​  2​​ = ​      ​​Q​  3​​ =​

Met ICT – Excel:

GeoGebra

N

Er zijn geen specifieke formules om de kwartielen te berekenen in een niet-gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.

VA

Gegroepeerde frequentietabel Voorbeeld

Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Je bepaalt de kwartielen via de 25 %-grens, de 50 %-grens en de 75 %-grens. Een eerste benadering is door gebruik te maken van de klassen waarin de kwartielen gelegen zijn.

​​m​  i​​​

​​n​  i​​​

​c​f​  i​​​

[0, 5[

2,5

1

[5, 10[

7,5

8

[10, 15[

12,5

7

[15, 20[

17,5

20

[20, 25[

22,5

10

1

[25, 30[

27,5

25

2

[30, 35[

32,5

10

3

[35, 40[

37,5

15

4

[40, 45[

42,5

2

5

[45, 50[

47,5

2

6

totaal

©

zakgeld (in euro)

62

100

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

​​Q​  1​​ =​     ​​Q​  2​​ =​     =     ​​Q​  3​​ =​     Betekenis:


De kwartielen bepalen via de klassenmiddens is niet nauwkeurig genoeg. Een betere methode is om te werken met het ogief. Via het ogief kun je eenvoudig de 25 %-grens, 50 %-grens en 75 %-grens bepalen. 100 %

96 %

98 %

100 %

90 % 81 % 71 %

70 % 60 % 50 %

46 %

40 %

36 %

30 % 20 %

16 % 9%

10 % 0%

IN

cumulatieve relatieve frequentie

80 %

0%

1%

0

5

10

15

Q1

20

25

Q2

30

Q3

35

40

45

50

N

zakgeld (in euro)

​​Q​  1​​ ≈​     ​​Q​  2​​ = Me ≈​     ​​Q​  3​​ ≈​     Opmerking:

VA

Op een analoge manier kun je een rij verdelen in 10 of 100 delen. Je spreekt dan van decielen en percentielen. Met ICT – Excel:

Er zijn geen specifieke formules om de kwartielen te berekenen in een gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.

©

GeoGebra

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

63


Oefeningen REEKS A De tabel bevat de leeftijden van de dansers in een dansgroep. Bepaal de kwartielen en geef de betekenis. 15

16

16

17

REEKS B 12

18

18

19

20

In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. (zie oefening 4)

N

ICT

18

IN

11

VA

Bepaal de kwartielen en geef telkens de betekenis.

ICT

13

Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘twee vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). (zie oefening 5) a) Een kwart van de verkochte hemden heeft hoogstens maat

.

b) De helft van de verkochte hemden heeft hoogstens maat

©

c) 75 % van de verkochte hemden heeft hoogstens maat

ICT

14

2

3 4 5 6

64

.

Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. (zie oefening 6) Bepaal de kwartielen via het ogief en geef telkens de betekenis.

1

.

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


3.3

Een middelgrote hond wordt gemiddeld 12 jaar. Een kwart van de honden wordt niet ouder dan 11 jaar en een kwart wordt zelfs ouder dan 13 jaar.

13,8 mm verschil in neerslag tussen de natste en de droogste dag in april.

IN

VIDEO

Spreidingsmaten

VA

N

Sint-Martens-Latem is opnieuw de gemeente met het hoogste gemiddelde inkomen.

Bron: hln.be

©

Wie in Amerika afstudeert aan één van de Ivy League-schools (zoals Harvard, Yale, Princeton ...) verdient meer dan wie naar een klassieke universiteit gaat.

Bron: U.S. Dept. of Education College Scorecard

De bovenstaande voorbeelden tonen dat er naast centrummaten nog andere kenmerkende getallen zijn die in een statistisch onderzoek worden gebruikt. Ze geven de spreiding weer ten opzichte van die centrummaten. Je noemt ze spreidingsmaten.

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

65


3.3.1 De variatiebreedte Definitie

Variatiebreedte De variatiebreedte R (‘range’) is het verschil tussen het grootste en het kleinste waarnemingsgetal. Ruwe gegevens Voorbeeld Aan 16 gezinnen werd het aantal kinderen gevraagd: 0

0

1

1

1

1

2

2

2

2

3

3

3

4

9

IN

0

Bepaal de variatiebreedte R =         Niet-gegroepeerde frequentietabel ​​n​  i​​​

0

1

1

4

2

3

3

6

4 5 totaal

Voorbeeld

De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden.

N

​​x​  i​​​ (punten op 5)

Bepaal de variatiebreedte R =

7

2

23

VA

Gegroepeerde frequentietabel ​​m​  i​​​

​​n​  i​​​

[0, 5[

2,5

1

[5, 10[

7,5

8

[10, 15[

12,5

7

[15, 20[

17,5

20

[20, 25[

22,5

10

[25, 30[

27,5

25

[30, 35[

32,5

10

[35, 40[

37,5

15

[40, 45[

42,5

2

[45, 50[

47,5

2

©

zakgeld (in euro)

totaal

100

In een gegroepeerde frequentietabel is het verschil tussen de bovengrens van de laatste klasse en de ondergrens van de eerste klasse een benadering voor de variatiebreedte. Voorbeeld Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Bepaal de variatiebreedte R =

Voor- en nadelen van de variatiebreedte

1

De variatiebreedte is eenvoudig te berekenen en is daarom geschikt voor het snel verkrijgen van een eerste, vrij ruwe schets van de spreiding van de waarnemingsgetallen.

2

3

De nadelen zijn dat de variatiebreedte • enkel rekening houdt met de twee uiterste waarden en daardoor zeer gevoelig is voor uitschieters; • geen rekening houdt met de frequenties van de waarnemingsgetallen.

4 5 6

GeoGebra 66

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


3.3.2 De interkwartielafstand Definitie

Interkwartielafstand De interkwartielafstand IQR (‘interquartile range’) is het verschil tussen het derde en het eerste kwartiel. • De interkwartielafstand bakent de middelste 50 % van de gegevens af. • Hoe verder Q3 en Q1 uit elkaar liggen, hoe groter de spreiding is van de gegevens. Ruwe gegevens Aan 16 gezinnen werd het aantal kinderen gevraagd. 0

0

1

1

2

2

2

3

3

Q1 =

1

1

2

3

4

9

IN

0

(zie 3.2)

Q3 =

Niet-gegroepeerde frequentietabel

IQR =

De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden.

IQR =

(zie 3.2)

Q3 =

N

Q1 =

Gegroepeerde frequentietabel

VA

Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Q1 =

IQR =

Q3 =

(zie 3.2)

Voor- en nadelen van de interkwartielafstand

De interkwartielafstand houdt in zekere mate rekening met de frequenties van de gegevens en kan relatief eenvoudig bepaald worden.

©

Het nadeel is dat de interkwartielafstand enkel de spreiding weergeeft van de middelste helft van de gegevens. Er wordt geen rekening gehouden met de 25 % kleinste en de 25 % grootste gegevens. GeoGebra

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

67


3.3.3 De boxplot De nadelen die de variatiebreedte en/of de interkwartielafstand opleveren, worden via de boxplot opgelost. VIDEO

De 5-getallen-samenvatting van een verdeling bestaat uit het minimum, het eerste kwartiel, de mediaan, het derde kwartiel en het maximum. Een boxplot is een grafische voorstelling van de 5-getallen-samenvatting en bestaat uit • een rechthoek (de box) met de interkwartielafstand als basis; • een verticale lijn in de box, die de plaats van de mediaan weergeeft; • lijnstukken die de box verbinden met het minimum en het maximum.

IN

Een boxplot verdeelt de gegevens in vier gebieden die elk 25 % van de waarnemingsgetallen bevatten. IQR

25 %

25 %

middelste 50 %

25 %

25 %

N

R MIN

Opmerking

Me

Q1

Q3

MAX

VA

• Bij gegroepeerde gegevens neem je als minimum de ondergrens van de eerste klasse en als maximum de bovengrens van de laatste klasse. • Je kunt het gemiddelde via de boxplot schatten door het midden van de box te bepalen. Voorbeeld

©

Teken de boxplot voor het aantal kinderen van de 16 gezinnen en bespreek.

0

1

2

3

4

5

6

GeoGebra

1

2

3 4 5 6

68

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

7

8

9


Oefeningen REEKS A 15

Bij een snelheidscontrole op een gewestweg werd op een vrijdag de snelheid van auto’s (in km/h) opgemeten. Van deze gegevens wordt een boxplot getekend. 43

61,5

68 70

89

a) Vul in:

IN

43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89

Een kwart van de auto’s rijdt hoogstens De helft van de auto’s rijdt minstens De maximaal gemeten snelheid is b) Bepaal: IQR =

.

.

N

R=

.

c) Schat het gemiddelde.

VA

REEKS B

Aan een aantal mensen is gevraagd hoeveel geld (in euro) ze afgelopen oudjaar aan cadeautjes hebben uitgegeven. Het resultaat vind je in de onderstaande boxplot. 0

0

25

10

20

50

30

40

50

77,50

60

70

80

90

77,60

100

110

120

130

140

150

160

Waar of niet waar? Verklaar met behulp van de boxplot.

©

16

a) Het bedrag dat werd uitgegeven aan cadeautjes varieert tussen 0 en 160 euro.

b) 50 % van de groep mensen geeft hoogstens 77,50 euro uit.

c) Er werden 100 mensen ondervraagd.

d) Er geven evenveel mensen minstens 77,50 euro uit als hoogstens 25 euro.

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

69


ICT

17

In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. (zie oefeningen 4 en 12) a) Bereken de interkwartielafstand. b) Bereken de variatiebreedte. c) Teken de boxplot en bespreek.

ICT

18

IN

Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘twee vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). (zie oefeningen 5 en 13) Teken de boxplot en bespreek.

N

19

Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. (zie oefeningen 6 en 14)

VA

ICT

Teken de boxplot en bespreek.

20

Een brouwer doet een aselecte steekproef om te weten te komen of de machine die de bierflesjes vult, voldoende nauwkeurig werkt. Op de etiketten van de bierflesjes staat dat de netto-inhoud 25 cl is. Van 65 flesjes wordt de inhoud (in cl) gecontroleerd.

©

ICT

klasse

​​n​  i​​​

[22, 23[

2

[23, 24[

7

1

[24, 25[

13

2

[25, 26[

17

3

[26, 27[

14

[27, 28[

9

[28, 29[

3

4 5

a) Bepaal de variatiebreedte. b) Bepaal de kwartielen via het ogief en geef de betekenis. Q1 =

Q2 =

Q3 =

6

70

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


3.3.4 De standaardafwijking

​​x​  i​​​

​​n​  i​​​

_ ​​x​  i​​ – ​ x ​​

_ ​​​n​  i​​  ​(​​​x​  i​​ – ​ x )​​ ​​​​

_2 ​​​(​x​  i​​ – ​ x )​ ​​​  ​​

_2 ​​n​  i​​  ​​(​x​  i​​ – ​ x )​ ​​​  ​​

1

3

2

3

3

7

4

5

5

2

som

IN

VIDEO

Een klas kreeg een toets voor wiskunde. Er konden 5 punten verdiend worden. De resultaten zie je in de frequentietabel. _ Bereken het gemiddelde ​​ x ​ =    ​.

Je kunt voor elk resultaat kijken hoe ver het zich van het gemiddelde bevindt. _ Voor elke ​​x​  i​​​verkrijg je zo de afwijking ten opzichte van het gemiddelde: x​​ ​  i​​ – ​ x ​​.

Bereken je het gemiddelde van die afwijkingen, dan krijg je als resultaat:       .

N

Dat komt omdat de afwijkingen ten opzichte van het gemiddelde zowel positief als negatief zijn. De positieve en negatieve afwijkingen neutraliseren elkaar. _2 Daarom kwadrateer je die afwijkingen: (​​​ ​x​  i​​ – ​ x )​ ​​​  ​​ en bereken je de gemiddelde kwadratische afwijking. 2 Je noemt die gemiddelde kwadratische afwijking ook de variantie s​​ ​​  ​​: 2

s​​ ​​  ​​ =

VA

De afwijkingen ten opzichte van het gemiddelde worden zo groter gemaakt dan ze in werkelijkheid zijn. Een ander probleem is dat het resultaat niet meer dezelfde eenheid heeft als de waarnemingsgetallen zelf. Een spreidingsmaat in dezelfde eenheid als de waarnemingsgetallen is de positieve vierkantswortel uit de variantie. Dat getal noem je de standaardafwijking: s=

De berekening van een standaardafwijking voor een populatie verschilt van die voor een steekproef.

Formule

Standaardafwijking van een populatie _____________________________ _2 _2 _2 (​​ ​x​  1​​ – ​ x )​ ​​​  ​ + (​​ ​x​  2​​ – ​ x )​ ​​​  ​+ ... + (​​ ​x​  n​​ – ​ x )​ ​​​  ​ _____________________________        ​s = ​ ​      ​ ​ ​ n

©

Bij een steekproef zul je een kleine correctie moeten maken omdat je niet met de volledige populatie werkt. In plaats van te delen door n, deel je bij de berekening van de variantie uit een steekproef door n – 1. Dat noem je de Gausscorrectie.

Formule

Standaardafwijking van een steekproef _____________________________ _2 _2 _2 ​x​  1​​ – ​ x )​ ​​​  ​ + (​​ ​x​  2​​ – ​ x )​ ​​​  ​+ ... + (​​ ​x​  n​​ – ​ x )​ ​​​  ​ ​​_____________________________ (  ​ ​ ​        ​s = ​ ​     n–1

Opmerking • Je rondt de standaardafwijking af op twee cijfers meer na de komma dan de oorspronkelijke gegevens. • De betekenis van de standaardafwijking zul je later ontdekken in hoofdstuk 5. • Voor grote aantallen (n) is het verschil tussen s ​ ​ en s zeer klein. STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

71


Ruwe gegevens Voorbeeld: Aan 16 gezinnen werd het aantal kinderen gevraagd. 0

0

0

1

1

1

1

2

2

2

2

3

3

3

4

9

_ x=

(zie 3.1.1)

Met ICT – Excel: Open het bestand ‘AUTO.xlsx’.

.

IN

De standaardafwijking is s =

GeoGebra

N

Opmerking: STDEV.P gebruik je bij een populatie, STDEV.S gebruik je voor een steekproef.

VA

Niet-gegroepeerde frequentietabel Voorbeeld

De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden.

©

Open het bestand ‘WISKUNDE.xlsx’.

1

De standaardafwijking is s =

2

3

GeoGebra

4 5 6

72

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

.


Gegroepeerde frequentietabel Voorbeeld Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Opmerking Bij een gegroepeerde frequentietabel kan de standaardafwijking enkel benaderd worden door gebruik te maken van de klassenmiddens.

N

IN

Open het bestand ‘ZAKGELD.xlsx’.

.

VA

De standaardafwijking is s ≈

©

GeoGebra

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

73


3.3.5 De standaardscore De gemiddelde schoenmaat van een Belgische vrouw is 39. De standaardafwijking is 1,62. In de Verenigde Staten is de gemiddelde schoenmaat 6,78 met een standaardafwijking van 0,873. De Vlaamse Talitha heeft maat 41, haar Amerikaanse nicht Jennifer heeft maat 7,5. Wie heeft relatief gezien de grootste maat?

Definitie

Standaardscore

IN

Om die vraag te kunnen beantwoorden, moet je de gegevens onafhankelijk maken van de meeteenheid. Daarvoor gebruik je de standaardscore. _ xi – x ______ . De standaardscore of z-score van een waarnemingsgetal x i is het getal z i = s

De z-score drukt het verschil uit van een waarnemingsgetal ten opzichte van het gemiddelde in verhouding tot de standaardafwijking. Gebruik van de standaardscore

N

Omdat de standaardscore onafhankelijk is van de meeteenheid, is het een goed instrument om gegevens van verschillende steekproeven met elkaar te vergelijken. standaardscore z < −2

betekenis

meer dan 2 keer de standaardafwijking onder het gemiddelde: uitzonderlijk laag laag

1<z<2

hoog

VA

−2 < z < −1 −1 < z < 1 z>2

minder dan 1 keer de standaardafwijking verwijderd van het gemiddelde: behorend tot de standaardgroep

meer dan 2 keer de standaardafwijking boven het gemiddelde: uitzonderlijk hoog

Wie heeft relatief de grootste schoenmaat?

©

zT =

Besluit:

1

Oefeningen

2

3

GeoGebra

4 5 6

74

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

zJ =


Oefeningen REEKS B

ICT

21

In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. (zie oefeningen 4, 12 en 17) a) Bereken de standaardafwijking. b) Diëgo heeft schoenmaat 46. Bereken de standaardscore en geef de betekenis.

IN

ICT

22

Een machine maakt kogellagers die een diameter van 20,50 mm moeten hebben. Bij een controle wordt van veertig kogellagers de diameter (in mm) bepaald.

20,48 20,32 20,53 20,82 20,20 20,44 20,48 20,71 20,55 20,33 20,39 20,38 20,73 20,50 20,26 20,65 20,72 20,81 20,44 20,57 20,51 20,49 20,43 20,32 20,50

N

20,53 20,36 20,86 20,54 20,41

20,53 20,36 20,32 20,67 20,69 20,42 20,56 20,34 20,44 20,52

a) Bereken het gemiddelde.

VA

b) Is de machine goed afgesteld?

c) Bereken de standaardafwijking.

23

Bepaalde doosjes met punaises zouden volgens het etiket 120 punaises bevatten. De fabrikant doet een steekproef bij 95 willekeurige doosjes punaises. Het resultaat zie je in de frequentietabel. ​​x​  i​​​

​​n​  i​​​

115 116 117 118 119 120 121 122 123 124 125 126 totaal

2 5 7 10 12 18 13 12 6 6 3 1 95

©

ICT

a) Bereken het gemiddelde. b) Is de vulmachine goed afgesteld? c) Bereken de standaardafwijking.

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

75


ICT

24

Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘twee vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). (zie oefeningen 5, 13 en 18) a) Bereken de standaardafwijking. b) Pjotr heeft maat 36. Bereken de standaardscore en geef de betekenis.

IN

Een leerkracht Frans geeft aan het begin van het schooljaar een woorddictee met 10 moeilijke woorden. De frequentietabel toont het aantal gemaakte fouten. ​​x​  i​​​

​​n​  i​​​

0

7

a) Het gemiddeld aantal fouten is 3,4. Bereken de standaardafwijking.

N

25

1

10

2

9

3

14

4

8

5

11

6

8

7

6

totaal

73

b) Heeft iemand met 7 fouten een uitzonderlijk slecht dictee gemaakt?

VA

ICT

ICT

26

Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. (zie oefeningen 6, 14 en 19) Bereken de standaardafwijking.

©

27

1

2

De gemiddelde lengte van de Amerikaanse man is 175,5 cm, met een standaardafwijking van 5,82 cm. De gemiddelde Belgische man meet 180,4 cm en de standaardafwijking is 6,14 cm. Wie is relatief het grootst: een Amerikaan van 180 cm of een Belg van 185 cm?

3

4

5 6

76

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


28

Aan negentig Vlaamse gezinnen werd het aantal kinderen gevraagd. 3

2

2

2

3

0

4

1

0

3

1

5

2

3

2

0

1

1

0

2

2

2

1

3

1

2

3

4

2

1

2

4

2

1

3

3

1

1

5

4

2

2

4

3

1

0

2

2

3

1

0

1

4

0

1

2

0

4

5

2

1

2

1

2

2

1

4

4

1

2

2

2

4

2

3

0

1

3

2

0

1

2

1

6

3

1

8

3

1

3

IN

ICT

a) De helft van de gezinnen heeft minstens        kinderen.

b) Een kwart van de gezinnen heeft hoogstens        kinderen. c) Als je het aantal kinderen van 1 000 Vlaamse gezinnen samentelt, hoeveel kinderen kun je dan verwachten?

N

d) Bereken de standaardafwijking:           e) Een gezin heeft 4 kinderen. Bereken de standaardscore en geef de betekenis.

VA

29

In een drukke winkelstraat werd aan 200 vrouwen gevraagd welk budget (in euro) ze elke maand aan kleding besteden. a) Vul in (maak gebruik van het ogief)

budget

​​n​  i​​​

[0, 100[

15

[100, 200[

73

[200, 300[

38

[300, 400[

26

[400, 500[

19

[500, 600[

14

[600, 700[

8

[700, 800[

4

[800, 900[

2

[900, 1 000[

1

©

ICT

• Een kwart van de vrouwen besteedt minstens       per maand.

• Een kwart van de vrouwen besteedt hoogstens       per maand.

b) Gemiddeld besteedt een vrouw       per maand aan kleding. c) Teken de boxplot en bespreek.

c) Bereken de interkwartielafstand: d) Bereken de variatiebreedte: e) Bereken de standaardafwijking: STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

77


STUDIEWIJZER Statistische kengetallen voor de leerling

3.1 Centrummaten KENNEN

_ Het gemiddelde ​​ x ​​van een rij numerieke gegevens ​​x​  1​​, ​x​  2​​, ..., ​x​  n​​​is de som van die gegevens gedeeld door het aantal gegevens: ​x​  ​​ + ​x​  2​​+ ... + ​x​  n​​ _ _____________ ​​ x ​ =    ​  1  ​ ​ n

voor de leerkracht

–  + –  +

Stel dat er k ​ ​verschillende waarnemingsgetallen ​​x​  i​​​ (​​​x​  1​​, ​x​  2​​, ..., ​x​  k​​​)​​​​ zijn met respectievelijke frequenties ​​n​  i​​ ​(​​​n​  1​​, ​n​  2​​, ..., ​n​  k​​​)​​​​. ​  1​​  ​x​  1​​ + ​n​  2​​  ​x​  2​​+ ... + ​n​  k​​  ​x​  k​​ _ ​n_______________________     ​ ​ ​​ x ​ = ​      n

IN

Stel dat er k ​ ​klassen zijn met respectievelijk klassenmiddens ​​m​  i​​ ​(​​m,​ m​  2​​, ..., ​m​  k​​​)​​​​ met klassenfrequenties ​​n​  i​​ ​(​​​n​  1​​, ​n​  2​​, ..., ​n​  k​​​)​​​​. ​ ​  1​​  ​m​  1​​ + n ​ ​  2​​  ​m​  2​​+ ... + ​n​  k​​  ​m​  k​​ _ n         ​ ​ ​​ x ​ ≈ ​  _________________________ n

n + ​​. 1 De mediaan Me van een gerangschikte rij met n getallen is het getal met rangorde ​​ _____ 2 De modus Mo is het gegeven met de grootste frequentie. De modale klasse is de klasse met de grootste frequentie.

KUNNEN

–  + –  +

Het gemiddelde berekenen van een rij gegevens of vanuit een frequentietabel.

N

De betekenis van het rekenkundig gemiddelde formuleren.

De mediaan bepalen van een rij gegevens, vanuit een frequentietabel of met behulp van een ogief. De betekenis van de mediaan formuleren.

De modus of modale klasse bepalen van een rij gegevens vanuit een frequentietabel.

VA

De betekenis van de modus formuleren.

3.2 Kwartielen

KENNEN

–  + –  +

KUNNEN

–  + –  +

©

1 Het eerste kwartiel ​​Q​  1​​​is het getal met rangorde _____ ​​ n + ​ ​ 4 (25 % van de gegevens ligt links van Q1). 1 Het tweede kwartiel ​​Q​  2​​​is het getal met rangorde _____ ​​ n + ​​ 2 (50 % van de gegevens ligt links van Q2). 3  ​(​​n + 1​)​​ Het derde kwartiel ​​Q​  3​​​is het getal met rangorde ​​ ________  ​​ 4 (75 % van de gegevens ligt links van Q3).

De kwartielen bepalen van een rij gegevens, vanuit een frequentietabel of met behulp van een ogief. De betekenis van de kwartielen formuleren.

1

2

3 4 5 6

78

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN


voor de leerling

3.3 Spreidingsmaten KENNEN

voor de leerkracht

–  + –  +

De variatiebreedte R (‘range’) is het verschil tussen het grootste en het kleinste waarnemingsgetal. De interkwartielafstand IQR (‘interquartile range’) is het verschil tussen het derde en het eerste kwartiel.

De standaardafwijking van een populatie: ___________________________ _2 _2 _2 (​​ ​x​  1​​ – ​ x )​ ​​​  ​ + (​​ ​x​  2​​ – ​ x )​ ​​​  ​+ ... + (​​ ​x​  n​​ – ​ x )​ ​​​  ​ ​ = ​ ​ ___________________________ s           ​ ​ ​ n

De standaardafwijking van een steekproef: ___________________________ _2 _2 _2 (​​ ​x​  1​​ – ​ x )​ ​​​  ​ + (​​ ​x​  2​​ – ​ x )​ ​​​  ​+ ... + (​​ ​x​  n​​ – ​ x )​ ​​​  ​ ___________________________ ​s = ​ ​             ​ ​ ​ n–1

IN

De 5-getallen-samenvatting van een verdeling bestaat uit het minimum, het eerste kwartiel, de mediaan, het derde kwartiel en het maximum. Een boxplot is een grafische voorstelling van de 5-getallen-samenvatting.

_ ​x​  i​​ – ​ x ​ ______  ​ ​. De standaardscore of z-score van een waarnemingsgetal x​ ​​ i​​​ is het getal ​​z​  i​​ = ​  s

KUNNEN

–  + –  +

De standaardafwijking berekenen van een rij gegevens of vanuit een frequentietabel.

©

VA

N

De standaardscore gebruiken om de ligging van een gegeven ten opzichte van het gemiddelde te specifiëren.

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

79


Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?

❑ filter

❑ schets

❑ patroon

❑ schema/tabel

❑ kennis

❑ vereenvoudig

❑ logisch nadenken

❑ gok verstandig

❑ ...

IN

❑ concreet materiaal

1. In een klas van 30 leerlingen met 12 meisjes en 18 jongens kiest elke leerling ofwel een bijkomend uur Italiaans ofwel een bijkomend uur Spaans. Er kiezen 24 leerlingen een uur Italiaans. De som van het aantal meisjes die Italiaans kiezen en het aantal jongens die Spaans kiezen, is 12. Hoeveel meisjes kiezen voor een uur Italiaans? A) 5

B) 6

C) 7

D) 8

E) 9

N

JWO, editie 2021-2022, tweede ronde

VA

2. Piet gooit 5 keer met 2 dobbelstenen. Het resultaat per worp wordt berekend door het aantal ogen van de 2 dobbelstenen te vermenigvuldigen (als Piet 3 en 6 gooit, is het resultaat van de worp 18). Piet gooit 5 keer met de dobbelstenen: • De 2e worp geeft 5 punten meer dan de 1e. • De 3e worp geeft 6 punten minder dan de 2e. • De 4e worp geeft 11 punten meer dan de 3e. • De 5e worp geeft 8 punten minder dan de 4e.

©

Hoeveel punten haalde Piet in elk van de 5 worpen?

3. In een klein stadspark met één ingang en één uitgang kun je enkel wandelen op eenrichtingspaden zoals in de figuur. Op hoeveel verschillende manieren kun je van de ingang naar de uitgang wandelen?

1

2

3 4

A) 4

5

B) 5

JWO, editie 2021-2022, tweede ronde

6

80

STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN

C) 6

D) 7

E) 8


HOOFDSTUK 4 I KANSREKENING

4.1

Basisbegrippen van de kansrekening

92

IN

4.2 Tellen met verzamelingen

82 99

4.4 De uniforme kansverdeling

109

4.5 Kansbomen

116

Studiewijzer

126

Pienter problemen oplossen

128

©

VA

N

4.3 De productregel

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

81


4.1

Basisbegrippen van de kansrekening

4.1.1 Inleiding Van waar is het woord ‘wiskunde’ afkomstig? In vele talen bestaat er een woord dat afgeleid is van het woord ‘mathematica’ (de wetenschap van de eigenschap van getallen en het meten van grootheden). Het woord ‘wiskunde’ komt van het middeleeuwse woord ‘wisconst’, bedacht door de Belg Simon Stevin (1548-1620). Het woord betekent ‘kunst van het zekere’.

In de statistiek beschrijf je toevalsveranderlijken met behulp van verzamelde data, die je analyseert en waaruit je besluiten trekt. In de kansrekening gebruik je wiskundige regels en modellen om het toeval te beschrijven. Beide deeldomeinen staan nooit los van elkaar en vullen elkaar aan.

N

Algemeen

IN

Maar vele zaken uit de natuur en de samenleving zijn niet met zekerheid voorspelbaar. Denk maar aan kansspelen, het aantal kinderen per gezin, het hebben van een ongeval ... Daarbij wordt de uitkomst bepaald door het toeval. De tak van de wiskunde die zich bezighoudt met het beschrijven van verschijnselen die door het toeval worden beheerst, is de waarschijnlijkheidsrekening. Die bestaat uit twee deeldomeinen: de statistiek en de kansrekening.

VA

In vele gebieden hield men jarenlang tabellen bij in verband met geboortes, sterftes, huwelijken, landbouw ..., maar pas in de zeventiende eeuw is men zich beginnen bezighouden met de wiskundige beschrijving van onzekerheden. Het begon toen de Franse wiskundige Blaise Pascal (1623-1662) in 1654 een brief kreeg van Chevalier de Méré. Daarin vroeg hij uitleg over twee ‘kansproblemen’. Het eerste probleem ging over het eerlijk verdelen van de inzet bij een gokspel als het spel vroegtijdig moet worden stopgezet.

©

Zijn tweede vraag ging over het feit waarom hij op de lange duur geld verloor als hij gokte dat bij 24 worpen met twee dobbelstenen er minstens één keer een dubbele zes zou komen. Pascal begon erover een briefwisseling met Pierre de Fermat (1601-1665) en uiteindelijk kwamen ze tot een oplossing. Je zult in dit hoofdstuk beide problemen ook zelf oplossen.

1

2 3

4 5 6

82

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

Het eerste bekende werk over kansrekening kwam er in 1713. In het boek Ars Conjectandi (‘de kunst van het gissen’) beschreef de Zwitser Jacob Bernoulli kansen als getallen die tussen 0 en 1 liggen.


4.1.2 Experiment, uitkomstenverzameling en gebeurtenis Experiment Als je een dobbelsteen opgooit en noteert hoeveel ogen je hebt geworpen, dan doe je een experiment. Je kunt dit experiment zo vaak herhalen als je maar wilt. Definitie

Experiment

IN

Een experiment is een handeling, een waarneming, een telling ... met als doel een door het toeval beheerst verschijnsel te onderzoeken. Een experiment moet zo vaak herhaald kunnen worden als wenselijk en dit onder dezelfde omstandigheden. Voorbeelden

• E1 : ‘een muntstuk opwerpen’ • E2 : ‘een leerling uit een klas van 20 leerlingen kiezen’ • E3 : ‘twee verschillende dobbelstenen opgooien’ De experimenten E1 , E2 zijn enkelvoudige experimenten. Het experiment E3 is een samengesteld experiment.

N

Uitkomstenverzameling Je gooit 4 ogen met een dobbelsteen. Het getal 4 is een uitkomst van het experiment. Welke uitkomsten zijn nog mogelijk?

Uitkomst en uitkomstenverzameling

Een uitkomst van een experiment is een resultaat van dat experiment. De uitkomstenverzameling U van een experiment is de verzameling van alle mogelijke uitkomsten van dat experiment.

VA

Definitie

Voorbeelden

• Bij het experiment E1 is de uitkomstenverzameling U1 =

• De uitkomstenverzameling van het experiment E3 is U3 =

©

De uitkomst van een experiment hoeft dus niet altijd een getal te zijn. In de kansrekening is het belangrijker het aantal elementen van een uitkomstenverzameling te bepalen, dan die verzameling weer te geven door opsomming. Notatie

# ​​(U)​​is het aantal elementen van ​U​  . # (U1  ) =

# (U2  ) =

# (U3  ) =

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

83


Gebeurtenis Je gooit met een dobbelsteen. De uitkomstenverzameling U ​ ​bij dit experiment is ​U = {​ 1, 2, 3, 4, 5, 6}​​. Je wint een punt als je minstens 5 ogen gooit. De verzameling A ​ = ​{5, 6}​​bevat alle mogelijkheden om minstens 5 ogen te gooien. A is een deelverzameling van U ​ ​. Je noemt A een gebeurtenis in ​U​. Gebeurtenis

Definitie

Een gebeurtenis is een deelverzameling van de uitkomstenverzameling. Voorbeelden

IN

• Beschouw het experiment E3: ‘twee verschillende dobbelstenen opgooien’. Neem de gebeurtenis A: ‘de som van de ogen is minstens 10’. Dan: A =

• Beschouw het experiment ‘een getal vormen met twee cijfers’.

# (A) =

Neem de gebeurtenis A: ‘het getal bestaat uit twee gelijke cijfers’.

# (U) =

Dan: A =

# (A) =

N

U=

Neem de gebeurtenis B: ‘het getal bestaat uit twee verschillende cijfers’.

Dan: # (B) =

VA

Bijzondere gebeurtenissen Elementaire gebeurtenis

Definitie

Een elementaire gebeurtenis is een gebeurtenis met één element.

Geef alle elementaire gebeurtenissen bij het experiment ‘een cijfer kiezen van 1 tot 5’.

Elke uitkomstenverzameling is deel van zichzelf en is dus ook een gebeurtenis. Zekere gebeurtenis

©

Definitie

De uitkomstenverzameling U is de zekere gebeurtenis.

1

Definitie

2

De lege verzameling ​∅​is deel van elke uitkomstenverzameling. Onmogelijke gebeurtenis

De lege verzameling ​∅​is de onmogelijke gebeurtenis.

3

4 5 6

84

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


4.1.3 Relatieve frequentie van een gebeurtenis Definitie

VIDEO

Relatieve frequentie Als een gebeurtenis A, bij n herhaalde experimenten, n A keer voorkomt, nA de relatieve frequentie van de gebeurtenis A. dan is f A = _ n

Voorbeeld 1

Je gooit 50 keer met een dobbelsteen. Het resultaat zie je in de frequentietabel. ni

1

9

2

6

3

11

4

8

5

10

6

6

Bepaal de relatieve frequentie van de volgende gebeurtenissen.

IN

xi

• A : ‘3 ogen gooien’: fA =

• B : ‘een oneven aantal ogen gooien’: fB =

• C : ‘minstens 5 ogen gooien’: fC =

Voorbeeld 2

N

50

In de tabel zie je hoe de leerlingen van een bepaalde school op een dag met normale weersomstandigheden naar school komen. ni

te voet

54

fiets

163

step

41

bromfiets

105

openbaar vervoer

377

auto

66

VA

vervoer

©

Bepaal de relatieve frequentie van de volgende gebeurtenissen. Rond af op 0,01 %. • A: ‘een leerling komt met de fiets naar school’: fA =

• B: ‘een leerling komt met de step of de bromfiets naar school’: fB = • C: ‘een leerling komt niet te voet naar school’: fC =

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

85


4.1.4 Het principe van de statistische stabiliteit Als je met een (onvervalste) dobbelsteen gooit, dan weet je dat je ‘één kans op zes’ hebt om bijvoorbeeld 5 ogen te gooien. Maar wat betekent ‘één kans op zes’? Zul je dan iedere 6 worpen één keer 5 ogen gooien? Zeker niet! Met ICT kun je het experiment ‘gooien met een onvervalste dobbelsteen’ eenvoudig simuleren. Simulatie met Excel

N

IN

In een bepaalde cel kiest Excel zelf random een getal van 1 tot en met 6. Je kunt willekeurig naar onder en naar rechts doorvoeren.

Simulatie met GeoGebra

VA

Je laat het aantal experimenten (n) toenemen en bepaalt telkens, op 0,01 % nauwkeurig, de relatieve frequentie van de gebeurtenis A: ‘5 ogen gooien’. n

50

100

200

300

500

750

1 000

nA

f A (%)

©

Wat merk je op?

Besluit

Naarmate het aantal herhaalde experimenten stijgt, zal de relatieve frequentie van een gebeurtenis steeds meer een bepaalde waarde benaderen.

Deze wetmatigheid is het principe van de statistische stabiliteit of de wet van de grote aantallen.

1

2

In de statistiek bestaat er ook een wet van de kleine aantallen. Als je over weinig gegevens beschikt, dan zal een afwijkend gegeven daar een grote invloed op hebben, waardoor je gemakkelijk verkeerde besluiten trekt.

3

4

Een voorbeeld: je bent een week in Spanje geweest en het regende vijf van de zeven dagen. Daaruit besluiten dat Spanje een land is met veel regen, is een verkeerde statistische methode.

5 6

86

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


4.1.5 Het begrip kans Kans op een gebeurtenis

Definitie

De kans op een gebeurtenis is het getal dat de relatieve frequentie van die gebeurtenis benadert als het aantal herhaalde experimenten steeds groter wordt. Notatie P(A) = de kans dat gebeurtenis A zich voordoet. Gevolgen van de definitie

•​​ ​​0 ⩽ P  (A) ⩽ 1​

•​​ ​​P  (A) = 0 ⇔ •​ ​​ ​ P  (A) = 1

IN

Als A een gebeurtenis is van de uitkomstenverzameling ​U​van een experiment, dan geldt:

A = ∅​  (De kans op de onmogelijke gebeurtenis is 0.)

A = U​  (De kans op de zekere gebeurtenis is 1.)

4.1.6 Schatten van kansen door herhaalde experimenten

N

VIDEO

In vele gevallen kun je bij het berekenen van kansen uitgaan van een gelijke kans van alle elementaire gebeurtenissen van een uitkomstenverzameling. In dat geval spreek je van een uniforme kansverdeling. Je leert met die kansverdeling werken in paragraaf 4.4. In andere gevallen is een theoretisch model niet altijd mogelijk. Een manier om dan kansen te bepalen, is het gebruik van het principe van de statistische stabiliteit.

VA

Iemand krijgt drie enveloppen aangeboden. In één van de enveloppen zit een prijs. De uitkomstenverzameling van dit experiment is ​U = ​{l(inks), m(idden), r(echts)}​​ Stel: ​L = ​{l}​, M = ​{m}​, R = ​{r}​​

Het is geweten dat meer mensen geneigd zijn om de middelste enveloppe te kiezen. Van de twee buitenste enveloppen mag je aannemen dat die evenveel kans hebben om uitgekozen te worden. • Om P ​ (M)​te bepalen, herhaal je het experiment n keer (met n verschillende personen) en noteer je hoeveel keer de middelste enveloppe is gekozen. Bereken telkens fM en bepaal dan ​P(M)​vanuit het principe

©

van de statistische stabiliteit: P ​ (M)​ =

• Bereken P(L) en P(R). ​ P​(U)​= 1

P(L) + P(R) =

​⇒

P​(L)​+ P(M) + P(R) = 1​

P(L) = P(R) =​

n

nM

fM

10

3

50

18

100

43

150

58

200

81

300

121

500

199

1 000

401

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

87


Oefeningen REEKS A 1

Neem het experiment ‘een getal raden van 1 tot en met 10’. a) Geef de uitkomstenverzameling: U =

b) Omschrijf de gebeurtenis A = {8, 9, 10}.

IN

c) Bepaal de gebeurtenis B: ‘een veelvoud van drie raden’ door opsomming.

d) Omschrijf de gebeurtenis C = {1, 3, 5}.

Onze kat heeft een nest met 3 kleine kittens gekregen. Neem het experiment ‘het geslacht raden van de 3 kittens’.

VA

2

N

e) Geef het aantal elementen van de gebeurtenis D: ‘een even getal groter dan 5 raden’.

a) Hoeveel elementen telt de uitkomstenverzameling?

b) Bepaal de gebeurtenis B: ‘het nest bevat 2 kattinnen (m) en 1 kater ( j)’ door opsomming.

©

c) Omschrijf de gebeurtenis C = {(m,m,m), ( j,j,j)}. d) Geef het aantal elementen van de gebeurtenis D: ‘het nest bevat hoogstens 1 kattin’.

1

e) Geef het aantal elementen van de gebeurtenis E: ‘het nest bevat minstens 1 kattin’.

2 3

4 5 6

88

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


REEKS B 3

Neem het experiment: ‘3 verschillende dobbelstenen opgooien.’ a) Hoeveel elementen telt de uitkomstenverzameling? b) Toon aan dat de gebeurtenis A: ‘de som van het aantal ogen is 3’ een elementaire gebeurtenis is. c) Omschrijf de gebeurtenis B ​ = {​ ​(2,2,1)​, (​ 2,1,2)​, (1,2,2)}​​.

IN

d) Bepaal de gebeurtenis C: ‘de som van de ogen is gelijk aan 5’ door opsomming.

e) Hoeveel elementen heeft de gebeurtenis D: ‘de som van de ogen is gelijk aan 7’?

N

VA

Een biefstuk kun je eten zonder saus (‘natuur’), met béarnaisesaus, met pepersaus, met champignonsaus of met Provençaalse saus. De tabel toont de voorkeur van de klanten van een restaurant. Bereken de relatieve frequentie van de volgende gebeurtenissen. Rond af op 0,01 %.

voorkeur

ni

©

4

natuur

105

béarnaise

72

peper

97

champignon

41

Provençaals

35

a) A: ‘een klant kiest steak natuur’. b) B: ‘een klant kiest peper- of champignonsaus’. c) C: ‘een klant kiest niet voor Provençaalse saus’.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

89


ni

38

20

39

41

40

76

41

103

42

135

43

164

44

128

45

97

46

39

47

16

a) A: ‘een man heeft maat 42’

b) B: ‘een man heeft maat 40 of 41’

c) C: ‘een man heeft minstens maat 45’

IN

maat

d) D: ‘een man heeft niet maat 38’

Anissa en Bram spelen regelmatig een spelletje Rummikub. Anissa heeft al dubbel zo veel spelletjes gewonnen als Bram. Bereken de kans dat Bram het volgende spelletje wint.

VA

6

Een grote schoenenwinkel heeft bijgehouden hoeveel paren herenschoenen van elke maat ze in een jaar tijd hebben verkocht. Bereken de relatieve frequentie van de volgende gebeurtenissen. Rond af op 0,01 %.

N

5

Bij het spel ‘Vier op een rij’ heeft Arend in het verleden 3 keer zo veel gewonnen als Beatrice, die 2 keer zoveel gewonnen heeft als Charlie. Bereken de kans voor elk van de spelers dat ze het volgende spel winnen.

©

7

1

2 3

4 5 6

90

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


REEKS C 8

Een dobbelsteen kun je vervalsen door het zwaartepunt van de kubusvorm te wijzigen. Een bepaalde dobbelsteen is zo vervalst dat er een grotere kans is om 6 ogen te gooien. De kans om 1 te gooien is daardoor kleiner. De andere kansen zijn gelijk. Om de kansverdeling te bepalen gebruik je het principe van de statistische stabiliteit. In de tabel is n het aantal worpen, nZ het aantal keer 6 en nE het aantal keer 1. a) Vul de tabel aan. Rond de percentages af op 0,01 %. nZ

nE

10

2

1

25

7

50

11

75

20

100

24

150

37

200

51

17

101

33

149

50

600

3 5 7

8

13

N

400

IN

n

VA

b) Bepaal de kans op de gebeurtenis Z: ‘6 ogen gooien’. Rond af op 1 %.

c) Bepaal de kans op de gebeurtenis E: ‘1 gooien’?

©

d) Bereken de andere elementaire kansen.

e) Bereken de kans om een even aantal ogen te gooien.

f) Bereken de kans om hoogstens 2 ogen te gooien.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

91


4.2

Tellen met verzamelingen

4.2.1 Verzamelingen voorstellen met venndiagrammen • Neem de verzameling A van de getallen 0 tot en met 9. 10

A = {​ 0, 1, 2, ..., 9}​​   #(A) =     ​ De getallen 0 tot en met 9 zijn de elementen van verzameling A. Je noteert: ​0 ∈ A​(0 is element van A), 1​ ∈ A​ ... _ De getallen 10 en ​​√ 2 ​​zijn geen elementen van A. _ √ Dat noteer je als: ​10 ∉ A, ​  ​ 2 ∉ A​.

A

2

1

3

0 5 7

6 9

8

2

IN

4

• Stel: B is de verzameling van de strikt positieve cijfers die drievouden zijn. 10

2

1

0

5

3

​B = {​ 3, 6, 9}​​

9

7

2

#(B) =

Alle getallen van B behoren ook tot A. Je zegt dat B een deelverzameling is van A. Notatie: B ​ ⊂ A​

6

N

4

A

B

8

VA

• Stel: C is de verzameling van de priemgetallen kleiner dan 20.

A

0

6

8

2

9

5

13

19

©

4

17

7

3

1

11

C

C=

De getallen 2, 3, 7 en 5 behoren tot A en tot C. Je noteert: ​A  C​ = {​​ 2, 3, 5, 7}​​, de doorsnede van A en C. #​(A  C  )​ =

De getallen 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 13, 17 en 19 behoren tot A of tot C. Je noteert: A ​  C = ​{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 13, 17, 19}​​, de unie van A en C. #​(A  C)​ =

Is #​(A  C) =​ #​​(A)​ +​ #​​(C)​​?

1

Waarom (niet)?

2

De getallen 11, 13, 17 en 19 behoren wel tot C, maar niet tot A.

3

Je noteert: ​C \ A = ​{11, 13, 17, 19}​​, het verschil van C en A.  #​​(C \ A)​​ =

4

​ A \ C​ =

5 6

92

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

​​

#​​(A \ C)​​ =

#(C  ) =


4.2.2 Tellen met behulp van venndiagrammen Voorbeeld 1 VIDEO

Op een school mogen de leerlingen van de derde graad kiezen: ’s middags op school blijven of naar buiten gaan. Er zijn 23 leerlingen die ervoor kiezen om op school te blijven en 95 leerlingen die liever naar buiten willen. Hoeveel leerlingen zitten er in de derde graad? Stel: B

S

S is de verzameling van de schoolblijvers. B is de verzameling van de leerlingen die buiten gaan.

#​​(S)​​ =

Voorbeeld 2

#​​(S  B)​​ =

IN

Dan: #​​(S  B)​ =​

#​​(B)​​ =

Hoeveel natuurlijke getallen van 1 tot en met 50 zijn a) deelbaar door 2 of door 3?

Stel: T

#​​(T  )​​ =

#​​(D)​​ =

⇒​  #​​(T  D)​​ = ​

N

D

T is de verzameling van de veelvouden van 2. D is de verzameling van de veelvouden van 3.

In de doorsnede zitten de getallen die veelvoud zijn van 2 en van 3. Dit zijn dus veelvouden van 6.

VA

Dan: #​​(T  D)​ =​

b) deelbaar door 2 maar niet door 3? #​​(T \ D)​ =​

Voorbeeld 3

©

In een klas zitten 21 leerlingen. Ze hebben allemaal een smartphone of een tablet. 17 leerlingen hebben een smartphone en 9 leerlingen hebben een tablet. Hoeveel leerlingen hebben beide toestellen?

S

Stel: T

S is de verzameling van de smartphonebezitters. T is de verzameling van de tabletbezitters.

#​​(S)​​ =

#​​(T  )​​ =

Als je het aantal leerlingen met een smartphone en het aantal leerlingen met een tablet optelt, krijg je 26. Dat is 5 meer dan het aantal leerlingen in de klas. #​​(S)​ +​ #​​(T  )​​ =    en #​​(S  T  )​​ =    ​ ⇒​  #​​(S  T  )​​ =

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

93


4.2.3 Tellen met behulp van het complement van een verzameling Complement van een deelverzameling VIDEO

V

Neem een verzameling V en stel ​A ⊂ V​. _ De verzameling ​​ A ​ = V \ A​noem je het complement van A

A

_ Als ​A ⊂ V​, dan is #​​( ​ A ​  )​​ = #​​(V )​ −​ #​​(A)​​.

Eigenschap

Voorbeeld 1

IN

ten opzichte van de verzameling V. _ ​ ​A ​​bevat dus alle elementen van V die niet tot A behoren.

Hoeveel natuurlijke getallen van 1 tot en met 50 zijn niet deelbaar door 3?

Stel: ​ V​is de verzameling van alle natuurlijke getallen van 1 tot en met 50.

VA

Voorbeeld 2

N

D is de verzameling van de drievouden tussen 1 en 50. _ Dan is ​​ D ​​de verzameling van alle natuurlijke getallen tussen 1 en 50 die geen drievoud zijn. _ #​​( ​ D ​  )​​ = #​​(V)​ −​ #​​(D)​​ =

Hoeveel getallen van twee cijfers bevatten het cijfer 7? methode 1

methode 2

• Je telt het aantal getallen met één 7:

• Er zijn     getallen met twee cijfers.

Er zijn     getallen waarbij 7 op

• Je telt het aantal daarvan die geen 7

de eerste plaats staat.

bevatten:

©

Er zijn     getallen waarbij 7 op de tweede plaats staat.

• Het totaal aantal getallen die 7 bevatten is dus

• Er is     getal met twee keer het cijfer 7 en dat heb je dubbel geteld.

1

• Het totaal aantal getallen die 7 bevatten is

2

dus

3

4 5 6

94

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

.

.


Oefeningen REEKS A In een bosje staan 290 bomen, waaronder 124 beuken en 83 eiken. De rest zijn dennen. Hoeveel dennen staan er in het bos?

10

Op een bijeenkomst zijn 42 Belgen en 73 Nederlanders. Er zijn ook Fransen. In totaal zijn er 161 mensen aanwezig. Hoeveel Fransen zijn er?

11

Een school heeft 217 leerlingen in de eerste graad en 198 leerlingen in de tweede graad. Het totaal aantal leerlingen is 584. Hoeveel leerlingen zitten in de derde graad?

VA

N

IN

9

Neem de verzameling G van alle getallen met 3 cijfers. a) Bepaal G door opsomming.

©

12

b) Hoeveel elementen telt G? c) Hoeveel daarvan zijn deelbaar door 5?

d) Hoeveel getallen van G zijn strikt groter dan 150?

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

95


REEKS B 13

Op een vergadering verstaan alle aanwezigen Frans of Engels. Er zijn er 12 die Engels verstaan, 11 die Frans verstaan en 8 mensen die beide talen verstaan. a) Hoeveel mensen zijn er op de vergadering?

14

IN

b) Hoeveel aanwezigen verstaan Engels maar geen Frans?

In de bovenbouw van een scholengemeenschap zijn er 76 leerkrachten die in de tweede graad les geven en 59 die in de derde graad les geven. Er zijn 23 leerkrachten die in beide graden les geven. a) Hoeveel leerkrachten zijn er in de bovenbouw?

b) Hoeveel leerkrachten geven geen les

N

in de derde graad? c) Hoeveel leerkrachten geven enkel les in de derde graad?

Een wijk telt 76 huizen. Alle huizen hebben een garage of een carport. Er zijn 53 huizen met een garage en 38 huizen met een carport.

VA

15

a) Hoeveel huizen hebben zowel een garage als een carport?

b) Hoeveel huizen hebben een carport maar geen garage?

Van alle gezinnen in België heeft 81 % een abonnement voor een vaste telefoonlijn en 93 % een abonnement om mobiel te bellen.

©

16

a) Hoeveel procent heeft beide abonnementen?

1

b) Hoeveel procent heeft geen abonnement

2

voor een vaste lijn?

3

c) Hoeveel procent heeft wel een abonnement om mobiel

4

te bellen, maar niet om met een vaste lijn te bellen?

5 6

96

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


17

Hoeveel getallen van drie cijfers bevatten een 0? • Aantal getallen van drie cijfers: • Aantal getallen van drie cijfers die geen 0 bevatten: • Aantal getallen van drie cijfers die een 0 bevatten:

18

Je gooit met twee dobbelstenen en telt de som van het aantal ogen. In hoeveel gevallen gooi je minder dan 11 ogen? • Totaal aantal mogelijkheden:

IN

• Aantal mogelijkheden om 11 of 12 te gooien: • Aantal mogelijkheden om minder dan 11 te gooien:

19

De 194 leerlingen van de derde graad gaan tijdens de paasvakantie op meerdaagse buitenlandse reis. Bij een enquête in het begin van het schooljaar mochten ze één of twee voorkeursbestemmingen aanduiden. Er waren 82 leerlingen die Barcelona kozen en 67 leerlingen die Rome kozen. 35 leerlingen duidden beide steden aan.

N

a) Hoeveel leerlingen hebben voor Barcelona of Rome gekozen?

b) Hoeveel leerlingen hebben voor Rome gekozen maar niet voor Barcelona?

VA

c) Hoeveel leerlingen hebben niet voor Barcelona gekozen?

d) Hoeveel leerlingen hebben voor

een andere bestemming gekozen?

Bij een enquête wordt aan 150 gezinnen gevraagd welke huisdieren ze hebben. Er zijn 38 gezinnen die minstens één hond hebben en 45 gezinnen hebben één of meerdere katten. 17 gezinnen hebben beide soorten huisdieren.

©

20

a) Hoeveel gezinnen hebben een kat maar geen hond?

b) Hoeveel gezinnen hebben geen hond?

c) Hoeveel gezinnen hebben geen hond en geen kat? d) Hoeveel procent van de gezinnen heeft een hond maar geen kat? STATISTIEK I HOOFDSTUK 4 I KANSREKENING

97


REEKS C 21

Bewegen is, zeker op oudere leeftijd, heel belangrijk. Uit een bevraging blijkt dat 63 % van de 65-plussers regelmatig een wandeling doet en dat 35 % regelmatig fietst. 20 % van de ondervraagden doet geen van beide activiteiten. a) Hoeveel procent van de senioren doet aan wandelen of aan fietsen? b) Hoeveel procent doet zowel aan wandelen

IN

als aan fietsen? c) Hoeveel procent wandelt wel maar fietst niet?

d) Hoeveel procent fietst niet?

Nathan gooit 50 keer met een dobbelsteen. Telkens als hij minstens 4 ogen of een even aantal ogen gooit, krijgt hij 1 punt. Hij gooit 23 keer minstens 4 ogen en 28 keer een even aantal ogen. In totaal heeft hij 35 punten.

N

22

VA

a) Hoeveel keer gooide hij 4 of 6 ogen?

b) Hoeveel keer gooide hij 5 ogen?

©

c) Hoeveel keer gooide hij 2 ogen?

d) Nathan heeft 15 keer geen punt gewonnen. Hoeveel ogen gooide hij dan?

1

2 3

4 5 6

98

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


4.3

De productregel

4.3.1 Tellen met boomdiagrammen

VIDEO

GEOGEBRA

IN

Mynthra wil een nieuwe auto kopen. Het merk en type heeft ze al gekozen. Ze moet wel nog kiezen tussen de benzineversie (B), de hybrideversie (H) en de elektrische versie (E). Bij iedere versie is er nog keuze tussen drie pakketten: de standaarduitvoering (ST), de luxe uitvoering (L) en de sportieve uitvoering (SP). Hoeveel keuzemogelijkheden heeft Mynthra in totaal? Je kunt haar keuzemogelijkheden voorstellen in een boomdiagram. ST B

SP

• Bij de eindpunten van de getekende takken zet je telkens de keuzemogelijkheid.

ST

• Bij elke keuze van de versie volgt een tweede keuze, namelijk van de uitvoering. Elke mogelijke keuze stel je daarbij voor met een tak die vertrekt uit een eindpunt van een tak die hoort bij de eerste keuze.

N

H

L

• Eerst kiest ze de versie. Elke mogelijke keuze stel je voor met een tak die vertrekt uit een beginpunt.

L

SP ST

• Bij elk eindpunt van de nieuwe takken plaats je weer de keuzemogelijkheid. • Het totaal aantal keuzes die Mynthra heeft is gelijk aan het aantal eindpunten van het diagram.

SP

Mynthra heeft dus in totaal

VA L

E

keuzemogelijkheden.

Bereken het product van het aantal keuzemogelijkheden bij elke deelkeuze:

©

Wat merk je op?

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

99


4.3.2 De productregel Sam gaat op restaurant en wil een voorgerecht, een hoofdgerecht en een dessert bestellen. Hij heeft keuze tussen 8 voorgerechten, 9 hoofdgerechten en 6 desserts. Bij zijn eten verkiest hij om bruiswater te drinken. Hij kan daarbij uit 3 merken kiezen. Op hoeveel manieren kan hij zijn menu samenstellen?

V

H

D

B

8

9

6

3

Sam kan op Algemeen

IN

Het totaal aantal keuzemogelijkheden voor Sam voorstellen met een boomdiagram is onbegonnen werk. Je gebruikt de techniek van de ‘cellen’. Sam kiest een voorgerecht (V) én een hoofdgerecht (H) én een dessert (D) én een bruiswater (B). Elke onderdeel van het menu stel je voor door een cel, waaronder je het aantal mogelijke keuzes plaatst. Het totaal aantal mogelijke menu’s is dan het product van het aantal deelkeuzes.

manieren zijn menu samenstellen.

Als een beslissing B bestaat uit k deelbeslissingen B 1, B 2, ... B k

N

en #(B 1) = n 1, #(B 2) = n 2, ..., #(B k) = n k dan: #(B) = n 1  n 2  ...  n k

VA

4.3.3 Faculteit

Op hoeveel manieren kun je 10 personen op een rijtje zetten? P1

P2

...

P10

10

9

...

1

Om op een snelle manier een dergelijk product te berekenen, gebruik je het begrip faculteit. Faculteit

© Definitie

Als n ∈ n \ {0,1}, dan is n ! = n  (n – 1)  ...  1 0 ! = 1 en 1 ! = 1

Op hoeveel manieren kun je 20 personen op 20 stoelen zetten?

1

2 3

4 5 6

100

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


4.3.4 Toepassingen • De pincode van een bankkaart bestaat uit 4 cijfers. Hoeveel mogelijkheden zijn er? C1

C2

C3

C4 →

C1

C2

C3

IN

• Hoeveel natuurlijke getallen bestaan uit 5 verschillende cijfers? Let op: een natuurlijk getal kan nooit met een 0 beginnen. C4

C5

L1

N

• Een anagram is een woord dat je vormt met dezelfde letters als een gegeven woord. Een anagram hoeft niet noodzakelijk zelf een betekenis te hebben. Hoeveel anagrammen heeft het woord ‘TAFEL’? L2

L3

L4

L5

VA

• Een code bestaat uit 4 letters en 2 cijfers. Hoeveel codes bevatten minstens 1 letter a? 

Totaal aantal codes:

Aantal codes die de letter a niet bevatten:

Aantal codes die minstens één a bevatten:

©

• Uit een klas met 15 leerlingen kies je willekeurig 4 leerlingen. Hoeveel mogelijkheden zijn er? 

Aantal mogelijkheden waarbij de volgorde van kiezen belangrijk is:

Aantal mogelijke omwisselingen van de gekozen 4 leerlingen:

Het gevraagde aantal mogelijkheden is

.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

101


• In de finale van de play-offs van de basketbalcompetitie, moeten de twee finalisten een eindronde spelen. De ploeg die het eerst 3 wedstrijden wint, is kampioen. Hoeveel wedstrijden moeten er maximaal gespeeld worden?

Op hoeveel manieren kan de finale zich ontwikkelen? Teken een boomdiagram.

©

VA

N

IN

1

2 3

4

In hoeveel gevallen zijn er slechts 3 wedstrijden nodig?

In hoeveel gevallen zijn er hoogstens 4 wedstrijden nodig?

5 6

102

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


Oefeningen REEKS A 23

Los de vraagstukken op met de productregel. a) Een inlogcode bestaat uit 4 letters. Hoeveel mogelijkheden zijn er?

IN

b) Een byte bestaat uit 8 bits (een 1 of een 0). Hoeveel bytes zijn er mogelijk?

c) In een bibliotheek krijgen de boeken een code die bestaat uit 2 letters, verschillend van 0 en 3 cijfers, verschillend van 0. Hoeveel boeken kan de bibliotheek bevatten?

N

d) De 12 leerlingen van een klas komen het leslokaal binnen. Hoeveel volgordes van binnenkomen zijn er mogelijk?

VA

e) De 12 leerlingen van een klas doen een loopwedstrijd. Hoeveel mogelijkheden zijn er om de eerste 5 te voorspellen?

f) Hoeveel even natuurlijke getallen zijn er die bestaan uit 5 cijfers?

©

g) Hoeveel oneven natuurlijke getallen zijn er die bestaan uit 5 verschillende cijfers?

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

103


Alexandra gaat naar de bakker. Ze wil een brood, een stuk taart en een meeneemkoffie kopen. Er is keuze tussen 11 soorten broden, 8 soorten taart en 3 soorten koffie. Hoeveel keuzemogelijkheden heeft ze in totaal?

25

Een firma maakt cilindersloten. Elke sleutel bestaat uit 6 gedeelten. Voor elk gedeelte kan gekozen worden tussen de patronen A, B of C. Hoeveel verschillende sleutels kunnen er gemaakt worden?

26

Je wilt 15 boeken op een boekenplank rangschikken. Hoeveel mogelijkheden heb je? Rond af op 1 miljoen.

27

Een code bestaat uit 6 verschillende cijfers. Er komt geen 0 en geen 9 in voor en het eerste cijfer is 1. Hoeveel mogelijkheden zijn er om de juiste code te raden?

VA

N

IN

24

Vier vrienden gaan samen op restaurant. Ze kunnen kiezen tussen 5 menu’s. Op hoeveel verschillende manieren kunnen de 4 vrienden hun keuze maken?

©

28

29

1

2

Er is een verkeersongeval met vluchtmisdrijf gebeurd. Een getuige herinnert zich nog dat de nummerplaat van de weggevluchte auto begon met het cijfer 1, dat daarna de letters C, E en K kwamen en dan de cijfers 6, 8 en 1. De volgorde van de letters en de cijfers herinnert de getuige zich niet meer. Hoeveel mogelijkheden zijn er nog om te achterhalen wie de schuldige is?

3

4 5 6

104

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


REEKS B Sofie en Kim spelen ‘Vier op een rij’. Ze spreken af dat diegene die het eerste 2 spelletjes na elkaar of 3 spelletjes in totaal wint, de eindoverwinnaar is. Op hoeveel manieren kan het spelverloop evolueren? Los op met behulp van een boomdiagram.

Je hebt 10 euro op zak en doet mee aan een gokspel. Je neemt je voor hoogstens 5 spelletjes te spelen. Als je een spel wint, krijg je 10 euro en als je verliest moet je 10 euro afgeven. Je stopt eerder als je geen geld meer hebt of als je 30 euro hebt. Hoeveel mogelijkheden zijn er? Los op met behulp van een boomdiagram.

©

VA

31

N

IN

30

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

105


32

Je gooit 4 keer een muntstuk op. a) Hoeveel mogelijkheden zijn er in totaal?

VA

N

IN

b) In hoeveel gevallen gooi je minstens 2 keer kruis? Los op met een boomdiagram.

33

In de hoogste klasse van het vrouwenvoetbal spelen 14 ploegen. Elke ploeg moet tegen elke andere ploeg een thuismatch en een match op verplaatsing spelen. Hoeveel wedstrijden worden er in totaal gespeeld?

©

34

1

2 3

5 leerlingen van klas A en 6 leerlingen van klas B gaan op een rij staan, zodat de leerlingen van klas A naast elkaar staan en de leerlingen van klas B naast elkaar staan. Hoeveel mogelijkheden zijn er?

4

5

6

106

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


In een boek zijn de bladzijden genummerd van 1 tot en met 285. Hoeveel bladzijden hebben een cijfer 2 in de nummering?

36

In de woonkamer staat een tafel met 6 stoelen.

IN

35

a) Hoeveel manieren zijn er om 6 personen te laten plaatsnemen?

N

b) Hoeveel manieren zijn er om 4 personen te laten plaatsnemen?

Een klas bestaat uit 14 leerlingen. De klassenleraar nodigt hen op het einde van het schooljaar uit voor een barbecuefestijn. Ze zijn niet verplicht om te komen. Op hoeveel manieren kan het feestgezelschap samengesteld worden?

38

Een leerkracht wetenschappen heeft 4 boeken over natuurkunde, 5 boeken over chemie en 3 boeken over biologie.

©

VA

37

a) Op hoeveel manieren kan de leerkracht die boeken op een plank rangschikken?

b) Hoeveel manieren zijn er als de boeken per vak gerangschikt moeten staan?

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

107


REEKS C In een badmintonclub zijn er 24 leden. Elk lid moet één match tegen elk ander lid spelen. Hoeveel matchen worden er in totaal gespeeld?

40

Een bedrijf heeft 4 nieuwe werknemers nodig. Ze hebben 23 sollicitanten.

IN

39

a) Hoeveel keuzemogelijkheden heeft het bedrijf als elk van de 4 werknemers een andere soort job krijgt?

Hoeveel mogelijkheden zijn er om 6 verschillende getallen te kiezen uit de getallen van 1 tot en met 45?

VA

41

N

b) Hoeveel mogelijkheden zijn er als de 4 werknemers dezelfde soort job krijgen?

Op een kantoor werken 10 mensen die vloeiend Engels spreken en 6 mensen die vloeiend Duits spreken. 4 mensen spreken beide talen vloeiend. Er worden 2 mensen afgevaardigd. De ene moet vloeiend Engels spreken, de andere vloeiend Duits. Hoeveel keuzemogelijkheden zijn er?

©

42

1

2 3

4 5 6

108

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


4.4

De uniforme kansverdeling

4.4.1 Definitie Neem het experiment ‘opgooien van een dobbelsteen’. U = {1, 2, 3, 4, 5, 6} en P (U) = 1

Deze uitkomstenverzameling telt 6 elementaire gebeurtenissen. E 1 = {1}, E 2 = {2}, ..., E 6 = {6} ⇒ Definitie

P(E 1) = P(E 2) = ... = P (E 6) =

Uniforme kansverdeling

IN

Elk van deze elementaire gebeurtenissen is even waarschijnlijk.

Een kansverdeling is uniform als de kansen op elk van de elementaire gebeurtenissen van een uitkomstenverzameling U aan elkaar gelijk zijn.

Voorbeelden

N

Als een experiment aanleiding geeft tot een uniforme kansverdeling, dan zegt men dat het experiment op een aselecte (of lukrake) manier is uitgevoerd.

Duid de kansexperimenten die aanleiding geven tot een uniforme kansverdeling aan met een vinkje.

• Kiezen van een leerling uit een klas.

• Nagaan of een bepaald geneesmiddel nevenwerkingen heeft of niet.

• Een balletje uit een trommel met 45 balletjes nemen.

• Een kaart uit een spel trekken.

• Is een gekozen getal een priemgetal of niet?

©

VA

• Opgooien van een muntstuk.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

109


4.4.2 Eigenschappen Eigenschap 1

Kans op een elementaire gebeurtenis Bij een uniforme kansverdeling in een uitkomstenverzameling U ​​ met n elementen, is de kans op elke elementaire gebeurtenis gelijk aan _ ​​  1 .​​ n

VIDEO

Voorbeelden • Je kiest een getal van 1 tot en met 10. De kans dat je 6 kiest is

.

• De kans dat je een bepaalde persoon aanduidt van een groep van 45 personen is

.

Eigenschap 2

IN

Je bekijkt nu de kans op een gebeurtenis met meerdere elementen. Bij het opgooien van een dobbelsteen heb je evenveel kans om een even aantal ogen te gooien dan om een oneven aantal te gooien. #​({​ 2, 4, 6})​ ​ 3 ​ = ___________ 1  ​ = ​ _ ​   ​​ ​⇒ P (​ ​{2, 4, 6}​)​ = ​ _ 2 6 #​(U )​ Kansregel van Laplace

Bij een uniforme kansverdeling in een uitkomstenverzameling U ​​

met n elementen, is de kans op een gebeurtenis A met k elementen gelijk aan

Voorbeelden

N

aantal gunstige gevallen k ​ = ​ ______________________ ​   (​ A )​ = ​ _ P        ​​  . n aantal mogelijke gevallen

VA

• In een klas van 21 leerlingen dragen 7 leerlingen een bril. Je kiest willekeurig een leerling .

uit de klas. De kans dat die leerling een bril draagt is

• Wat is de kans dat een getal van 3 cijfers deelbaar is door 5 (gebeurtenis A)? ​n = #​(U)​ =​

©

​k = #(A ) =​

1

2

P​(A)​ = ​

Pierre Simon de Laplace (1749-1827) was een Franse wiskundige en autodidact. Hij ging maar tot zijn zestiende naar school, maar dat weerhield hem er niet van een mooie carrière uit te bouwen. • In 1769 werd hij wiskundeleraar aan de militaire school van Parijs, waar hij les gaf aan onder andere Napoleon. • In 1794 kreeg hij een leerstoel aan de Polytechnische Hogeschool van Parijs. • In 1799 benoemde Napoleon hem tot minister van Binnenlandse Handel.

3

4 5 6

110

​⇒

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


4.4.3 Toepassingen • Op school zijn er ’s middags belegde broodjes te krijgen. Er zijn 5 soorten beleg voorzien: kaas, ham, americain, kip en zalm. 4 leerlingen van een klas bestellen een broodje. Bereken de kans dat ze alle 4 voor een ander soort beleg kiezen (gebeurtenis V). n=

​​​⇒

k=

IN

P (V ) =​

• In een hogeschool moeten de 73 studenten van het laatste jaar één of twee keuzevakken kiezen. Er zijn 24 studenten die statistiek kiezen, 31 studenten die marketing kiezen en 9 studenten die beide vakken willen volgen. Bereken, op 0,01 % nauwkeurig, de kans dat een willekeurige student 

statistiek of marketing kiest;

N

​ P  (​ S  M)​ =​

statistiek kiest maar geen marketing;

​ P  (​ S \ M)​ = ​

andere vakken kiest.

VA

S  M ​   )​ =​ ​ P  (​   ​‾

• Je gooit met 2 verschillende dobbelstenen en bepaalt de som van het aantal ogen. 

Vul de tabel aan. som ogen

©

kans

2

3

4

5

​​

6

Bereken de kans om 7 of 8 ogen te gooien:

Bereken de kans om minstens 10 ogen te gooien:

Bereken de kans om minstens 4 ogen te gooien:

7

8

9

10

11

12

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

111


Oefeningen REEKS A 43

Je trekt lukraak een kaart uit een spel van 52 kaarten. Wat is de kans dat het een harten is?

44

IN

Een boeket bevat 10 rode rozen, 9 witte rozen en 11 roze rozen. Je neemt willekeurig een roos uit het boeket. Bereken de kans dat het een rode roos is.

45

N

Bereken de kans dat een getal van 3 cijfers geen 7 bevat.

VA

46

In een bokaal zitten 5 witte, 7 blauwe en 4 groene knikkers. Je trekt aselect een knikker uit de bokaal. a) Wat is de kans dat de knikker wit is?

b) Wat is de kans dat de knikker blauw of groen is?

©

c) Bereken de kans dat de knikker niet groen is.

1

2 3

4 5 6

112

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


REEKS B 47

Sara gooit 7 ogen met 2 dobbelstenen. Bereken de kans dat David meer gooit.

48

Wat is de kans dat de pincode van een bankkaart uit 4 verschillende cijfers bestaat?

Je weet van 8 personen dat ze allemaal in juli jarig zijn. Bereken de kans dat ze alle 8 op een verschillende dag jarig zijn. Rond af op 0,01 %.

Je zet 5 Franse boeken en 4 Nederlandse boeken op een boekenplank. Wat is de kans dat de boeken in een bepaalde taal samen staan? Noteer als een onvereenvoudigbare breuk.

VA

50

N

49

IN

©

51

Je plaatst 5 Belgen en 4 Fransen op een rij. Bereken de kans dat er geen 2 Belgen naast elkaar staan. Noteer als een onvereenvoudigbare breuk.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

113


52

Bereken de kans dat een natuurlijk getal van 2 cijfers a) deelbaar is door 2 en door 5;

b) deelbaar is door 2 of door 5;

c) deelbaar is door 2 maar niet door 5.

53

.

IN

d) niet deelbaar is door 2 en niet door 5.

Een hotel aan zee heeft 146 kamers. Daarvan hebben 42 kamers zicht op zee. 2 24 kamers hebben een oppervlakte die groter is dan 30 m . 2 Het hotel heeft 94 kamers die geen zicht op zee hebben en kleiner zijn dan 30 m .

N

a) Wat is de kans dat een kamer zeezicht heeft 2 en groter is dan 30 m ? Rond af op 0,01 %.

VA

b) Wat is de kans dat een kamer wel zeezicht heeft, 2 maar niet groter is dan 30 m ? Rond af op 0,01 %.

©

c) Je krijgt een kamer die groter is dan 30 m². Wat is de kans dat die kamer zeezicht heeft? Rond af op 0,01 %.

54

Je gooit 4 keer een muntstuk op. Bereken de kans dat je minstens 2 keer kruis gooit. Gebruik het boomdiagram van oefening 32.

1

2 3

4 5 6

114

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


REEKS C Een groep bestaat uit 10 Belgen en 7 Nederlanders. Je kiest lukraak 2 mensen uit de groep. Wat is de kans dat het 2 Belgen zijn? Rond af op 0,01 %.

56

In een bak zitten 5 rode balletjes, 4 gele balletjes en 6 groene balletjes. Je neemt aselect 3 balletjes uit de bak. Bereken, op 0,01 % nauwkeurig, de kans dat

N

a) het 3 groene balletjes zijn;

IN

55

VA

b) er geen rode balletjes bij zijn;

©

c) er minstens 1 geel balletje bij is.

57

Je gooit 8 keer een muntstuk op. Bereken de kans dat je 3 keer munt gooit. Rond af op 0,01 %.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

115


4.5

Kansbomen

4.5.1 Voorbeeld 1 Bij een spel gooi je 4 keer een dobbelsteen op. Je wint het spel als je minstens 2 keer 5 of 6 ogen gooit. Wat is de kans dat je het spel wint? GEOGEBRA

Om een overzicht te krijgen van alle mogelijkheden, teken je een kansboom. Hierin stelt A de gebeurtenis ‘5 of 6 ogen gooien’ voor.

1/3

A

1/3

2/3

A

A

A

1/3

2/3

2/3

A

1/3

A

1/3

A

A A

2/3

A

A

1/3

N

2/3

2/3

A A

2/3

A

1/3

1/3

A

VA

1/3

2/3

A

A

1/3

2/3

A

A

2/3

A

A

1/3

2/3

A A

2/3

A

1/3

A

©

2/3

1/3

A

2/3

A

1/3

IN

A

1/3

A

2/3

A

Er zijn verschillende mogelijkheden om minstens twee keer 5 of 6 ogen te gooien. Om de kans te bepalen dat je het spel wint, bekijk je de eindpunten die in het rood zijn aangeduid. In die gevallen heb je 2, 3 of 4 keer 5 of 6 ogen gegooid. 4

1  ​​ . De kans om 4 keer 5 of 6 ogen te gooien is _ ​​  1  ​  _ ​  1  ​  _ ​  1  ​  _ ​  1  ​ = ​​ _ ​  1  ​ ​​​  ​ = ​ _ 3 3 3 3 (3) 81 3 8  ​​. ​  1  ​)​​​  ​  _ ​  2 ​ = ​ _ De kans om 3 keer 5 of 6 ogen te gooien is ​4  ​​(_ 3 3 81 2 2 8  ​​. 24 ​ = ​ _ ​  1  ​)​​​  ​  ​​(_ ​  2 ​)​​​  ​ = ​ _ De kans om 2 keer 5 of 6 ogen te gooien is ​6  ( ​​ _ 3 3 81 27 ​  8  ​ + _ ​  8  ​ = _ ​  11  ​ ≈ 0,407 4 = 40,74 %​. De kans dat je het spel wint is dus _ ​​  1  ​ + _ 81 81 27 27

1

2 3

4 5 6

116

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


4.5.2 Voorbeeld 2 Je trekt 3 ballen uit een vaas die 3 rode en 2 groene ballen bevat. Na elke trekking leg je de uitgekozen bal niet terug in de vaas. Bereken de kans dat • de 3 ballen rood zijn; • er juist 1 groene bal bij is; • er minstens 1 rode bal bij is.

GEOGEBRA

VIDEO

R2

1/3

R3

2/3

G1

2/4

R1

2/3

R2

2/4

3/5

1/3

G2

2/3

R2

R1

2/5

• De kans dat de 3 ballen rood zijn, is

is

• De kans dat er minstens 1 rode bal bij is, is

3/4

1/3

.

• De kans dat er juist 1 groene bal bij is,

N

G1

IN

Omdat je elke getrokken bal niet terug in de vaas legt, beïnvloedt elke trekking de volgende. Je spreekt in dit geval van afhankelijke experimenten en voorwaardelijke kansen.

. .

G2

VA

G1

1/4

1

G2

R1

Kansbomen

• De som van de kansen bij de takken die vertrekken vanuit eenzelfde punt is altijd gelijk aan 1. • Om de kans van een eindpunt te bepalen, vermenigvuldig je de kansen van de deeltakken die je terugvindt vanaf het beginpunt tot dat eindpunt. • Als verschillende eindpunten in aanmerking komen, tel je de kansen van de eindpunten op.

©

Algemeen

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

117


4.5.3 Afhankelijke en onafhankelijke experimenten Je gebruikt kansbomen om kansen te berekenen bij samengestelde experimenten. De deelexperimenten van een samengesteld experiment zijn onafhankelijk als na het beëindigen van elk deelexperiment de oorspronkelijke situatie opnieuw hersteld wordt. In dat geval moet in een punt van de kansboom geen rekening gehouden worden met de voorafgaande kansen.

Voorbeeld 1

IN

De deelexperimenten van een samengesteld experiment zijn afhankelijk als elk deelexperiment, vanaf het tweede, wordt beïnvloed door de voorgaande experimenten. In dat geval moet in een punt van de kansboom wel rekening gehouden worden met de voorafgaande kansen.

Een kaartspel bestaat uit 13 harten, 13 ruiten, 13 schoppen en 13 klaveren. Je trekt lukraak 3 kaarten uit een spel. Bereken, op 0,01 % nauwkeurig, de kans dat • het 3 harten zijn;

• het 2 harten zijn en een andere kaart.

afhankelijke experimenten

N

onafhankelijke experimenten

Elke kaart wordt na trekking teruggestoken

Getrokken kaarten worden niet teruggestoken

(‘trekkingen met teruglegging’)

(‘trekkingen zonder teruglegging’)

• P (‘3 harten’)

• P (‘3 harten’)

VA

​= P​(​H​  1​​)​  P​(​H​  2​​)​  P​(​H​  3​​)​​

©

• P (‘2 harten en 1 andere’) _ ​​  ​​  1)​​ ​ ​= P(​ ​H​  1​​)​  P​(​H​  2​​)​  P​(H _ ​​  ​​  1)​​ ​  P​(​H​  2​​)​ + P​(​H​  1​​)​  P​(H _ ​​  ​​  1)​​ ​  P​(​H​  1​​)​  P​(​H​  2​​)​​ + P​(H

• P (‘2 harten en 1 andere’) _ ​​  ​​  1)​​ ​ ​= P(​ ​H​  1​​)​  P​(​H​  2​​)​  P​(H _ ​​  ​​  1)​​ ​  P​(​H​  2​​)​ + P​(​H​  1​​)​  P​(H _ ​​  ​​  1)​​ ​  P​(​H​  1​​)​  P​(​H​  2​​)​​ + P​(H

1

2 3

4 5 6

118

​= P​(​H​  1​​)​  P​(​H​  2​​)​  P​(​H​  3​​)​​

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


Voorbeeld 2 In een fabriek ondergaan alle afgewerkte producten een drievoudige kwaliteitstest alvorens de fabriek te verlaten. De tests worden onafhankelijk van elkaar uitgevoerd. 90 % van alle producten voldoet aan de eerste test, 85 % voldoet aan de tweede test en 88 % aan de derde test. Een product dat 3 keer voldoet, krijgt het label ‘eerste keus’. De producten die aan 2 van de 3 testen voldoen, worden als ‘tweede keus’ verkocht. De overige artikels worden niet verkocht en gerecycleerd.

IN

• Bereken de kans dat een product ‘eerste keus’ is.

• Wat is de kans dat een product ‘tweede keus’ is?

N

• Hoeveel procent van de producten wordt niet verkocht?

VA

Voorbeeld 3

©

Het eerste probleem van Chevalier de Méré: A en B spelen een aantal spelletjes waarbij ze telkens evenveel kans hebben om te winnen. Elke speler zet een bepaald bedrag in (bijvoorbeeld elk 10 euro). Wie eerst 5 spelletjes wint, krijgt de volledige inzet. Door omstandigheden moeten ze het spel vroegtijdig stopzetten. A heeft dan al 4 keer gewonnen en B 3 keer. Hoe kan de inzet op een rechtvaardige manier worden verdeeld? • De kans dat A eerst 5 spelletjes zou winnen, is

A5

1/2

• De kans dat B eerst 5 spelletjes zou winnen, is

1/2

1/2

A5

B4

1/2

B5

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

119


Oefeningen Rond bij alle oefeningen het berekende percentage af op 0,01 %.

REEKS B 58

Een groep bestaat uit 8 Belgen, 5 Nederlanders en 7 Duitsers. Je kiest willekeurig 2 personen uit de groep. a) Wat is de kans dat het 2 Belgen zijn?

IN

b) Wat is de kans dat het een Nederlander en een Duitser zijn?

Je gooit 24 keer twee verschillende dobbelstenen op en telt telkens de som van het aantal ogen. Bereken de kans dat je minstens 1 keer 12 ogen gooit (het tweede probleem van Chevalier de Méré).

VA

59

N

De kans dat een bepaald geneesmiddel bijwerkingen heeft, is 2 %. 3 personen krijgen van hun huisarts het middel voorgeschreven.

©

60

a) Wat is de kans dat er niemand bijwerkingen heeft?

1

b) Wat is de kans dat er 1 iemand bijwerkingen heeft?

2 3

4

5 6

120

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


61

Zoë gooit 2 dobbelstenen op en telt de som van het aantal ogen. Yann gooit 1 dobbelsteen op. Maak gebruik van een kansboom om de kans te berekenen dat Yann meer ogen gooit dan Zoë.

IN

VA

N

Op een boekenrek staan 15 boeken over wiskunde en 10 boeken over fysica Je kiest lukraak 2 boeken uit het rek. Bereken de kans dat het 2 boeken zijn over hetzelfde vak a) als het eerst gekozen boek niet teruggeplaatst wordt;

©

62

b) als het eerst gekozen boek wel teruggeplaatst wordt.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

121


63

In een mandje liggen 8 potloden, 12 balpennen en 7 stiften. Je kiest lukraak 2 voorwerpen uit het mandje. Bereken de kans dat er minstens 1 potlood bij zit a) als het eerste gekozen voorwerp niet teruggelegd wordt;

Vier vrienden gaan een ijsje eten en spreken af dat er één iemand zal trakteren. Om te bepalen wie, steken ze 4 briefjes, genummerd van 1 tot 4, in een doosje. Wie het briefje met het cijfer 1 trekt, trakteert. De briefjes worden na trekking niet teruggestoken. Wie heeft er het meeste kans om te moeten trakteren?

©

VA

64

N

IN

b) als het eerste gekozen voorwerp wel teruggelegd wordt.

1

2 3

4 5 6

122

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


65

Uit een onderzoek door Statistiek Vlaanderen van eind 2022 over mediabezit blijkt dat 52 % van de senioren (mensen ouder dan 65 jaar) beschikt over een smartphone, 63 % over een computer en 42 % over een tablet. Bereken de kans dat een willekeurige senior beschikt over a) een smartphone, maar geen computer en geen tablet;

N

c) minstens 1 van de 3 toestellen.

IN

b) 2 van de 3 toestellen;

VA

Licht komt het oog binnen via de pupil. De lens zorgt ervoor dat het inkomende licht geconcentreerd wordt op het netvlies. De kegeltjes en de staafjes zetten het licht om in signalen. Via zenuwen gaan deze signalen naar de hersenen, die zorgen voor de omzetting naar beeld. Als er iets mis is met de kegeltjes en staafjes, dan worden bepaalde kleuren in grijstinten gezien. De meeste kleurenblinde mensen zien niet alles in grijstinten, maar hebben problemen met bepaalde kleurenschema’s, zoals rood-groen of geel-blauw.

Ongeveer 0,5 % van de vrouwen en 8 % van de mannen is kleurenblind. Het lerarenkorps van een school bestaat uit 45 vrouwen en 27 mannen. Bereken de kans dat een leerkracht van de school kleurenblind is.

©

66

67

Van alle volwassen mensen onder 35 jaar leest 52 % regelmatig (minstens één keer per week) een krant. Bij de mensen tussen 35 en 65 jaar is dat 66 %. In een bedrijf werken 126 mensen onder 35 jaar en 217 mensen boven 35 jaar. Bereken de kans dat een willekeurige werknemer regelmatig de krant leest.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

123


In een school studeren 28 leerlingen van richting A, 21 van richting B en 43 van richting C verder. Uit richting A haalt gemiddeld 61 % van de leerlingen een diploma hoger onderwijs. Uit richting B is dat 47 % en uit richting C 68 %. Bereken de kans dat een willekeurige leerling van die school een diploma hoger onderwijs haalt.

IN

68

REEKS C

Van 6 laptops zijn er 2 defect, maar je weet niet welke. Je test telkens 1 laptop tot je weet welke 2 defect zijn. Bereken de kans dat je meer dan 4 keer moet testen.

©

VA

N

69

1

2 3

4 5 6

124

STATISTIEK I HOOFDSTUK 4 I KANSREKENING


70

In een lokaal zitten 11 leerlingen van klas A, 7 leerlingen van klas B en 12 leerlingen van klas C. Je kiest lukraak 3 leerlingen. Bereken de kans dat het 3 leerlingen zijn van dezelfde klas

IN

a) als er 3 verschillende leerlingen moeten gekozen worden;

In een doos liggen 6 strips van Jommeke, 7 strips van Suske & Wiske en 5 strips van Asterix. Je kiest aselect 3 strips. Bereken de kans dat het 3 strips zijn van verschillende reeksen

VA

71

N

b) als een leerling meermaals kan gekozen worden.

©

a) als de gekozen strips niet teruggelegd worden;

b) als de gekozen strips teruggelegd worden

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

125


STUDIEWIJZER Kansrekening voor de leerling

4.1 Basisbegrippen van de kansrekening KENNEN

voor de leerkracht

–  + –  +

Een experiment is een handeling, een waarneming, een telling ... met als doel een door het toeval beheerst verschijnsel te onderzoeken. Een experiment moet zo vaak herhaald kunnen worden als wenselijk en dat onder dezelfde omstandigheden. Een uitkomst van een experiment is een resultaat (een getal of hoedanigheid) van dat experiment. De uitkomstenverzameling ​U​van een experiment is de verzameling van alle mogelijke uitkomsten van dat experiment.

IN

Een gebeurtenis is een deelverzameling van de uitkomstenverzameling. Een elementaire gebeurtenis is een gebeurtenis met één element. De uitkomstenverzameling ​U​is de zekere gebeurtenis.

De ledige verzameling ∅ ​ ​is de onmogelijke gebeurtenis.

Als een gebeurtenis A, bij n herhaalde experimenten, n ​ ​  A​​ ​​n​  A​​​ keer voorkomt, dan is ​​f​  A​​ = ​ _ ​​ de relatieve frequentie van A. n Naarmate het aantal herhaalde experimenten stijgt, zal de relatieve frequentie van een gebeurtenis steeds meer een bepaalde waarde benaderen.

N

De kans op een gebeurtenis is het getal dat de relatieve frequentie van die gebeurtenis benadert als het aantal herhaalde experimenten steeds groter wordt. Notatie: ​P(​ A)​ =​de kans dat gebeurtenis A zich voordoet.

KUNNEN

–  + –  +

De uitkomstenverzameling van een experiment bepalen.

Een gebeurtenis bepalen door opsomming of omschrijving.

VA

De kans op een gebeurtenis bepalen.

4.2 Tellen met verzamelingen

KENNEN

–  + –  +

De doorsnede van twee verzamelingen A en B is de verzameling van de elementen die tot A en B behoren. Notatie: ​A  B​ De unie van twee verzamelingen A en B is de verzameling van de elementen die tot A of B behoren. Notatie: ​A  B​

©

Het verschil van twee verzamelingen A en B is de verzameling van de elementen die tot A en niet tot B behoren. Notatie: ​A \ B​ _ De verzameling ​​ A ​ = V \ A​noem je het complement _ van A ten opzichte van de verzameling V. Er geldt: #​​(​ A )​ ​​ = #​​(V)​−​ #​​(A)​​.

KUNNEN

Een venndiagram gebruiken bij het oplossen van een telprobleem.

1

Het aantal elementen van de doorsnede, de unie, het verschil of het complement van eindige verzamelingen bepalen bij telproblemen.

2 3

4 5 6

126

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

–  + –  +


voor de leerling

4.3 De productregel KENNEN

voor de leerkracht

–  + –  +

Als een beslissing B bestaat uit k deelbeslissingen ​​B​  1​​  , ​B​  2​​  , ..., ​B​  k​​​ en #​​(​B​  1​​)​ = ​n​  1​​​, #​​(​B​  2​​)​ = ​n​  2​​​​ ​, ..., #​​(​B​  k​​)​ = ​n​  k​​​ ​ ​  1​​  ​n​  2​​  ...  ​n​  k​​​ dan: #​​(B)​ = n

Als ​n ∈ n \ {​ 0,1}​​, dan is ​n ! = n  (​ n − 1)​  ...  1​ ​0 ! = 1​ en ​1 ! = 1​

KUNNEN

–  + –  +

4.4 De uniforme kansverdeling

IN

Een boomdiagram of de productregel gebruiken bij telproblemen.

KENNEN

–  + –  +

Een kansverdeling is uniform als de kansen op elk van de elementaire gebeurtenissen van een uitkomstenverzameling ​U​aan elkaar gelijk zijn. Bij een uniforme kansverdeling in een uitkomstenverzameling ​U​ met n elementen, is de kans op een gebeurtenis A met k elementen gelijk aan aantal gunstige gevallen k ​ = ​ ______________________ ​P(​ A)​ = ​ _        ​​. n aantal mogelijke gevallen

N

KUNNEN

–  + –  +

De kans berekenen van een gebeurtenis bij experimenten waarbij alle uitkomsten even waarschijnlijk zijn.

VA

4.5 Kansbomen

KENNEN

–  + –  +

De som van de kansen bij de takken die vertrekken vanuit eenzelfde punt is altijd gelijk aan 1. Om de kans van een eindpunt te bepalen, vermenigvuldig je de kansen van de deeltakken die je terugvindt vanaf het beginpunt tot dat eindpunt. Als verschillende eindpunten in aanmerking komen, tel je de kansen van de eindpunten op.

KUNNEN

–  + –  +

©

Een kansboom gebruiken om kansen te bepalen bij trekkingen met teruglegging en trekkingen zonder teruglegging.

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

127


Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?

❑ filter

❑ schets

❑ patroon

❑ schema/tabel

❑ kennis

❑ vereenvoudig

❑ logisch nadenken

❑ gok verstandig

❑ ...

IN

❑ concreet materiaal

1. Wat is de oppervlakte van de gekleurde vierhoek in de gegeven rechthoek?

12

8

8

14

6

B) 144

C) 152

D) 156

E) 280

N

A) 84

16

VA

JWO, editie 2023, eerste ronde

2. Stel dat het aantal vluchten tussen Brussel en Londen in een bepaalde periode met 10 % is afgenomen en dat het aantal passagiers op dat traject met 25 % is gedaald. Met hoeveel procent is in die periode het gemiddelde aantal passagiers per vlucht gedaald? Rond af op 0,1 %.

3. Twee naast elkaar liggende getallen in deze piramide hebben als som het getal dat erboven staat.

©

91

Vul de piramide verder in. 20

12

1

5

2

7

3

4 5 6

128

STATISTIEK I HOOFDSTUK 4 I KANSREKENING

35

4


HOOFDSTUK 5 I DE NORMALE VERDELING

Kansdichtheidsfunctie

130

5.2

De normale kansdichtheidsfunctie

133

5.3

IN

5.1

Berekeningen met de normale verdeling 136

5.4 De standaardnormale verdeling 5.5

140

Niet alle gegevens zijn normaal verdeeld 147 157

Pienter problemen oplossen

158

©

VA

N

Studiewijzer

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

129


5.1

Kansdichtheidsfunctie

5.1.1 Symmetrische verdeling Als je een bakje aardbeien koopt van 500 g, dan bevat het bakje zelden exact 500 g. Je kunt moeilijk een aardbei in stukken snijden. Een aselecte steekproef bij 500 bakjes aardbeien leverde de volgende frequentietabel op. ni

fi

[478, 482[

3

0,60 %

[482, 486[

12

2,40 %

[486, 490[

28

5,60 %

[490, 494[

59

11,80 %

[494, 498[

92

18,40 %

[498, 502[

108

21,60 %

[502, 506[

95

19,00 %

[506, 510[

62

12,40 %

[510, 514[

29

5,80 %

[514, 518[

10

2,00 %

[518, 522[

2

0,40 %

500

100,00 %

25,00 %

IN

massa (g)

21,60 %

VA _ x=

Me =

19,00 %

18,40 %

15,00 %

12,40 %

11,80 %

10,00 %

5,80 %

5,60 % 5,00 %

N 2,40 %

2,00 %

0,60 %

0,40 %

modale klasse =

massa (g)

De steekproef levert een symmetrische verdeling op. Je ziet dat het gemiddelde en de mediaan aan elkaar gelijk zijn en in de modale klasse liggen. De oppervlakte van het gedeelte van het histogram links van de verticale rechte x = 500 is gelijk aan de oppervlakte rechts ervan. Als gegroepeerde gegevens symmetrisch verdeeld zijn dan zijn het gemiddelde en de mediaan aan elkaar gelijk en liggen ze in het midden van de modale klasse.

©

Algemeen

GeoGebra

1

2 3 4

5 6

130

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

[518, 522[

[514, 518[

[510, 514[

[506, 510[

[502, 506[

[498, 502[

[494, 498[

[486, 490[

[482, 486[

[478, 482[

0,00 %

[490, 494[

relatief aantal bakjes

20,00 %


5.1.2 Frequentiedichtheid en kansdichtheid Definitie

Frequentiedichtheid De frequentiedichtheid van een klasse in een gegroepeerde frequentietabel is het quotiënt van de relatieve frequentie en de klassenbreedte.

VIDEO

De frequentiedichtheid is dus de relatieve frequentie per eenheid. • Bereken de frequentiedichtheid voor elke klasse van de frequentietabel. massa (g)

mi

fi

[478, 482[

480

0,60 %

[482, 486[

484

2,40 %

[486, 490[

488

5,60 %

[490, 494[

492

11,80 %

[494, 498[

496

18,40 %

[498, 502[

500

21,60 %

[502, 506[

504

19,00 %

[506, 510[

508

12,40 %

512

5,80 %

516

2,00 %

[514, 518[

IN

f.d.

0,05

0,04

0,03

0,02

520

0,40 %

0,01

0

m (g)

VA

[518, 522[

0,06

474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524

[510, 514[

fdi

N

GEOGEBRA

Naast de tabel zie je het bijhorende dichtheidshistogram en de frequentiepolygoon. Die frequentiepolygoon is een type lijndiagram die de punten (​​ ​m​  i​​  , f​d​  i​​)​​met elkaar verbindt en die aansluit op de horizontale as. • Hoe kun je uit de frequentiedichtheid van een klasse de relatieve frequentie van die klasse berekenen?

Wat is de grafische betekenis van die berekening?

©

• Bereken de standaardafwijking met ICT: ​s =​

Schat hoeveel procent van de gegevens hoogstens één keer de standaardafwijking afwijken van het gemiddelde. Rond af op 1 %. STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

131


Van steekproef naar populatie De 500 gewogen bakjes aardbeien vormen een steekproef die getrokken is uit de volledige populatie van alle bakjes aardbeien die een massa van 500 g op het etiket staan hebben. _ Het gemiddelde ​​ x ​ = 500,0 (g)​en de standaardafwijking s = 7,30 (g) van de steekproef zijn dan schattingen voor het populatiegemiddelde m en de populatiestandaardafwijking s. Omdat het daarbij gaat om een aselecte steekproef kun je, vanuit het principe van de statistische stabiliteit, bepalen dat de benadering van het gemiddelde en de standaardafwijking voor de volledige populatie zal verbeteren als het aantal elementen van de steekproef toeneemt.

0,06

IN

De relatieve frequentieverdeling wordt dan een kansverdeling en de frequentiedichtheid wordt een kansdichtheid.

Je ziet het histogram dat hoort bij de uitgevoerde streekproef en de grafiek van een vloeiende kromme. Die kromme kun je beschouwen als de idealisering van de frequentiepolygoon van de vorige pagina.

f.d.

0,05

0,04

0,02

0,01

m (g)

474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524

VA

0

De functie waarvan je de grafiek ziet, noem je een kansdichtheidsfunctie. ​ = 500,0​en s De waarden m ​ = 7,30​ zijn de parameters van de kansdichtheidsfunctie. De waarden op de horizontale as noem je dan waarden van een toevalsveranderlijke X. In ons voorbeeld is X de massa (in g) van een bakje aardbeien.

N

0,03

Overzicht

steekproef

©

relatieve frequentie van een klasse

1

kans dat een toevalsveranderlijke waarden aanneemt tussen twee gegeven getallen

_ gemiddelde ​​ x ​​ standaardafwijking s

populatiegemiddelde m populatiestandaardafwijking s

frequentiedichtheid histogram en frequentiepolygoon

kansdichtheid grafiek van een kansdichtheidsfunctie

2 3 4

5 6

132

populatie

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


5.2

De normale kansdichtheidsfunctie

5.2.1 Definitie Bij heel wat continue numerieke gegevens verkrijg je een verdeling waarbij de mediaan en het gemiddelde samenvallen in de modale klasse en het histogram bij benadering een klokvormige curve vormt. Dergelijke gegevens noem je ‘normaal verdeeld’. Definitie

Normale kansdichtheidsfunctie 2

1 _  e – 2 ( s ) is de normale kansdichtheidsfunctie De functie met voorschrift f (x) = _ s  √ 2p met parameters m en s.

IN

x–m 1 _ _

Opmerkingen

• Het getal e is een constant irrationaal getal en is ongeveer gelijk aan 2,718. • De parameters m en s zijn respectievelijk gelijk aan het populatiegemiddelde en de populatiestandaardafwijking. • Je hoeft de formule voor de normale kansdichtheidsfunctie niet vanbuiten te leren. Berekeningen met de normale verdeling zul je met ICT uitvoeren.

N

5.2.2 Kenmerken van de grafiek

• De grafiek ligt boven de x-as en is klokvormig en symmetrisch ten opzichte van de verticale rechte met vergelijking x = m. • De functie bereikt een maximum als x = m. • De grafiek bezit twee buigpunten, namelijk als x = m – s en als x = m + s. (In een buigpunt maakt een kromme de overgang van hol naar bol of omgekeerd.) • De x-as is een horizontale asymptoot voor de grafiek.

VA

y

x

x=μ-σ

x=μ

x=μ+σ

©

Invloed van de parameters m en s op de vorm van de grafiek

De grafiek van de normale kansdichtheidsfunctie wordt soms ook de Gausscurve genoemd, naar de Duitse wiskundige Carl Friedrich Gauss (1777-1855) die aantoonde dat de verdeling van meetfouten bij waarnemingen ‘normaal’ verdeeld is.

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

133


5.2.3 De normale verdeling met ICT y

f

x b

IN

a

Je kunt niet rechtstreeks kansen berekenen vanuit het voorschrift van de kansdichtheidsfunctie f. Om de kans te bepalen dat X tussen a en b is gelegen (bijvoorbeeld de kans dat iemand tussen 175 cm en 180 cm groot is), bereken je de oppervlakte tussen de grafiek van f, de x-as en de verticalen x = a en x = b. De kans dat een continue toevalsveranderlijke X gelijk is aan een bepaalde waarde (denk bijvoorbeeld aan de kans dat iemand exact 178 cm groot is) is dus 0.

Je gebruikt de schermindeling ‘Kansrekening’.

464 466 468 470 472 474 476 478 480 482 484 486 488 490 492 494 496

Normale verdeling

474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524 526

P ( 498

μ 500

≤ X ≤ 502

σ 7,3

) = 0,2159

N

Vul de volgende tabel aan. Maak voor de linkerkolom gebruik van de normale kansdichtheidsfunctie met m = 500 en s = 7,30 en voor de rechterkolom van de frequentietabel van § 5.1. De stand van de intervalhaken speelt geen rol, omdat de kans op exact een bepaalde waarde gelijk is aan 0.

VA

kans

P(490 ⩽ X ⩽ 494) =

f [490, 494[ =

P(X ⩾ 514) =

1 – c f [510, 514[ =

P(X ⩽ 502) =

relatieve frequentie

c f [498, 502[ =

©

De normale verdeling met Excel

1

2

P(490 ⩽ X ⩽ 494) = NORM.VERD.N(494; 500; 7,30; 1) – NORM.VERD.N(490; 500; 7,30; 1)

3 4

5

De normale verdeling met GeoGebra

6

134

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


Oefeningen REEKS A 1

Je ziet de grafieken van 6 normale kansdichtheidsfuncties. Bepaal telkens de parameters m en s. Kies voor s uit de waarden 1; 1,5; 2; 3 en 4.

y grafiek 3

IN

0,4

0,35

0,3

grafiek 6

0,25

grafiek 1

0,2

0,15

0,1

grafiek 2

grafiek 5

VA

0,05

N

grafiek 4

O

2

4

m

©

grafiek 1

6

8

10

x 12

14

16

18

s

20

22

m

24

s

grafiek 4

grafiek 2

grafiek 5

grafiek 3

grafiek 6

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

135


5.3

Berekeningen met de normale verdeling

5.3.1 Voorbeeld 1

massa (g)

m

s

jongens

3 440

425

meisjes

3 360

410

IN

VIDEO

De tabel bevat gegevens over het geboortegewicht van levend geboren eenlingen in België. De gemiddelden zijn afgerond op 10 g, de standaardafwijkingen op 5 g. Veronderstel dat de gegevens leiden tot een normale verdeling.

• Hoeveel procent van de meisjes weegt tussen 2 800 en 3 200 g?

Normal

σ 410

P ( 2 800 ≤ X ≤ 3 200 ) =

N

2 400 2 600 2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200

μ 3 360

VA

Excel: NORM.VERD.N(3 200; 3 360; 410; 1) – NORM.VERD.N(2 800; 3 360; 410; 1)

• Wat is de kans dat een jongen meer dan 4 kg weegt?

2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200 4 400 4 600 4 800

©

Excel: 1 – NORM.VERD.N(4 000; 3 440; 425; 1)

1

2 3 4

5 6

136

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

Normal

μ 3 440

P ( 4 000 ≤ X ) =

σ 425


• Hoeveel moet een jongen wegen om tot de lichtste 10 % te behoren? Rond af op 1 g.

μ 3 440

Normal

P( X ≤

2 200 2 400 2 600 2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200 4 400

σ 425

) = 0,1

IN

Excel: NORM.INV.N(0,1; 3 440; 425)

• Hoeveel weegt het zwaarste kwart bij de meisjes? Rond af op 1 g.

Normal

2 600 2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200 4 400 4 600

P(

μ 3 360

σ 410

≤ X ) = 0,25

N

Excel: NORM.INV.N(0,75; 3 360; 410)

VA

5.3.2 Voorbeeld 2

Letse vrouwen zijn gemiddeld de grootste ter wereld. Ze worden gemiddeld 170,3 cm groot. De standaardafwijking is 7,26 cm. De Belgische vrouwen staan op de twintigste plaats. Gemiddeld worden ze 166,1 cm groot, met een standaardafwijking van 7,80 cm.

©

Als een Belgische vrouw bij de 20 % grootsten is, hoeveel procent van de Letse vrouwen is dan groter?

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

137


Oefeningen Bij alle berekeningen rond je het eindresultaat af op twee cijfers na de komma.

REEKS A 2

Niet alle euromunten hebben exact dezelfde diameter. De diameter van de munten van één euro is normaal verdeeld met een gemiddelde van 23,25 mm. De standaardafwijking is 0,085 mm. a) Hoeveel procent heeft een diameter van minstens 23,4 mm?

IN

b) Van hoeveel procent ligt de diameter tussen 23,2 en 23,4 mm?

c) Wat is de diameter van de 25 % grootste munten?

De gemiddelde dagtemperatuur in Oostende voor de maand juli is 16,3 ºC. De standaardafwijking is 3,78 ºC. Je mag uitgaan van een normale verdeling.

N

3

a) Wat is de kans dat er in juli een dagtemperatuur is boven 20 ºC?

VA

b) Bereken de kans dat de dagtemperatuur tussen 15 ºC en 17 ºC ligt.

c) Wat is de dagtemperatuur van de 10 % koudste julimaanden?

De leeftijd waarop een kind voor het eerst alleen kan lopen is normaal verdeeld. Het gemiddelde is 13,5 maanden en de standaardafwijking 1,95 maanden.

©

4

a) Bij hoeveel procent worden de eerste pasjes gezet tussen de 12 en 14 maanden?

b) Wat is de kans dat een kind al loopt als het 11 maanden is?

1

c) Hoeveel procent loopt pas na de leeftijd van 15 maanden?

2

3

d) Een kind is bij de 5 % vroegste lopers. Op welke leeftijd begon het te lopen?

4

5

6

138

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


REEKS B 5

De populairste appelsoorten in België zijn de jonagold en de granny smith. De massa van beide appelsoorten is normaal verdeeld. Een jonagold weegt gemiddeld 194 g met een standaardafwijking van 29,5 g. Een granny smith weegt gemiddeld 155 g met een standaardafwijking van 22,6 g. a) Hoeveel procent van de jonagoldappelen weegt meer dan 250 g? b) De 15 % lichtste jonagoldappelen worden gebruikt voor appelsap. Hoeveel wegen die appelen?

IN

c) Hoeveel procent van de grannysmithappelen weegt minder dan de gemiddelde jonagoldappel?

d) Wat is de kans dat een granny smith meer weegt dan het derde kwartiel van de jonagoldappelen?

De dosis van een product nodig voor een volledige verdoving is normaal verdeeld met gemiddelde 50 mg en standaardafwijking 10 mg. De letale dosis (dat is de dosis die de dood veroorzaakt) van dat product is ook normaal verdeeld. Het gemiddelde is 110 mg en de standaardafwijking 20 mg. Als een anesthesist een dosis zou gebruiken die in 90 % van de gevallen voldoende is om een patiënt te verdoven, hoeveel procent sterfgevallen zouden er dan zijn?

VA

6

N

Een bedrijf maakt bouten en bijpassende moeren. De diameter van de bouten is normaal verdeeld met gemiddelde 2,0 mm en standaardafwijking 0,12 mm. Ook de diameter van de moeren is normaal verdeeld. De gemiddelde moer heeft een diameter van 2,2 mm en een standaardafwijking van 0,09 mm. De 10 % kleinste moeren worden niet in de handel gebracht. Welk deel van de bouten kan daardoor ook niet verkocht worden?

©

7

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

139


5.4

De standaardnormale verdeling

5.4.1 Standaardscore Definitie

Standaardscore De standaardscore of z-score van de waarde x van een toevalsveranderlijke X x–m is gelijk aan z = _ s . Daarbij is m het populatiegemiddelde en s de populatiestandaardafwijking.

IN

De standaardscore is de afwijking van x ten opzichte van het gemiddelde m, uitgedrukt in aantal keer de standaardafwijking s.

Met behulp van de standaardscore kun je op een eenvoudige manier verschillende veranderlijken in verschillende meeteenheden met elkaar vergelijken. De standaardscore is immers onafhankelijk van de meeteenheid. Voorbeeld 1

N

De gemiddelde Belgische man wordt 181,7 cm groot, met een standaardafwijking van 7,05 cm. In de Verenigde Staten werken ze met inches. De gemiddelde Amerikaan wordt 69,1 inch groot, met een standaardafwijking van 2,43 inch.

VA

Een Belgische man is 185 cm groot, zijn Amerikaanse kennis meet 70,9 inch. Wie is relatief het grootst van de twee? zB =

zA =

Voorbeeld 2

©

Het bintje is de meest verkochte frietaardappel. Het gemiddelde bintje dat als frietaardappel aangeboden wordt, heeft een massa van 193,5 g. De standaardafwijking is 27,35 g. Frietbintjes met een z-score boven 1,5 worden als XL-bintjes verkocht. Hoeveel wegen de XL-bintjes?

1

2 3 4

5 6

140

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


5.4.2 De standaardnormale kansdichtheidsfunctie Als je de waarden x van een normaal verdeelde toevalsverandelijke X vervangt door hun standaardscore z, dan krijg je een toevalsveranderlijke Z GEOGEBRA

Definitie

waarvoor geldt: m ​​ ​Z​​ = 0 en  ​s​  Z​​ = 1​

1 2 _

–​   ​​z​​  ​ 2 De kansdichtheidsfunctie die hoort bij Z heeft als voorschrift f​ (z) = _ ​  1_  ​  e​ ​​  ​​. ​√ 2p ​

standaardnormale kansdichtheidsfunctie

1 2 _

IN

–​   ​​z​​  ​ 2 De functie met voorschrift ​f (z) = _ ​  1_  ​  ​e​​  ​​is de standaardnormale kansdichtheidsfunctie ​√ 2p ​ met parameters ​​m​  Z​​ = 0 en  ​s​  Z​​ = 1​.

y 0,4

• De grafiek is symmetrisch ten opzichte van de verticale rechte met vergelijking z = 0.

0,3

• De functie bereikt een maximum als z = 0. • De grafiek bezit twee buigpunten,

0,2

namelijk als z = –1 en als z = 1.

N

• De z-as is een horizontale asymptoot

0,1

voor de grafiek.

z

–2

–1

0

1

2

3

VA

–3

5.4.3 De empirische regel

Je gaat na hoeveel procent van de normaal verdeelde gegevens hoogstens één keer, twee keer of drie keer de standaardafwijking afwijkt van het gemiddelde.

VIDEO

©

​– 1 ⩽ z ⩽ 1​

–3 –2,5 –2 –1,5 –1 –0,5

0

0,5

1

1,5

2

2,5

Normale verdeling

3

P ( −1

≤X≤ 1

μ 0

σ 1

) = 0,6827

68,27 % van de gegevens wijkt hoogstens één keer s af van m.

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

141


​– 2 ⩽ z ⩽ 2​ μ 0

Normale verdeling

–3 –2,5 –2 –1,5 –1 –0,5

0

0,5

1

1,5

2

2,5

P ( −2

3

≤X≤ 2

σ 1

) = 0,9545

95,45 % van de gegevens wijkt hoogstens twee keer s af van m.

IN

​– 3 ⩽ z ⩽ 3​

μ 0

Normale verdeling

–3 –2,5 –2 –1,5 –1 –0,5

0

0,5

1

1,5

2

2,5

P ( −3

3

≤X≤ 3

σ 1

) = 0,9973

Opmerking

N

99,73 % van de gegevens wijkt hoogstens drie keer s af van m.

Wie met Excel werkt, gebruikt de functie NORM.S.VERD. Bijvoorbeeld: ​P(​ – 1 ⩽ Z ⩽ 1)​ =​NORM.S.VERD(1; 1) – NORM.S.VERD(–1; 1).

VA

Samenvatting

Empirische regel voor normaal verdeelde toevalsveranderlijken

y

y

y

68 %

95 %

99,7 %

©

16 %

–3

–2

–1

2,5 %

16 %

0

1

2

3

z 4

–3

–2

–1

2,5 % 0

1

2

3

0,15 % z 4

0,15 % z

–3

–2

–1

0

• De waarden in [​m – s, m + s​] horen tot de standaardgroep. • De waarden in [​m – 2  s, m – s​  [ zijn laag; de waarden in [​m + s, m + 2  s​] zijn hoog.

1

• De waarden buiten [​m – 2  s, m + 2  s​] zijn uitzonderlijk.

2 3 4

5 6

142

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

1

2

3

4


5.4.4 Gebruik van de standaardnormale verdeling Voorbeeld 1 Intelligentie is een van de meest onderzochte begrippen in de wetenschappelijke psychologie. Het intelligentiequotiënt (IQ) heeft vooral betrekking op aanleg tot goed kunnen redeneren, logisch denken en ruimtelijk inzicht.

VIDEO

De gemiddelde IQ-score is 100 en de standaardafwijking is 15.

standaardscore

IQ

IN

Vul de tabel aan. Gebruik de empirische regel.

–2 ⩽ z < –1 –1 ⩽ z ⩽ 1

laag: onintelligent

standaard begaafd hoog: intelligent

N

1<z⩽2

Voorbeeld 2

procent van de bevolking

uitzonderlijk laag: zwakbegaafd

z < –2

z>2

betekenis

uitzonderlijk hoog: hoogbegaafd

VA

De hoeveelheid koffie die een automaat per keer levert, is normaal verdeeld. De helft van de bekertjes bevat minstens 160 ml, een kwart minstens 165 ml. De bekertjes kunnen hoogstens 180 ml bevatten. Bereken de kans dat er een bekertje overloopt.

• Bij een normale verdeling is het gemiddelde gelijk aan de mediaan • De standaardafwijking bepaal je met behulp van de standaardscore.

©

Voor een kwart van de gegevens geldt dat z ⩾ 0,674 5. x–m 165 – 160 = 0,674 5 _ _ s = 0,674 5 ⇔ s 5 _ 0,674 5  s = 5 ⇔ s = ≈ 7,41 (ml) 0,674 5

⇒ m = 160

Excel: = NORM.S.INV(0,75)

• Bereken, op 0,01 % nauwkeurig, de kans dat er een bekertje overloopt.

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

143


Oefeningen Je rondt berekende kansen altijd af op twee cijfers na de komma.

REEKS A 8

De gemiddelde maandelijkse all-in huurprijs voor een studentenkamer in Gent in het academiejaar 2022-2023 bedroeg 451 euro. De standaardafwijking was 63,50 euro. Los de volgende vragen op zonder ICT.

IN

a) Wat is de kans dat een kamer meer dan 514,50 euro per maand kostte?

Als de dokter je bloeddruk meet, dan geeft hij twee waarden op: de bovendruk en de onderdruk. De bovendruk is de hoogste druk op de vaatwanden, namelijk als het hart samentrekt. De onderdruk wordt gemeten als het hart zich ontspant. De bovendruk bij volwassenen is normaal verdeeld met een gemiddelde van 117 mmHg (kwikdruk) en een standaardafwijking van 18,5 mmHg. Los de volgende vragen op zonder ICT.

VA

9

N

b) Tot welk bedrag was de maandelijkse huurprijs uitzonderlijk laag?

a) Tussen welke waarden ligt de bovendruk bij 68 % van de volwassenen?

©

b) De dokter zegt dat je bloeddruk laag is. Welke bovendruk heb je dan?

c) Vanaf welke waarde is de bovendruk uitzonderlijk hoog?

1

2 3

d) Hoeveel procent van de volwassen heeft een uitzonderlijk hoge bovendruk?

4

5 6

144

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


REEKS B 10

De inhoud van automatisch gevulde melkflessen is normaal verdeeld. Het gemiddelde is de inhoud waarop de machine is ingesteld. De standaardafwijking is 1,50 cl. Het bedrijf wenst dat 75 % van de flessen minstens 100 cl bevat. a) Op welke inhoud moet de vulmachine worden ingesteld? Rond af op 1 ml.

IN

b) De flessen kunnen hoogstens 105 ml melk bevatten. Wat is de kans dat een fles overloopt bij het vullen?

Op pakjes boter staat meestal 250 g ℮. Dat betekent dat, volgens de Europese norm, niet meer dan 5 % van die pakjes minder dan 250 g mag bevatten. De massa van pakjes boter van een bepaald merk is normaal verdeeld met een standaardafwijking van 6,5 g.

N

11

VA

a) Bereken de gemiddelde massa zodat precies voldaan wordt aan de Europese norm. Rond af op 0,1 g.

b) Wat is de kans dat een pakje boter tussen 255 en 260 g weegt?

©

c) Wat is de kans dat een pakje minder weegt dan 245 g?

d) Hoeveel wegen de 20 % zwaarste pakjes? Rond af op 0,1 g.

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

145


12

Een supermarktketen biedt appelmoes aan in bokalen waarvan het etiket een inhoud van 500 ml aangeeft. Uit een voldoende grote aselecte steekproef is gebleken dat de helft van de bokalen appelmoes meer dan 502 ml bevatten. Eén op de tien bokalen bevat meer dan 510 ml. Je mag ervan uitgaan dat de inhoud van de bokalen normaal verdeeld is.

IN

a) Bereken de standaardafwijking op 0,01 ml nauwkeurig.

b) Wat is de kans dat een bokaal appelmoes tussen 495 ml en 505 ml bevat?

De spanwijdte van de vleugels van vlinders is normaal verdeeld. Een bioloog heeft van 2 000 koolwitjes de spanwijdte (in cm) van de vleugels gemeten. Zijn onderzoek leidt tot de volgende boxplot.

VA

13

N

c) Bereken het eerste kwartiel. Rond af op 0,1 ml.

2,50

4,65 5,25 5,85

8,00

©

a) Bepaal het gemiddelde en de standaardafwijking. Rond s af op 0,001 cm.

1

2 3

b) Wat is de kans dat je een koolwitje ziet met een vleugelwijdte van meer dan 7 cm?

4

5 6

146

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


5.5

Niet alle gegevens zijn normaal verdeeld Van sommige gegevens is algemeen geweten dat ze normaal verdeeld zijn. Veel natuurlijke kenmerken (de lengte van een mens, de massa van eieren, de schofthoogte van een hondenras ...) kunnen beschreven worden met de normale verdeling. Ook de theorie van de meetfouten bij laboratoriumonderzoek of automatisering steunt op de normale verdeling.

5.5.1 Rechtsscheve verdelingen

IN

In veel andere gevallen kun je echter de normale verdeling niet toepassen.

In 2021 voerde Statbel een loonenquête uit naar het maandelijkse bruto-inkomen bij 130 000 werknemers van Belgische bedrijven. Je ziet de verdeling in loonklassen. Het gemiddelde is 3 835,6 euro en de standaardafwijking 1 071,76 euro. 25 %

15 %

N

18,18 %

14,46 %

11,52 %

10 %

9,40 %

7,24 %

VA

percentage van de werknemers

21,12 % 20 %

7,58 % 5,61 %

5%

3,66 %

1,23 %

0%

[1 500, 2 000[

[2 500, 3 000[

[2 000, 2 500[

[3 500, 4 000[

[3 000, 3 500[

[4 500, 5 000[ [4 000, 4 500[

[5 500, 6 000[ [5 000, 5 500[

> 6 000

maandelijks bruto inkomen in euro

0,045 % 0,040 %

©

frequentiedichtheid en kansdichtheid (normale verdeling)

Je zet de relatieve frequenties om naar frequentiedichtheden.

0,035 % 0,030 % 0,025 % 0,020 % 0,015 % 0,010 % 0,005 % > 6 000

[5 500, 6 000[

[5 000, 5 500[

[4 500, 5 000[

[4 000, 4 500[

[3 500, 4 000[

[3 000, 3 500[

[2 500, 3 000[

[2 000, 2 500[

[1 500, 2 000[

0,000 %

Over het histogram voor de frequentiedichtheden is (een stuk van) de Gausscurve getekend met m = 3 835,6 en s = 1071,76. Bij de verdeling van de inkomens ligt de modale klasse links van het centrum en is er een ‘staart naar rechts’, waardoor het gemiddelde rechts van de mediaan ligt. _ Er geldt dus: ​​ x ​ > Me​. Je noemt die verdeling rechtsscheef.

maandelijks bruto inkomen in euro

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

147


5.5.2 Linksscheve verdelingen In 2022 bedroeg de gemiddelde leeftijd waarop een Belgische vrouw stierf 84,0 jaar. De standaardafwijking was 13,55 jaar en de mediaanleeftijd 86 jaar. Het histogram is gemaakt op basis van de sterftetafels. 40 % 36,15 % 35 %

IN

relatief aantal sterfgevallen

31,96 % 30 %

25 %

20 %

16,35 %

15 %

10 %

5% 0%

N

7,36 %

2,88 %

2,85 %

0,35 %

0,11 %

0,24 %

0,51 %

[0, 10[

[10, 20[

[20, 30[

[30, 40[

1,24 %

[40, 50[

[50, 60[

[60, 70[

[70, 80[

[80, 90[

[90, 100[

>100

leeftijd in jaren

VA

Vul de tabel met frequentiedichtheden aan.

leeftijd

[0, 10[ [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50, 60[ [60, 70[ [70, 80[ [80, 90[ [90, 100[

f.d. (%)

4,0 %

3,0 %

©

frequentiedichtheid en normale kansdichtheid

3,5 %

2,5 % 2,0 % 1,5 % 1,0 %

leeftijd in jaren

3 4

Verdelingen met GeoGebra

5 6

148

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

>100

[90, 100[

[80, 90[

[70, 80[

[60, 70[

[50, 60[

[40, 50[

[30, 40[

[20, 30[

2

[10, 20[

0,0 %

[0, 10[

0,5 %

1

>100

Het histogram voor de frequentiedichtheden is helemaal niet goed te benaderen door de Gausscurve met m = 84,0 en s = 13,55. Bij de verdeling van de leeftijden is er een ‘staart naar rechts’, waardoor het gemiddelde links van de mediaan ligt. _ Er geldt dus: x < Me. Je noemt die verdeling linksscheef.


5.5.3 Symmetrische verdelingen die niet normaal verdeeld zijn In het verkeer is de reactietijd de tijd die verloopt tussen het zien van een gevaar en het ogenblik dat het rempedaal wordt ingedrukt. De reactietijd is afhankelijk van verschillende factoren: leeftijd, vermoeidheid, alcoholgebruik, zichtbaarheid van het gevaar ... In een experiment werd de reactietijd (in honderdsten van een seconde) gemeten van 100 mannelijke chauffeurs van 25 jaar, bij een identieke vooropgestelde situatie. 60 % 49 %

40 % 30 % 20 %

IN

aantal chauffeurs in procent

50 %

13 %

12 %

10 % 0%

7% 1%

2%

3%

[72, 74[

[74, 76[

[76, 78[

7%

[78, 80[

[80, 82[

[82, 84[

[84, 86[

[86, 88[

4%

[88, 90[

1%

[90, 92[

1%

[92, 94[

N

reactietijd in honderdsten seconden

De gemiddelde reactietijd en de mediaantijd zijn gelijk, namelijk 83,0 honderdsten seconden. De standaardafwijking is 3,13 honderdsten seconden. Er is dus duidelijk sprake van een symmetrische verdeling. Om na te gaan of hier ook een normale verdeling geldt, gebruik je ICT.

VA

Methode met Excel

©

Stap 1: je vult de frequentietabel aan met de klassenmiddens en de frequentiedichtheden.

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

149


Stap 2: je berekent voor elk klassenmidden de waarde van de normale kansdichtheidsfunctie

IN

Je gebruikt de functie NORM.VERD.N

Stap 3: je tekent het histogram voor de frequentiedichtheden en de Gausscurve.

• Selecteer de kolommen met de waarden van de frequentiedichtheid en de kansdichtheid.

10,0 %

N 1

2

3

de klassen.

• Verplaats de grafiek naar een nieuw blad.

• Rechtermuisklik op het lijndiagram –

©

• Geef gepaste astitels.

Het is duidelijk dat een normale verdeling hier niet past.

3 4

5 6

150

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

11

0,5 %

0,5 %

[90, 92[

[92, 94[

reactietijd in honderdsten seconde frequentiedichtheid

Gegevensreeks opmaken – Opvulling en lijn –Vloeiende lijn.

Methode met GeoGebra

10

2,0 %

1,5 %

0,0 %

[76, 78[

4,0 %

1,0 %

8,0 %

[74, 76[

Reeks 2 → normale kansdichtheid

2

9

[88, 90[

12,0 %

Reeks 1 → frequentiedichtheid

1

8 Reeks 2

16,0 %

0,5 %

frequentiedichtheid en normale kansdichtheid

• Wijzig de legendenamen:

7

24,5 %

[72, 74[

VA naar eigen voorkeur.

6

20,0 %

Gegevensreeks opmaken –

Opvulling en contour doe je

5

24,0 %

• Rechtermuisklik op één van de staven – Breedte tussenruimte: 0 %.

4 Reeks 1

3,5 %

0,0 %

[86, 88[

Aslabelbereik: selecteer de cellen met

6,5 %

5,0 %

[84, 86[

Horizontale aslabels – Bewerken.

[82, 84[

Gegevens selecteren –

15,0 %

6,0 %

• Rechtermuisklik op de horizontale as;

20,0 %

[80, 82[

Gegroepeerde kolom lijn – OK.

25,0 %

3,5 %

Alle grafieken – Combinatie –

30,0 %

[78, 80[

• Invoegen – Aanbevolen Grafieken –

normale kansdichtheid


5.5.4 Toepassen van de empirische regel Voorbeeld 1 Een aardappelverwerkingsbedrijf heeft van 96 willekeurig gekozen aardappelen de massa bepaald in g. Ga na of een normale verdeling geldig is. 73

100

131

95

99

95

112

101

124

114

118

108

56

125

82

93

143

100

113

72

86

128

118

102

94

106

132

92

111

117

69

108

104

111

100

102

96

89

77

108

144

117

93

107

105

46

141

65

100

106

81

81

138

99

56

94

77

105

117

133

98

101

125

133

103

137

71

119

92

77

102

105

109

128

31

96

100

117

119

53

107

130

78

107

141

110

79

98

99

139

116

129

94

98

97

116

_ x ≈ Me

De verdeling is symmetrisch.

_ x= Me =

IN

VIDEO

percentage gegevens (empirische regel)

interval

aantal gegevens (steekproef)

relatieve frequentie

N

_ _ [x – s , x + s] =

s=

68 %

_ _ [x – 2  s , x + 2  s] =

95 %

VA

Deze percentages voldoen aan de empirische regel. Je kunt een normale verdeling toepassen. Voorbeeld 2

Aan 83 leerkrachten van een school werd gevraagd op hoeveel kilometer ze van school wonen. 7

36

5

10

1

22

2

4

15

3

11

12

25

4

2

13

6

5

31

10

2

12

18

6

1

41

7

4

8

19

12

17

24

9

19

23

12

17

9

32

13

30

1

3

15

5

6

7

20

3

38

44

11

24

14

8

23

12

37

11

13

33

26

8

1

9

39

17

8

18

21

10

29

18

2

25

28

11

21

8

29

6

©

3

_ x= Me =

_ x > Me ⇒ de verdeling is rechtsscheef. Er is geen normale verdeling van toepassing.

GeoGebra STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

151


Oefeningen REEKS A 14

Tot welke soort verdeling (symmetrisch S, rechtsscheef R, linksscheef L) geven de volgende histogrammen aanleiding? MAANDELIJKS KLEDINGBUDGET VAN 2 000 PERSONEN 40,00 %

36,50 %

30,00 %

S

25,00 % 19,00 %

20,00 % 15,00 %

13,00 %

10,00 %

9,50 %

7,50 %

7,00 %

4,00 %

5,00 % 0,00 % [0, 100[

r

IN

relatief aantal personen

35,00 %

2,00 %

1,00 %

R

r

L

r

S

r

R

r

L

r

S

r

R

r

L

r

0,50 %

[100, 200[ [200, 300[ [300, 400[ [400, 500[ [500, 600[ [600, 700[ [700, 800[ [800, 900[ [900, 1 000[

budget in euro

DIAMETER VAN 160 KOGELLAGERS

N

25,00 %

16,25 %

15,00 %

15,63 %

10,63 %

10,00 %

10,00 %

8,13 %

VA

relatief aantal kogellagers

21,25 %

20,00 %

5,00 %

0,00 %

7,50 % 5,63 %

5,00 %

[20,0; 20,1[ [20,1; 20,2[ [20,2; 20,3[ [20,3; 20,4[ [20,4; 20,5[ [20,5; 20,6[ [20,6; 20,7[ [20,7; 20,8[ [20,8; 20,9[

diameter in mm

DUUR VAN DE ZWANGERSCHAP BIJ 10 000 VROUWEN

40,00 %

37,66 %

30,00 %

©

relatief aantal vrouwen

35,00 %

25,00 % 20,00 %

9,83 %

10,00 %

0,00 %

2

16,01 %

15,00 %

5,00 %

1

18,58 %

3,90 % < 37

8,87 %

5,15 %

[37, 38[

[38, 39[

[39, 40[

aantal weken

3 4

5 6

152

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

[40, 41[

[41, 42[

> 42


REEKS B Bij een onderzoek naar de levensduur van ledverlichting, werd bij 80 ledlampen nagegaan hoelang (in h) ze ononderbroken kunnen blijven branden. Het resultaat van het onderzoek zie je in de frequentietabel. Ga grafisch na of een normale verdeling geldig is. De gemiddelde levensduur is 41 450 h en de standaardafwijking is 9 665,56 h.

levensduur (h)

ni

[20 000, 24 000[

5

[24 000, 28 000[

7

[28 000, 32 000[

9

[32 000, 36 000[

12

[36 000, 40 000[

16

[40 000, 44 000[

11

[44 000, 48 000[

12

[48 000, 52 000[

8

[52 000, 56 000[

6

IN

15

N

ICT

©

VA

80

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

153


ICT

16

Van 150 kippeneieren wordt de massa (in g) bepaald. Het gemiddelde is 60,0 g en de standaardafwijking 6,50 g. a) Toon grafisch aan dat de gegevens normaal verdeeld zijn. massa (g)

ni

[42, 46[

2

[46, 50[

7

[50, 54[

17

[54, 58[

30

[58, 62[

37

[62, 66[

31

[66, 70[

16

[70, 74[

8

[74, 78[

2

IN

150

VA

N

©

b) Een ei dat minstens 73 g weegt, krijgt het label XL (extra large). Bepaal zonder ICT hoeveel procent van de eieren daaraan voldoen.

1

c) Eieren tussen 53 g en 63 g krijgen het label M (medium). Hoeveel procent van de eieren krijgt dat label?

2 3

4

d) Hoeveel weegt de 10 % zwaarste eieren? Rond af op 0,1 g.

5

6

154

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


REEKS C 17

De tabel bevat de jaartotalen (in %) voor het vak wiskunde, van de 118 leerlingen die vorig jaar in het zesde jaar van onze school zaten. Ga na of een normale verdeling geldig is. 63

56

82

92

62

65

70

76

52

91

61

67

86

71

66

63

80

56

64

57

71

56

81

47

75

66

64

75

53

72

82

73

63

54

67

61

62

71

70

53

65

46

67

72

75

61

66

62

61

83

61

54

66

73

75

66

75

71

66

65

70

66

68

44

66

65

62

63

52

61

71

82

60

71

65

66

71

67

66

65

66

67

75

71

70

72

71

56

73

70

65

64

63

60

80

66

57

61

65

66

70

72

81

45

70

73

61

62

66

61

65

62

63

69

57

51

87

41

IN

ICT

VA

N

©

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

155


18

Op de etiketten van de flesjes water die door een machine automatisch worden gevuld staat een netto-inhoud van 50 cl. Een bedrijf doet een aselecte steekproef en controleert de inhoud (in ml) van 80 van de band genomen flesjes. Ga na of een normale verdeling geldig is.

508

496

501

499

496

499

502

501

496

504

494

506

499

497

503

501

498

496

500

492

504

500

498

503

497

503

492

502

499

500

497

507

499

490

500

507

499

505

497

501

502

495

507

503

501

497

500

496

509

494

499

504

496

504

494

493

503

501

505

500

505

493

504

498

501

498

502

496

491

499

499

501

494

503

500

495

499

497

503

498

IN

ICT

N

VA

©

1

2 3 4

Carl Friedrich Gauss is geboren in 1777 en groeide uit tot één van de grootste wis- en natuurkundigen aller tijden. Als 3-jarige verbeterde hij al rekenfouten van zijn vader en op 7-jarige leeftijd ontdekte hij een methode om de natuurlijke getallen van 1 tot en met 100 op te tellen. Gauss heeft zo goed als in alle takken van de wiskunde een bepalende rol gespeeld en kreeg dan ook niet voor niets de bijnaam ‘prins van de wiskunde’. Zijn meest tot de verbeelding sprekende wiskundige prestaties waren het ontdekken van een methode om de baan van hemellichamen te beschrijven, de normale verdeling van meetfouten en de ontwikkeling van niet-Euclidische meetkunde (de meetkunde van gekromde oppervlakken).

5 6

156

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING


STUDIEWIJZER De normale verdeling voor de leerling

5.1 Kansdichtheidsfunctie KENNEN

voor de leerkracht

–  + –  +

De frequentiedichtheid van een klasse is het quotiënt van de relatieve frequentie en de klassenbreedte.

5.2 De normale kansdichtheidsfunctie KENNEN

–  + –  +

IN

De grafiek van de normale kansdichtheidsfunctie is klokvormig en symmetrisch ten opzichte van de rechte met vergelijking x = m. De functie bezit een maximum als x = m. De grafiek bezit twee buigpunten, namelijk als x = m – s en als x = m + s. De x-as is een horizontale asymptoot voor de grafiek.

m is het populatiegemiddelde en s is de populatiestandaardafwijking.

5.3 Berekeningen met de normale verdeling

KUNNEN

–  + –  +

N

ICT gebruiken om vraagstukken op te lossen met behulp van de normale kansdichtheidsfunctie.

5.4 De standaardnormale kansdichtheidsfunctie

VA

KENNEN

–  + –  +

De standaardscore of z-score van de waarde x van een toevalsveranderlijke X is gelijk aan ​ x–m z = ​ _​​.

s

Er geldt: m ​​ ​  Z​​ = 0 en  ​s​  Z​​ = 1​.

68 % van de waarden ligt in [​m – s, m + s​].

95 % van de waarden ligt in [​m – 2  s, m + 2  s​]

KUNNEN

–  + –  +

©

De standaardnormale verdeling gebruiken in vraagstukken waarbij de onafhankelijkheid van de meeteenheden noodzakelijk is.

5.5 Niet alle gegevens zijn normaal verdeeld KUNNEN

–  + –  +

Nagaan of een rij gegevens benaderd kan worden met behulp van een normale kansdichtheidsfunctie.

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

157


Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?

❑ filter

❑ schets

❑ patroon

❑ schema/tabel

❑ kennis

❑ vereenvoudig

❑ logisch nadenken

❑ gok verstandig

❑ ...

IN

❑ concreet materiaal

N

1. Jan liegt altijd op maandag, dinsdag en woensdag, en niet op de andere dagen. Piet liegt altijd op donderdag, vrijdag en zaterdag, en niet op de andere dagen. Op een dag zegt Jan tegen Piet: “Morgen zal ik liegen.” Piet reageert: “Morgen zal ik ook liegen.” Op welke dag vond dat gesprek plaats?

VA

2. Het grootste vierkant van de figuur heeft een zijde 4. Bereken de oppervlakte van het rode driehoekje.

©

3. Een dief steelt een kwart van het fortuin van een kok en geeft daarvan de helft aan zijn vrouw. Die schenkt op haar beurt een derde van wat ze net kreeg aan haar minnaar, die bevriend is met de kok en hem daarvan de helft geeft. De kok is 11 000 florijnen armer geworden. Hoe groot was het fortuin van de kok oorspronkelijk?

1

A) 36 000 florijnen

B) 45 000 florijnen

2

D) 52 000 florijnen

E) 60 000 florijnen

3

JWO, editie 2021, eerste ronde

4

5 6

158

STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING

C) 48 000 florijnen


HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

6.1

Spreidingsdiagrammen en trendlijnen

163

IN

6.2 Correlatie

160 165

Studiewijzer

173

Pienter problemen oplossen

174

©

VA

N

6.3 Correlatie en causaliteit

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

159


6.1

Spreidingsdiagrammen en trendlijnen

6.1.1 Inleiding minder hitte die naar de ruimte ontsnapt 30 biljoen ton CO2 per jaar minder zuurstof in de lucht meer fossiele brandstoffen in de lucht meer hitte die terug naar de aarde gaat

Af en toe online gamen verbetert de schoolresultaten van 15-jarigen. Maar activiteiten op sociale media hebben een averechts effect.

IN

nachten warmen sneller op dan dagen

Regelmatige lichaamsbeweging bevordert het geheugen.

De toename van de gemiddelde temperatuur kan alleen verklaard worden door de menselijke invloed in rekening te brengen.

Tot nu toe heb je in dit leerwerkboek enkel met één statistische veranderlijke gewerkt. In dat geval spreek je van eendimensionale of univariate statistiek.

N

In de tweedimensionale of bivariate statistiek behandel je de mogelijke samenhang tussen twee veranderlijken. De ene veranderlijke kan de andere beïnvloeden en omgekeerd. Ook de sterkte van het verband is belangrijk.

VA

Om een benaderende formule te vinden voor het verband tussen de twee gemeten veranderlijken, gebruik je regressie. Je maakte er al eerder kennis mee. Voorbeeld

Femke is vertegenwoordiger. Ze krijgt een vast maandloon en daarbovenop een percentage op de maandelijkse omzet. In de tabel zie je het maandloon y (in euro) in functie van de omzet x (in euro). Gebruik lineaire regressie om het verband tussen y en x te bepalen. 1 000

5 000

10 000

20 000

30 000

y (euro)

1 740

1 900

2 100

2 500

2 900

©

x (euro)

Met ICT – Excel:

1

2 3 4

Je selecteert de gegevensrijen en voegt een spreidingsdiagram in. Klik met de rechtermuisknop op één van de punten. Kies eerst 'trendlijn toevoegen' en vervolgens 'lineair'. Vink ‘Vergelijking in grafiek weergeven’ aan.

Het maandloon y kun je berekenen met de formule

5

GeoGebra

6

160

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

.


B+S

6.1.2 De best passende trendlijn bepalen Voorbeeld 1 Aan 17 vrouwen werd de lengte en de schoenmaat gevraagd. Gebruik lineaire regressie om het verband te bepalen tussen de schoenmaat y en de lengte x (in cm). x (cm) 176 155 163 153 169 173 152 161 165 163 42

y

36

38

36

40

41

35

38

37

37

171

158 168 167 160 165

171

39

37

40

38

39

36

38

VERBAND TUSSEN LICHAAMSLENGTE EN SCHOENMAAT BIJ 17 VROUWEN 44

IN

In tegenstelling tot het voorbeeld van § 6.1.1 is het niet mogelijk om een rechte te tekenen die perfect bij alle punten past. De regressierechte is de ‘best passende trendlijn’.

42

schoenmaat

40

• De vergelijking van de trendlijn is

38

36

.

• Schat de schoenmaat van een vrouw van 175 cm.

N

34

32 150 152 154 156 158 160 162 164 166 168 170 172 174 176 178

lengte (cm)

VA

Voorbeeld 2

Het risico op een verkeersongeval is, volgens een studie van het Instituut voor Mobiliteit van de universiteit Hasselt, even groot voor mannen als voor vrouwen. De kans op een ongeval met doden of gekwetsten is wel afhankelijk van het geslacht. De tabel toont de kans op een ziekenhuisopname bij een ongeval bij mannen. Bepaal, via machtsregressie, het omgekeerd evenredig verband tussen het risico en de leeftijd. KANS OP EEN ZIEKENHUISOPNAME BIJ EEN VERKEERSONGEVAL BIJ MANNEN

mi

kans in %

2

[15, 25[

20

1,9

1,6

[25, 35[

30

1,1

[35, 45[

40

0,82

[45, 55[

50

0,68

[55, 65[

60

0,52

[65, 75[

70

0,51

1,8

kans in procent

©

leeftijd

1,4 1,2 1 0,8 0,6 0,4 0,2 0

0

10

20

30 40 50 leeftijd in jaren

60

70

80

Als x de leeftijd (in jaren) is en y de kans (in procent) op een ziekenhuisopname bij een ongeval, dan geldt: ​y ≈​    . GeoGebra

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

161


6.1.3 Lineaire regressie In § 6.1.1 lagen alle punten perfect op de regressierechte. Bij een statistische dataset is dat echter niet altijd zo. In dat geval bepaal je de trendlijn die zo goed mogelijk bij de data past.

Covariantie

IN

Een puntenwolk is een grafische voorstelling van puntenkoppels (x, y). Daarbij is x de onafhankelijke veranderlijke en y de afhankelijke veranderlijke.

Als bij een toenemende waarde van x over het algemeen een afnemende waarde van y hoort, dan spreek je van een negatieve covariantie.

N

Als bij een toenemende waarde van x over het algemeen een toenemende waarde van y hoort, dan spreek je van een positieve covariantie.

Lineaire regressie

VA

Bij lineaire regressie zoek je een rechte als trendlijn bij een puntenwolk. Die rechte past zo goed mogelijk bij de puntenkoppels.

sterk verband

©

Het verband tussen y en x noem je sterk als de punten, over het algemeen, vrij dicht bij de regressierechte liggen. Als de punten vrij ver van de regressierechte verwijderd liggen, spreek je van een zwak verband.

GeoGebra

1

2 3 4 5

6

162

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

zwak verband


6.2

Correlatie

6.2.1 De correlatiecoëfficiënt bij lineaire regressie Het woord ‘covariantie’ betekent letterlijk ‘het samen variëren’. Met andere woorden: als de ene veranderlijke verandert, verandert de andere veranderlijke mee. VIDEO

Als je in het woordenboek de betekenis van het woord ‘correlatie’ opzoekt, dan vind je als uitleg: ‘de manier waarop iets samenhangt met iets anders’ (encyclo.nl).

IN

In de statistiek gebruikt men de correlatiecoëfficiënt om de sterkte van die samenhang te bepalen. Er zijn meerdere definities van dit begrip, maar de meest gebruikte is de correlatiecoëfficiënt van Pearson, een Engelse statisticus die leefde van 1857 tot 1936. De formule is nogal complex. Daarom zul je de correlatiecoëfficiënt berekenen met ICT. Berekening van de correlatiecoëfficiënt met Excel

Aan 17 vrouwen werd de lengte x (in cm) en de schoenmaat y gevraagd.

y

176 155 163 153 169 173 152 161 165 163

171

158 168 167 160 165

171

42

39

37

40

36

38

36

40

41

35

38

37

37

N

x (cm)

38

39

36

38

Open het bestand ‘lengte en schoenmaat.xlsx’.

VA

Om de correlatiecoëfficiënt te berekenen gebruik je de functie CORRELATIE(matrix1;matrix2).

Rond de correlatiecoëfficiënt af op 0,01: r =

©

GeoGebra

Betekenis van de waarde van de correlatiecoëfficiënt r<0 r>0 r=0

|​​ r |​ = 1​

0 ​ < ​|r |​ < 1​

negatieve correlatie: een stijging van de onafhankelijke veranderlijke heeft over het algemeen een daling van de afhankelijke veranderlijke tot gevolg positieve correlatie: een stijging van de onafhankelijke veranderlijke heeft over het algemeen een stijging van de afhankelijke veranderlijke tot gevolg geen correlatie perfecte correlatie hoe dichter |​​r |​​bij 1 ligt, hoe sterker de samenhang hoe dichter ​​|r |​​bij 0 ligt, hoe zwakker de samenhang STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

163


B+S

6.2.2 Betekenis van de correlatiecoëfficiënt ​​|r |​ = 0​

​0,7 ⩽ ​|r |​ < 0,85​

r=0

r = 0,80

sterk verband

IN

geen enkel verband

​0 < ​|r |​ < 0,3​

​0,85 ⩽ ​|r |​ < 0,95​

r = 0,2

N

r = –0,90

zeer sterk verband

​0,3 ⩽ ​|r |​ < 0,5​

​0,95 ⩽ |​r |​ < 1​

VA

zeer zwak verband

©

r = –0,4

r = 0,98

zwak verband

uitzonderlijk sterk verband

​0,5 ⩽ ​|r |​ < 0,7​

|​​ r |​ = 1​

r = 0,55

r = –1

1

2 3

matig verband

4 5

6

164

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

perfecte correlatie


6.3

Correlatie en causaliteit

6.3.1 Voorbeeld 1 In een landelijke gemeente is er één kledingzaak en één basisschool. De tabel toont het wekelijkse aantal verkochte paren handschoenen x van de winkel en het aantal afwezige leerlingen y in de school in dezelfde week. Je ziet ook het spreidingsdiagram en de bijhorende regressierechte.

3

5

0

3

1

0

y

10

13

4

9

3

3

3

2

2

8

10

13

9

7

5

6

4

8

6

5

17

14

19

21

12

10

11

7

IN

x

Bereken de correlatiecoëfficiënt.

22

y = 1, 3553x + 3,66

20 18 16

Je kunt hier dus spreken van een zeer sterk positief verband. Toch is het duidelijk dat een toename van het aantal verkochte paren handschoenen niet de oorzaak is van een toename van het aantal afwezige leerlingen (of omgekeerd). Je zegt dat er geen oorzakelijk of causaal verband is tussen y en x.

14 12 10 8 6 4 2 0

0

1

2

N

aantal afwezige leerlingen in dezelfde week

VERBAND TUSSEN AANTAL PAREN HANDSCHOENEN EN AFWEZIGE LEERLINGEN 24

3 5 6 8 9 10 11 12 4 7 aantal paren verkochte handschoenen in één week

13

14

VA

Het is duidelijk dat de (koude) temperatuur de toename van beide veranderlijken x en y veroorzaakt. De temperatuur noem je de verborgen (of confounding) veranderlijke z. x

y

©

z

Besluit

Correlatie betekent dat twee veranderlijken een bepaalde samenhang hebben. Causaliteit betekent dat er een oorzaak-gevolgrelatie is. Correlatie betekent niet noodzakelijk dat er een causaal verband is. Er kan een derde (verborgen) veranderlijke een rol spelen.

GeoGebra

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

165


6.3.2 Voorbeeld 2 Een psycholoog beweert een test ontworpen te hebben die de ‘aanleg tot statistiek’ van studenten kan voorspellen. Om de waarde van de test te controleren neemt hij bij 15 studenten, zonder voorkennis statistiek, de psychologische test af. Vervolgens laat hij hen gedurende 5 uur een stukje van de cursus statistiek instuderen, waarna een test volgt. De punten behaald op de psychologische test zijn de punten T1 en de punten van de statistiektest zijn de punten T2.

A

B

C

D

E

T1 (%)

65

90

75

40

85

T2 (%)

70

75

65

50

85

y = 0, 586 6x + 28, 357

80

H

I

J

K

N

O

55

60

50

45

80

55

35

50

65

75

65

75

55

45

75

65

55

50

60

90

punten T1

60

y = 1, 169x − 13, 873

70 60

N

50

40

40

30

40

50

60 70 punten T1

80

90

100

VA

Bereken de correlatiecoëfficiënt waarbij T1 de onafhankelijke veranderlijke is en T2 de afhankelijke veranderlijke.

30 30

40

50

©

Bij het berekenen van de correlatie tussen twee veranderlijken x en y, stel je alleen vast of er een verband is tussen x en y of tussen y en x. Je krijgt geen antwoord op de vraag of er een causaal verband is en zo ja, welke veranderlijke de oorzaak is en welke veranderlijke het gevolg is.

GeoGebra

1

2 3 4 5

6

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

60 punten T2

70

80

90

Bereken de correlatiecoëfficiënt waarbij T2 de onafhankelijke veranderlijke is en T1 de afhankelijke veranderlijke.

De correlatiecoëfficiënt is in beide gevallen dezelfde. De invloed van T1 op T2 is dus even groot als de invloed van T2 op T1.

166

M

70

50

Besluit

L

80

70

30

G

100

90

punten T2

F

IN

student


6.3.3 Observationeel en experimenteel onderzoek Mensen die roken hebben een grotere kans op longziektes. Er is een sterke positieve correlatie tussen roken en longziektes en het is duidelijk dat een toename van de veranderlijke ‘roken’ een toename van de veranderlijke ‘kans op longziektes’ veroorzaakt en niet omgekeerd. Het causaal verband tussen roken en de kans op longziektes is men niet te weten gekomen door experimenten uit te voeren, maar door jarenlang observaties uit te voeren.

observationeel onderzoek

IN

Geef twee redenen waarom het onmogelijk is om hier experimenten over op te zetten.

Voorbeelden

Het verband tussen twee veranderlijken wordt onderzocht door vooraf opgestelde experimenten. Daarbij wordt meestal met een testgroep en een controlegroep gewerkt. De testgroep ondergaat een bepaald experiment, de controlegroep niet.

N

Er wordt onderzoek gedaan naar het verband tussen twee veranderlijken, zonder tussenkomst van de onderzoekers. Er worden geen experimenten, zoals in de betekenis van de kansrekening, uitgevoerd.

experimenteel onderzoek

Voorbeelden

• de invloed van de hoeveelheid medicatie op de kans op nevenwerkingen; • het verband tussen het dagelijks aantal uren schermtijd en de schoolprestaties.

Het voorkomen van een verborgen veranderlijke kan niet worden uitgesloten.

Het experiment kan zo worden opgezet dat verborgen veranderlijken uitgesloten zijn.

VA

• de invloed van het drinken van alcohol op de kans op een ongeval; • het verband tussen de lichaamslengte en de schoenmaat.

©

Complottheorieën willen mensen dingen doen geloven die op onwaarheden zijn gebaseerd. De sociale media staan er bol van. Dergelijke theorieën rekenen op de goedgelovigheid van mensen en zijn meestal niet door wetenschappelijke experimenten ondersteund. Enkele voorbeelden: • Men is nooit echt op de maan geweest; alles in Hollywood is in scène gezet en gefilmd. • Coronavaccins kunnen blindheid veroorzaken. • De wereldwijde opwarming bestaat niet en is verzonnen door de Chinese overheid. • De piramides in Egypte zijn gebouwd door buitenaardse wezens.

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

167


Oefeningen REEKS A 1

Welke veranderlijke heeft het sterkste verband met x? x

10

15

20

25

30

35

40

y

13

78

61

103

157

122

196

z

360

341

193

209

93

99

34

u

89

55

78

47

82

28

22

v

96

123

105

138

205

284

243

w

2

19

28

23

30

26

33

IN

ICT

Je ziet telkens twee veranderlijken x en y waartussen een correlatie bestaat. Geef telkens aan of x een oorzaak kan zijn van y (optie 1), y een oorzaak kan zijn van x (optie 2) of als beide opties mogelijk zijn. x: a) y:

‘de mate van ongezond leven’ ‘de kans op een hartaanval’

b) x : y:

‘de punten voor een toets wiskunde’ ‘het aantal uren studeren’

c) x:

‘de verkeersdrukte op de autosnelweg (het aantal auto’s dat per minuut een bepaald punt passeert)’ ‘de gemiddelde snelheid van de auto’s op de autosnelweg’

d) x : y:

‘de temperatuur van het zeewater’ ‘de temperatuur aan het strand’

e) x: y:

‘het aantal klachten over geluidshinder’ ‘de afstand tot de festivalweide’

f) x: y:

‘het aantal toeschouwers voor een filmvoorstelling’ ‘de opbrengst van de toegangstickets’

VA

2

N

©

y:

1

2 3 4 5

6

168

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT


REEKS B 3

Bij de onderstaande beweringen is er telkens een sterke correlatie, maar geen causaal verband. Bepaal telkens een mogelijke verborgen veranderlijke z. a) Als de verkoop van ijsjes stijgt, stijgt ook het aantal mensen met een zonnesteek. b) Het aantal brandweermannen die aanwezig zijn om een brand te blussen, zorgt ervoor dat de schade groter is.

IN

c) Hoe meer pianolessen iemand volgt, hoe slimmer die persoon wordt.

d) Hoe groter de schoenmaat van een kind van de lagere school, hoe beter de leesvaardigheid.

e) Hoe meer gras er wordt gezaaid, hoe minder zwembroeken er worden verkocht.

N

f) Als het aantal dvd-recorders in een huisgezin daalt, stijgt het aantal computers.

Welke soort onderzoek (observationeel of experimenteel) is aangewezen? Leg telkens uit waarom.

VA

4

a) De invloed van de leeftijd op de reactiesnelheid.

b) De invloed van het roken van joints op intellectuele prestaties.

©

c) Het verband tussen goede cijfers op school en het zelfvertrouwen.

d) Het verband tussen de kostprijs van een auto en het aantal verkeersboetes. e) Het verband tussen het eten van chocolade en het krijgen van een migraineaanval. STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

169


B+S

ICT

5

Een kleine steekproef die zocht naar het verband tussen de lichaamslengte y (in cm) van een volwassen zoon en de lichaamslengte x (in cm) van zijn vader, leverde de volgende data op. x (cm)

176

170

167

186

178

175

183

169

172

175

188

175

180

y (cm)

182

177

173

184

178

179

181

176

175

180

186

174

183

a) Bepaal via lineaire regressie het verband tussen y en x. b) Bereken de correlatiecoëfficiënt en geef de betekenis.

IN

c) Schat de lengte van een zoon waarvan de vader 175 cm is. Rond af op 1 cm.

d) Vergelijk die geschatte waarde met de gemeten waarde(n).

N

VA

e) Schat de lengte van een vader waarvan de zoon 190 cm groot is. Rond af op 1 cm.

f) Waarom is dat resultaat verrassend?

©

g) De vader van Ilan is 5 cm groter dan de vader van Millau. Schat hoeveel groter Ilan zal worden dan Millau. Rond af op 0,1 cm.

1

2

3 4 5

6

170

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT


6

Hoe hoger de temperatuur, hoe meer dorst je hebt. In de tabel zie je de gemiddelde dagtemperatuur x (in ºC) en het aantal liter water y dat in een warenhuis op die dag werd verkocht.

B+S

ICT

x (ºC)

12

14

15

17

18

20

21

23

25

27

28

30

31

y (l)

651

713

747

805

829

891

924

980

1 036 1 102

1 136

1 198 1 233

a) Bepaal via lineaire regressie het verband tussen y en x.

IN

b) Schat de verkochte hoeveelheid water als het 32 ºC is. Rond af op 1 l.

c) Geef de betekenis van de richtingscoëfficiënt van het lineaire verband.

N

d) Op een kille dag heeft het warenhuis maar 500 l water verkocht. Hoeveel graden was het die dag? Rond af op 0,1 ºC.

VA

e) Bereken de correlatiecoëfficiënt en geef de betekenis.

In Metro kon je lezen dat er een verband is tussen het aantal Nobelprijswinnaars T h e n e w e ng l a n d j o u r na l o f m e dic i n e in een land en de chocoladeconsumptie. 35

Sweden

Switzerland

30

Nobel Laureates per 10 Million Population

r=0.791 P<0.0001

Denmark

25

Austria

20

a) Geef de sterkte van het verband.

Norway

United Kingdom

©

7

b) Het is duidelijk dat het verband niet causaal is. Geef een mogelijke verwarrende veranderlijke.

15

United States

The Netherlands Belgium Canada

Poland Portugal Greece

Germany

France

10

5

Ireland

Finland Australia

Italy Spain

Japan

0

China

Brazil

0

5

10

15

Chocolate Consumption (kg/yr/capita) Figure 1. Correlation between Countries’ Annual Per Capita Chocolate Consumption and the Number of Nobel Laureates per 10 Million Population.

Bron: nl.metrotime.be Discussion

The principal finding of this study is a surprisingly powerful correlation between chocolate intake per capita and the number of Nobel laureates in various countries. Of course, a correlation between X and Y does not prove causation but indicates that either X influences Y, Y influ-

about 14 Nobel laureates, yet we observe 32. Considering that in this instance the observed number exceeds the expected number by a factor of more than 2, one cannot quite escape the notion that either the Nobel Committee in Stockholm has some inherent patriotic bias I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT when assessing the candidatesSTATISTIEK for these awards or, perhaps, that the Swedes are particularly

171


ICT

8

Op een toets moesten de leerlingen invullen hoeveel minuten ze hadden gestudeerd voor de toets. Ze moesten ook een score van 1 (heel eenvoudig) tot 5 (heel moeilijk) geven over de moeilijkheidsgraad van de toets. In de tabel is x het aantal minuten studie, y de moeilijkheidsgraad en z de punten op 20 voor de toets. x (min)

30

90

20

110

40

70

50

60

50

80 100 60

60

70

50

30

90

y (op 5)

5

1

5

1

5

3

3

4

4

2

1

3

3

2

4

4

2

z (op 20)

8

17

6

18

9

15

14

9

12

16

19

12

13

15

11

10

16

IN

B+S

REEKS C

a) Bepaal via lineaire regressie het verband tussen • z en x: • y en x: • z en y:

N

b) Noa heeft drie kwartier gestudeerd voor de toets. Schat hoeveel punten ze zal behalen.

VA

c) Lars gaf een score 2 voor de moeilijkheidsgraad van de toets. Schat hoeveel minuten hij heeft gestudeerd. Rond af op 1 min.

e) Geef de betekenis van de richtingscoëfficiënt van het lineaire verband tussen z en y.

©

f) Tussen welke veranderlijken is het verband het sterkst?

1

2 3

g) Kun je spreken van een zuiver causaal verband tussen de veranderlijken of kan er ook een verwarrende variabele meespelen?

4 5

6

172

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT


STUDIEWIJZER Correlatie en causaliteit voor de leerling

6.1 Spreidingsdiagrammen en trendlijnen KENNEN

voor de leerkracht

–  + –  +

Een puntenwolk is een grafische voorstelling van puntenkoppels (x, y). Daarbij is x de onafhankelijke veranderlijke en y de afhankelijke veranderlijke. Bij lineaire regressie zoek je een rechte als trendlijn bij een puntenwolk. Die rechte past zo goed mogelijk bij de puntenkoppels.

De best passende trendlijn bepalen met ICT.

6.2 Correlatie

–  + –  +

IN

KUNNEN

KENNEN

–  + –  +

De correlatiecoëfficiënt geeft de sterkte weer van het verband dat bij een lineaire regressie hoort.

KUNNEN

–  + –  +

N

De correlatiecoëfficiënt berekenen met ICT en daarmee de sterkte van een lineair verband weergeven.

6.3 Correlatie en causaliteit

KENNEN

–  + –  +

VA

Correlatie betekent dat twee veranderlijken op een ordelijke manier een bepaalde samenhang hebben. Causaliteit betekent dat er een oorzaak-gevolgrelatie is. Correlatie betekent niet noodzakelijk dat er een causaal verband is. Er kan een derde (verborgen) veranderlijke een rol spelen.

Bij het berekenen van de correlatie tussen twee veranderlijken x en y, stel je alleen vast of er een verband is tussen x en y of tussen y en x. Je krijgt geen antwoord op de vraag welke veranderlijke oorzaak is en welke veranderlijke gevolg is.

KUNNEN

–  + –  +

©

Bepalen of er, naast een correlatie, ook een causaal verband bestaat en de eventuele verborgen veranderlijke benoemen. In eenvoudige gevallen bepalen wat de onafhankelijke veranderlijke is en wat de afhankelijke veranderlijke is. Het verschil inzien tussen observationeel onderzoek en experimenteel onderzoek.

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

173


Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?

❑ filter

❑ schets

❑ patroon

❑ schema/tabel

❑ kennis

❑ vereenvoudig

❑ logisch nadenken

❑ gok verstandig

❑ ...

IN

❑ concreet materiaal

1. Van welk natuurlijk getal n is het kwadraat gelijk aan 997 ? 998 ? 999 ? 1 001 ? 1 002 ? 1 003 + 36? (Je mag geen rekenmachine gebruiken.)

N

JWO, editie 2022-2023, finale

VA

2. Een muis legt nevenstaande weg af over een vloer met vierkante tegels van 10 cm bij 10 cm om bij een blokje kaas te komen. Daarna keert ze langs dezelfde weg terug. De gebogen stukken van de weg zijn opgebouwd uit kwartcirkels. Hoeveel centimeter heeft de muis gelopen? A) 40p + 80

B) 50p + 80

D) 40p + 160

E) 50p + 160

C) 25p + 160

©

VWO, editie 2021-2022, eerste ronde

3. Moederdag valt elk jaar op de tweede zondag van mei. Wat is de laatste dag in mei waarop Moederdag kan vallen? A) 7 mei

1

B) 10 mei

JWO, editie 2021-2022, eerste ronde

2 3 4 5

6

174

STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT

C) 13 mei

D) 14 mei

E) 17 mei


VA

© N IN


VA

© N IN


Articles inside

Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.