hoofstuk 3 data en onzekerheid: gegevens verzamelen

hoofstuk 3 data en onzekerheid
3.1 Kansrekenen ( later)
3.2 gegevens verzamelen
3.3 normaal verdeling
1 / 103
volgende
Slide 1: Tekstslide
WiskundeSecundair onderwijs

In deze les zitten 103 slides, met interactieve quizzen, tekstslides en 2 videos.

time-iconLesduur is: 60 min

Onderdelen in deze les

hoofstuk 3 data en onzekerheid
3.1 Kansrekenen ( later)
3.2 gegevens verzamelen
3.3 normaal verdeling

Slide 1 - Tekstslide

gegevens verzamelen
  • voorkennis
  • voorwaarde voor een goede steekproef
  • een trend is geen oorzaak
  • samenvatting

Slide 2 - Tekstslide

voorkennis
Wat is statistiek?

Statistiek helpt ons begrijpen wat er in onze omgeving gebeurt. een voorgevoel hebben =>  maar statistieken leveren de cijfers of harde feiten => bewijzen of weerleggen.
Statistiek is enkelvoud  het  vakgebied.
Statistieken (meervoud) zijn de getallen in een gegevensverzameling.

Slide 3 - Tekstslide

voorkennis
Waar wordt statistiek voor gebruikt?

Statistiek is de wetenschap van het verzamelen, bewerken, interpreteren en presenteren van gegevens.
Overheden, bedrijven, gezondheidszorg of onderwijs kunnen deze gegevens gebruiken om patronen of trends te achterhalen. 

Slide 4 - Tekstslide

Een goed statistisch onderzoek

Slide 5 - Tekstslide

Data verzamelen

Slide 6 - Tekstslide

data verzamelen
 een goede steekproefmethode: zodat de steekproef representatief is voor de populatie. 
de kenmerken van de steekproef vergelijkbaar moeten zijn met die van de gehele populatie.

Slide 7 - Tekstslide

Statistische begrippen en hun symbolen

Slide 8 - Tekstslide

Soorten variabelen
De variabele of veranderlijke is het kenmerk of de eigenschap die je bij elk element van de steekproef onderzoekt.

Een gegeven of waarnemingsgetal is elk cijfer, getal of woord dat als antwoord voor de variabele voorkomt.

Slide 9 - Tekstslide

soorten variabelen

Slide 10 - Tekstslide

test je voorkennis 
oef 1-9

Slide 11 - Tekstslide

3.2.2 Voorwaarden voor een goede steekproef
Je leert...

  1. de redenen kennen waarom het zinvol is om te werken met een steekproef in plaats van met de volledige populatie.
  2. op welke manieren je een representatieve steekproef kan trekken.
  3. in een gegeven situatie herkennen op welke manier een steekproef samengesteld werd.
  4. op welke manieren er vertekening kan optreden.
  5. beoordelen en uitleggen of een steekproef representatief is voor de gegeven populatie.

Slide 12 - Tekstslide

1 Redenen om met een steekproef te werken
Zoals je weet is de populatie de volledige verzameling van dingen of mensen waarvan je iets wil onderzoeken.

In de meeste gevallen is het niet praktisch of onmogelijk om gegevens te verzamelen van de volledige populatie waarin je geïnteresseerd bent. In plaats daarvan verzamel je gegevens voor een aantal elementen uit de populatie.
Dat is de steekproef. Met de resultaten van deze steekproef ga je daarna conclusies trekken over de gehele populatie.

Slide 13 - Tekstslide

De overheid wil onderzoeken hoe tevreden de inwoners van België zijn over de gezondheidszorg.

Wat zou je doen om dit te onderzoeken? Verklaar je antwoord.

Slide 14 - Open vraag

Een directeur op een middelbare school wil de examenresultaten van geschiedenis op het einde van het schooljaar van alle zesde jaars analyseren.
Wat zou je doen om dit te onderzoeken? Verklaar je antwoord.

Slide 15 - Open vraag

Er zijn verschillende redenen om te werken met een steekproef  in plaats van met de volledige populatie:

  1. De omvang van de populatie is te groot om iedereen te ondervragen of om alle elementen te meten.
  2. Snelheid is gewenst, waardoor niet de hele populatie onderzocht kan worden.
  3. Het is te kostbaar om een groot aantal metingen uit te voeren (materiaal, apparatuur, …).
  4. De populatie zou vernietigd worden.

Slide 16 - Tekstslide

2 Een representatieve steekproef trekken... hoe doe je dat?

Het samenstellen van een steekproef is een zeer belangrijke taak voor elke statisticus! De resultaten van de steekproef moeten immers veralgemeend kunnen worden voor de volledige populatie om zo betrouwbare conclusies te kunnen trekken. Als dat het geval is, noem je de steekproef representatief voor de populatie. 

Slide 17 - Tekstslide

Een onderzoeker wil weten hoeveel mensen in België een elektrische auto hebben. Hij stuurt een online enquête naar 5000 willekeurig gekozen personen die een auto bezitten. Wat is de populatie en de steekproef in dit onderzoek?
A
populatie: alle mensen die een auto bezitten steekproef: de 5000 willekeurig gekozen personen
B
populatie: alle mensen die een elektrische auto hebben steekproef: alle mensen die de enquête invullen
C
populatie: alle mensen die een auto bezitten steekproef: alle mensen die een elektrische auto hebben
D
populatie: alle mensen in België steekproef: alle mensen die een auto bezitten

Slide 18 - Quizvraag

Een fruitteler wil weten hoeveel appels in zijn boomgaard rijp zijn. Hij plukt 50 appels uit elke 10e boom en meet het suikergehalte. Wat is de populatie en de steekproef in dit onderzoek?
A
populatie: alle bomen in de boomgaard steekproef: de 10e bomen
B
populatie: alle appels met een bepaald suikergehalte steekproef: de 50 appels
C
populatie: alle appels uit de 10e bomen steekproef: de 50 appels
D
populatie: alle appels in de boomgaard steekproef: de 50 appels uit elke 10e boom.

Slide 19 - Quizvraag

Een school met 500 leerlingen wil weten wat de leerlingen denken over de inrichting van de speelplaats. De directeur ondervraagt daarom 5 leerlingen naar hun mening? Duid de juiste uitspraak aan.
A
De steekproef is niet representatief omdat ook naar de mening van de ouders moet gevraagd worden.
B
De steekproef is niet representatief omdat er te weinig leerlingen worden ondervraagd.
C
De steekproef is niet representatief want er wordt geen onderscheid gemaakt tussen jongens en meisjes. Jongens zouden nochtans een heel andere inrichting kiezen dan meisjes.
D
De steekproef is representatief en zal leiden tot een toffe inrichting van de speelplaats.

Slide 20 - Quizvraag

Een school met 500 leerlingen wil weten wat de leerlingen denken over de inrichting van de speelplaats. De directeur ondervraagt daarom de leerlingen van het eerste leerjaar naar hun mening? Duid aan welke uitspraken waar zijn.
A
Dit is een goede steekproef omdat de leerlingen van het eerste jaar het kleinst zijn en de inrichting dus op hun maat moet gebeuren.
B
De steekproef is niet representatief omdat ook naar de mening van de ouders moet gevraagd worden.
C
Deze steekproef is niet representatief omdat leerlingen uit alle jaren moeten bevraagd worden.
D
De steekproef is niet representatief want er wordt geen onderscheid gemaakt tussen jongens en meisjes. Jongens zouden nochtans een heel andere inrichting kiezen dan meisjes.

Slide 21 - Quizvraag

oefening in Lernova
1 Redenen om met een steekproef te werken
1 & 2

Slide 22 - Tekstslide

Een steekproef is representatief als ze voldoet aan twee basisvoorwaarden:

1 De omvang van de steekproef moet voldoende groot zijn.
Zo zal men bijvoorbeeld voor een populatie van minder dan 1000 elementen doorgaans 30% ervan in het onderzoek moeten betrekken. Hoe groter de populatie, hoe kleiner dat percentage wordt.
2 De steekproef moet betrouwbaar zijn.
Dat betekent dat de steekproef zo goed mogelijk moet weergeven wie er allemaal in de populatie zit.
Daarvoor is de steekproef best aselect. Dit betekent dat elk element in de populatie evenveel kans moet hebben om in de steekproef terecht te komen. Er zijn hiervoor een viertal mogelijkheden.


Slide 23 - Tekstslide

soorten steekproef
1 Enkelvoudig aselecte steekproef
2 Systematische steekproef met aselect begin
3 Gestratificeerde aselecte steekproef
4 Geclusterde aselecte steekproef

Slide 24 - Tekstslide

1 Enkelvoudig aselecte steekproef
  • elk element uit de populatie krijgt een volgnummer
  • er wordt willekeurig het gewenst aantal elementen geselecteerd

Slide 25 - Tekstslide

1 Enkelvoudig aselecte steekproef

Voorbeeld​
Ik wil op onze school van 1200 leerlingen 400 leerlingen selecteren om deel te nemen aan een enquête. Ik neem de genummerde, alfabetische lijst van alle leerlingen en willekeurig laat ik 400 volgnummers genereren. De leerlingen met deze volgnummers zullen deelnemen aan de enquête.


Slide 26 - Tekstslide

2 Systematische steekproef met aselect begin

  • elk element uit de populatie krijgt een volgnummer
  • er wordt willekeurig een volgnummer geselecteerd als eerste element voor de steekproef
  • met regelmatige intervallen worden de volgende elementen geselecteerd



Slide 27 - Tekstslide

2 Systematische steekproef met aselect begin


Voorbeeld
In plaats van 400 volgnummers willekeurig te laten genereren, kies ik willekeurig 1 volgnummer. Vermits ik 1 op 3 leerlingen van de school wil selecteren voor de steekproef (400 van de 1200), zal ik de leerling met dit volgnummer en vervolgens telkens de derde erop volgende leerling in de steekproef opnemen. 


Slide 28 - Tekstslide

3 Gestratificeerde aselecte steekproef

  • de populatie wordt in subpopulaties of strata verdeeld op basis van gemeenschappelijke kenmerken
  • er wordt een willekeurig aantal elementen uit elke subgroep geselecteerd voor de steekproef



Slide 29 - Tekstslide

3 Gestratificeerde aselecte steekproef

Voorbeeld
Ik werk met de verschillende jaren (1ste tot en met 6de) als strata of subgroepen. Uit elk jaar selecteer ik het percentage leerlingen voor de steekproef gelijk aan het totaalpercentage van dat jaar op school. Er zitten bijvoorbeeld 240 leerlingen van de 1200 in het eerste jaar (20%), dus selecteer ik ook voor de steekproef 20% van de leerlingen van het eerste jaar.


Slide 30 - Tekstslide

4 Geclusterde aselecte steekproef
  • de populatie wordt in clusters verdeeld op basis van verschillende kenmerken
  • er wordt vervolgens willekeurig een aantal clusters gekozen en volledig in de steekproef opgenomen

Slide 31 - Tekstslide

4 Geclusterde aselecte steekproef

Voorbeeld
In plaats van de leerlingen in te delen per jaar, verdeel ik ze alfabetisch in 12 groepen van 100 leerlingen. Vermits ik voor de steekproef 400 leerlingen wil selecteren, kies ik nu willekeurig 4 van deze 12 clusters om deel te nemen aan de enquête.   



Slide 32 - Tekstslide

oefeningen
Crowdfunding is een manier van geld inzamelen die steeds vaker gebruikt wordt. Hierbij wordt aan mensen gevraagd om geld te doneren om een project te kunnen verwezenlijken. Kickstarter is een bekend platform dat op deze manier probeert geld in te zamelen voor creatieve doeleinden.

Kickstarter wil een aantal van haar gebruikers selecteren om hen te vragen deel te nemen aan een volgend crowdfundingproject, namelijk een nieuw bordspel. Om deze mensen te selecteren twijfelen de medewerkers tussen verschillende manieren. 

Slide 33 - Tekstslide

De eerste mogelijkheid waarover ze denken is om van de eerste 25 bezoekers van de website van vandaag willekeurig eentje te selecteren. Vervolgens willen ze dan telkens de 25ste persoon die de site erna bezoekt selecteren voor de steekproef.
Welk type aselecte steekproef zou men op deze manier bekomen?
A
Enkelvoudig aselecte steekproef
B
Systematische steekproef met aselect begin
C
Gestratificeerde aselecte steekproef
D
Geclusterde aselecte steekproef

Slide 34 - Quizvraag

Een tweede medewerker stelt echter voor het niet zo ingewikkeld te maken en op het einde van de week gewoon willekeurig het gewenst aantal mensen te selecteren uit degenen die afgelopen week de site bezochten.

Welk type aselecte steekproef zou men op deze manier bekomen?
A
Enkelvoudig aselecte steekproef
B
Systematische steekproef met aselect begin
C
Gestratificeerde aselecte steekproef
D
Geclusterde aselecte steekproef

Slide 35 - Quizvraag

Een derde medewerker komt met het idee om enkel de mensen die op dinsdag, donderdag of zaterdag de website bezochten op te nemen in de steekproef. Dat lijkt hem gemakkelijk en het is volgens hem toch zo dat er elke dag een zeer uiteenlopend publiek de website raadpleegt.
Welk type aselecte steekproef zou men op deze manier bekomen?
A
Enkelvoudig aselecte steekproef
B
Systematische steekproef met aselect begin
C
Gestratificeerde aselecte steekproef
D
Geclusterde aselecte steekproef

Slide 36 - Quizvraag

Volgens een vierde medewerker levert dat niet het gewenste resultaat op, want hij weet dat de mensen afhankelijk van hun leeftijd op verschillende dagen de website bezoeken en dat het aantal bezoekers erg verschilt per dag. Hij stelt daarom voor om in de juiste verhouding een aantal mensen te selecteren per dag.
Welk type aselecte steekproef zou men op deze manier bekomen?
A
Enkelvoudig aselecte steekproef
B
Systematische steekproef met aselect begin
C
Gestratificeerde aselecte steekproef
D
Geclusterde aselecte steekproef

Slide 37 - Quizvraag

oefening in Lernova
2 Een representatieve steekproef trekken... hoe doe je dat?
1 tot 6

Slide 38 - Tekstslide

3 Wat moet je zeker en vast vermijden?

1 Opportunistische steekproef
2 Vrijwillige respons
3 Ondervertegenwoordiging
4 Suggestieve vragen







Slide 39 - Tekstslide

1 Opportunistische steekproef

Je mag het jezelf niet te gemakkelijk en/of te goedkoop maken, door de elementen die eenvoudig te bereiken zijn te betrekken in het onderzoek.







Slide 40 - Tekstslide

1 Opportunistische steekproef
Voorbeeld

Je gaat aan de ingang van de bioscoop staan om te onderzoeken of mensen een bioscoopbezoek leuk vinden. Je zal hier uiteraard geen mensen vinden die absoluut niet naar de bioscoop willen gaan. Je steekproef zal niet representatief zijn en dus zal je ook je resultaat niet kunnen veralgemenen.


Slide 41 - Tekstslide

2 Vrijwillige respons
Je mag mensen niet zelf laten kiezen of ze willen meewerken aan jouw onderzoek.

Slide 42 - Tekstslide

2 Vrijwillige respons
Voorbeeld

Je deelt in de bioscoop flyers uit aan de bezoekers en vraagt om via een QR-code aan te geven hoe tevreden ze waren over hun bioscoopbezoek. Veel mensen zullen de flyer nog voor ze buiten zijn in de prullenbak gooien, maar de enkelingen die ontevreden waren of net heel tevreden zullen misschien wel de moeite doen om hun mening te geven. Je resultaat zal sowieso vertekend zijn.

Slide 43 - Tekstslide

3 Ondervertegenwoordiging
Je moet vermijden dat je de steekproef slechts uit een gedeelte van de populatie trekt en hierdoor bepaalde subgroepen over het hoofd ziet.

Slide 44 - Tekstslide

3 Ondervertegenwoordiging
Voorbeeld

Je wil weten hoe de leerlingen naar school komen: met de bus, de auto, te voet, met de fiets of de brommer. Daarvoor bevraag je alle leerlingen van de eerste graad. Uiteraard zal niemand van hen met de brommer komen, want dat mag pas vanaf 16 jaar. Toch zullen er in de tweede en derde graad misschien wel een aantal leerlingen op deze manier naar school komen. Deze leerlingen werden echter niet vertegenwoordigd in de steekproef.

Slide 45 - Tekstslide

4 Suggestieve vragen
Je mag in je vraag niet al een mogelijk antwoord laat doorschemeren.
Voorbeeld​
Je vraagt aan een goed geselecteerde groep leerlingen van de school of ze "vinden dat de speelplaats saai ingericht is". In deze vraag laat je je eigen mening al doorschemeren: de speelplaats is saai ingericht. Deelnemers zullen hierdoor sneller gaan beamen dat dat inderdaad zo is, terwijl ze er eerder misschien niet eens een uitgesproken mening over hadden of het hen niet eens echt stoorde. Je resultaat zal andermaal vertekend zijn.  

Slide 46 - Tekstslide

opmerkingen
  1. Uit één bepaalde populatie kunnen meerdere, goede, representatieve steekproeven getrokken worden. Deze zullen meestal niet dezelfde elementen bevatten en bijgevolg andere resultaten kunnen opleveren. Het verschil tussen deze resultaten wordt in de statistiek steekproefvariabiliteit genoemd. Je kan bijgevolg nooit met 100% zekerheid besluiten trekken over de populatie, op basis van een getrokken steekproef. In de statistiek worden technieken gebruikt waarmee je toch betrouwbare uitspraken kunt maken over de volledige populatie.

Slide 47 - Tekstslide

opmerkingen

Bij een selecte steekproef maak je gebruik van niet-willekeurige criteria om een deel van de populatie te kiezen.
Een selecte steekproef wordt gebruikt als je niet over voldoende tijd of middelen beschikt om een aselecte steekproef te doen, of als je een specifieke groep wilt onderzoeken. Een nadeel van een selecte steekproef is dat deze niet representatief is voor de hele populatie. Dat betekent dat je geen algemene conclusies kunt trekken op basis van je steekproef. Je kunt alleen uitspraken doen over de personen die je hebt onderzocht. Een selecte steekproef kan ook leiden tot vertekening of bias, omdat je bewust of onbewust personen kiest die jouw verwachtingen bevestigen of die niet typisch zijn voor de populatie.

Slide 48 - Tekstslide

Nadat ik een paar nachten in een hotel verbleef, kreeg ik van Booking.com een mail om te vragen of ik eventueel een recensie wilde achterlaten op de website.
Waardoor zal er een vertekend beeld ontstaan bij de recensies die op de website verschijnen?
A
Er is sprake van een opportunistische steekproef.
B
Er wordt een suggestieve vraag gesteld.
C
Er is sprake van vrijwillige respons.
D
Er is sprake van ondervertegenwoordiging.

Slide 49 - Quizvraag

Het natuurhulpcentrum organiseert elk jaar een opendeurdag. Tijdens de rondleidingen wordt telkens gevraagd aan de bezoekers hoe ze denken over hoe de opkomst van de wolf in ons land aangepakt wordt.

Waardoor zal er een vertekend beeld ontstaan bij de antwoorden die het Natuurhulpcentrum zo verzamelt?
A
Er is sprake van een opportunistische steekproef.
B
Er wordt een suggestieve vraag gesteld.
C
Er is sprake van vrijwillige respons.
D
Er is sprake van ondervertegenwoordiging.

Slide 50 - Quizvraag

Sam wil op zijn school een onderzoek doen rond de bescherming van privacy en veiligheid van persoonsgegevens (GDPR). Hij selecteert daarom willekeurig 350 leerlingen uit degenen die de instagram-pagina van de school volgen en nodigt hen uit om zijn enquête erover te komen invullen. De geselecteerde leerlingen zien dat wel zitten, vermits ze dan niet naar de les hoeven te gaan en komen allemaal. Waardoor zal er een vertekend beeld ontstaan bij de antwoorden die hij zo verzamelt?
A
Er is sprake van een opportunistische steekproef.
B
Er wordt een suggestieve vraag gesteld.
C
Er is sprake van vrijwillige respons.
D
Er is sprake van ondervertegenwoordiging.

Slide 51 - Quizvraag

Tijdens het BK wielrennen bij de vrouwen wordt aan willekeurige bezoekers van verschillend geslacht en leeftijd gevraagd of ze ook vinden dat Lotte Kopecky een absolute toprenster is.
Waardoor zal er een vertekend beeld ontstaan bij de antwoorden die zo verzameld worden?
A
Er is sprake van een opportunistische steekproef.
B
Er wordt een suggestieve vraag gesteld.
C
Er is sprake van vrijwillige respons.
D
Er is sprake van ondervertegenwoordiging.

Slide 52 - Quizvraag

4 Kritische noot

Denk je dat in praktijk de meeste steekproeven betrouwbaar zijn? Heb je misschien zelf ervaring met onderzoeken waaraan je gevraagd werd deel te nemen? Hoe werd je gecontacteerd of geselecteerd?
Probeer (eventueel samen met je klasgenoten) tot een aantal voorbeelden te komen van onderzoeken die representatief verlopen en andere waarvan je kan zeggen dat ze niet erg betrouwbaar zullen zijn! 

Slide 53 - Tekstslide

3 Wat moet je zeker en vast vermijden?

lernova oefeningen 1-3 

Slide 54 - Tekstslide

3.2.3 Een trend is geen oorzaak
Je leert...

  • de betekenis van het begrip correlatie uitleggen.
  • bij voorbeelden nagaan of er mogelijk sprake kan zijn van correlatie.
  • het verschil tussen positieve en negatieve correlatie kennen.
  • bij voorbeelden bepalen of er sprake is van een positieve of negatieve correlatie.
  • wat het begrip 'causaliteit' betekent.
  • dat correlatie niet noodzakelijk causaliteit betekent, maar er andersom bij causaliteit wel altijd correlatie is.
  • wat de voornaamste redenen zijn van het verkeerd interpreteren van een correlatie.

Slide 55 - Tekstslide

3.2.3 Een trend is geen oorzaak
1 Het begrip correlatie
2 Richting van de correlatie
3 Correlatie versus causaliteit
4 Actualiteit

Slide 56 - Tekstslide

1 Het begrip correlatie
tot nu toe één variabele per keer binnen statistiek
een frequentietabel opstellen en de gegevens voorstellen met behulp van grafische voorstellingen

Slide 57 - Tekstslide

Slide 58 - Tekstslide

a) Over welke twee variabelen spreekt men in de vetgedrukte inleiding?
A
Immense klimaatrampen
B
Hoeveelheid koolstofdioxide
C
Gigantische ontploffingen van supervulkanen
D
Zwaarte klimaatcrisis

Slide 59 - Quizvraag

De zwaarte van de klimaatcrisis wordt in dit voorbeeld gebaseerd op de gemiddelde temperatuurstijging. Welk soort variabele is de gemiddelde temperatuursstijging?
A
Ordinaal
B
Continu
C
Discreet
D
Nominaal

Slide 60 - Quizvraag

In de tekst wordt het woord 'correleert' gebruikt (onderlijnd). Waarschijnlijk ken je dit begrip nog niet. Lees goed de context. Welk synoniem komt er volgens jou het best mee overeen?
A
verandert
B
daalt
C
samenhangt
D
stijgt

Slide 61 - Quizvraag

correlatie
Een samenhang of verband tussen twee variabelen wordt in de statistiek correlatie genoemd: als de ene variabele verandert, zal de andere ook veranderen. 

vb: Is het zelfbeeld van tieners afhankelijk van de hoeveelheid sport die ze doen?  

Slide 62 - Tekstslide

Mogelijke correlatie
Geen correlatie
Het IQ en de schoolresultaten van de Vlaamse jeugd
het aantal uren dat iemand als jobstudent werkt en de prijs van hun smartphone
lengte en kledingmaat van kinderen
het aantal tassen koffie dat er gedronken wordt en het aantal echtscheidingen
het aantal volgers op Instagram en het aantal uren iemand sport
Het welbevinden van de Belgische bevolking en het aantal coronapatiënten op de IC

Slide 63 - Sleepvraag

Richting van de correlatie
Men spreekt over positieve correlatie als een stijging van de ene variabele ook een stijging van de andere variabele betekent.

Bij een negatieve correlatie zal een stijging van de ene variabele samenhangen met een daling van de andere variabele.

Slide 64 - Tekstslide

Als de lengte van een kind toeneemt, stijgt /daalt zijn/haar kledingmaat.
A
stijgt
B
daalt

Slide 65 - Quizvraag

Hoe hoger het IQ van een Vlaamse jongere, hoe slechter / beter over het algemeen zijn/haar schoolresultaten zullen zijn.
A
slechter
B
beter

Slide 66 - Quizvraag

Als het aantal Coronapatiënten op de IC stijgt, stijgt / daalt het welbevinden van de Belgische bevolking.
A
stijgt
B
daalt

Slide 67 - Quizvraag

Positieve correlatie:
  • Lengte en kledingmaat van kinderen (0-12jr).
  • Het IQ en de schoolresultaten van de Vlaamse jeugd.
Negatieve correlatie:
  • ​Het welbevinden van de Belgische bevolking en het aantal coronapatiënten op de IC.

Slide 68 - Tekstslide

Als de lengte van een kind toeneemt, stijgt zijn/haar kledingmaat.
A
De verandering in lengte is een oorzaak van de verandering in kledingmaat.
B
De verandering in lengte is geen oorzaak van de verandering in kledingmaat.

Slide 69 - Quizvraag

Als het IQ van een Vlaamse jongere hoger is, zijn over het algemeen zijn/haar schoolresultaten beter.
A
Een ander IQ is een oorzaak van andere schoolresultaten.
B
Een ander IQ is geen oorzaak van andere schoolresultaten.

Slide 70 - Quizvraag

Als het aantal coronapatiënten op de IC stijgt, daalt het welbevinden van de Belgische bevolking.
A
Een verandering in het aantal patiënten is een oorzaak van veranderingen in het welbevinden.
B
Een verandering in het aantal patiënten is geen oorzaak van veranderingen in het welbevinden.

Slide 71 - Quizvraag

Causaliteit

Soms is een verandering van de ene variabele ook effectief een oorzaak van de verandering van de andere variabele. Men spreekt dan van causaliteit. Er is dus een oorzaak-gevolgrelatie tussen de variabelen: de toename van de lengte van een kind veroorzaakt een toename van de kledingmaat.

Slide 72 - Tekstslide

Causaliteit
Dit is echter lang niet altijd het geval, zoals je in het laatste voorbeeld merkt. Het feit dat er meer coronapatiënten zijn op de IC is niet de oorzaak van de daling van het welbevinden van de Belgische bevolking, hoewel er wel een samenhang is. 

Slide 73 - Tekstslide

Correlatie of samenhang: wanneer er een statistisch verband is tussen twee variabelen, maar er is geen directe oorzaak-gevolgrelatie.

Causaliteit: de variabelen zijn gecorreleerd én een verandering van de ene variabele veroorzaakt een verandering van de andere.
Correlatie betekent dus niet altijd causaliteit, maar bij causaliteit is er wel steeds sprake van correlatie!

Slide 74 - Tekstslide

Slide 75 - Video

Er is een correlatie tussen de verkoop van ijsjes en het gebruik van zonnecrème.


b) Mensen smeren meer zonnecrèmeomdat ze meer ijsjes eten.
Juist / Fout


Juist / Fout
A
juist
B
fout

Slide 76 - Quizvraag

Mensen gaan meer ijsjes eten omdat ze meer zonnecrème op zich smeren.
A
juist
B
fout

Slide 77 - Quizvraag

Mensen smeren meer zonnecrème omdat ze meer ijsjes eten.

A
juist
B
fout

Slide 78 - Quizvraag

Het klopt wel dat er meer ijsjes worden gegeten als er veel zonnecrème wordt gesmeerd, maar de ijsjes zijn niet de oorzaak van het meer smeren van zonnecrème. 
Er is geen oorzaak-gevolgrelatie tussen deze variabelen. Je zegt daarom dat er geen causaal verband is tussen het aantal ijsjes dat er gegeten wordt en het gebruik van zonnecrème.

Slide 79 - Tekstslide

Hoe zou je kunnen verklaren dat als er meer ijsjes worden gegeten er ook meer zonnecrème gesmeerd wordt?

A
zonnecrème is plakkerig en daarom willen mensen zich verfrissen
B
omwille van de temperatuur, de zon schijnt en 't is lekker warm
C
de geur van zonnecrème geeft je meer zin in ijsjes

Slide 80 - Quizvraag

Samengevat: vul de zinnen aan door de juiste vetgedrukte woorden te selecteren.

Mooi zomerweer veroorzaakt wel / niet een hogere ijsjesverkoop. Ook zal het aantal mensen met zonnebrand er doordalen / stijgen . Hierdoor zal er een negatieve / positieve correlatie bestaan tussen de ijsjesverkoop en het aantal mensen met zonnebrand. Deze correlatie is wel / geen causaliteit, vermits de hogere ijsjesverkoop wel / niet de oorzaak is van de zonnebrand. Er is hier sprake van een derde variabele, namelijk de ijsjesverkoop / temperatuur / het aantal mensen met zonnebrand .


Slide 81 - Tekstslide

Slide 82 - Tekstslide

Je noemt in dit voorbeeld de temperatuur de derde variabele. Deze derde variabele beïnvloedt beide variabelen in het onderzoek waardoor er een causale relatie lijkt te bestaan die er niet is. Er is dus wel een correlatie tussen deze twee variabelen zelf, maar er is daarom nog geen oorzakelijk verband.

Slide 83 - Tekstslide

Een eerste reden waardoor er een causaliteit lijkt te zijn die er eigenlijk niet is, is dat er vaak een derde variabele in het spel is. Deze derde variabele beïnvloedt beide variabelen, waardoor er een causale relatie lijkt te bestaan die er niet is. Er is dus wel een verband tussen de twee variabelen zelf, maar dat is daarom nog geen oorzakelijk verband.

Slide 84 - Tekstslide

Er zijn steeds meer overstromingen in België.
Er zijn ook steeds minder vlinders in België.
Je zou dus kunnen besluiten dat er steeds minder vlinders zijn omdat er meer overstromingen zijn.
De klimaatopwarming veroorzaakt steeds meer overstromingen in België.
De klimaatopwarming zorgt er ook voor dat er steeds minder vlinders zijn in België.
Er zal daardoor een correlatie op te merken zijn tussen het aantal vlinders en het aantal overstromingen .
Toch kan je hieruit niet besluiten dat de overstromingen de oorzaak zijn van de kleinere populatie vlinders.


Slide 85 - Tekstslide

Mensen die in hun verleden gepest zijn, blijken vaak een laag zelfbeeld te hebben. Is er hier sowieso sprake van causaliteit?
A
nee
B
ja

Slide 86 - Quizvraag

Zouden pesterijen de oorzaak kunnen zijn van een laag zelfbeeld?
A
ja
B
nee

Slide 87 - Quizvraag

Zouden mensen met een laag zelfbeeld vaker slachtoffer kunnen worden van pesterijen?
A
ja
B
nee

Slide 88 - Quizvraag

Zou er dan ook sprake kunnen zijn van causaliteit tussen een laag zelfbeeld en pesterijen?
A
ja
B
nee

Slide 89 - Quizvraag

Een tweede reden waardoor een correlatie ten onrechte geïnterpreteerd zou kunnen worden als causaliteit, is een 'de kip of het ei'-verhaal. Het is niet altijd duidelijk welke variabele de oorzaak is en welke het gevolg. Men spreekt daarom van de richting van de causaliteit.

Slide 90 - Tekstslide

Er bestaat een correlatie tussen slapeloosheid en depressie. Het is mogelijk dat slapeloosheid een depressie veroorzaakt. Het kan echter ook zijn dat door een depressie slapeloosheid ontstaat. In welke richting is er hier dan sprake van causaliteit?

Slide 91 - Tekstslide

De twee belangrijkste redenen waardoor een correlatie onterecht geïnterpreteerd wordt als een causaliteit zijn:

een derde variabele: deze beïnvloedt de twee variabelen in het onderzoek elk op hun beurt, waardoor zij onderling zullen correleren maar er geen rechtstreeks oorzakelijk verband tussen is.
de richting van de causaliteit: er wordt verondersteld dat variabele A de oorzaak is van variabele B, terwijl het eigenlijk andersom blijkt te zijn.

Slide 92 - Tekstslide

Slide 93 - Video

Hoe kan je een onderscheid maken tussen correlaties en causale relaties?

Om een onderscheid te kunnen maken tussen correlaties en causale relaties moet je gebruik maken van het juiste type onderzoek. 
Correlationeel of observationeel onderzoek kan alleen correlaties tussen variabelen vaststellen, terwijl experimentele onderzoeken gebruikt worden om causaliteit te onderzoeken.

Slide 94 - Tekstslide

Correlationeel of observationeel onderzoek
In een louter correlationeel onderzoek zal je enkel gegevens van de twee variabelen verzamelen en nagaan of er sprake is van samenhang. Je zal hierbij de variabelen niet manipuleren om de invloed ervan na te gaan, omdat dit te duur is of ethisch niet verantwoord. Je kunt hiermee geen causaliteit (oorzaak-gevolgrelatie) vaststellen, maar wel de sterkte en richting van de correlatie. 

Slide 95 - Tekstslide

Je wil weten of er een samenhang is tussen het aantal uren dat iemand sport en het mentale welbevinden. Je selecteert daarom een representatieve steekproef en vraagt elke deelnemer hoeveel uren hij sport per week. Vervolgens neem je een gestandaardiseerde test rond mentaal welzijn af bij de deelnemers. Je ontdekt dat mensen die meer sporten zich over het algemeen beter in hun vel voelen. Er is correlatie tussen deze twee variabelen.

Slide 96 - Tekstslide

Experimenteel onderzoek

​Wil je echter op zoek gaan naar causaliteit, dan zal hiervoor experimenteel onderzoek nodig zijn. Je bepaalt in welke richting je een oorzakelijk verband wil nagaan, geeft de vermoedelijke onafhankelijke variabele verschillende waarden en meet de invloed ervan op de afhankelijke. De invloed van eventuele andere variabelen moet hierbij zo goed mogelijk uitgesloten worden door bijvoorbeeld te werken met controlegroepen. 

Slide 97 - Tekstslide

Omdat je verwacht dat het aantal uren sport per week het mentaal welbevinden beïnvloedt, laat je de deelnemers van de onderzoeksgroep in verschillende weken meer of minder sporten en ga je telkens met dezelfde test hun welbevinden na om eventuele veranderingen daarin vast te stellen. Door te vergelijken met de deelnemers van een controlegroep die je gevraagd hebt telkens evenveel te blijven sporten, zou je kunnen nagaan of er inderdaad een oorzakelijk verband is tussen het aantal uren sport per week en het mentale welbevinden.   

Slide 98 - Tekstslide

Afhankelijk van wat je wil beogen en wat er praktisch mogelijk is, bestaan er twee types onderzoek:

  • in een correlationeel of observationeel onderzoek meet je de variabelen zonder ze te manipuleren. Je kunt dan nagaan of ze een samenhang vertonen (allebei toenemen, allebei afnemen of de een neemt toe en de ander neemt af). Je kunt niet vaststellen of een verandering van de ene variabele, een verandering in de andere variabele veroorzaakt. Je kunt hiermee dus geen causaal verband aantonen.
  • in een experimenteel onderzoek manipuleer je een van de variabelen (dit is de onafhankelijke variabele) en meet je de invloed op de andere variabele (dit is de afhankelijke variabele). Op deze manier kan eventuele causaliteit vastgesteld worden.


Slide 99 - Tekstslide

Je onderzoekt de relatie tussen de hoeveelheid koffie die iemand drinkt en zijn/haar hartslag. De onafhankelijke variabele is het drinken van koffie en de afhankelijke variabele is de hartslag. Door de hoeveelheid koffie die iemand drinkt te manipuleren en vervolgens de hartslag te meten, kan je onderzoeken of er een causaal verband bestaat tussen deze twee variabelen. Wat voor soort onderzoek is dit?
A
experimenteel onderzoek
B
correlationeel onderzoek

Slide 100 - Quizvraag

Je onderzoekt de relatie tussen het aantal uren dat iemand tv kijkt en zijn/haar slaapkwaliteit. Je neemt hiervoor enquêtes en interviews af bij studenten, werknemers en gepensioneerden. Wat voor soort onderzoek is dit?
A
experimenteel onderzoek
B
correlationeel onderzoek

Slide 101 - Quizvraag

Via een onderzoek wil je de effectiviteit van een nieuw medicijn testen. Je geeft daarvoor aan een groep patiënten het nieuwe medicijn geven en een andere groep een placebo. Vervolgens meet je de gezondheid van de patiënten. Wat voor soort onderzoek is dit?
A
experimenteel onderzoek
B
correlationeel onderzoek

Slide 102 - Quizvraag

extra oefening artikel
daarna oefeningen een trend is geen oorzaak

Slide 103 - Tekstslide