-
In de laatste videos hebben we uitgezocht
wat de totale variatie is
-
in deze 9 data punten,
-
en dat was 30, onze totale kwadratensom.
Toen vroegen we ons af,
-
hoeveel van deze variatie komt door
variatie binnen groepen, versus variatie
-
tussen de groepen zelf?
-
Voor de variatie binnen groepen hadden we
de kwadratensom binnen groepen, dat was 6.
-
En de balans hiervan, 30, de balans van
deze variatie,
-
kwam van de variatie tussen groepen,
die hebben we uitgerekend.
-
Daaruit kwam 24.
-
Wat ik in deze video wil doen, is
dit type informatie gebruiken om
-
inferenties af te leiden, waarmee we
mogelijk een conclusie kunnen trekken.
-
Wat ik ga doen is deze groepen in een
context plaatsen.
-
We hebben deze groepen nu als abstract
behandeld, maar je kan bedenken dat
-
deze het resultaat zijn van een experiment
-
Stel dat ik 3 typen pillen, of 3 typen
voedsel, aan mensen geef die een toets maken
-
En dat zijn hun scores op die toets.
-
Dit is voedsel type 1, type 2, en dat
is voedsel 3.
-
En nu wil ik weten: beïnvloed het type
voedsel dat mensen eten hun testscore?
-
Als je naar de gemiddeldes kijkt dan lijkt
het alsof groep 3 beter is dan groep 1 &2
-
Maar komt dit verschil door toeval?
-
Of ben ik zeker dat er daadwerkelijk een
verschil zit
-
in de populatie gemiddeldes van alle
mensen die ooit voedsel 3, 2 of 1 nemen?
-
De vraag is hier, verschillen de populatie
gemiddeldes met de steekproefgemiddeldes?
-
Dit steekproefgemiddelde bestaat uit 3
metingen.
-
Maar als ik dat de ware populatie gemiddelden wist
-
Mijn vraag is: is het populatiegemiddelde
van mensen die voedsel type 1 eten gelijk
-
aan dat van mensen die voedsel type 2 eten?
-
Natuurlijk kan ik dit voedsel niet aan alle
mensen geven en ze daarna
-
te dwingen om die toets te maken.
-
Maar er is wél een ware gemiddelde,
we kunnen het alleen niet observeren.
-
Dus mijn vraag is 'dit' gelijk aan 'dit'
gelijk aan het ware populatiegemiddelde
-
van groep 3. Zijn deze drie aan elkaar
gelijk?
-
Als ze niet aan elkaar gelijk zijn, dan
moet een type voedsel een effect hebben
-
op mensen hun testscores.
-
Laten we een hypothesetoets uitvoeren.
Mijn nulhypothese is dat de gemiddeldes
-
aan elkaar gelijk zijn. Type voedsel heeft
geen effect.
-
Voedsel heeft geen effect.
-
Mijn alternatieve hypothese is dat voedsel
wél een effect heeft.
-
Quantitatief gezien betekent dit,
-
dat als er geen verschil is
-
de ware populatiegemiddeldes aan elkaar
gelijk zijn.
-
Het ware populatiegemiddelde van de groep
die voedsel 1 had zal gelijk zijn aan die
-
van de groep dat voedsel 2 had en aan dat
van groep 3.
-
Als onze alternatieve hypothese juist is
dan zijn deze gemiddelden niet aan elkaar gelijk.
-
Hoe kunnen we deze hypothese toetsen?
-
We nemen aan dat de nulhypothese waar is,
-
dat doen we altijd bij hypothese toetsing.
-
En dan berekenen we de kans dat
-
we een zekere statistiek krijgen die
zo extreem is?
-
En ik heb nog niet een gedefinieerd wat
deze statistiek is.
-
Dus we definieren -- we doen alsof de nul-
hypothese waar is en dan
-
en nu gebruiken we een statistiek genaamd
de F-statistiek.
-
Onze F-statistiek
-
Deze heeft een F-verdeling, daar gaan we
niet diep op in.
-
Maar je kan je deze voorstellen als zijnde
een ratio van 2 chi kwadraat verdelingen
-
Die mogelijk verschillende vrijheidsgraden
hebben.
-
Onze F-statistiek is de ratio van de
kwadratensom tussen de samples.
-
Gedeeld door de vrijheidsgraden tussen--
-
Dit wordt de gemiddelde kwadratensom
genoemd.
-
Dat, gedeeld door de kwadratensom binnen,
gedeeld door de vrijheidgraden van de
-
kwadraten som binnen.
-
Dat was m, m keer (n-1)
-
Laten we even nadenken wat dit hier doet.
-
Als de teller veel groter is dan de noemer
dan geeft dat aan dat de variatie in deze
-
data voornamelijk veroorzaakt wordt door
verschillen in gemiddelden
-
en in mindere mate door de variatie binnen
de gemiddelden.
-
Dus als de teller groter is dan de noemer.
-
Dat geeft aan dat er een verschil is in de
ware populatiegemiddelden.
-
Als dit getal erg groot is, geeft dat aan
dat er een kleinere kans is dat onze
-
nulhypothese waar is.
-
Als dit getal erg klein is, dan komt
variatie binnen elke groep een groter
-
onderdeel is van de totale variatie dan de
variatie tussen groepen.
-
Dat betekent dat variatie binnen groepen
een groter % is van de totale variatie dan
-
vs de variatie tussen de groepen.
-
Dat geeft aan dat, een verschil in groeps-
gemiddelden waarschijnlijk toeval is.
-
En dat maakt het moeilijker om de nul-
hypothese te verwerpen.
-
Laten we het voor dit voorbeeld uitrekenen
-
in dit geval is onze kwadratensom tussen
groepen 24 en we hadden 2 vrijheidsgraden.
-
en onze kwadratensom binnen groepen was 6
en onze vrijheidsgraden waren ook 6.
-
24/2=12 /1 = 12
-
Dus onze F-statistiek is 12.
Dit staat voor Fischer, de bedenker.
-
Onze F-statistiek is 12.
Dit is een vrij hoog getal.
-
1 ding ben ik vergeten te zeggen, in elke
hypothese toets moet er een significantie
-
niveau zijn. Laten we ons signifiacntie
niveau op 10% zetten.
-
Wat betekent dat als we aannemen dat
de nulhypothese waar is dan is er een
-
kans van minder dan 10% om deze waarde,
deze F-statistiek te vinden dat we hebben.
-
Deze F-statistiek
-
Dan verwerpen we de nulhypothese
-
Dus wat we willen doen is een kritische
F-statistiek waarde die --
-
Dat we zo een waarde of extremer vinden
met een kans van 10%.
-
En als deze groter is dan onze kritische F
waarde dan verwerpen we de nulhypothese.
-
Als deze kleiner is kunnen we niet de nul-
hypothese verwerpen.
-
Ik wil niet ingaan op de details van de
F-statistiek maar je kan op prijs stellen
-
dat elke kwadratensom chi kwadraat
verdeeld is.
-
Dit heeft een chi kwadraat verdeling endit
heeft een andere chi kwadraat verdeling.
-
Deze heeft twee vrijheidsgraden
-
Deze heeft ongeveer zes vrijheidsgraden.
-
De F-verdeling is een ratio van twee chi
kwadraat verdelingen.
-
en ik heb deze F-tabel, en zo ziet de F
verdeling eruit.
-
En deze ziet er anders uit bij andere
vrijheidsgraden in de teller of noemer.
-
Er zijn 2 vrijheidsgraden om over na te
denken.
-
Met dat in gedachten laten we de kritische
F-waarde berekenen.
-
De kritische F-waarde voor alpha=0.10
-
En je zal verschillende F-tabellen zien
Voor verschillende alpha's
-
waarbij onze teller vrijheidsgraden 2 zijn
en onze noemer vrijheidsgraden 6 zijn.
-
Deze hele tabel is voor een alpha van 0.10
-
En onze teller vrijheidsgraden is 2 en
onze noemer vrijheidsgraden is 6.
-
Dus onze kritische F-waarde is 3.46
-
De waarde die wij hebben gekregen is veel
hoger dan deze en heeft dus een erg kleine
-
p-waarde. De kans om zoiets extreems te
vinden per toeval aannemend dat de nul-
-
hypothese waar is, is erg klein.
-
Daarom kunnen we de nulhypothese verwerpen
en kunnen we concluderen dat de populatie
-
gemiddelden verschillen. Dat geeft aan dat
er een verschil is in prestatie op de test
-
als je de verschillende voedseltypes
toedient.