WEBVTT 00:00:00.000 --> 00:00:03.280 In de laatste videos hebben we uitgezocht wat de totale variatie is 00:00:03.280 --> 00:00:06.400 in deze 9 data punten, 00:00:06.400 --> 00:00:10.774 en dat was 30, onze totale kwadratensom. Toen vroegen we ons af, 00:00:10.774 --> 00:00:15.968 hoeveel van deze variatie komt door variatie binnen groepen, versus variatie 00:00:15.968 --> 00:00:18.798 tussen de groepen zelf? 00:00:18.828 --> 00:00:26.045 Voor de variatie binnen groepen hadden we de kwadratensom binnen groepen, dat was 6. 00:00:26.045 --> 00:00:31.493 En de balans hiervan, 30, de balans van deze variatie, 00:00:31.493 --> 00:00:33.943 kwam van de variatie tussen groepen, die hebben we uitgerekend. 00:00:33.943 --> 00:00:38.523 Daaruit kwam 24. 00:00:38.523 --> 00:00:45.903 Wat ik in deze video wil doen, is dit type informatie gebruiken om 00:00:45.903 --> 00:00:53.977 inferenties af te leiden, waarmee we mogelijk een conclusie kunnen trekken. 00:00:53.977 --> 00:00:56.660 Wat ik ga doen is deze groepen in een context plaatsen. 00:00:56.660 --> 00:00:59.247 We hebben deze groepen nu als abstract behandeld, maar je kan bedenken dat 00:00:59.247 --> 00:01:02.550 deze het resultaat zijn van een experiment 00:01:02.550 --> 00:01:11.935 Stel dat ik 3 typen pillen, of 3 typen voedsel, aan mensen geef die een toets maken 00:01:11.935 --> 00:01:13.790 En dat zijn hun scores op die toets. 00:01:13.790 --> 00:01:26.467 Dit is voedsel type 1, type 2, en dat is voedsel 3. 00:01:26.467 --> 00:01:33.313 En nu wil ik weten: beïnvloed het type voedsel dat mensen eten hun testscore? 00:01:33.313 --> 00:01:39.777 Als je naar de gemiddeldes kijkt dan lijkt het alsof groep 3 beter is dan groep 1 &2 00:01:39.777 --> 00:01:44.353 Maar komt dit verschil door toeval? 00:01:44.353 --> 00:01:50.053 Of ben ik zeker dat er daadwerkelijk een verschil zit 00:01:50.053 --> 00:01:56.480 in de populatie gemiddeldes van alle mensen die ooit voedsel 3, 2 of 1 nemen? 00:01:59.250 --> 00:02:04.007 De vraag is hier, verschillen de populatie gemiddeldes met de steekproefgemiddeldes? 00:02:04.007 --> 00:02:07.918 Dit steekproefgemiddelde bestaat uit 3 metingen. 00:02:07.918 --> 00:02:10.489 Maar als ik dat de ware populatie gemiddelden wist 00:02:10.489 --> 00:02:14.235 Mijn vraag is: is het populatiegemiddelde van mensen die voedsel type 1 eten gelijk 00:02:14.235 --> 00:02:17.111 aan dat van mensen die voedsel type 2 eten? 00:02:17.111 --> 00:02:22.557 Natuurlijk kan ik dit voedsel niet aan alle mensen geven en ze daarna 00:02:22.557 --> 00:02:25.543 te dwingen om die toets te maken. 00:02:25.543 --> 00:02:28.533 Maar er is wél een ware gemiddelde, we kunnen het alleen niet observeren. 00:02:28.533 --> 00:02:35.460 Dus mijn vraag is 'dit' gelijk aan 'dit' gelijk aan het ware populatiegemiddelde 00:02:35.460 --> 00:02:38.570 van groep 3. Zijn deze drie aan elkaar gelijk? 00:02:38.570 --> 00:02:46.927 Als ze niet aan elkaar gelijk zijn, dan moet een type voedsel een effect hebben 00:02:46.927 --> 00:02:49.120 op mensen hun testscores. 00:02:49.120 --> 00:02:57.717 Laten we een hypothesetoets uitvoeren. Mijn nulhypothese is dat de gemiddeldes 00:02:57.717 --> 00:03:01.073 aan elkaar gelijk zijn. Type voedsel heeft geen effect. 00:03:01.073 --> 00:03:10.960 Voedsel heeft geen effect. 00:03:10.960 --> 00:03:16.247 Mijn alternatieve hypothese is dat voedsel wél een effect heeft. 00:03:16.247 --> 00:03:19.070 Quantitatief gezien betekent dit, 00:03:19.070 --> 00:03:20.497 dat als er geen verschil is 00:03:20.497 --> 00:03:24.520 de ware populatiegemiddeldes aan elkaar gelijk zijn. 00:03:24.520 --> 00:03:28.380 Het ware populatiegemiddelde van de groep die voedsel 1 had zal gelijk zijn aan die 00:03:28.380 --> 00:03:34.990 van de groep dat voedsel 2 had en aan dat van groep 3. 00:03:34.990 --> 00:03:39.483 Als onze alternatieve hypothese juist is dan zijn deze gemiddelden niet aan elkaar gelijk. 00:03:39.483 --> 00:03:43.550 Hoe kunnen we deze hypothese toetsen? 00:03:43.550 --> 00:03:45.863 We nemen aan dat de nulhypothese waar is, 00:03:45.863 --> 00:03:47.967 dat doen we altijd bij hypothese toetsing. 00:03:52.197 --> 00:03:56.027 En dan berekenen we de kans dat 00:03:56.027 --> 00:03:58.238 we een zekere statistiek krijgen die zo extreem is? 00:03:58.238 --> 00:04:01.119 En ik heb nog niet een gedefinieerd wat deze statistiek is. 00:04:01.119 --> 00:04:04.780 Dus we definieren -- we doen alsof de nul- hypothese waar is en dan 00:04:04.797 --> 00:04:09.157 en nu gebruiken we een statistiek genaamd de F-statistiek. 00:04:09.157 --> 00:04:11.933 Onze F-statistiek 00:04:11.933 --> 00:04:17.040 Deze heeft een F-verdeling, daar gaan we niet diep op in. 00:04:17.040 --> 00:04:21.110 Maar je kan je deze voorstellen als zijnde een ratio van 2 chi kwadraat verdelingen 00:04:21.110 --> 00:04:24.069 Die mogelijk verschillende vrijheidsgraden hebben. 00:04:24.069 --> 00:04:36.278 Onze F-statistiek is de ratio van de kwadratensom tussen de samples. 00:04:36.278 --> 00:04:41.967 Gedeeld door de vrijheidsgraden tussen-- 00:04:41.967 --> 00:04:46.133 Dit wordt de gemiddelde kwadratensom genoemd. 00:04:46.133 --> 00:05:03.173 Dat, gedeeld door de kwadratensom binnen, gedeeld door de vrijheidgraden van de 00:05:03.173 --> 00:05:04.463 kwadraten som binnen. 00:05:04.463 --> 00:05:09.123 Dat was m, m keer (n-1) 00:05:09.123 --> 00:05:11.640 Laten we even nadenken wat dit hier doet. 00:05:11.640 --> 00:05:24.757 Als de teller veel groter is dan de noemer dan geeft dat aan dat de variatie in deze 00:05:24.757 --> 00:05:31.143 data voornamelijk veroorzaakt wordt door verschillen in gemiddelden 00:05:31.143 --> 00:05:35.820 en in mindere mate door de variatie binnen de gemiddelden. 00:05:35.820 --> 00:05:40.867 Dus als de teller groter is dan de noemer. 00:05:40.867 --> 00:05:46.323 Dat geeft aan dat er een verschil is in de ware populatiegemiddelden. 00:05:46.323 --> 00:05:51.296 Als dit getal erg groot is, geeft dat aan dat er een kleinere kans is dat onze 00:05:51.333 --> 00:05:53.430 nulhypothese waar is. 00:05:53.430 --> 00:06:01.753 Als dit getal erg klein is, dan komt variatie binnen elke groep een groter 00:06:01.753 --> 00:06:05.217 onderdeel is van de totale variatie dan de variatie tussen groepen. 00:06:05.217 --> 00:06:12.567 Dat betekent dat variatie binnen groepen een groter % is van de totale variatie dan 00:06:12.573 --> 00:06:14.590 vs de variatie tussen de groepen. 00:06:14.590 --> 00:06:20.550 Dat geeft aan dat, een verschil in groeps- gemiddelden waarschijnlijk toeval is. 00:06:20.550 --> 00:06:24.940 En dat maakt het moeilijker om de nul- hypothese te verwerpen. 00:06:24.940 --> 00:06:27.007 Laten we het voor dit voorbeeld uitrekenen 00:06:27.007 --> 00:06:38.480 in dit geval is onze kwadratensom tussen groepen 24 en we hadden 2 vrijheidsgraden. 00:06:38.480 --> 00:06:52.320 en onze kwadratensom binnen groepen was 6 en onze vrijheidsgraden waren ook 6. 00:06:52.320 --> 00:06:59.957 24/2=12 /1 = 12 00:06:59.957 --> 00:07:11.517 Dus onze F-statistiek is 12. Dit staat voor Fischer, de bedenker. 00:07:11.517 --> 00:07:16.487 Onze F-statistiek is 12. Dit is een vrij hoog getal. 00:07:16.487 --> 00:07:21.517 1 ding ben ik vergeten te zeggen, in elke hypothese toets moet er een significantie 00:07:21.517 --> 00:07:27.453 niveau zijn. Laten we ons signifiacntie niveau op 10% zetten. 00:07:30.393 --> 00:07:35.837 Wat betekent dat als we aannemen dat de nulhypothese waar is dan is er een 00:07:35.837 --> 00:07:40.220 kans van minder dan 10% om deze waarde, deze F-statistiek te vinden dat we hebben. 00:07:40.220 --> 00:07:41.667 Deze F-statistiek 00:07:41.667 --> 00:07:44.550 Dan verwerpen we de nulhypothese 00:07:44.550 --> 00:07:49.057 Dus wat we willen doen is een kritische F-statistiek waarde die -- 00:07:49.057 --> 00:07:53.610 Dat we zo een waarde of extremer vinden met een kans van 10%. 00:07:53.610 --> 00:07:58.923 En als deze groter is dan onze kritische F waarde dan verwerpen we de nulhypothese. 00:07:58.923 --> 00:08:01.563 Als deze kleiner is kunnen we niet de nul- hypothese verwerpen. 00:08:01.563 --> 00:08:06.267 Ik wil niet ingaan op de details van de F-statistiek maar je kan op prijs stellen 00:08:06.267 --> 00:08:10.357 dat elke kwadratensom chi kwadraat verdeeld is. 00:08:10.357 --> 00:08:14.650 Dit heeft een chi kwadraat verdeling endit heeft een andere chi kwadraat verdeling. 00:08:14.650 --> 00:08:17.533 Deze heeft twee vrijheidsgraden 00:08:17.533 --> 00:08:23.423 Deze heeft ongeveer zes vrijheidsgraden. 00:08:23.427 --> 00:08:29.490 De F-verdeling is een ratio van twee chi kwadraat verdelingen. 00:08:29.490 --> 00:08:40.873 en ik heb deze F-tabel, en zo ziet de F verdeling eruit. 00:08:40.873 --> 00:08:46.607 En deze ziet er anders uit bij andere vrijheidsgraden in de teller of noemer. 00:08:46.607 --> 00:08:52.020 Er zijn 2 vrijheidsgraden om over na te denken. 00:08:52.023 --> 00:08:56.933 Met dat in gedachten laten we de kritische F-waarde berekenen. 00:08:56.933 --> 00:09:02.037 De kritische F-waarde voor alpha=0.10 00:09:02.037 --> 00:09:06.563 En je zal verschillende F-tabellen zien Voor verschillende alpha's 00:09:06.563 --> 00:09:11.563 waarbij onze teller vrijheidsgraden 2 zijn en onze noemer vrijheidsgraden 6 zijn. 00:09:11.563 --> 00:09:18.980 Deze hele tabel is voor een alpha van 0.10 00:09:18.980 --> 00:09:24.583 En onze teller vrijheidsgraden is 2 en onze noemer vrijheidsgraden is 6. 00:09:24.583 --> 00:09:30.133 Dus onze kritische F-waarde is 3.46 00:09:39.440 --> 00:09:45.323 De waarde die wij hebben gekregen is veel hoger dan deze en heeft dus een erg kleine 00:09:45.323 --> 00:09:49.627 p-waarde. De kans om zoiets extreems te vinden per toeval aannemend dat de nul- 00:09:49.627 --> 00:09:54.733 hypothese waar is, is erg klein. 00:09:56.423 --> 00:10:04.193 Daarom kunnen we de nulhypothese verwerpen en kunnen we concluderen dat de populatie 00:10:04.193 --> 00:10:10.520 gemiddelden verschillen. Dat geeft aan dat er een verschil is in prestatie op de test 00:10:10.520 --> 00:10:14.000 als je de verschillende voedseltypes toedient.