WEBVTT 00:00:00.640 --> 00:00:03.050 Ik wil in deze video er voor zorgen dat we 00:00:03.050 --> 00:00:05.390 intuitief en ook anders het verschil begrijpen 00:00:12.616 --> 00:00:13.905 tussen een Z-toets --iets dat ik maar moeilijk 00:00:13.905 --> 00:00:19.850 uit kan spreken--- en een T-toets 00:00:19.850 --> 00:00:24.338 Een hoop van wat we doen in dit soort 00:00:24.338 --> 00:00:26.264 statistiek, is er achter proberen te komen wat 00:00:26.264 --> 00:00:28.610 de kans is op een bepaald steekproefgemiddelde. 00:00:28.610 --> 00:00:30.373 Dus wat we aan het doen zijn, in het bijzonder bij een 00:00:32.315 --> 00:00:35.502 grote steekproef --Wacht, ik teken even een steekproeven- 00:00:35.540 --> 00:00:38.480 Dus dit is de 00:00:38.480 --> 00:00:40.040 steekproeven verdeling, 00:00:44.237 --> 00:00:48.090 Je neemt een bepaald steekproeven-gemiddelde en standaarddeviatie aan. 00:00:48.090 --> 00:00:52.920 En wat wij gaan doen is dat een verkregen resultaat, laten we zeggen 00:00:52.920 --> 00:00:55.460 dat we dit steekproefgemiddelde krijgen. 00:00:55.460 --> 00:00:57.350 We willen uitvinden wat de kans is dat we 00:00:57.350 --> 00:00:59.700 een resultaat krijgen dat minstens zo extreem is als deze. 00:00:59.700 --> 00:01:03.170 Dat kan je doen door de kans te vinden van een 00:01:03.170 --> 00:01:05.614 resultaat onder dit gemiddelde en dat van 1 aftrekken, of 00:01:05.614 --> 00:01:08.470 gewoon dit gebiedje hier berekenen. 00:01:08.470 --> 00:01:11.720 En om dat te doen, kijken we hoeveel standaard 00:01:11.720 --> 00:01:15.120 deviaties we boven het steekproeven-gemiddelde zitten. 00:01:15.120 --> 00:01:20.010 En hoe we dat doen is dat we ons steekproefgemiddelde nemen, en we 00:01:20.010 --> 00:01:26.200 trekken daar het steekproeven-gemiddelde van af 00:01:26.200 --> 00:01:28.350 (of wat we aannemen dat het steekproeven-gemiddelde is, misschien weten we 00:01:28.350 --> 00:01:31.890 dat wel niet) 00:01:31.890 --> 00:01:36.447 En dat delen we door de standaarddeviate van de 00:01:36.447 --> 00:01:38.956 steekproevenverdeling. 00:01:42.783 --> 00:01:44.700 En dit is hoeveel standaarddeviaties ons steekproefgemiddelde 00:01:44.700 --> 00:01:46.100 boven het steekproeven-gemiddelde zit. 00:01:46.100 --> 00:01:48.860 Dat is deze afstand hier. 00:01:48.860 --> 00:01:52.420 Gewoonlijk weten we ook niet wat dit hier is is. 00:01:52.420 --> 00:01:54.840 Normaal weet je dat ook niet. 00:01:54.840 --> 00:02:01.020 En de centrale limiet stelling vertelt ons dat, aangenomen 00:02:01.020 --> 00:02:04.650 dat onze steekproef groot genoeg is, dat dit ding hier, dit 00:02:04.650 --> 00:02:10.913 is hetzelfde als -- onze steekproef is 00:02:10.913 --> 00:02:16.257 hetzelfde als de standaard deviatie van 00:02:16.257 --> 00:02:19.231 de populatie, gedeeld door de wortel van 00:02:19.231 --> 00:02:24.930 Dus dit deel van de formule hier kan worden herschreven als 00:02:24.930 --> 00:02:30.290 het steekproefgemiddelde min het steekproevengemiddelde 00:02:30.290 --> 00:02:34.510 gedeeld door dit deel hier -- 00:02:34.510 --> 00:02:36.482 gedeeld door het populatiegemiddelde, gedeeld door de wortel 00:02:36.482 --> 00:02:39.160 van de steekproefgrootte 00:02:39.160 --> 00:02:41.830 En dit is in essentie de beste maat die we hebben voor 00:02:41.830 --> 00:02:45.650 hoe veel standaarddeviaties we van een gemiddelde we af zitten. 00:02:45.650 --> 00:02:48.131 En dit hier, zoals we eerder geleerd hebben, is een 00:02:49.532 --> 00:02:51.780 Z- score, of als we te maken hebben met echte statistiek, als 00:02:51.780 --> 00:02:54.631 het afgeleid is van het steekproefgemiddelde, dan noemen we dit een 00:02:54.631 --> 00:02:58.327 een z-toets. 00:02:58.396 --> 00:03:02.080 En dat kunnen we opzoeken in een Z-tabel of in een normale 00:03:02.080 --> 00:03:04.730 verdelingstabel, om te zien wat de kans id op 00:03:04.730 --> 00:03:08.330 een waarde van deze Z of groter. 00:03:08.330 --> 00:03:09.890 Dus dan zou je die kans krijgen. 00:03:09.890 --> 00:03:11.640 Dus wat is de kans op 00:03:11.640 --> 00:03:13.680 zo'n extreem resultaat? 00:03:13.680 --> 00:03:18.350 Normaal gezien, en in de afgelopen paar video's hebben we dat ook gezien, 00:03:18.350 --> 00:03:24.270 weten we ook niet wat de standaarddeviatie van de 00:03:24.270 --> 00:03:25.550 populatie is. 00:03:25.550 --> 00:03:31.200 Dus om de z-score te benaderen, om 00:03:31.200 --> 00:03:33.556 te zeggen wat die ongeveer 00:03:36.623 --> 00:03:38.460 zal zijn -- ik zal het even opnieuw 00:03:38.460 --> 00:03:45.363 opschrijven-- We schatten de standaarddeviatie uit de populatie met onze standaarddeviatie 00:03:45.363 --> 00:03:47.797 uit de steekproef -- ik doe het in een nieuwe kleur --- we gebruiken onze 00:03:47.797 --> 00:03:53.623 standaarddeviatie uit de steekproef. 00:03:53.623 --> 00:04:02.830 En dit mag als je steekproef groter is dan 30. 00:04:02.830 --> 00:04:05.600 Of, op een andere manier gezegd, je kunt aannemen dat de steekproef normaal verdeeld is 00:04:05.600 --> 00:04:14.310 als hij groter is dan 30. 00:04:14.310 --> 00:04:16.211 En zelfs deze benadering is ongeveer normaal 00:04:16.211 --> 00:04:17.930 verdeeld 00:04:17.930 --> 00:04:20.850 Als je steekproef kleiner is dan 30, in het bijzonder als 00:04:20.850 --> 00:04:23.180 het een heleboel kleiner is dan 30, dan zal dit 00:04:23.180 --> 00:04:25.730 niet normaal verdeeld zijn. 00:04:25.730 --> 00:04:28.270 Dus ik schrijf hem hier opnieuw. 00:04:28.270 --> 00:04:32.140 Steekproefgemiddelde min je steekproeven-gemiddelde 00:04:32.140 --> 00:04:35.640 gedeeld door de standaarddeviatie van de steekproef 00:04:35.640 --> 00:04:39.420 gedeeld door de wortel van de steekproefgrootte. 00:04:39.420 --> 00:04:44.100 We zeiden net al dat dit hier groter is dan 30, of gelijk aan 30. 00:04:44.100 --> 00:04:47.747 Dan zal deze waarde hier 00:04:48.355 --> 00:04:49.520 normaal verdeeld zijn 00:04:49.520 --> 00:04:53.040 Als dat niet zo is, als dit klein is, dan zal dit een 00:04:55.170 --> 00:04:58.562 T-verdeling zijn. 00:04:59.815 --> 00:05:02.518 En dan ga je hetzelfde doen hier NOTE Paragraph 00:05:02.617 --> 00:05:04.003 maar nu neem je aan dat de verdeling 00:05:04.003 --> 00:05:05.718 niet meer normaal verdeeld is, NOTE Paragraph 00:05:05.974 --> 00:05:07.754 dus in dit voorbeeld was het normaal. 00:05:08.730 --> 00:05:11.680 alles van Z is normaal verdeeld. 00:05:11.710 --> 00:05:14.123 Bij de t-verdeling, en dit zal 00:05:14.173 --> 00:05:16.322 een normale t-verdeling zijn omdat 00:05:16.332 --> 00:05:18.641 we het gemiddelde hebben afgetrokken. 00:05:18.806 --> 00:05:22.036 Dus in een normale t-verdeling, 00:05:22.067 --> 00:05:24.755 zal je een gemiddelde van 0 hebben. 00:05:24.755 --> 00:05:26.254 En wat je gaat doen, is je wil weten wat de 00:05:26.254 --> 00:05:27.692 waarschijnlijkheid is van het krijgen van 00:05:27.692 --> 00:05:30.984 een t-waarde tenminste zo extreem. 00:05:31.294 --> 00:05:34.170 Dus dit is de t-waarde die je zou krijgen, 00:05:34.170 --> 00:05:37.364 en dan bereken je het gebied onder de lijn 00:05:37.794 --> 00:05:39.812 hier. 00:05:39.812 --> 00:05:42.435 Dus een makkelijke vuistregel is: 00:05:42.435 --> 00:05:44.759 Bereken deze hoeveelheid hoe dan ook. 00:05:47.335 --> 00:05:49.298 Als je meer dan 30 steekproeven hebt, 00:05:49.298 --> 00:05:53.298 als je meer dan 30 steekproeven hebt, 00:05:53.740 --> 00:05:55.890 Dan is de standaard deviatie van je steekproef 00:05:55.910 --> 00:05:57.585 een goede schatter voor je 00:05:57.585 --> 00:05:59.640 populatie standaard deviatie. 00:05:59.700 --> 00:06:01.163 En dus zal dit hele ding 00:06:01.163 --> 00:06:02.702 ongeveer normaal verdeeld zijn, 00:06:03.252 --> 00:06:04.888 en kan je een Z tabel gebruiken 00:06:04.888 --> 00:06:07.398 om de waarschijnlijkheid van een resultaat 00:06:07.398 --> 00:06:08.725 zo extreem te vinden. 00:06:08.725 --> 00:06:12.803 Als je steekproef klein is, 00:06:12.803 --> 00:06:14.988 dan deze statistiek, deze hoeveelheid, 00:06:16.001 --> 00:06:18.461 zal een t verdeling hebben, 00:06:18.991 --> 00:06:22.665 en dan moet je een t tabel gebruiken, 00:06:22.855 --> 00:06:24.378 om de waarschijnlijkheid van de t-waarde 00:06:24.378 --> 00:06:26.763 te vinden ten minste zo extreem. 00:06:27.623 --> 00:06:28.823 En we gaan dit zien in een voorbeeld 00:06:28.943 --> 00:06:29.938 een paar videos verder dan nu, 00:06:29.938 --> 00:06:31.593 in ieder geval, hopelijk heeft dit geholpen, 00:06:31.593 --> 00:06:32.835 om wat dingen te verduidelijken in je hoofd 00:06:32.835 --> 00:06:35.205 over hoe de Z-toets gebruikt moet worden 00:06:35.205 --> 00:06:38.373 of wanneer je t-statistiek gebruikt.