WEBVTT 00:00:00.000 --> 00:00:00.660 ... 00:00:00.660 --> 00:00:02.480 Trocha procvičení není nikdy na škodu. 00:00:02.480 --> 00:00:05.550 Tohle je tedy problém číslo 5 z kapitoly normálního rozdělení. 00:00:05.550 --> 00:00:11.350 Flexbooku AP statistiky na webových stránkách ck12.org. 00:00:11.350 --> 00:00:15.960 Říkají, že výsledky ze zkoušky AP Statistics 2007 00:00:15.960 --> 00:00:20.920 nebyly normálně rozděleny se střední hodnotou 2.8 a 00:00:20.920 --> 00:00:24.010 směrodatnou odchylkou 1.34. 00:00:24.010 --> 00:00:25.510 Citují zde materiály College Board. 00:00:25.510 --> 00:00:27.110 Toto jsem nezkopíroval a nevložil... 00:00:27.110 --> 00:00:29.050 Jaké je přibližné z-skóre? 00:00:29.050 --> 00:00:32.360 Připomeňme si, že z-skóre je pouze kolik standardních odchylek 00:00:32.360 --> 00:00:33.780 jste vzdáleni od střední hodnoty. 00:00:33.780 --> 00:00:36.570 Jaké je přibližné z-skóre, které odpovídá 00:00:36.570 --> 00:00:39.410 skóre 5 ze zkoušky? 00:00:39.410 --> 00:00:41.410 Takže musíme jen přijít na to – to je hezký 00:00:41.410 --> 00:00:43.790 přímočarý problém – budeme muset přijít na to, o kolik 00:00:43.790 --> 00:00:48.260 směrodatných odchylek je pětka vzdálena od střední hodnoty? 00:00:48.260 --> 00:00:53.220 Dobře, takže pouze spočtete 5 minus 2.8, správně? 00:00:53.220 --> 00:00:54.370 Střední hodnota je 2.8. 00:00:54.370 --> 00:00:55.200 Teď tedy zcela jasně. 00:00:55.200 --> 00:00:56.160 Střední hodnota je 2.8. 00:00:56.160 --> 00:00:56.820 To je zadáno. 00:00:56.820 --> 00:00:58.555 Ani jsme to nemuseli počítat, že? 00:00:58.555 --> 00:01:03.670 Tedy střední hodnota je 2.8, takže 5 mínus 2.8 se rovná 2.2. 00:01:03.670 --> 00:01:07.320 Takže se nacházíme 2.2 nad střední hodnotou, a pokud to chceme vyjádřit ve 00:01:07.320 --> 00:01:09.620 směrodatných odchylkách, tak to jen vydělíme naší 00:01:09.620 --> 00:01:10.740 směrodatnou odchylkou. 00:01:10.740 --> 00:01:14.850 Vydělíme 1.34. 00:01:14.850 --> 00:01:17.230 Vydělíme 1.34. 00:01:17.230 --> 00:01:20.630 Na tohle si vezmu kalkulačku. 00:01:20.630 --> 00:01:30.950 Takže máme 2.2 děleno 1.34, to se rovná 1.64. 00:01:30.950 --> 00:01:35.940 Toto se rovná 1.64, a to je možnost c. 00:01:35.940 --> 00:01:37.550 Takže tohle bylo doopravdy velmi přímočaré. 00:01:37.550 --> 00:01:40.800 Jen jsme se museli podívat, jak daleko jsme od střední hodnoty, jestliže obdržíme 00:01:40.800 --> 00:01:43.830 skóre 5, což věřím, že získáte, když se zúčastníte 00:01:43.830 --> 00:01:46.895 zkoušky AP statistics po shlédnutí těchto videí, a poté 00:01:46.895 --> 00:01:48.750 vydělíme směrodatnou odchylkou, abychom řekli, 00:01:48.750 --> 00:01:52.060 kolik směrodatných odchylek od střední hodnoty je skóre 5. 00:01:52.060 --> 00:01:53.680 To je 1.64. 00:01:53.680 --> 00:01:55.710 Myslím, že jediná záludná věc tady, by mohla být, 00:01:55.710 --> 00:01:58.720 že by jste mohli být v pokušení vybrat možnost e, která říká, že 00:01:58.720 --> 00:02:00.870 z-skóre nemůže být počítáno, protože distribuční funkce 00:02:00.870 --> 00:02:01.750 není normální. 00:02:01.750 --> 00:02:04.660 Myslím, že důvod, proč jste mohli podlehnout pokušení, je, 00:02:04.660 --> 00:02:08.350 že jsme používali z-scóre v kontextu 00:02:08.350 --> 00:02:10.160 normálního rozdělení. 00:02:10.160 --> 00:02:13.210 Ale z-skóre doslova znamená, kolik standardních 00:02:13.210 --> 00:02:15.910 odchylek jste vzdáleni od střední hodnoty. 00:02:15.910 --> 00:02:18.720 Mohlo by být uplatněno na libovolnou distribuční funkci, 00:02:18.720 --> 00:02:21.720 pro kterou můžete spočítat střední hodnotou a směrodatnou odchylku. 00:02:21.720 --> 00:02:23.760 Takže e není správná odpověď. 00:02:23.760 --> 00:02:27.320 Z-skóre lze použít i na ne-normální rozdělení, tedy 00:02:27.320 --> 00:02:29.980 odpověď je c, a tuším, že tohle je vhodná úroveň znalostí na to, 00:02:29.980 --> 00:02:31.580 abychom toto opustili. 00:02:31.580 --> 00:02:33.370 Uvažoval jsem, že bych v tomto videu mohl probrat dva problémy, 00:02:33.370 --> 00:02:35.330 protože ten předchozí byl docela krátký. 00:02:35.330 --> 00:02:38.580 Tady problém číslo 6: Výška chlapců páté třídy 00:02:38.580 --> 00:02:40.680 ve Spojených státech je přibližně normálně rozdělená, 00:02:40.680 --> 00:02:44.140 to je dobré vědět, se střední hodnotou výšky 00:02:44.140 --> 00:02:53.330 143.5, takže střední hodnota je 143.5 centimetrů a 00:02:53.330 --> 00:02:56.980 standardní odchylka je 7.1 centimetrů. 00:02:56.980 --> 00:03:01.570 Směrodatná odchylka 7.1 centimetrů. 00:03:01.570 --> 00:03:04.360 Jaká je pravděpodobnost, že náš náhodně zvolený chlapec 00:03:04.360 --> 00:03:08.850 páté třídy by byl vyšší než 157.7 centimetrů? 00:03:08.850 --> 00:03:11.740 Vykresleme tedy tuto distribuční funkci, tak jako jsme to již 00:03:11.740 --> 00:03:14.180 udělali u několika problémů. 00:03:14.180 --> 00:03:17.550 Pokládají nám jen jednu otázku, takže můžete vyznačit tuto 00:03:17.550 --> 00:03:19.430 distribuční funkci trochu výše. 00:03:19.430 --> 00:03:21.720 Dejme tomu, že toto je naše distribuční funkce – a 00:03:21.720 --> 00:03:28.220 střední hodnota tady, střední hodnota, jak bylo řečeno, je 143.5. 00:03:28.220 --> 00:03:31.106 Ptají se nás na vyšší než 157.7, takže jdeme 00:03:31.106 --> 00:03:31.990 směrem nahoru. 00:03:31.990 --> 00:03:36.950 Takže jedna směrodatná odchylka nad střední hodnotou nás vezme 00:03:36.950 --> 00:03:40.460 přesně sem a musíme tedy přidat 7.1 k tomuto číslu tady. 00:03:40.460 --> 00:03:42.560 Stoupáme o 7.1. 00:03:42.560 --> 00:03:45.940 Tedy 143.5 plus 7.1 je kolik? 00:03:45.940 --> 00:03:49.410 150.6. 00:03:49.410 --> 00:03:51.040 To je jedna směrodatná odchylka. 00:03:51.040 --> 00:03:52.750 Kdybychom šli o další směrodatnou odchylku, 00:03:52.750 --> 00:03:54.910 Jdeme o 7.1 dál. 00:03:54.910 --> 00:03:57.480 Kolik je 7.1 plus 150.6? 00:03:57.480 --> 00:04:03.430 To je 157.7, což se ukazuje jako přesně stejná číslo, 00:04:03.430 --> 00:04:04.200 na jaké se ptají. 00:04:04.200 --> 00:04:06.440 Ptají se na výšku, pravděpodobnost 00:04:06.440 --> 00:04:08.580 dosažení výšky, vyšší než tato. 00:04:08.580 --> 00:04:11.460 Takže chtějí vědět, jaká je pravděpodobnost, že spadneme pod 00:04:11.460 --> 00:04:14.300 tuto oblast tady, nebo v podstatě více než dvě 00:04:14.300 --> 00:04:17.700 směrodatné odchylky od střední hodnoty nebo 00:04:17.700 --> 00:04:18.630 nad dvě směrodatné odchylky. 00:04:18.630 --> 00:04:20.975 Nemůžeme počítat tento levý konec tady. 00:04:20.975 --> 00:04:23.220 Takže můžeme použít empirické pravidlo. 00:04:23.220 --> 00:04:24.320 Můžeme použít empirické pravidlo. 00:04:24.320 --> 00:04:26.660 Pokud uděláme naše směrodatné odchylky nalevo, 00:04:26.660 --> 00:04:29.740 jedna směrodatná odchylka, dvě směrodatné odchylky. 00:04:29.740 --> 00:04:31.860 Víme, kolik je celá tato oblast. 00:04:31.860 --> 00:04:35.530 Dovolte mi vybrat jinou barvu. 00:04:35.530 --> 00:04:39.730 Takže víme, kolik je tato oblast, oblast uvnitř dvou 00:04:39.730 --> 00:04:40.445 směrodatných odchylek. 00:04:40.445 --> 00:04:41.980 Empirické pravidlo nám říká, 00:04:41.980 --> 00:04:48.340 nebo ještě lépe, pravidlo 68-95-99.7 nám říká, že tato oblast, 00:04:48.340 --> 00:04:54.390 protože je to mezi dvěma směrodatnými odchylkami, je 95 %, nebo 00:04:54.390 --> 00:04:59.570 0.95, nebo je to 95 % plochy pod normální distribuční funkcí, 00:04:59.570 --> 00:05:02.820 což nám říká, že to, co zbylo mimo, tento konec, který nás zajímá 00:05:02.820 --> 00:05:05.390 o tento levý konec tady, musí dávat 00:05:05.390 --> 00:05:08.200 zbytek, neboli 5 %. 00:05:08.200 --> 00:05:13.520 Takže ty dva konce dohromady musí být 5 % a jsou symetrické. 00:05:13.520 --> 00:05:14.460 Toto jsme dělali již předtím. 00:05:14.460 --> 00:05:15.950 Toto je vlastně trochu redundantní vůči ostatních 00:05:15.950 --> 00:05:17.110 problémům, které jsme již řešili. 00:05:17.110 --> 00:05:20.250 Ale pokud tyto dva dohromady jsou 5 %, pak říkají, že každý 00:05:20.250 --> 00:05:22.520 z nich je 2.5 procenta. 00:05:22.520 --> 00:05:24.880 Každý z těchto dvou je 2.5 procenta. 00:05:24.880 --> 00:05:27.400 Tedy k odpovědi na položenou otázku, jaká je pravděpodobnost, 00:05:27.400 --> 00:05:31.800 že náhodně vybraný chlapec páté třídy by byl vyšší než 157.7 00:05:31.800 --> 00:05:34.550 centimetrů, no, to je doslova právě tato oblast pod 00:05:34.550 --> 00:05:36.170 touto zelenou částí. 00:05:36.170 --> 00:05:37.450 Možná to vyznačím v jiné barvě. 00:05:37.450 --> 00:05:39.820 Tato fialová část, kterou právě vybarvuji, to je 00:05:39.820 --> 00:05:43.480 právě ta oblast, kterou jsme spočítali jako 2,5 %. 00:05:43.480 --> 00:05:46.810 Existuje tedy 2.5 procentní šance, že náhodně vybraný 00:05:46.810 --> 00:05:51.190 chlapec páté třídy bude vyšší než 157.7 centimetrů, 00:05:51.190 --> 00:05:54.030 za předpokladu, že toto je střední hodnota a směrodatná odchylka a 00:05:54.030 --> 00:05:56.370 máme co do činění s normálním rozdělením. 00:05:56.370 --> 00:05:56.622 ...