1 00:00:00,000 --> 00:00:00,660 ... 2 00:00:00,660 --> 00:00:02,480 Trocha procvičení není nikdy na škodu. 3 00:00:02,480 --> 00:00:05,550 Tohle je tedy problém číslo 5 z kapitoly normálního rozdělení. 4 00:00:05,550 --> 00:00:11,350 Flexbooku AP statistiky na webových stránkách ck12.org. 5 00:00:11,350 --> 00:00:15,960 Říkají, že výsledky ze zkoušky AP Statistics 2007 6 00:00:15,960 --> 00:00:20,920 nebyly normálně rozděleny se střední hodnotou 2.8 a 7 00:00:20,920 --> 00:00:24,010 směrodatnou odchylkou 1.34. 8 00:00:24,010 --> 00:00:25,510 Citují zde materiály College Board. 9 00:00:25,510 --> 00:00:27,110 Toto jsem nezkopíroval a nevložil... 10 00:00:27,110 --> 00:00:29,050 Jaké je přibližné z-skóre? 11 00:00:29,050 --> 00:00:32,360 Připomeňme si, že z-skóre je pouze kolik standardních odchylek 12 00:00:32,360 --> 00:00:33,780 jste vzdáleni od střední hodnoty. 13 00:00:33,780 --> 00:00:36,570 Jaké je přibližné z-skóre, které odpovídá 14 00:00:36,570 --> 00:00:39,410 skóre 5 ze zkoušky? 15 00:00:39,410 --> 00:00:41,410 Takže musíme jen přijít na to – to je hezký 16 00:00:41,410 --> 00:00:43,790 přímočarý problém – budeme muset přijít na to, o kolik 17 00:00:43,790 --> 00:00:48,260 směrodatných odchylek je pětka vzdálena od střední hodnoty? 18 00:00:48,260 --> 00:00:53,220 Dobře, takže pouze spočtete 5 minus 2.8, správně? 19 00:00:53,220 --> 00:00:54,370 Střední hodnota je 2.8. 20 00:00:54,370 --> 00:00:55,200 Teď tedy zcela jasně. 21 00:00:55,200 --> 00:00:56,160 Střední hodnota je 2.8. 22 00:00:56,160 --> 00:00:56,820 To je zadáno. 23 00:00:56,820 --> 00:00:58,555 Ani jsme to nemuseli počítat, že? 24 00:00:58,555 --> 00:01:03,670 Tedy střední hodnota je 2.8, takže 5 mínus 2.8 se rovná 2.2. 25 00:01:03,670 --> 00:01:07,320 Takže se nacházíme 2.2 nad střední hodnotou, a pokud to chceme vyjádřit ve 26 00:01:07,320 --> 00:01:09,620 směrodatných odchylkách, tak to jen vydělíme naší 27 00:01:09,620 --> 00:01:10,740 směrodatnou odchylkou. 28 00:01:10,740 --> 00:01:14,850 Vydělíme 1.34. 29 00:01:14,850 --> 00:01:17,230 Vydělíme 1.34. 30 00:01:17,230 --> 00:01:20,630 Na tohle si vezmu kalkulačku. 31 00:01:20,630 --> 00:01:30,950 Takže máme 2.2 děleno 1.34, to se rovná 1.64. 32 00:01:30,950 --> 00:01:35,940 Toto se rovná 1.64, a to je možnost c. 33 00:01:35,940 --> 00:01:37,550 Takže tohle bylo doopravdy velmi přímočaré. 34 00:01:37,550 --> 00:01:40,800 Jen jsme se museli podívat, jak daleko jsme od střední hodnoty, jestliže obdržíme 35 00:01:40,800 --> 00:01:43,830 skóre 5, což věřím, že získáte, když se zúčastníte 36 00:01:43,830 --> 00:01:46,895 zkoušky AP statistics po shlédnutí těchto videí, a poté 37 00:01:46,895 --> 00:01:48,750 vydělíme směrodatnou odchylkou, abychom řekli, 38 00:01:48,750 --> 00:01:52,060 kolik směrodatných odchylek od střední hodnoty je skóre 5. 39 00:01:52,060 --> 00:01:53,680 To je 1.64. 40 00:01:53,680 --> 00:01:55,710 Myslím, že jediná záludná věc tady, by mohla být, 41 00:01:55,710 --> 00:01:58,720 že by jste mohli být v pokušení vybrat možnost e, která říká, že 42 00:01:58,720 --> 00:02:00,870 z-skóre nemůže být počítáno, protože distribuční funkce 43 00:02:00,870 --> 00:02:01,750 není normální. 44 00:02:01,750 --> 00:02:04,660 Myslím, že důvod, proč jste mohli podlehnout pokušení, je, 45 00:02:04,660 --> 00:02:08,350 že jsme používali z-scóre v kontextu 46 00:02:08,350 --> 00:02:10,160 normálního rozdělení. 47 00:02:10,160 --> 00:02:13,210 Ale z-skóre doslova znamená, kolik standardních 48 00:02:13,210 --> 00:02:15,910 odchylek jste vzdáleni od střední hodnoty. 49 00:02:15,910 --> 00:02:18,720 Mohlo by být uplatněno na libovolnou distribuční funkci, 50 00:02:18,720 --> 00:02:21,720 pro kterou můžete spočítat střední hodnotou a směrodatnou odchylku. 51 00:02:21,720 --> 00:02:23,760 Takže e není správná odpověď. 52 00:02:23,760 --> 00:02:27,320 Z-skóre lze použít i na ne-normální rozdělení, tedy 53 00:02:27,320 --> 00:02:29,980 odpověď je c, a tuším, že tohle je vhodná úroveň znalostí na to, 54 00:02:29,980 --> 00:02:31,580 abychom toto opustili. 55 00:02:31,580 --> 00:02:33,370 Uvažoval jsem, že bych v tomto videu mohl probrat dva problémy, 56 00:02:33,370 --> 00:02:35,330 protože ten předchozí byl docela krátký. 57 00:02:35,330 --> 00:02:38,580 Tady problém číslo 6: Výška chlapců páté třídy 58 00:02:38,580 --> 00:02:40,680 ve Spojených státech je přibližně normálně rozdělená, 59 00:02:40,680 --> 00:02:44,140 to je dobré vědět, se střední hodnotou výšky 60 00:02:44,140 --> 00:02:53,330 143.5, takže střední hodnota je 143.5 centimetrů a 61 00:02:53,330 --> 00:02:56,980 standardní odchylka je 7.1 centimetrů. 62 00:02:56,980 --> 00:03:01,570 Směrodatná odchylka 7.1 centimetrů. 63 00:03:01,570 --> 00:03:04,360 Jaká je pravděpodobnost, že náš náhodně zvolený chlapec 64 00:03:04,360 --> 00:03:08,850 páté třídy by byl vyšší než 157.7 centimetrů? 65 00:03:08,850 --> 00:03:11,740 Vykresleme tedy tuto distribuční funkci, tak jako jsme to již 66 00:03:11,740 --> 00:03:14,180 udělali u několika problémů. 67 00:03:14,180 --> 00:03:17,550 Pokládají nám jen jednu otázku, takže můžete vyznačit tuto 68 00:03:17,550 --> 00:03:19,430 distribuční funkci trochu výše. 69 00:03:19,430 --> 00:03:21,720 Dejme tomu, že toto je naše distribuční funkce – a 70 00:03:21,720 --> 00:03:28,220 střední hodnota tady, střední hodnota, jak bylo řečeno, je 143.5. 71 00:03:28,220 --> 00:03:31,106 Ptají se nás na vyšší než 157.7, takže jdeme 72 00:03:31,106 --> 00:03:31,990 směrem nahoru. 73 00:03:31,990 --> 00:03:36,950 Takže jedna směrodatná odchylka nad střední hodnotou nás vezme 74 00:03:36,950 --> 00:03:40,460 přesně sem a musíme tedy přidat 7.1 k tomuto číslu tady. 75 00:03:40,460 --> 00:03:42,560 Stoupáme o 7.1. 76 00:03:42,560 --> 00:03:45,940 Tedy 143.5 plus 7.1 je kolik? 77 00:03:45,940 --> 00:03:49,410 150.6. 78 00:03:49,410 --> 00:03:51,040 To je jedna směrodatná odchylka. 79 00:03:51,040 --> 00:03:52,750 Kdybychom šli o další směrodatnou odchylku, 80 00:03:52,750 --> 00:03:54,910 Jdeme o 7.1 dál. 81 00:03:54,910 --> 00:03:57,480 Kolik je 7.1 plus 150.6? 82 00:03:57,480 --> 00:04:03,430 To je 157.7, což se ukazuje jako přesně stejná číslo, 83 00:04:03,430 --> 00:04:04,200 na jaké se ptají. 84 00:04:04,200 --> 00:04:06,440 Ptají se na výšku, pravděpodobnost 85 00:04:06,440 --> 00:04:08,580 dosažení výšky, vyšší než tato. 86 00:04:08,580 --> 00:04:11,460 Takže chtějí vědět, jaká je pravděpodobnost, že spadneme pod 87 00:04:11,460 --> 00:04:14,300 tuto oblast tady, nebo v podstatě více než dvě 88 00:04:14,300 --> 00:04:17,700 směrodatné odchylky od střední hodnoty nebo 89 00:04:17,700 --> 00:04:18,630 nad dvě směrodatné odchylky. 90 00:04:18,630 --> 00:04:20,975 Nemůžeme počítat tento levý konec tady. 91 00:04:20,975 --> 00:04:23,220 Takže můžeme použít empirické pravidlo. 92 00:04:23,220 --> 00:04:24,320 Můžeme použít empirické pravidlo. 93 00:04:24,320 --> 00:04:26,660 Pokud uděláme naše směrodatné odchylky nalevo, 94 00:04:26,660 --> 00:04:29,740 jedna směrodatná odchylka, dvě směrodatné odchylky. 95 00:04:29,740 --> 00:04:31,860 Víme, kolik je celá tato oblast. 96 00:04:31,860 --> 00:04:35,530 Dovolte mi vybrat jinou barvu. 97 00:04:35,530 --> 00:04:39,730 Takže víme, kolik je tato oblast, oblast uvnitř dvou 98 00:04:39,730 --> 00:04:40,445 směrodatných odchylek. 99 00:04:40,445 --> 00:04:41,980 Empirické pravidlo nám říká, 100 00:04:41,980 --> 00:04:48,340 nebo ještě lépe, pravidlo 68-95-99.7 nám říká, že tato oblast, 101 00:04:48,340 --> 00:04:54,390 protože je to mezi dvěma směrodatnými odchylkami, je 95 %, nebo 102 00:04:54,390 --> 00:04:59,570 0.95, nebo je to 95 % plochy pod normální distribuční funkcí, 103 00:04:59,570 --> 00:05:02,820 což nám říká, že to, co zbylo mimo, tento konec, který nás zajímá 104 00:05:02,820 --> 00:05:05,390 o tento levý konec tady, musí dávat 105 00:05:05,390 --> 00:05:08,200 zbytek, neboli 5 %. 106 00:05:08,200 --> 00:05:13,520 Takže ty dva konce dohromady musí být 5 % a jsou symetrické. 107 00:05:13,520 --> 00:05:14,460 Toto jsme dělali již předtím. 108 00:05:14,460 --> 00:05:15,950 Toto je vlastně trochu redundantní vůči ostatních 109 00:05:15,950 --> 00:05:17,110 problémům, které jsme již řešili. 110 00:05:17,110 --> 00:05:20,250 Ale pokud tyto dva dohromady jsou 5 %, pak říkají, že každý 111 00:05:20,250 --> 00:05:22,520 z nich je 2.5 procenta. 112 00:05:22,520 --> 00:05:24,880 Každý z těchto dvou je 2.5 procenta. 113 00:05:24,880 --> 00:05:27,400 Tedy k odpovědi na položenou otázku, jaká je pravděpodobnost, 114 00:05:27,400 --> 00:05:31,800 že náhodně vybraný chlapec páté třídy by byl vyšší než 157.7 115 00:05:31,800 --> 00:05:34,550 centimetrů, no, to je doslova právě tato oblast pod 116 00:05:34,550 --> 00:05:36,170 touto zelenou částí. 117 00:05:36,170 --> 00:05:37,450 Možná to vyznačím v jiné barvě. 118 00:05:37,450 --> 00:05:39,820 Tato fialová část, kterou právě vybarvuji, to je 119 00:05:39,820 --> 00:05:43,480 právě ta oblast, kterou jsme spočítali jako 2,5 %. 120 00:05:43,480 --> 00:05:46,810 Existuje tedy 2.5 procentní šance, že náhodně vybraný 121 00:05:46,810 --> 00:05:51,190 chlapec páté třídy bude vyšší než 157.7 centimetrů, 122 00:05:51,190 --> 00:05:54,030 za předpokladu, že toto je střední hodnota a směrodatná odchylka a 123 00:05:54,030 --> 00:05:56,370 máme co do činění s normálním rozdělením. 124 00:05:56,370 --> 00:05:56,622 ...