1 00:00:00,560 --> 00:00:03,960 Pojďme vyřešit další příklad na normální rozdělení 2 00:00:03,960 --> 00:00:10,020 ze sekce ck12.org AP statistické knihy. 3 00:00:10,020 --> 00:00:14,000 Používám ji, protože je to otevřený zdroj a je to docela dobrá kniha. 4 00:00:14,000 --> 00:00:16,415 Příklady jsou pro naše procvičování dobré. 5 00:00:16,415 --> 00:00:18,940 Podívejte, číslo 3. 6 00:00:18,940 --> 00:00:21,690 Můžete jít na jejich web a stáhnout si tuto knihu. 7 00:00:21,690 --> 00:00:26,810 Předpokládejte, že průměrná váha 1-letých dívek má v USA normálního rozdělení... 8 00:00:26,810 --> 00:00:32,140 ... nebo je normálně rozdělena s průměrem okolo 9,5 gramů. 9 00:00:32,140 --> 00:00:33,820 Měly by to být kilogramy. 10 00:00:33,820 --> 00:00:38,530 Mám 10 měsíčního syna a ten váží okolo 9 kilogramů 11 00:00:38,530 --> 00:00:39,570 a ne 9,5 gramů. 12 00:00:39,570 --> 00:00:41,040 9,5 gramu je nic. 13 00:00:41,040 --> 00:00:43,780 Vypadá to, jako by se zde hovořilo o myších. 14 00:00:43,780 --> 00:00:44,940 Toto musí být kilogramy. 15 00:00:44,940 --> 00:00:50,940 Je to o 9,5 kilogramech se směrodatnou odchylkou přibližně 1,1 gram. 16 00:00:50,940 --> 00:00:56,220 Takže průměr je roven 9,5 kilogramů, předpokládám, 17 00:00:56,220 --> 00:01:01,130 a směrodatná odchylka je rovna 1,1 kilogramů. 18 00:01:01,130 --> 00:01:04,840 Bez použití kalkulačky... ... je to zajímavé vodítko... 19 00:01:04,840 --> 00:01:10,020 Odhadněte procento 1-letých dívek v USA, které splňují následující podmínky. 20 00:01:10,020 --> 00:01:14,310 Když říkají, že to máme odhadnout bez kalkulačky, tak je to velká nápověda, 21 00:01:14,310 --> 00:01:20,040 abychom použili empirické pravidlo. 22 00:01:20,040 --> 00:01:27,320 Empirické pravidlo, kterému se občas říká pravidlo 68-95-99,7. 23 00:01:27,320 --> 00:01:29,960 A pokud si vzpomínáte, tak toto je jméno pravidla, 24 00:01:29,960 --> 00:01:31,500 jakým si ho zapamatujete. 25 00:01:31,500 --> 00:01:33,830 Co nám to říká, pokud máme normální rozdělení... 26 00:01:33,830 --> 00:01:36,940 Nejprve to zde trochu shrnu, než se ponoříme do příkladu. 27 00:01:36,940 --> 00:01:38,640 Pokud máme normální rozdělení... 28 00:01:38,640 --> 00:01:40,380 ... nakreslím normální rozdělení. 29 00:01:40,380 --> 00:01:42,900 Vypadá to takto. 30 00:01:42,900 --> 00:01:44,240 Toto je normální rozdělení. 31 00:01:44,240 --> 00:01:46,060 Není to perfektně, ale představu máte. 32 00:01:46,060 --> 00:01:47,560 Mělo by to být symetrické. 33 00:01:47,560 --> 00:01:50,840 Zde je náš průměr. 34 00:01:50,840 --> 00:01:54,230 Pokud bychom šli 1 směrodatnou odchylku nad průměr 35 00:01:54,230 --> 00:01:57,440 a 1 směrodatnou odchylku pod průměr, 36 00:01:57,440 --> 00:02:01,780 tak je to náš průměr plus 1 směrodatná odchylka. 37 00:02:01,780 --> 00:02:05,730 Toto je náš průměr minus 1 směrodatná odchylka. 38 00:02:05,730 --> 00:02:07,890 Pravděpodobnost nalezení výsledků, 39 00:02:07,890 --> 00:02:10,420 pokud se zabýváme perfektním normálním rozdělením, 40 00:02:10,420 --> 00:02:13,170 je mezi 1 směrodatnou odchylkou pod průměrem 41 00:02:13,170 --> 00:02:15,720 a 1 směrodatnou odchylkou nad průměrem... 42 00:02:15,720 --> 00:02:22,910 ... tak by to byla tato plocha, což by bylo zhruba 68 %. 43 00:02:22,910 --> 00:02:27,610 68 % šance, že získáte něco uvnitř 1 směrodatné odchylky od průměru. 44 00:02:27,610 --> 00:02:31,460 Buď směrodatnou odchylku pod nebo nad nebo kdekoliv mezi. 45 00:02:31,460 --> 00:02:34,710 Pokud se bavíme o 2 směrodatných odchylkách okolo průměru... 46 00:02:34,710 --> 00:02:38,370 Pokud půjdeme dolů o další směrodatnou odchylku 47 00:02:38,370 --> 00:02:41,020 a o další směrodatnou odchylku nahoru od průměru... 48 00:02:41,020 --> 00:02:42,180 A zeptáme se sami sebe, 49 00:02:42,180 --> 00:02:47,360 jaká je pravděpodobnost nalezení něčeho v tomto rámci, 50 00:02:47,360 --> 00:02:50,740 tak byste to mohli odhadnout na 95 %. 51 00:02:50,740 --> 00:02:53,060 A zahrnuje to tuto plochu zde. 52 00:02:53,060 --> 00:02:56,300 68 % je podmnožinou těchto 95 %. 53 00:02:56,300 --> 00:02:58,040 A myslím, že víte, kam to povede. 54 00:02:58,040 --> 00:03:02,520 Pokud půjdeme 3 směrodatné odchylky pod průměr a nad průměr, 55 00:03:02,520 --> 00:03:07,320 tak nám pravidlo 68-95-99,7 říká, 56 00:03:07,320 --> 00:03:16,950 že existuje 99,7 % šance, že nalezneme výsledek normálního rozdělení, 57 00:03:16,950 --> 00:03:20,110 v rozsahu 3 směrodatných odchylek od průměru. 58 00:03:20,110 --> 00:03:23,230 Tedy nad 3 směrodatnými odchylkami pod průměrem 59 00:03:23,230 --> 00:03:26,030 a pod 3 směrodatnými odchylkami nad průměrem. 60 00:03:26,030 --> 00:03:27,870 Toto nám říká empirické pravidlo. 61 00:03:27,870 --> 00:03:30,790 Nyní se podívejme, zda to můžeme aplikovat na tento příklad. 62 00:03:30,790 --> 00:03:33,140 Dali nám průměr a směrodatnou odchylku. 63 00:03:33,140 --> 00:03:34,550 Nakreslím to. 64 00:03:34,550 --> 00:03:38,550 Nejprve nakreslím osu nejlépe, jak umím. 65 00:03:38,550 --> 00:03:39,600 Toto je má osa. 66 00:03:39,600 --> 00:03:45,930 Nakreslím zvonkovitou křivku. 67 00:03:45,930 --> 00:03:48,140 Ta zvonkovitá křivka je tak dobrá, 68 00:03:48,140 --> 00:03:50,920 jak ji jen můžete očekávat kreslením od ruky. 69 00:03:50,920 --> 00:03:53,920 A průměr zde je 9... ... toto by mělo být symetrické. 70 00:03:53,920 --> 00:03:56,070 Tato výška by měla být stejná, jako tato zde. 71 00:03:56,070 --> 00:03:57,600 Myslím, že máte představu. 72 00:03:57,600 --> 00:03:59,260 Nejsem počítač. 73 00:03:59,260 --> 00:04:01,990 9,5 je průměr. 74 00:04:01,990 --> 00:04:03,250 Nechci psát jednotky. 75 00:04:03,250 --> 00:04:04,640 Všechny jsou v kilogramech. 76 00:04:04,640 --> 00:04:11,540 1 směrodatná odchylka nad průměrem... ... měli bychom přičíst 1,1 k tomuto, 77 00:04:11,540 --> 00:04:14,090 protože nám říkají, že směrodatná odchylka je 1,1. 78 00:04:14,090 --> 00:04:16,590 Takže to bude 10,6. 79 00:04:16,590 --> 00:04:19,450 Nakreslím zde tečkovanou čáru... 80 00:04:19,450 --> 00:04:23,700 1 směrodatná odchylka pod průměrem... 81 00:04:23,700 --> 00:04:34,110 ... odečteme 1,1 od 9,5 a to by mělo být 8,4. 82 00:04:34,110 --> 00:04:37,620 Pokud bychom šli 2 směrodatné odchylky nad průměr, 83 00:04:37,620 --> 00:04:40,160 tak bychom přičetli další směrodatnou odchylku. 84 00:04:40,160 --> 00:04:42,730 Šli jsme 1 směrodatnou odchylku, 2 směrodatné odchylky. 85 00:04:42,730 --> 00:04:44,435 To by nám dalo 11,7. 86 00:04:44,435 --> 00:04:48,910 A pokud bychom šli 3 směrodatné odchylky, tak bychom opět přičetli 1,1. 87 00:04:48,910 --> 00:04:50,720 Dostali bychom 12,8. 88 00:04:50,720 --> 00:04:52,470 Když to uděláme na opačné straně, 89 00:04:52,470 --> 00:04:55,380 tak 1 směrodatná odchylka pod průměrem je 8,4. 90 00:04:55,380 --> 00:04:57,570 2 směrodatné odchylky pod průměrem... 91 00:04:57,570 --> 00:05:00,610 ... znovu odečíst 1,1... a bude to 7,3. 92 00:05:00,610 --> 00:05:03,380 A pak 3 směrodatné odchylky pod průměrem... 93 00:05:03,380 --> 00:05:07,010 ... což bychom napsali zde... ... by byly 6,2 kilogramů. 94 00:05:07,010 --> 00:05:08,800 Toto je vyznačení našeho příkladu. 95 00:05:08,800 --> 00:05:13,080 Jaká je pravděpodobnost, že bychom našli 1-letou dívku v USA, 96 00:05:13,080 --> 00:05:17,360 která váží méně než 8,4 kilogramů? 97 00:05:17,360 --> 00:05:21,640 Nebo bych měl říct, s hmotností menší než 8,4 kilogramů. 98 00:05:21,640 --> 00:05:25,150 Pokud se podíváme sem, tak pravděpodobnost nalezení miminka 99 00:05:25,150 --> 00:05:27,070 nebo holčičky, která má 1 rok 100 00:05:27,070 --> 00:05:30,290 a hmotnost nebo váhu menší než 8,4 kilogramů, 101 00:05:30,290 --> 00:05:31,610 tak je to tato plocha. 102 00:05:31,610 --> 00:05:35,070 Říkám hmotnost, protože kilogramy jsou jednotky hmotnosti. 103 00:05:35,070 --> 00:05:36,940 Hodně lidí používá váhu. 104 00:05:36,940 --> 00:05:38,470 Je to tato plocha. 105 00:05:38,470 --> 00:05:40,210 Jak můžeme zjistit tuto plochu 106 00:05:40,210 --> 00:05:43,900 pod tímto normálním rozdělením s použitím empirického pravidla? 107 00:05:43,900 --> 00:05:47,280 Známe tuto plochu. 108 00:05:47,280 --> 00:05:52,210 Známe tuto plochu mezi minus 1 směrodatnou odchylkou 109 00:05:52,210 --> 00:05:54,500 a plus 1 směrodatnou odchylkou. 110 00:05:54,500 --> 00:05:58,230 Víme, že je to 68 %. 111 00:05:58,230 --> 00:06:03,100 Pokud je to 68 %, tak to znamená, že v části, která není uprostřed, 112 00:06:03,100 --> 00:06:04,360 je hodnota plochy 32 %. 113 00:06:04,360 --> 00:06:09,240 Protože plocha pod celým normálním rozdělením je 100 nebo 100 % nebo 1, 114 00:06:09,240 --> 00:06:11,610 v závislosti na tom, jak o tom chcete přemýšlet. 115 00:06:11,610 --> 00:06:13,460 Protože nemůžete mít... 116 00:06:13,460 --> 00:06:17,600 Všechny možné kombinace mohou vést pouze k 1. 117 00:06:17,600 --> 00:06:21,480 Nemůžete mít více než 100 %. 118 00:06:21,480 --> 00:06:24,540 Pokud sečtete tento úsek a tento úsek... 119 00:06:24,540 --> 00:06:29,490 ... tedy toto plus toto bude zbytek. 120 00:06:29,490 --> 00:06:32,590 100 minus 68 je 32. 121 00:06:32,590 --> 00:06:33,920 32 % 122 00:06:33,920 --> 00:06:39,010 32 % je pokud sečtete tuto levou stranu a tuto pravou stranu. 123 00:06:39,010 --> 00:06:40,990 A toto je perfektní normální rozdělení. 124 00:06:40,990 --> 00:06:42,975 Řekli nám, že je to normální rozdělení. 125 00:06:42,975 --> 00:06:44,780 Budou perfektně symetrické. 126 00:06:44,780 --> 00:06:47,810 Pokud tuto stranu a tuto stranu přičteme k 32, 127 00:06:47,810 --> 00:06:51,310 ale obojí jsou symetrické, což znamená, že mají stejnou plochu, 128 00:06:51,310 --> 00:06:57,910 pak tato strana... udělám ji růžově... ... vypadá spíš jako fialová... 129 00:06:57,910 --> 00:07:00,020 ... pak tato strana by byla 16 %. 130 00:07:00,020 --> 00:07:02,700 A tato strana zde bude 16 %. 131 00:07:02,700 --> 00:07:07,010 Takže pravděpodobnost , že dostanete více než 1 směrodatnou odchylku nad průměrem... 132 00:07:07,010 --> 00:07:09,540 ... tato pravá strana bude 16 %. 133 00:07:09,540 --> 00:07:12,180 Nebo pravděpodobnost, že budeme mít výsledek menší 134 00:07:12,180 --> 00:07:16,800 než 1 směrodatnou odchylku pod průměrem, by byla tato... 16 %. 135 00:07:16,800 --> 00:07:18,400 Chtějí znát pravděpodobnost, 136 00:07:18,400 --> 00:07:23,140 že budeme mít 1-leté dítě vážící méně než 8,4 kilogramů. 137 00:07:23,140 --> 00:07:27,970 Méně než 8,4 kilogramů je v této oblasti. 138 00:07:27,970 --> 00:07:29,500 A to je 16 %. 139 00:07:29,500 --> 00:07:33,270 16 % je odpověď pro část (a). 140 00:07:33,270 --> 00:07:38,040 Udělejme část (b): mezi 7,3 a 11,7 kilogramy. 141 00:07:38,040 --> 00:07:40,820 Mezi 7,3... to je někde tady. 142 00:07:40,820 --> 00:07:43,850 Jsou to 2 směrodatné odchylky pod průměrem... 143 00:07:43,850 --> 00:07:48,920 ... a 11,7 jsou 2 směrodatné odchylky nad průměrem. 144 00:07:48,920 --> 00:07:51,260 V podstatě se nás ptají, jaká je pravděpodobnost, 145 00:07:51,260 --> 00:07:55,230 že dostaneme výsledek uvnitř 2 směrodatných odchylek od průměru. 146 00:07:55,230 --> 00:07:57,040 Zde je průměr. 147 00:07:57,040 --> 00:08:00,030 Toto jsou 2 směrodatné odchylky pod. 148 00:08:00,030 --> 00:08:02,630 Toto jsou 2 směrodatné odchylky nad. 149 00:08:02,630 --> 00:08:04,130 Je to hezky přímočaré. 150 00:08:04,130 --> 00:08:05,690 Empirické pravidlo nám říká, 151 00:08:05,690 --> 00:08:14,820 že mezi 2 směrodatnými odchylkami máme 95 % šanci, že získáme žádaný výsledek. 152 00:08:14,820 --> 00:08:17,740 Takže nám empirické pravidlo dává odpověď. 153 00:08:17,740 --> 00:08:19,290 A nakonec část (c): 154 00:08:19,290 --> 00:08:25,510 Pravděpodobnost, že 1-letá holčička z USA bude mít více než 12,8 kilogramů. 155 00:08:25,510 --> 00:08:29,460 12,8 kilogramů jsou 3 směrodatné odchylky nad průměrem. 156 00:08:29,460 --> 00:08:32,160 Chceme tedy znát pravděpodobnost, že budeme mít výsledek 157 00:08:32,160 --> 00:08:36,250 vyšší než 3 směrodatné odchylky nad průměrem. 158 00:08:36,250 --> 00:08:41,920 Je to tato oblast, kterou jsem zakreslil oranžově. 159 00:08:41,920 --> 00:08:45,290 Možná bych měl použít jinou barvu kvůli kontrastu. 160 00:08:45,290 --> 00:08:48,575 Je to tato malá oblast. 161 00:08:48,575 --> 00:08:50,690 Jaká je pravděpodobnost? 162 00:08:50,690 --> 00:08:53,420 Vraťme se zpět k empirickému pravidlu. 163 00:08:53,420 --> 00:08:56,230 Známe pravděpodobnost... ... známe tuto plochu. 164 00:08:56,230 --> 00:08:59,270 Známe plochu mezi -3 směrodatnými odchylkami 165 00:08:59,270 --> 00:09:01,670 a +3 směrodatnými odchylkami. 166 00:09:01,670 --> 00:09:04,440 Známe toto... vzhledem k tomu, že je to poslední příklad, 167 00:09:04,440 --> 00:09:05,910 můžu celou oblast obarvit... 168 00:09:05,910 --> 00:09:14,300 Víme, že tato oblast mezi -3 a +3 směrodatnými odchylkami je 99,7 %. 169 00:09:14,300 --> 00:09:16,830 Velký objem výsledků spadá pod toto. 170 00:09:16,830 --> 00:09:18,130 Myslím tím skoro všechny. 171 00:09:18,130 --> 00:09:21,090 Co tedy zbývá na tyto 2 okraje? 172 00:09:21,090 --> 00:09:22,180 Toto je 1 z okrajů. 173 00:09:22,180 --> 00:09:25,810 Pak máte výsledky, které jsou menší než 3 směrodatné odchylky pod průměrem. 174 00:09:25,810 --> 00:09:27,480 Tento okraj zde. 175 00:09:27,480 --> 00:09:33,200 Říká nám to, že méně než 3 směrodatné odchylky pod průměrem 176 00:09:33,200 --> 00:09:36,710 a více než 3 směrodatné odchylky nad průměrem 177 00:09:36,710 --> 00:09:38,850 musí být dohromady zbytek. 178 00:09:38,850 --> 00:09:46,530 Zbytek tvoří pouze 0,3 %. 179 00:09:46,530 --> 00:09:48,250 A tyto 2 strany jsou symetrické. 180 00:09:48,250 --> 00:09:49,620 Budou si tedy rovny. 181 00:09:49,620 --> 00:09:54,510 Tato zde musí být polovinou tohoto, tedy 0,15 % 182 00:09:54,510 --> 00:09:59,160 a zde bude také 0,15 %. 183 00:09:59,160 --> 00:10:06,390 Pravděpodobnost, že v USA bude 1-letá holčička s více než 12,8 kilogramy, 184 00:10:06,390 --> 00:10:10,500 pokud předpokládáte perfektní normální rozdělení plochy pod touto křivkou, 185 00:10:10,500 --> 00:10:14,260 tak je to plocha větší než 3 směrodatné odchylky nad průměrem. 186 00:10:14,260 --> 00:10:21,590 A to je 0,15 %. 187 00:10:21,590 --> 00:10:24,410 Doufám, že jste to shledali užitečným.