WEBVTT 00:00:00.560 --> 00:00:03.960 Pojďme vyřešit další příklad na normální rozdělení 00:00:03.960 --> 00:00:10.020 ze sekce ck12.org AP statistické knihy. 00:00:10.020 --> 00:00:14.000 Používám ji, protože je to otevřený zdroj a je to docela dobrá kniha. 00:00:14.000 --> 00:00:16.415 Příklady jsou pro naše procvičování dobré. 00:00:16.415 --> 00:00:18.940 Podívejte, číslo 3. 00:00:18.940 --> 00:00:21.690 Můžete jít na jejich web a stáhnout si tuto knihu. 00:00:21.690 --> 00:00:26.810 Předpokládejte, že průměrná váha 1-letých dívek má v USA normálního rozdělení... 00:00:26.810 --> 00:00:32.140 ... nebo je normálně rozdělena s průměrem okolo 9,5 gramů. 00:00:32.140 --> 00:00:33.820 Měly by to být kilogramy. 00:00:33.820 --> 00:00:38.530 Mám 10 měsíčního syna a ten váží okolo 9 kilogramů 00:00:38.530 --> 00:00:39.570 a ne 9,5 gramů. 00:00:39.570 --> 00:00:41.040 9,5 gramu je nic. 00:00:41.040 --> 00:00:43.780 Vypadá to, jako by se zde hovořilo o myších. 00:00:43.780 --> 00:00:44.940 Toto musí být kilogramy. 00:00:44.940 --> 00:00:50.940 Je to o 9,5 kilogramech se směrodatnou odchylkou přibližně 1,1 gram. 00:00:50.940 --> 00:00:56.220 Takže průměr je roven 9,5 kilogramů, předpokládám, 00:00:56.220 --> 00:01:01.130 a směrodatná odchylka je rovna 1,1 kilogramů. 00:01:01.130 --> 00:01:04.840 Bez použití kalkulačky... ... je to zajímavé vodítko... 00:01:04.840 --> 00:01:10.020 Odhadněte procento 1-letých dívek v USA, které splňují následující podmínky. 00:01:10.020 --> 00:01:14.310 Když říkají, že to máme odhadnout bez kalkulačky, tak je to velká nápověda, 00:01:14.310 --> 00:01:20.040 abychom použili empirické pravidlo. 00:01:20.040 --> 00:01:27.320 Empirické pravidlo, kterému se občas říká pravidlo 68-95-99,7. 00:01:27.320 --> 00:01:29.960 A pokud si vzpomínáte, tak toto je jméno pravidla, 00:01:29.960 --> 00:01:31.500 jakým si ho zapamatujete. 00:01:31.500 --> 00:01:33.830 Co nám to říká, pokud máme normální rozdělení... 00:01:33.830 --> 00:01:36.940 Nejprve to zde trochu shrnu, než se ponoříme do příkladu. 00:01:36.940 --> 00:01:38.640 Pokud máme normální rozdělení... 00:01:38.640 --> 00:01:40.380 ... nakreslím normální rozdělení. 00:01:40.380 --> 00:01:42.900 Vypadá to takto. 00:01:42.900 --> 00:01:44.240 Toto je normální rozdělení. 00:01:44.240 --> 00:01:46.060 Není to perfektně, ale představu máte. 00:01:46.060 --> 00:01:47.560 Mělo by to být symetrické. 00:01:47.560 --> 00:01:50.840 Zde je náš průměr. 00:01:50.840 --> 00:01:54.230 Pokud bychom šli 1 směrodatnou odchylku nad průměr 00:01:54.230 --> 00:01:57.440 a 1 směrodatnou odchylku pod průměr, 00:01:57.440 --> 00:02:01.780 tak je to náš průměr plus 1 směrodatná odchylka. 00:02:01.780 --> 00:02:05.730 Toto je náš průměr minus 1 směrodatná odchylka. 00:02:05.730 --> 00:02:07.890 Pravděpodobnost nalezení výsledků, 00:02:07.890 --> 00:02:10.420 pokud se zabýváme perfektním normálním rozdělením, 00:02:10.420 --> 00:02:13.170 je mezi 1 směrodatnou odchylkou pod průměrem 00:02:13.170 --> 00:02:15.720 a 1 směrodatnou odchylkou nad průměrem... 00:02:15.720 --> 00:02:22.910 ... tak by to byla tato plocha, což by bylo zhruba 68 %. 00:02:22.910 --> 00:02:27.610 68 % šance, že získáte něco uvnitř 1 směrodatné odchylky od průměru. 00:02:27.610 --> 00:02:31.460 Buď směrodatnou odchylku pod nebo nad nebo kdekoliv mezi. 00:02:31.460 --> 00:02:34.710 Pokud se bavíme o 2 směrodatných odchylkách okolo průměru... 00:02:34.710 --> 00:02:38.370 Pokud půjdeme dolů o další směrodatnou odchylku 00:02:38.370 --> 00:02:41.020 a o další směrodatnou odchylku nahoru od průměru... 00:02:41.020 --> 00:02:42.180 A zeptáme se sami sebe, 00:02:42.180 --> 00:02:47.360 jaká je pravděpodobnost nalezení něčeho v tomto rámci, 00:02:47.360 --> 00:02:50.740 tak byste to mohli odhadnout na 95 %. 00:02:50.740 --> 00:02:53.060 A zahrnuje to tuto plochu zde. 00:02:53.060 --> 00:02:56.300 68 % je podmnožinou těchto 95 %. 00:02:56.300 --> 00:02:58.040 A myslím, že víte, kam to povede. 00:02:58.040 --> 00:03:02.520 Pokud půjdeme 3 směrodatné odchylky pod průměr a nad průměr, 00:03:02.520 --> 00:03:07.320 tak nám pravidlo 68-95-99,7 říká, 00:03:07.320 --> 00:03:16.950 že existuje 99,7 % šance, že nalezneme výsledek normálního rozdělení, 00:03:16.950 --> 00:03:20.110 v rozsahu 3 směrodatných odchylek od průměru. 00:03:20.110 --> 00:03:23.230 Tedy nad 3 směrodatnými odchylkami pod průměrem 00:03:23.230 --> 00:03:26.030 a pod 3 směrodatnými odchylkami nad průměrem. 00:03:26.030 --> 00:03:27.870 Toto nám říká empirické pravidlo. 00:03:27.870 --> 00:03:30.790 Nyní se podívejme, zda to můžeme aplikovat na tento příklad. 00:03:30.790 --> 00:03:33.140 Dali nám průměr a směrodatnou odchylku. 00:03:33.140 --> 00:03:34.550 Nakreslím to. 00:03:34.550 --> 00:03:38.550 Nejprve nakreslím osu nejlépe, jak umím. 00:03:38.550 --> 00:03:39.600 Toto je má osa. 00:03:39.600 --> 00:03:45.930 Nakreslím zvonkovitou křivku. 00:03:45.930 --> 00:03:48.140 Ta zvonkovitá křivka je tak dobrá, 00:03:48.140 --> 00:03:50.920 jak ji jen můžete očekávat kreslením od ruky. 00:03:50.920 --> 00:03:53.920 A průměr zde je 9... ... toto by mělo být symetrické. 00:03:53.920 --> 00:03:56.070 Tato výška by měla být stejná, jako tato zde. 00:03:56.070 --> 00:03:57.600 Myslím, že máte představu. 00:03:57.600 --> 00:03:59.260 Nejsem počítač. 00:03:59.260 --> 00:04:01.990 9,5 je průměr. 00:04:01.990 --> 00:04:03.250 Nechci psát jednotky. 00:04:03.250 --> 00:04:04.640 Všechny jsou v kilogramech. 00:04:04.640 --> 00:04:11.540 1 směrodatná odchylka nad průměrem... ... měli bychom přičíst 1,1 k tomuto, 00:04:11.540 --> 00:04:14.090 protože nám říkají, že směrodatná odchylka je 1,1. 00:04:14.090 --> 00:04:16.590 Takže to bude 10,6. 00:04:16.590 --> 00:04:19.450 Nakreslím zde tečkovanou čáru... 00:04:19.450 --> 00:04:23.700 1 směrodatná odchylka pod průměrem... 00:04:23.700 --> 00:04:34.110 ... odečteme 1,1 od 9,5 a to by mělo být 8,4. 00:04:34.110 --> 00:04:37.620 Pokud bychom šli 2 směrodatné odchylky nad průměr, 00:04:37.620 --> 00:04:40.160 tak bychom přičetli další směrodatnou odchylku. 00:04:40.160 --> 00:04:42.730 Šli jsme 1 směrodatnou odchylku, 2 směrodatné odchylky. 00:04:42.730 --> 00:04:44.435 To by nám dalo 11,7. 00:04:44.435 --> 00:04:48.910 A pokud bychom šli 3 směrodatné odchylky, tak bychom opět přičetli 1,1. 00:04:48.910 --> 00:04:50.720 Dostali bychom 12,8. 00:04:50.720 --> 00:04:52.470 Když to uděláme na opačné straně, 00:04:52.470 --> 00:04:55.380 tak 1 směrodatná odchylka pod průměrem je 8,4. 00:04:55.380 --> 00:04:57.570 2 směrodatné odchylky pod průměrem... 00:04:57.570 --> 00:05:00.610 ... znovu odečíst 1,1... a bude to 7,3. 00:05:00.610 --> 00:05:03.380 A pak 3 směrodatné odchylky pod průměrem... 00:05:03.380 --> 00:05:07.010 ... což bychom napsali zde... ... by byly 6,2 kilogramů. 00:05:07.010 --> 00:05:08.800 Toto je vyznačení našeho příkladu. 00:05:08.800 --> 00:05:13.080 Jaká je pravděpodobnost, že bychom našli 1-letou dívku v USA, 00:05:13.080 --> 00:05:17.360 která váží méně než 8,4 kilogramů? 00:05:17.360 --> 00:05:21.640 Nebo bych měl říct, s hmotností menší než 8,4 kilogramů. 00:05:21.640 --> 00:05:25.150 Pokud se podíváme sem, tak pravděpodobnost nalezení miminka 00:05:25.150 --> 00:05:27.070 nebo holčičky, která má 1 rok 00:05:27.070 --> 00:05:30.290 a hmotnost nebo váhu menší než 8,4 kilogramů, 00:05:30.290 --> 00:05:31.610 tak je to tato plocha. 00:05:31.610 --> 00:05:35.070 Říkám hmotnost, protože kilogramy jsou jednotky hmotnosti. 00:05:35.070 --> 00:05:36.940 Hodně lidí používá váhu. 00:05:36.940 --> 00:05:38.470 Je to tato plocha. 00:05:38.470 --> 00:05:40.210 Jak můžeme zjistit tuto plochu 00:05:40.210 --> 00:05:43.900 pod tímto normálním rozdělením s použitím empirického pravidla? 00:05:43.900 --> 00:05:47.280 Známe tuto plochu. 00:05:47.280 --> 00:05:52.210 Známe tuto plochu mezi minus 1 směrodatnou odchylkou 00:05:52.210 --> 00:05:54.500 a plus 1 směrodatnou odchylkou. 00:05:54.500 --> 00:05:58.230 Víme, že je to 68 %. 00:05:58.230 --> 00:06:03.100 Pokud je to 68 %, tak to znamená, že v části, která není uprostřed, 00:06:03.100 --> 00:06:04.360 je hodnota plochy 32 %. 00:06:04.360 --> 00:06:09.240 Protože plocha pod celým normálním rozdělením je 100 nebo 100 % nebo 1, 00:06:09.240 --> 00:06:11.610 v závislosti na tom, jak o tom chcete přemýšlet. 00:06:11.610 --> 00:06:13.460 Protože nemůžete mít... 00:06:13.460 --> 00:06:17.600 Všechny možné kombinace mohou vést pouze k 1. 00:06:17.600 --> 00:06:21.480 Nemůžete mít více než 100 %. 00:06:21.480 --> 00:06:24.540 Pokud sečtete tento úsek a tento úsek... 00:06:24.540 --> 00:06:29.490 ... tedy toto plus toto bude zbytek. 00:06:29.490 --> 00:06:32.590 100 minus 68 je 32. 00:06:32.590 --> 00:06:33.920 32 % 00:06:33.920 --> 00:06:39.010 32 % je pokud sečtete tuto levou stranu a tuto pravou stranu. 00:06:39.010 --> 00:06:40.990 A toto je perfektní normální rozdělení. 00:06:40.990 --> 00:06:42.975 Řekli nám, že je to normální rozdělení. 00:06:42.975 --> 00:06:44.780 Budou perfektně symetrické. 00:06:44.780 --> 00:06:47.810 Pokud tuto stranu a tuto stranu přičteme k 32, 00:06:47.810 --> 00:06:51.310 ale obojí jsou symetrické, což znamená, že mají stejnou plochu, 00:06:51.310 --> 00:06:57.910 pak tato strana... udělám ji růžově... ... vypadá spíš jako fialová... 00:06:57.910 --> 00:07:00.020 ... pak tato strana by byla 16 %. 00:07:00.020 --> 00:07:02.700 A tato strana zde bude 16 %. 00:07:02.700 --> 00:07:07.010 Takže pravděpodobnost , že dostanete více než 1 směrodatnou odchylku nad průměrem... 00:07:07.010 --> 00:07:09.540 ... tato pravá strana bude 16 %. 00:07:09.540 --> 00:07:12.180 Nebo pravděpodobnost, že budeme mít výsledek menší 00:07:12.180 --> 00:07:16.800 než 1 směrodatnou odchylku pod průměrem, by byla tato... 16 %. 00:07:16.800 --> 00:07:18.400 Chtějí znát pravděpodobnost, 00:07:18.400 --> 00:07:23.140 že budeme mít 1-leté dítě vážící méně než 8,4 kilogramů. 00:07:23.140 --> 00:07:27.970 Méně než 8,4 kilogramů je v této oblasti. 00:07:27.970 --> 00:07:29.500 A to je 16 %. 00:07:29.500 --> 00:07:33.270 16 % je odpověď pro část (a). 00:07:33.270 --> 00:07:38.040 Udělejme část (b): mezi 7,3 a 11,7 kilogramy. 00:07:38.040 --> 00:07:40.820 Mezi 7,3... to je někde tady. 00:07:40.820 --> 00:07:43.850 Jsou to 2 směrodatné odchylky pod průměrem... 00:07:43.850 --> 00:07:48.920 ... a 11,7 jsou 2 směrodatné odchylky nad průměrem. 00:07:48.920 --> 00:07:51.260 V podstatě se nás ptají, jaká je pravděpodobnost, 00:07:51.260 --> 00:07:55.230 že dostaneme výsledek uvnitř 2 směrodatných odchylek od průměru. 00:07:55.230 --> 00:07:57.040 Zde je průměr. 00:07:57.040 --> 00:08:00.030 Toto jsou 2 směrodatné odchylky pod. 00:08:00.030 --> 00:08:02.630 Toto jsou 2 směrodatné odchylky nad. 00:08:02.630 --> 00:08:04.130 Je to hezky přímočaré. 00:08:04.130 --> 00:08:05.690 Empirické pravidlo nám říká, 00:08:05.690 --> 00:08:14.820 že mezi 2 směrodatnými odchylkami máme 95 % šanci, že získáme žádaný výsledek. 00:08:14.820 --> 00:08:17.740 Takže nám empirické pravidlo dává odpověď. 00:08:17.740 --> 00:08:19.290 A nakonec část (c): 00:08:19.290 --> 00:08:25.510 Pravděpodobnost, že 1-letá holčička z USA bude mít více než 12,8 kilogramů. 00:08:25.510 --> 00:08:29.460 12,8 kilogramů jsou 3 směrodatné odchylky nad průměrem. 00:08:29.460 --> 00:08:32.160 Chceme tedy znát pravděpodobnost, že budeme mít výsledek 00:08:32.160 --> 00:08:36.250 vyšší než 3 směrodatné odchylky nad průměrem. 00:08:36.250 --> 00:08:41.920 Je to tato oblast, kterou jsem zakreslil oranžově. 00:08:41.920 --> 00:08:45.290 Možná bych měl použít jinou barvu kvůli kontrastu. 00:08:45.290 --> 00:08:48.575 Je to tato malá oblast. 00:08:48.575 --> 00:08:50.690 Jaká je pravděpodobnost? 00:08:50.690 --> 00:08:53.420 Vraťme se zpět k empirickému pravidlu. 00:08:53.420 --> 00:08:56.230 Známe pravděpodobnost... ... známe tuto plochu. 00:08:56.230 --> 00:08:59.270 Známe plochu mezi -3 směrodatnými odchylkami 00:08:59.270 --> 00:09:01.670 a +3 směrodatnými odchylkami. 00:09:01.670 --> 00:09:04.440 Známe toto... vzhledem k tomu, že je to poslední příklad, 00:09:04.440 --> 00:09:05.910 můžu celou oblast obarvit... 00:09:05.910 --> 00:09:14.300 Víme, že tato oblast mezi -3 a +3 směrodatnými odchylkami je 99,7 %. 00:09:14.300 --> 00:09:16.830 Velký objem výsledků spadá pod toto. 00:09:16.830 --> 00:09:18.130 Myslím tím skoro všechny. 00:09:18.130 --> 00:09:21.090 Co tedy zbývá na tyto 2 okraje? 00:09:21.090 --> 00:09:22.180 Toto je 1 z okrajů. 00:09:22.180 --> 00:09:25.810 Pak máte výsledky, které jsou menší než 3 směrodatné odchylky pod průměrem. 00:09:25.810 --> 00:09:27.480 Tento okraj zde. 00:09:27.480 --> 00:09:33.200 Říká nám to, že méně než 3 směrodatné odchylky pod průměrem 00:09:33.200 --> 00:09:36.710 a více než 3 směrodatné odchylky nad průměrem 00:09:36.710 --> 00:09:38.850 musí být dohromady zbytek. 00:09:38.850 --> 00:09:46.530 Zbytek tvoří pouze 0,3 %. 00:09:46.530 --> 00:09:48.250 A tyto 2 strany jsou symetrické. 00:09:48.250 --> 00:09:49.620 Budou si tedy rovny. 00:09:49.620 --> 00:09:54.510 Tato zde musí být polovinou tohoto, tedy 0,15 % 00:09:54.510 --> 00:09:59.160 a zde bude také 0,15 %. 00:09:59.160 --> 00:10:06.390 Pravděpodobnost, že v USA bude 1-letá holčička s více než 12,8 kilogramy, 00:10:06.390 --> 00:10:10.500 pokud předpokládáte perfektní normální rozdělení plochy pod touto křivkou, 00:10:10.500 --> 00:10:14.260 tak je to plocha větší než 3 směrodatné odchylky nad průměrem. 00:10:14.260 --> 00:10:21.590 A to je 0,15 %. 00:10:21.590 --> 00:10:24.410 Doufám, že jste to shledali užitečným.