WEBVTT 00:00:00.610 --> 00:00:04.100 Нека решим още една задача от раздела за нормално разпределение 00:00:04.100 --> 00:00:10.120 от учебника по статистика AP на ck12.org. 00:00:10.120 --> 00:00:11.770 Използвам техните материали, защото това е свободен 00:00:11.770 --> 00:00:13.990 източник и е доста добър учебник. 00:00:13.990 --> 00:00:16.475 Мисля, че тези задачи са добро упражнение за нас. 00:00:16.475 --> 00:00:19.070 Да видим задача 3. 00:00:19.070 --> 00:00:20.390 Можеш да посетиш сайта им, 00:00:20.390 --> 00:00:21.690 и мисля, че можеш да си изтеглиш учебника. 00:00:21.690 --> 00:00:26.180 Да допуснем, че теглото на 1-годишните момичета в Съединените щати 00:00:26.180 --> 00:00:32.280 е нормално разпределено и има медиана около 9,5 грама... 00:00:32.330 --> 00:00:33.820 Това трябва да са килограми! 00:00:33.820 --> 00:00:35.930 Имам 10-месечен син, който тежи около 20 фунта, 00:00:35.930 --> 00:00:39.570 което са около 9 килограма, а не 9,5 грама. 00:00:39.570 --> 00:00:41.040 9,5 грама са нищо. 00:00:41.040 --> 00:00:43.900 Все едно говорим за мишка. 00:00:43.900 --> 00:00:44.940 Това трябва да са килограми. 00:00:44.940 --> 00:00:47.350 Както и да е, около 9,5 килограма, 00:00:47.350 --> 00:00:51.050 със стандартно отклонение от около 1,1 грама. 00:00:51.050 --> 00:00:56.400 Значи медианата е равна на 9,5 килограма, предполагам, 00:00:56.400 --> 00:01:01.130 и стандартното отклонение е равно на 1,1 грама. 00:01:01.130 --> 00:01:04.840 Без да използваш калкулатор – това е интересна подсказка – 00:01:04.840 --> 00:01:08.950 намери процента на 1-годишните момичета в Съединените щати, 00:01:08.950 --> 00:01:09.995 които отговарят на следните условия... 00:01:09.995 --> 00:01:12.910 Когато ни казват, че трябва да намерим приблизителен отговор 00:01:12.910 --> 00:01:15.250 без калкулатор, това е голяма подсказка, че трябва 00:01:15.250 --> 00:01:20.030 да използваме емпиричното правило. 00:01:20.040 --> 00:01:27.480 Емпиричното правило се нарича също правилото 68-95-99,7. 00:01:27.480 --> 00:01:29.960 И ако запомниш, че това е името на правилото, 00:01:29.960 --> 00:01:31.500 вече си запомнил/а и самото правило. 00:01:31.500 --> 00:01:33.520 То ни казва, че ако имаме нормално разпределение – 00:01:33.520 --> 00:01:35.800 тук ще преговоря малко, преди 00:01:35.800 --> 00:01:36.750 да започнем да решаваме. 00:01:36.750 --> 00:01:39.203 Ако имаме нормално разпределение – 00:01:39.236 --> 00:01:40.480 ще начертая нормално разпределение. 00:01:40.480 --> 00:01:42.900 То изглежда така. 00:01:42.900 --> 00:01:44.240 Това ми е нормалното разпределение. 00:01:44.240 --> 00:01:45.940 Не го направих идеално, но разбираш за какво говоря. 00:01:45.940 --> 00:01:47.560 Трябва да е симетрично. 00:01:47.560 --> 00:01:49.980 Това тук ни е медианата. 00:01:49.980 --> 00:01:50.840 Това е медианата. 00:01:50.840 --> 00:01:54.810 Сега отиваме с едно стандартно отклонение над и с едно стандартно 00:01:54.810 --> 00:02:00.350 отклонение под медианата, значи това ни е 00:02:00.350 --> 00:02:01.780 медианата плюс едно стандартно отклонение. 00:02:01.780 --> 00:02:05.730 Това ни е медианата минус едно стандартно отклонение. 00:02:05.730 --> 00:02:08.710 Вероятността да намерим отговор, ако работим с 00:02:08.710 --> 00:02:12.080 идеално нормално разпределение, който е между едно стандартно 00:02:12.080 --> 00:02:15.350 отклонение под медианата и едно стандартно отклонение над медианата – 00:02:15.350 --> 00:02:18.390 това е ето тази площ – 00:02:18.390 --> 00:02:23.040 ще е 68%. 00:02:23.040 --> 00:02:26.170 Имаме 68% шанс да открием нещо в рамките на 00:02:26.170 --> 00:02:27.750 едно стандартно отклонение от медианата. 00:02:27.750 --> 00:02:30.140 Едно стандартно отклонение под или над медианата, 00:02:30.140 --> 00:02:31.450 или където и да е между тези две точки. 00:02:31.450 --> 00:02:34.920 Сега, ако говорим за две стандартни отклонения от медианата... 00:02:34.920 --> 00:02:36.800 Тоест, ако се преместим с още едно стандартно 00:02:36.800 --> 00:02:41.090 отклонение в едната или другата посока... 00:02:41.090 --> 00:02:43.190 ако си зададем въпроса каква е вероятността да намерим 00:02:43.190 --> 00:02:47.360 нещо в този интервал, можем да познаем, 00:02:47.360 --> 00:02:50.740 че става въпрос за 95%. 00:02:50.740 --> 00:02:53.060 И това включва и площта по средата. 00:02:53.060 --> 00:02:56.510 Тези 68% са част от 95-те %. 00:02:56.510 --> 00:02:58.140 Мисля, че разбираш какво става. 00:02:58.140 --> 00:03:01.360 Ако отидем три стандартни отклонения под медианата и 00:03:01.360 --> 00:03:06.820 над медианата, емпиричното правило или правилото 68-95-99,7 00:03:06.820 --> 00:03:15.740 ни казва, че има вероятност 99,7% да намерим резултат 00:03:15.740 --> 00:03:19.120 в нормално разпределение, който е в рамките на три стандартни 00:03:19.120 --> 00:03:20.110 отклонения от медианата. 00:03:20.110 --> 00:03:23.230 Над три стандартни отклонения под медианата 00:03:23.230 --> 00:03:26.030 и под три стандартни отклонения над медианата. 00:03:26.030 --> 00:03:27.870 Това ни казва емпиричното правило. 00:03:27.870 --> 00:03:30.960 Да видим дали можем да приложим това към задачата ни. 00:03:30.960 --> 00:03:33.140 Дали са ни медианата и стандартното отклонение. 00:03:33.140 --> 00:03:34.550 Нека начертая това. 00:03:34.550 --> 00:03:38.550 Ще начертая оста първо, възможно най-добре. 00:03:38.550 --> 00:03:39.600 Това ми е оста. 00:03:39.600 --> 00:03:45.750 Чертая камбановидната крива. 00:03:45.920 --> 00:03:49.090 Това е възможно най-хубавата крива, 00:03:49.090 --> 00:03:50.920 която може да се направи на ръка. 00:03:50.920 --> 00:03:54.140 И медианата тук е 9, това трябва да е симетрично. 00:03:54.140 --> 00:03:55.710 Тази височина трябва да е същата като тази. 00:03:55.710 --> 00:03:57.600 Мисля, че разбираш – 00:03:57.600 --> 00:03:59.260 аз не съм компютър. 00:03:59.260 --> 00:04:02.390 Медианата е 9,5. 00:04:02.390 --> 00:04:03.370 Няма да записвам мерните единици. 00:04:03.370 --> 00:04:04.580 Всичко е в килограми. 00:04:04.580 --> 00:04:11.330 Едно стандартно отклонение над медианата ще добави 1,1 към 00:04:11.330 --> 00:04:14.220 това, защото ни казват, че стандартното отклонение е 1,1. 00:04:14.220 --> 00:04:16.820 Това ще бъде 10,6. 00:04:16.820 --> 00:04:19.620 Нека направя една пунктирана линия. 00:04:19.620 --> 00:04:25.990 Ако отидем с 1 стандартно отклонение под медианата, ще извадим 00:04:25.990 --> 00:04:34.110 1,1 от 9,5 и това ще стане 8,4. 00:04:34.110 --> 00:04:37.620 Ако отидем с две стандартни отклонения над медианата, 00:04:37.620 --> 00:04:40.400 ще добавим още едно стандартно отклонение тук. 00:04:40.400 --> 00:04:40.610 Нали? 00:04:40.610 --> 00:04:41.890 Преместихме се с 1, 2 00:04:41.890 --> 00:04:42.700 стандартни отклонения. 00:04:42.700 --> 00:04:44.435 Тогава ще достигнем 11,7. 00:04:44.435 --> 00:04:47.040 И ако се преместим с 3 стандартни отклонения, 00:04:47.040 --> 00:04:48.910 пак ще добавим 1,1. 00:04:48.910 --> 00:04:50.720 И ще сме на 12,8. 00:04:50.720 --> 00:04:53.820 Ще го направя от другата страна, едно стандартно отклонение 00:04:53.820 --> 00:04:55.380 под медианата е 8,4. 00:04:55.380 --> 00:04:58.480 Две стандартни отклонения под медианата – вадим 1,1 пак 00:04:58.480 --> 00:05:00.910 и получаваме 7,3. 00:05:00.910 --> 00:05:03.380 И после – три стандартни отклонения под медианата – 00:05:03.380 --> 00:05:07.280 ще запишем тук 6,2 килограма. 00:05:07.280 --> 00:05:08.860 Това ни е подготовката за задачата. 00:05:08.860 --> 00:05:12.460 Търсим каква е вероятността да намерим 1-годишно момиче 00:05:12.460 --> 00:05:17.730 в Съединените щати, което тежи по-малко от 8,4 килограма. 00:05:17.730 --> 00:05:19.330 Или, по-добре да кажа, чиято маса ще е 00:05:19.330 --> 00:05:21.640 по-малка от 8,4 килограма. 00:05:21.640 --> 00:05:25.150 Ако погледнем тук, вероятността да намерим 00:05:25.150 --> 00:05:28.070 1-годишно момиченце с маса 00:05:28.070 --> 00:05:31.590 по-малко от 8,4 килограма е ето тази площ тук. 00:05:31.610 --> 00:05:35.070 Казах маса, защото килограмите всъщност са единица за измерване на маса. 00:05:35.070 --> 00:05:36.940 Повечето хора я използват и за тегло. 00:05:36.940 --> 00:05:38.470 Така, ето тази площ. 00:05:38.470 --> 00:05:40.950 Как можем да намерим тази площ под 00:05:40.950 --> 00:05:43.900 това нормално разпределение, като използваме емпиричното правило? 00:05:43.900 --> 00:05:47.280 Ние знаем колко е тази площ. 00:05:47.280 --> 00:05:52.370 Знаем, че площта между минус едно стандартно отклонение 00:05:52.370 --> 00:05:58.430 и плюс едно стандартно отклонение е 68%. 00:05:58.440 --> 00:06:01.720 И ако това е 68%, това означава, че частите, които 00:06:01.720 --> 00:06:04.360 не са в средната площ, са по 32%. 00:06:04.360 --> 00:06:07.110 Защото площта под цялото нормално разпределение е 00:06:07.110 --> 00:06:11.380 100% – или 1, зависи как го разглеждаш. 00:06:11.380 --> 00:06:17.840 Сборът от всички вероятности винаги е 1. 00:06:17.880 --> 00:06:21.480 Не може да имаме повече от 100% тук. 00:06:21.480 --> 00:06:27.270 Ако съберем тази и тази част, 00:06:27.270 --> 00:06:29.490 ще получим остатъка. 00:06:29.490 --> 00:06:32.590 Така 100 минус 68 прави 32. 00:06:32.590 --> 00:06:33.920 32%. 00:06:33.920 --> 00:06:37.820 32% – това се получава, като съберем лявата 00:06:37.820 --> 00:06:39.240 и дясната част тук. 00:06:39.240 --> 00:06:41.120 И това е идеално нормално разпределение. 00:06:41.120 --> 00:06:42.535 Казаха ни, че имаме нормално разпределение. 00:06:42.535 --> 00:06:44.780 Значи симетрията е идеална. 00:06:44.780 --> 00:06:48.730 Ако сборът на тази част и на тази част е 32 и те са 00:06:48.730 --> 00:06:51.820 симетрични, тоест имат еднаква площ, тогава 00:06:51.820 --> 00:06:56.490 тази част тук – ще я направя в розово... 00:06:56.490 --> 00:07:00.020 повече прилича на лилаво – ще е 16%. 00:07:00.020 --> 00:07:02.700 И ето тази част ще е 16%. 00:07:02.700 --> 00:07:05.900 Значи вероятността да получим резултат, по-голям от едно стандартно 00:07:05.900 --> 00:07:08.280 отклонение над медианата – ето тази, дясна част, 00:07:08.280 --> 00:07:09.760 ще бъде 16%. 00:07:09.760 --> 00:07:13.040 Или, вероятността да получим резултат, който е с по-малко от едно 00:07:13.040 --> 00:07:17.050 стандартно отклонение под медианата, ето тук, е 16%. 00:07:17.050 --> 00:07:20.560 Търсим вероятността да имаме 1-годишно момиче, 00:07:20.560 --> 00:07:23.140 което тежи по-малко от 8,4 килограма. 00:07:23.140 --> 00:07:27.970 По-малко от 8,4 килограма – това е площта ето тук. 00:07:27.970 --> 00:07:29.500 И това са 16%. 00:07:29.500 --> 00:07:33.270 Имаме 16% за подточка а). 00:07:33.270 --> 00:07:38.280 Да решим и част b: между 7,3 и 11,7 килограма. 00:07:38.280 --> 00:07:41.130 Така, между 7,3 – това е ето тук. 00:07:41.130 --> 00:07:44.330 Това са две стандартни отклонения под медианата. 00:07:44.330 --> 00:07:49.100 И 11,7 – едно, две стандартни отклонения над медианата. 00:07:49.100 --> 00:07:51.260 Значи всъщност ни питат каква е вероятността 00:07:51.260 --> 00:07:54.340 да получим резултат, който е до две стандартни отклонения 00:07:54.340 --> 00:07:55.230 от медианата, нали? 00:07:55.230 --> 00:07:57.040 Това ни е медианата. 00:07:57.040 --> 00:08:00.250 Това са две стандартни отклонения под нея. 00:08:00.250 --> 00:08:02.630 А това са две стандартни отклонения над нея. 00:08:02.630 --> 00:08:04.130 Това е доста ясно. 00:08:04.130 --> 00:08:07.490 Емпиричното правило ни казва, че между две стандартни отклонения 00:08:07.490 --> 00:08:13.370 имаме шанс 95% да получим резултат, който е 00:08:13.370 --> 00:08:15.140 в рамките на две стандартни отклонения. 00:08:15.140 --> 00:08:17.740 Значи емпиричното правило само по себе си ни дава този отговор. 00:08:17.740 --> 00:08:21.440 И накрая, да решим подточка с: Каква е вероятността да имаме 00:08:21.440 --> 00:08:25.510 1-годишно момиче, което тежи повече от 12,8 килограма? 00:08:25.510 --> 00:08:28.310 12,8 килограма са три стандартни отклонения 00:08:28.310 --> 00:08:29.770 над медианата. 00:08:29.770 --> 00:08:32.280 Значи търсим вероятността да имаме резултат, 00:08:32.280 --> 00:08:36.250 който е повече от три отклонения над медианата. 00:08:36.250 --> 00:08:42.170 Това е ето тази отдалечена площ, която направих в оранжево. 00:08:42.170 --> 00:08:44.310 Може би трябва да я направя в друг цвят, 00:08:44.310 --> 00:08:45.280 за повече контраст. 00:08:45.280 --> 00:08:48.575 Става въпрос за тази мъничка площ тук. 00:08:48.575 --> 00:08:51.020 Каква е тази вероятност? 00:08:51.020 --> 00:08:53.420 Нека се върнем към емпиричното ни правило. 00:08:53.420 --> 00:08:56.230 Знаем вероятността – знаем тази площ. 00:08:56.230 --> 00:08:59.740 Това е площта между минус три стандартни отклонения и 00:08:59.740 --> 00:09:01.960 плюс три стандартни отклонения. 00:09:01.960 --> 00:09:04.090 Това ни е последната задача, така че мога 00:09:04.090 --> 00:09:08.200 да оцветя всичко – знаем, че площта между 00:09:08.200 --> 00:09:14.300 минус 3 и плюс 3 е 99,7%. 00:09:14.300 --> 00:09:16.830 Знаем, че почти всички резултати 00:09:16.830 --> 00:09:17.940 попадат в тази площ, макар и не всички. 00:09:17.940 --> 00:09:20.320 Значи какво ни е останало за двете опашки? 00:09:20.320 --> 00:09:21.220 Запомни, че имаме две опашки. 00:09:21.220 --> 00:09:22.330 Това е едната от тях. 00:09:22.330 --> 00:09:24.630 После имаме резултатите, които са на по-малко от три 00:09:24.630 --> 00:09:25.730 стандартни отклонения под медианата. 00:09:25.730 --> 00:09:27.480 Ето тази опашка. 00:09:27.480 --> 00:09:32.640 Това означава, че по-малко от 3 стандартни отклонения 00:09:32.640 --> 00:09:35.280 под медианата и повече от 3 стандартни отклонения 00:09:35.280 --> 00:09:39.030 над медианата, взети заедно, дават остатъка. 00:09:39.040 --> 00:09:46.530 А за остатъка имаме само 0,3%. 00:09:46.530 --> 00:09:48.250 Тези две неща са симетрични. 00:09:48.250 --> 00:09:49.620 Значи са еднакви. 00:09:49.620 --> 00:09:54.880 Значи това трябва да е половината на това или 0,15%, 00:09:54.880 --> 00:09:59.160 и това тyк също е 0,15%. 00:09:59.160 --> 00:10:03.650 Значи вероятността да имаме 1-годишно момиче в Съединените щати, 00:10:03.650 --> 00:10:07.250 което тежи повече от 12,8 килограма, при 00:10:07.250 --> 00:10:10.490 идеално нормално разпределение, е площта под тази крива, 00:10:10.490 --> 00:10:13.040 площта, която е на повече от три стандартни отклонения 00:10:13.040 --> 00:10:14.250 под медианата. 00:10:14.250 --> 00:10:21.760 И това са 0,15%. 00:10:21.760 --> 00:10:24.410 Надявам се тази задача да ти е била полезна.