Нека решим още една задача от раздела
за нормално разпределение
от учебника по статистика AP на ck12.org.
Използвам техните материали,
защото това е свободен
източник и е доста добър учебник.
Мисля, че тези задачи
са добро упражнение за нас.
Да видим задача 3.
Можеш да посетиш сайта им,
и мисля, че можеш
да си изтеглиш учебника.
Да допуснем, че теглото на 1-годишните
момичета в Съединените щати
е нормално разпределено
и има медиана около 9,5 грама...
Това трябва да са килограми!
Имам 10-месечен син, който
тежи около 20 фунта,
което са около 9 килограма,
а не 9,5 грама.
9,5 грама са нищо.
Все едно говорим за мишка.
Това трябва да са килограми.
Както и да е, около 9,5 килограма,
със стандартно отклонение
от около 1,1 грама.
Значи медианата е равна на
9,5 килограма, предполагам,
и стандартното отклонение
е равно на 1,1 грама.
Без да използваш калкулатор –
това е интересна подсказка –
намери процента на 1-годишните
момичета в Съединените щати,
които отговарят на следните условия...
Когато ни казват, че трябва
да намерим приблизителен отговор
без калкулатор, това е голяма
подсказка, че трябва
да използваме емпиричното правило.
Емпиричното правило се нарича
също правилото 68-95-99,7.
И ако запомниш, че това е
името на правилото,
вече си запомнил/а и самото правило.
То ни казва, че ако имаме
нормално разпределение –
тук ще преговоря малко, преди
да започнем да решаваме.
Ако имаме нормално разпределение –
ще начертая нормално разпределение.
То изглежда така.
Това ми е нормалното разпределение.
Не го направих идеално,
но разбираш за какво говоря.
Трябва да е симетрично.
Това тук ни е медианата.
Това е медианата.
Сега отиваме с едно стандартно отклонение
над и с едно стандартно
отклонение под медианата,
значи това ни е
медианата плюс
едно стандартно отклонение.
Това ни е медианата минус
едно стандартно отклонение.
Вероятността да намерим отговор,
ако работим с
идеално нормално разпределение,
който е между едно стандартно
отклонение под медианата и едно
стандартно отклонение над медианата –
това е ето тази площ –
ще е 68%.
Имаме 68% шанс да открием
нещо в рамките на
едно стандартно отклонение
от медианата.
Едно стандартно отклонение
под или над медианата,
или където и да е между
тези две точки.
Сега, ако говорим за две стандартни
отклонения от медианата...
Тоест, ако се преместим
с още едно стандартно
отклонение в едната
или другата посока...
ако си зададем въпроса
каква е вероятността да намерим
нещо в този интервал,
можем да познаем,
че става въпрос за 95%.
И това включва и площта
по средата.
Тези 68% са част от 95-те %.
Мисля, че разбираш какво става.
Ако отидем три стандартни
отклонения под медианата и
над медианата, емпиричното правило
или правилото 68-95-99,7
ни казва, че има вероятност
99,7% да намерим резултат
в нормално разпределение, който
е в рамките на три стандартни
отклонения от медианата.
Над три стандартни отклонения
под медианата
и под три стандартни отклонения
над медианата.
Това ни казва емпиричното правило.
Да видим дали можем
да приложим това към задачата ни.
Дали са ни медианата
и стандартното отклонение.
Нека начертая това.
Ще начертая оста първо,
възможно най-добре.
Това ми е оста.
Чертая камбановидната крива.
Това е възможно най-хубавата крива,
която може да се направи на ръка.
И медианата тук е 9, това
трябва да е симетрично.
Тази височина трябва
да е същата като тази.
Мисля, че разбираш –
аз не съм компютър.
Медианата е 9,5.
Няма да записвам
мерните единици.
Всичко е в килограми.
Едно стандартно отклонение
над медианата ще добави 1,1 към
това, защото ни казват,
че стандартното отклонение е 1,1.
Това ще бъде 10,6.
Нека направя една
пунктирана линия.
Ако отидем с 1 стандартно отклонение
под медианата, ще извадим
1,1 от 9,5 и това ще стане 8,4.
Ако отидем с две стандартни
отклонения над медианата,
ще добавим още едно
стандартно отклонение тук.
Нали?
Преместихме се с 1, 2
стандартни отклонения.
Тогава ще достигнем 11,7.
И ако се преместим с
3 стандартни отклонения,
пак ще добавим 1,1.
И ще сме на 12,8.
Ще го направя от другата страна,
едно стандартно отклонение
под медианата е 8,4.
Две стандартни отклонения
под медианата – вадим 1,1 пак
и получаваме 7,3.
И после – три стандартни
отклонения под медианата –
ще запишем тук 6,2 килограма.
Това ни е подготовката
за задачата.
Търсим каква е вероятността
да намерим 1-годишно момиче
в Съединените щати, което тежи
по-малко от 8,4 килограма.
Или, по-добре да кажа,
чиято маса ще е
по-малка от 8,4 килограма.
Ако погледнем тук,
вероятността да намерим
1-годишно момиченце с маса
по-малко от 8,4 килограма
е ето тази площ тук.
Казах маса, защото килограмите всъщност
са единица за измерване на маса.
Повечето хора я използват
и за тегло.
Така, ето тази площ.
Как можем да намерим
тази площ под
това нормално разпределение,
като използваме емпиричното правило?
Ние знаем колко
е тази площ.
Знаем, че площта между минус едно
стандартно отклонение
и плюс едно стандартно
отклонение е 68%.
И ако това е 68%, това означава,
че частите, които
не са в средната площ, са по 32%.
Защото площта под цялото
нормално разпределение е
100% – или 1, зависи
как го разглеждаш.
Сборът от всички вероятности
винаги е 1.
Не може да имаме повече
от 100% тук.
Ако съберем тази и тази част,
ще получим остатъка.
Така 100 минус 68 прави 32.
32%.
32% – това се получава,
като съберем лявата
и дясната част тук.
И това е идеално нормално
разпределение.
Казаха ни, че имаме
нормално разпределение.
Значи симетрията е идеална.
Ако сборът на тази част
и на тази част е 32 и те са
симетрични, тоест имат
еднаква площ, тогава
тази част тук –
ще я направя в розово...
повече прилича на лилаво –
ще е 16%.
И ето тази част ще е 16%.
Значи вероятността да получим резултат,
по-голям от едно стандартно
отклонение над медианата –
ето тази, дясна част,
ще бъде 16%.
Или, вероятността да получим резултат,
който е с по-малко от едно
стандартно отклонение
под медианата, ето тук, е 16%.
Търсим вероятността
да имаме 1-годишно момиче,
което тежи по-малко
от 8,4 килограма.
По-малко от 8,4 килограма –
това е площта ето тук.
И това са 16%.
Имаме 16% за подточка а).
Да решим и част b:
между 7,3 и 11,7 килограма.
Така, между 7,3 – това е ето тук.
Това са две стандартни
отклонения под медианата.
И 11,7 – едно, две стандартни
отклонения над медианата.
Значи всъщност ни питат
каква е вероятността
да получим резултат, който е
до две стандартни отклонения
от медианата, нали?
Това ни е медианата.
Това са две стандартни
отклонения под нея.
А това са две стандартни
отклонения над нея.
Това е доста ясно.
Емпиричното правило ни казва, че
между две стандартни отклонения
имаме шанс 95%
да получим резултат, който е
в рамките на две
стандартни отклонения.
Значи емпиричното правило само по себе си
ни дава този отговор.
И накрая, да решим подточка с:
Каква е вероятността да имаме
1-годишно момиче, което тежи
повече от 12,8 килограма?
12,8 килограма са
три стандартни отклонения
над медианата.
Значи търсим вероятността
да имаме резултат,
който е повече от три
отклонения над медианата.
Това е ето тази отдалечена площ,
която направих в оранжево.
Може би трябва
да я направя в друг цвят,
за повече контраст.
Става въпрос за тази
мъничка площ тук.
Каква е тази вероятност?
Нека се върнем към
емпиричното ни правило.
Знаем вероятността –
знаем тази площ.
Това е площта между минус три
стандартни отклонения и
плюс три стандартни отклонения.
Това ни е последната задача,
така че мога
да оцветя всичко –
знаем, че площта между
минус 3 и плюс 3 е 99,7%.
Знаем, че почти всички резултати
попадат в тази площ,
макар и не всички.
Значи какво ни е останало
за двете опашки?
Запомни, че имаме две опашки.
Това е едната от тях.
После имаме резултатите, които
са на по-малко от три
стандартни отклонения
под медианата.
Ето тази опашка.
Това означава, че по-малко от
3 стандартни отклонения
под медианата и повече от
3 стандартни отклонения
над медианата, взети заедно,
дават остатъка.
А за остатъка имаме само 0,3%.
Тези две неща са симетрични.
Значи са еднакви.
Значи това трябва да е
половината на това или 0,15%,
и това тyк също е 0,15%.
Значи вероятността да имаме
1-годишно момиче в Съединените щати,
което тежи повече от
12,8 килограма, при
идеално нормално разпределение,
е площта под тази крива,
площта, която е на повече от
три стандартни отклонения
под медианата.
И това са 0,15%.
Надявам се тази задача
да ти е била полезна.