Нека решим още една задача от раздела за нормално разпределение от учебника по статистика AP на ck12.org. Използвам техните материали, защото това е свободен източник и е доста добър учебник. Мисля, че тези задачи са добро упражнение за нас. Да видим задача 3. Можеш да посетиш сайта им, и мисля, че можеш да си изтеглиш учебника. Да допуснем, че теглото на 1-годишните момичета в Съединените щати е нормално разпределено и има медиана около 9,5 грама... Това трябва да са килограми! Имам 10-месечен син, който тежи около 20 фунта, което са около 9 килограма, а не 9,5 грама. 9,5 грама са нищо. Все едно говорим за мишка. Това трябва да са килограми. Както и да е, около 9,5 килограма, със стандартно отклонение от около 1,1 грама. Значи медианата е равна на 9,5 килограма, предполагам, и стандартното отклонение е равно на 1,1 грама. Без да използваш калкулатор – това е интересна подсказка – намери процента на 1-годишните момичета в Съединените щати, които отговарят на следните условия... Когато ни казват, че трябва да намерим приблизителен отговор без калкулатор, това е голяма подсказка, че трябва да използваме емпиричното правило. Емпиричното правило се нарича също правилото 68-95-99,7. И ако запомниш, че това е името на правилото, вече си запомнил/а и самото правило. То ни казва, че ако имаме нормално разпределение – тук ще преговоря малко, преди да започнем да решаваме. Ако имаме нормално разпределение – ще начертая нормално разпределение. То изглежда така. Това ми е нормалното разпределение. Не го направих идеално, но разбираш за какво говоря. Трябва да е симетрично. Това тук ни е медианата. Това е медианата. Сега отиваме с едно стандартно отклонение над и с едно стандартно отклонение под медианата, значи това ни е медианата плюс едно стандартно отклонение. Това ни е медианата минус едно стандартно отклонение. Вероятността да намерим отговор, ако работим с идеално нормално разпределение, който е между едно стандартно отклонение под медианата и едно стандартно отклонение над медианата – това е ето тази площ – ще е 68%. Имаме 68% шанс да открием нещо в рамките на едно стандартно отклонение от медианата. Едно стандартно отклонение под или над медианата, или където и да е между тези две точки. Сега, ако говорим за две стандартни отклонения от медианата... Тоест, ако се преместим с още едно стандартно отклонение в едната или другата посока... ако си зададем въпроса каква е вероятността да намерим нещо в този интервал, можем да познаем, че става въпрос за 95%. И това включва и площта по средата. Тези 68% са част от 95-те %. Мисля, че разбираш какво става. Ако отидем три стандартни отклонения под медианата и над медианата, емпиричното правило или правилото 68-95-99,7 ни казва, че има вероятност 99,7% да намерим резултат в нормално разпределение, който е в рамките на три стандартни отклонения от медианата. Над три стандартни отклонения под медианата и под три стандартни отклонения над медианата. Това ни казва емпиричното правило. Да видим дали можем да приложим това към задачата ни. Дали са ни медианата и стандартното отклонение. Нека начертая това. Ще начертая оста първо, възможно най-добре. Това ми е оста. Чертая камбановидната крива. Това е възможно най-хубавата крива, която може да се направи на ръка. И медианата тук е 9, това трябва да е симетрично. Тази височина трябва да е същата като тази. Мисля, че разбираш – аз не съм компютър. Медианата е 9,5. Няма да записвам мерните единици. Всичко е в килограми. Едно стандартно отклонение над медианата ще добави 1,1 към това, защото ни казват, че стандартното отклонение е 1,1. Това ще бъде 10,6. Нека направя една пунктирана линия. Ако отидем с 1 стандартно отклонение под медианата, ще извадим 1,1 от 9,5 и това ще стане 8,4. Ако отидем с две стандартни отклонения над медианата, ще добавим още едно стандартно отклонение тук. Нали? Преместихме се с 1, 2 стандартни отклонения. Тогава ще достигнем 11,7. И ако се преместим с 3 стандартни отклонения, пак ще добавим 1,1. И ще сме на 12,8. Ще го направя от другата страна, едно стандартно отклонение под медианата е 8,4. Две стандартни отклонения под медианата – вадим 1,1 пак и получаваме 7,3. И после – три стандартни отклонения под медианата – ще запишем тук 6,2 килограма. Това ни е подготовката за задачата. Търсим каква е вероятността да намерим 1-годишно момиче в Съединените щати, което тежи по-малко от 8,4 килограма. Или, по-добре да кажа, чиято маса ще е по-малка от 8,4 килограма. Ако погледнем тук, вероятността да намерим 1-годишно момиченце с маса по-малко от 8,4 килограма е ето тази площ тук. Казах маса, защото килограмите всъщност са единица за измерване на маса. Повечето хора я използват и за тегло. Така, ето тази площ. Как можем да намерим тази площ под това нормално разпределение, като използваме емпиричното правило? Ние знаем колко е тази площ. Знаем, че площта между минус едно стандартно отклонение и плюс едно стандартно отклонение е 68%. И ако това е 68%, това означава, че частите, които не са в средната площ, са по 32%. Защото площта под цялото нормално разпределение е 100% – или 1, зависи как го разглеждаш. Сборът от всички вероятности винаги е 1. Не може да имаме повече от 100% тук. Ако съберем тази и тази част, ще получим остатъка. Така 100 минус 68 прави 32. 32%. 32% – това се получава, като съберем лявата и дясната част тук. И това е идеално нормално разпределение. Казаха ни, че имаме нормално разпределение. Значи симетрията е идеална. Ако сборът на тази част и на тази част е 32 и те са симетрични, тоест имат еднаква площ, тогава тази част тук – ще я направя в розово... повече прилича на лилаво – ще е 16%. И ето тази част ще е 16%. Значи вероятността да получим резултат, по-голям от едно стандартно отклонение над медианата – ето тази, дясна част, ще бъде 16%. Или, вероятността да получим резултат, който е с по-малко от едно стандартно отклонение под медианата, ето тук, е 16%. Търсим вероятността да имаме 1-годишно момиче, което тежи по-малко от 8,4 килограма. По-малко от 8,4 килограма – това е площта ето тук. И това са 16%. Имаме 16% за подточка а). Да решим и част b: между 7,3 и 11,7 килограма. Така, между 7,3 – това е ето тук. Това са две стандартни отклонения под медианата. И 11,7 – едно, две стандартни отклонения над медианата. Значи всъщност ни питат каква е вероятността да получим резултат, който е до две стандартни отклонения от медианата, нали? Това ни е медианата. Това са две стандартни отклонения под нея. А това са две стандартни отклонения над нея. Това е доста ясно. Емпиричното правило ни казва, че между две стандартни отклонения имаме шанс 95% да получим резултат, който е в рамките на две стандартни отклонения. Значи емпиричното правило само по себе си ни дава този отговор. И накрая, да решим подточка с: Каква е вероятността да имаме 1-годишно момиче, което тежи повече от 12,8 килограма? 12,8 килограма са три стандартни отклонения над медианата. Значи търсим вероятността да имаме резултат, който е повече от три отклонения над медианата. Това е ето тази отдалечена площ, която направих в оранжево. Може би трябва да я направя в друг цвят, за повече контраст. Става въпрос за тази мъничка площ тук. Каква е тази вероятност? Нека се върнем към емпиричното ни правило. Знаем вероятността – знаем тази площ. Това е площта между минус три стандартни отклонения и плюс три стандартни отклонения. Това ни е последната задача, така че мога да оцветя всичко – знаем, че площта между минус 3 и плюс 3 е 99,7%. Знаем, че почти всички резултати попадат в тази площ, макар и не всички. Значи какво ни е останало за двете опашки? Запомни, че имаме две опашки. Това е едната от тях. После имаме резултатите, които са на по-малко от три стандартни отклонения под медианата. Ето тази опашка. Това означава, че по-малко от 3 стандартни отклонения под медианата и повече от 3 стандартни отклонения над медианата, взети заедно, дават остатъка. А за остатъка имаме само 0,3%. Тези две неща са симетрични. Значи са еднакви. Значи това трябва да е половината на това или 0,15%, и това тyк също е 0,15%. Значи вероятността да имаме 1-годишно момиче в Съединените щати, което тежи повече от 12,8 килограма, при идеално нормално разпределение, е площта под тази крива, площта, която е на повече от три стандартни отклонения под медианата. И това са 0,15%. Надявам се тази задача да ти е била полезна.