-
Сега ще започнем пътешествие
в света на статистиката,
-
което е всъщност начин
да се запознаем с данните.
-
И така, статистиката е
всичко, свързано с данни.
-
И тъй като започваме пътешествие
в света на статистиката,
-
ние ще правим много
от така наречената
-
описателна (дескриптивна) статистика.
-
Ако имаме един куп данни
-
и искаме да кажем нещо
за всички тези данни,
-
без да предоставяме всичките данни,
-
можем ли по някакъв начин да ги изобразим
с по-малък набор от числа?
-
Сега ще се съсредоточим върху това.
-
И щом се екипираме с инструментариума
за описателната статистика,
-
след това можем да започнем да правим
изводи за тези данни –
-
ще започнем да правим заключения,
ще започнем да правим преценки.
-
Тоест ще започнем да работим
с изходната (инференциална) статистика –
-
Като имаме предвид всичко това,
нека помислим
-
как можем да опишем данните.
-
Нека кажем, че имаме множество от числа.
-
Можем да приемем,
че това ще бъдат данните.
-
Може би измерваме височината на растенията
-
в нашата градина.
-
И нека кажем, че имаме 6 растения.
-
И височините им са 4 см, 3 см, 1 см, 6 см
-
и имаме още едно от 1 см, и друго от 7 см.
-
И нека кажем, че някой в другата стая,
без да гледа растенията, те попита:
-
"Колко са високи твоите растения?"
-
И този някой иска да чуе едно число.
-
Иска да чуе едно число, което представя
-
всички различни височини на растенията.
-
Какво ще направиш?
-
Може би ще си помислиш,
че трябва да намериш нещо,
-
някакво символично число,
което някак изобразява средата.
-
Може би най-често
срещаното число?
-
Може би числото,
което по някакъв начин изобразява
-
центъра на всичките тези числа?
-
И ако си помислиш някое от тези неща,
-
ти всъщност ще правиш същото като хората,
-
измислили описателната статистика.
-
Те са си казали:
"Добре, как да направим това?"
-
Да започнем от идеята
за средата.
-
В ежедневния език
думата "средно"
-
има много специфично значение,
както ще видим.
-
Когато казват средно, много хора
имат предвид средно аритметично,
-
ще разгледаме това след малко.
-
Но в статистиката средна стойност
означава нещо по-общо.
-
Означава "представително число",
-
или "средно число", или...
-
И това са опити да се намери
-
дадена мярка на централната тенденция.
-
Централна тенденция.
-
Още веднъж – имаме множество числа.
-
Опитваме се по някакъв начин
да ги изобразим с едно число,
-
което ще наречем средно,
което е
-
представително, средно
или централно на тези числа.
-
И както ще видим,
има много видове средни величини.
-
Първата вероятно я познаваш.
-
Често се казва "средна оценка на изпита"
или "среден ръст".
-
И това е средното аритметично.
-
Нека го напиша с...
-
Ще го напиша с жълто,
средно аритметично.
-
Съществителното е аритметика.
-
Прилагателното става
"аритметично".
-
Средно аритметично.
-
И това е просто сумата от
всичките числа, разделена на...
-
Това е дефиниция, дадена от
нас, хората, която е полезна.
-
Сумата от всички числа, делена на
броя на дадените числа.
-
Знаейки това, колко ще е
средното аритметично
-
на този набор от данни?
-
Добре, нека просто да
го изчислим.
-
Това ще бъде 4 плюс
3, плюс 1, плюс 6, плюс 1,
-
плюс 7, върху броя на
точките с данни, които имаме.
-
И така, ние имаме шест
точки с данни.
-
Така че, ще разделим на 6.
-
И получаваме, 4 плюс 3 е 7,
плюс 1 е 8, плюс 6 е 14,
-
плюс 1 е 15, плюс 7.
-
15 плюс 7 е 22.
-
Нека го направя още веднъж.
-
Имаме 7, 8, 14, 15,
22, всичкото това върху 6.
-
Можем да го запишем
като смесено число.
-
6 се съдържа в 22 три пъти
с остатък от 4.
-
Така че това е 3 цяло и 4/6, което е
същото нещо като 3 цяло и 2/3.
-
Можем да го запишем и като
десетично число: 3 цяло и 6 в период.
-
Така че това е също 3,6 в период.
-
Бихме могли да го напишем по
всеки един от тези начини.
-
Но това е един вид
представително число.
-
То се опитва да ни покаже
основната тенденция.
-
Още веднъж, това е
измислено от хората.
-
Не е като някой да е намерил
религиозни документи, в които да пише:
-
"средната стойност
трябва да бъде определена по този начин".
-
Това не е чисто
пресмятане,
-
като, да кажем, намирането на
обиколката на окръжност,
-
Което наистина е факт, на който сме
попаднали при изучаването на вселената.
-
А това тук е дефиниция,
измислена от хората,
-
която сме намерили за полезна.
-
Сега, има други начини
да измерим средното,
-
да намерим типичната,
средната стойност.
-
Другият много типичен
начин е медианата.
-
И аз ще напиша медиана.
-
Свършват ми цветовете.
-
Ще напиша медиана в розово.
-
И така, ето я медианата.
-
И медианата е буквално
средното число.
-
Ако подредиш всичките числа
във възходящ ред,
-
това в средата
ще бъде твоята медиана.
-
Та колко ще бъде медианата
на дадения ни набор от числа?
-
Нека се опитаме да я намерим.
-
Нека ги подредим.
-
И така, имаме 1.
-
След това имаме друго 1.
-
След това имаме 3.
-
След това имаме 4, 6 и 7.
-
Просто ги пренаредих.
-
И така, кое е средното число?
-
Тъй като имаме четен брой числа,
в случая 6 числа,
-
няма едно средно число.
-
В действителност има две
средни числа тук.
-
Имаме две средни
числа тук.
-
Имаме 3 и 4.
-
И в този случай, когато
имаме две средни числа,
-
всъщност ни трябва средата
между тези две числа.
-
По същество вземаме
средното аритметично
-
тези две числа,
за да намерим медианата.
-
Така че медианата ще бъде
по средата между 3 и 4,
-
което е 3,5.
-
Така че медианата в
този случай е 3,5.
-
И така, ако имаме четен
брой числа, медианата е
-
средното аритметично на двете в средата,
или половината между двете средни числа...
-
Ако имаме нечетен
брой числа,
-
е малко по-лесно да
се изчисли.
-
Ще дам друг набор от данни.
-
Даден ни е набор
от данни, и ще ти го подредя.
-
Нека кажем, че числата ни са
-
е 0, 7, 50, 10 000 и 1 милион.
-
Нека кажем, че това е
наборът от данни.
-
Малко странен набор от данни.
-
Но в тази ситуация
колко е медианата?
-
Тук имаме пет числа.
-
Имаме нечетен
брой числа.
-
Така че е по-лесно да
изберем средата.
-
Средата е числото, което е
по-голямо от две от числата
-
и е по-малко от
две от числата.
-
То е точно в средата.
-
Така че в този случай
медианата е 50.
-
Сега, третата мярка
на основната тенденция,
-
която вероятно се използва
най-рядко в живота,
-
е модата.
-
Хората често забравят за нея.
-
Звучи като нещо
много сложно.
-
Но ще видим, че всъщност е
много просто понятие.
-
И в известен смисъл, то
е най-простото понятие.
-
Модата е най-повтарящото се
число в набора от данни,
-
ако има такова.
-
Ако всички числа са
представени поравно
-
и няма нито едно
най-повтарящо се число,
-
тогава нямаме мода.
-
Но предвид тази
дефиниция за модата,
-
кое е най-повтарящото се
число в нашия първоначален набор
-
от данни, в този набор
от данни ето тук?
-
Имаме само едно 4.
-
Имаме само едно 3.
-
Но имаме две единици.
-
Имаме едно 6 и едно 7.
-
Така че числото, което се явява
най-повтарящо се тук,
-
е 1.
-
Така че модата, най-типичното
число, най-повтарящото се число,
-
тук е 1.
-
И така, виждаш, че всичко това
са различни начини
-
при опитите ни да получим
типична, средна, основна тенденция.
-
Но начините са много различни.
-
И когато учим все повече статистика,
-
ще видим, че те са
подходящи за различни неща.
-
Средното аритметично
се използва много често.
-
Медианата е подходяща, ако
имаш някакво странно число,
-
което би изкривило
средното аритметично.
-
Модата може също да бъде полезна
в ситуации като тази,
-
особено ако имаме
едно число, което
-
се показва много по-често.
-
Както и да е, ще приключим дотук.
-
И в следващите няколко клипа ще
изучаваме статистиката дори по-подробно.