0:00:00.413,0:00:06.502 Сега ще започнем пътешествие[br]в света на статистиката, 0:00:06.502,0:00:11.402 което е всъщност начин[br]да се запознаем с данните. 0:00:11.402,0:00:14.556 И така, статистиката е[br]всичко, свързано с данни. 0:00:14.566,0:00:18.782 И тъй като започваме пътешествие[br]в света на статистиката, 0:00:18.782,0:00:20.893 ние ще правим много[br]от така наречената 0:00:20.893,0:00:22.983 описателна (дескриптивна) статистика. 0:00:22.994,0:00:25.224 Ако имаме един куп данни 0:00:25.224,0:00:27.877 и искаме да кажем нещо [br]за всички тези данни, 0:00:27.877,0:00:29.862 без да предоставяме всичките данни, 0:00:29.862,0:00:33.832 можем ли по някакъв начин да ги изобразим[br]с по-малък набор от числа? 0:00:33.832,0:00:35.764 Сега ще се съсредоточим върху това. 0:00:35.764,0:00:38.667 И щом се екипираме с инструментариума[br]за описателната статистика, 0:00:38.667,0:00:41.971 след това можем да започнем да правим[br]изводи за тези данни – 0:00:41.971,0:00:44.224 ще започнем да правим заключения,[br]ще започнем да правим преценки. 0:00:44.224,0:00:50.438 Тоест ще започнем да работим [br]с изходната (инференциална) статистика – 0:00:51.286,0:00:53.461 Като имаме предвид всичко това, [br]нека помислим 0:00:53.461,0:00:55.831 как можем да опишем данните. 0:00:55.831,0:01:00.326 Нека кажем, че имаме множество от числа. 0:01:00.326,0:01:02.401 Можем да приемем, [br]че това ще бъдат данните. 0:01:02.401,0:01:04.521 Може би измерваме височината на растенията 0:01:04.521,0:01:05.711 в нашата градина. 0:01:05.712,0:01:07.548 И нека кажем, че имаме 6 растения. 0:01:07.548,0:01:13.638 И височините им са 4 см, 3 см, 1 см, 6 см 0:01:13.638,0:01:17.482 и имаме още едно от 1 см, и друго от 7 см. 0:01:17.489,0:01:22.568 И нека кажем, че някой в другата стая,[br]без да гледа растенията, те попита: 0:01:22.590,0:01:24.490 "Колко са високи твоите растения?" 0:01:24.495,0:01:26.205 И този някой иска да чуе едно число. 0:01:26.207,0:01:30.398 Иска да чуе едно число, което представя 0:01:30.398,0:01:33.590 всички различни височини на растенията. 0:01:33.590,0:01:35.960 Какво ще направиш? 0:01:35.974,0:01:38.861 Може би ще си помислиш,[br]че трябва да намериш нещо, 0:01:38.861,0:01:43.935 някакво символично число,[br]което някак изобразява средата. 0:01:43.936,0:01:46.206 Може би най-често[br]срещаното число? 0:01:46.206,0:01:48.946 Може би числото,[br]което по някакъв начин изобразява 0:01:48.946,0:01:51.052 центъра на всичките тези числа? 0:01:51.052,0:01:52.970 И ако си помислиш някое от тези неща, 0:01:52.970,0:01:55.779 ти всъщност ще правиш същото като хората, 0:01:55.779,0:01:58.089 измислили описателната статистика. 0:01:58.089,0:02:00.168 Те са си казали: [br]"Добре, как да направим това?" 0:02:00.168,0:02:04.639 Да започнем от идеята[br]за средата. 0:02:04.639,0:02:07.497 В ежедневния език[br]думата "средно" 0:02:07.497,0:02:09.656 има много специфично значение, [br]както ще видим. 0:02:09.656,0:02:13.361 Когато казват средно, много хора[br]имат предвид средно аритметично, 0:02:13.361,0:02:14.861 ще разгледаме това след малко. 0:02:14.861,0:02:18.384 Но в статистиката средна стойност [br]означава нещо по-общо. 0:02:18.384,0:02:22.744 Означава "представително число", 0:02:22.744,0:02:29.919 или "средно число", или... 0:02:29.919,0:02:32.056 И това са опити да се намери 0:02:32.056,0:02:34.370 дадена мярка на централната тенденция. 0:02:34.370,0:02:38.571 Централна тенденция. 0:02:38.571,0:02:40.481 Още веднъж – имаме множество числа. 0:02:40.486,0:02:42.756 Опитваме се по някакъв начин [br]да ги изобразим с едно число, 0:02:42.756,0:02:45.906 което ще наречем средно, [br]което е 0:02:45.911,0:02:50.175 представително, средно[br]или централно на тези числа. 0:02:50.175,0:02:53.906 И както ще видим, [br]има много видове средни величини. 0:02:53.906,0:02:56.785 Първата вероятно я познаваш. 0:02:56.785,0:03:01.018 Често се казва "средна оценка на изпита"[br]или "среден ръст". 0:03:01.018,0:03:03.201 И това е средното аритметично. 0:03:03.201,0:03:05.486 Нека го напиша с... 0:03:05.486,0:03:13.081 Ще го напиша с жълто, [br]средно аритметично. 0:03:13.081,0:03:15.980 Съществителното е аритметика. 0:03:15.980,0:03:19.840 Прилагателното става[br]"аритметично". 0:03:19.840,0:03:21.586 Средно аритметично. 0:03:21.586,0:03:25.966 И това е просто сумата от[br]всичките числа, разделена на... 0:03:25.966,0:03:29.988 Това е дефиниция, дадена от[br]нас, хората, която е полезна. 0:03:29.988,0:03:34.168 Сумата от всички числа, делена на[br]броя на дадените числа. 0:03:34.445,0:03:36.705 Знаейки това, колко ще е[br]средното аритметично 0:03:36.713,0:03:39.053 на този набор от данни? 0:03:39.071,0:03:40.471 Добре, нека просто да [br]го изчислим. 0:03:40.490,0:03:46.040 Това ще бъде 4 плюс[br]3, плюс 1, плюс 6, плюс 1, 0:03:46.040,0:03:51.185 плюс 7, върху броя на[br]точките с данни, които имаме. 0:03:51.202,0:03:53.180 И така, ние имаме шест [br]точки с данни. 0:03:53.180,0:03:54.828 Така че, ще разделим на 6. 0:03:54.828,0:04:01.708 И получаваме, 4 плюс 3 е 7,[br]плюс 1 е 8, плюс 6 е 14, 0:04:01.729,0:04:05.059 плюс 1 е 15, плюс 7. 0:04:05.069,0:04:07.950 15 плюс 7 е 22. 0:04:07.950,0:04:09.271 Нека го направя още веднъж. 0:04:09.271,0:04:14.971 Имаме 7, 8, 14, 15,[br]22, всичкото това върху 6. 0:04:14.971,0:04:17.071 Можем да го запишем[br]като смесено число. 0:04:17.071,0:04:20.856 6 се съдържа в 22 три пъти[br]с остатък от 4. 0:04:20.856,0:04:25.026 Така че това е 3 цяло и 4/6, което е [br]същото нещо като 3 цяло и 2/3. 0:04:25.034,0:04:28.256 Можем да го запишем и като[br]десетично число: 3 цяло и 6 в период. 0:04:28.256,0:04:32.306 Така че това е също 3,6 в период. 0:04:32.325,0:04:34.474 Бихме могли да го напишем по[br]всеки един от тези начини. 0:04:34.474,0:04:36.652 Но това е един вид[br]представително число. 0:04:36.652,0:04:39.592 То се опитва да ни покаже[br]основната тенденция. 0:04:39.604,0:04:42.026 Още веднъж, това е[br]измислено от хората. 0:04:42.026,0:04:45.788 Не е като някой да е намерил[br]религиозни документи, в които да пише: 0:04:45.788,0:04:49.292 "средната стойност[br]трябва да бъде определена по този начин". 0:04:49.292,0:04:52.264 Това не е чисто[br]пресмятане, 0:04:52.264,0:04:54.942 като, да кажем, намирането на[br]обиколката на окръжност, 0:04:54.942,0:05:00.252 Което наистина е факт, на който сме[br]попаднали при изучаването на вселената. 0:05:00.320,0:05:02.170 А това тук е дефиниция, [br]измислена от хората, 0:05:02.177,0:05:03.667 която сме намерили за полезна. 0:05:03.677,0:05:07.027 Сега, има други начини[br]да измерим средното, 0:05:07.027,0:05:09.937 да намерим типичната, [br]средната стойност. 0:05:09.950,0:05:14.530 Другият много типичен [br]начин е медианата. 0:05:14.535,0:05:15.644 И аз ще напиша медиана. 0:05:15.644,0:05:16.684 Свършват ми цветовете. 0:05:16.688,0:05:18.673 Ще напиша медиана в розово. 0:05:18.673,0:05:21.233 И така, ето я медианата. 0:05:21.234,0:05:25.124 И медианата е буквално[br]средното число. 0:05:25.124,0:05:27.237 Ако подредиш всичките числа [br]във възходящ ред, 0:05:27.237,0:05:31.442 това в средата[br]ще бъде твоята медиана. 0:05:31.442,0:05:35.429 Та колко ще бъде медианата [br]на дадения ни набор от числа? 0:05:35.499,0:05:36.949 Нека се опитаме да я намерим. 0:05:36.949,0:05:38.139 Нека ги подредим. 0:05:38.139,0:05:39.609 И така, имаме 1. 0:05:39.626,0:05:41.055 След това имаме друго 1. 0:05:41.055,0:05:42.730 След това имаме 3. 0:05:42.730,0:05:46.540 След това имаме 4, 6 и 7. 0:05:46.540,0:05:48.300 Просто ги пренаредих. 0:05:48.313,0:05:50.443 И така, кое е средното число? 0:05:50.762,0:05:54.782 Тъй като имаме четен брой числа, [br]в случая 6 числа, 0:05:54.782,0:05:57.356 няма едно средно число. 0:05:57.356,0:05:59.308 В действителност има две[br]средни числа тук. 0:05:59.308,0:06:01.748 Имаме две средни[br]числа тук. 0:06:01.748,0:06:03.268 Имаме 3 и 4. 0:06:03.291,0:06:05.861 И в този случай, когато [br]имаме две средни числа, 0:06:05.873,0:06:09.619 всъщност ни трябва средата[br]между тези две числа. 0:06:09.619,0:06:12.089 По същество вземаме [br]средното аритметично 0:06:12.093,0:06:14.253 тези две числа, [br]за да намерим медианата. 0:06:14.253,0:06:17.101 Така че медианата ще бъде[br]по средата между 3 и 4, 0:06:17.101,0:06:19.201 което е 3,5. 0:06:19.207,0:06:24.147 Така че медианата в[br]този случай е 3,5. 0:06:24.168,0:06:26.608 И така, ако имаме четен [br]брой числа, медианата е 0:06:26.625,0:06:31.405 средното аритметично на двете в средата,[br]или половината между двете средни числа... 0:06:31.418,0:06:32.959 Ако имаме нечетен[br]брой числа, 0:06:32.959,0:06:34.344 е малко по-лесно да[br]се изчисли. 0:06:34.473,0:06:36.912 Ще дам друг набор от данни. 0:06:36.912,0:06:39.652 Даден ни е набор[br]от данни, и ще ти го подредя. 0:06:39.652,0:06:42.013 Нека кажем, че числата ни са 0:06:42.022,0:06:55.692 е 0, 7, 50, 10 000 и 1 милион. 0:06:55.692,0:06:56.928 Нека кажем, че това е[br]наборът от данни. 0:06:56.928,0:06:58.336 Малко странен набор от данни. 0:06:58.336,0:07:02.430 Но в тази ситуация [br]колко е медианата? 0:07:02.430,0:07:04.170 Тук имаме пет числа. 0:07:04.170,0:07:05.479 Имаме нечетен[br]брой числа. 0:07:05.479,0:07:07.115 Така че е по-лесно да[br]изберем средата. 0:07:07.115,0:07:12.025 Средата е числото, което е[br]по-голямо от две от числата 0:07:12.025,0:07:13.586 и е по-малко от [br]две от числата. 0:07:13.586,0:07:14.674 То е точно в средата. 0:07:14.674,0:07:18.624 Така че в този случай[br]медианата е 50. 0:07:18.628,0:07:21.161 Сега, третата мярка [br]на основната тенденция, 0:07:21.161,0:07:25.039 която вероятно се използва [br]най-рядко в живота, 0:07:25.039,0:07:26.360 е модата. 0:07:26.360,0:07:27.802 Хората често забравят за нея. 0:07:27.802,0:07:29.812 Звучи като нещо [br]много сложно. 0:07:29.825,0:07:32.983 Но ще видим, че всъщност е[br]много просто понятие. 0:07:33.203,0:07:35.782 И в известен смисъл, то[br]е най-простото понятие. 0:07:35.782,0:07:40.562 Модата е най-повтарящото се [br]число в набора от данни, 0:07:40.562,0:07:42.141 ако има такова. 0:07:42.141,0:07:43.882 Ако всички числа са [br]представени поравно 0:07:43.882,0:07:45.741 и няма нито едно[br]най-повтарящо се число, 0:07:45.741,0:07:47.021 тогава нямаме мода. 0:07:47.035,0:07:50.295 Но предвид тази [br]дефиниция за модата, 0:07:50.312,0:07:53.925 кое е най-повтарящото се[br]число в нашия първоначален набор 0:07:53.925,0:07:58.055 от данни, в този набор [br]от данни ето тук? 0:07:58.055,0:08:00.047 Имаме само едно 4. 0:08:00.047,0:08:01.477 Имаме само едно 3. 0:08:01.477,0:08:03.077 Но имаме две единици. 0:08:03.084,0:08:04.859 Имаме едно 6 и едно 7. 0:08:04.859,0:08:08.439 Така че числото, което се явява[br]най-повтарящо се тук, 0:08:09.802,0:08:11.075 е 1. 0:08:11.075,0:08:13.705 Така че модата, най-типичното[br]число, най-повтарящото се число, 0:08:15.865,0:08:17.410 тук е 1. 0:08:17.410,0:08:19.711 И така, виждаш, че всичко това[br]са различни начини 0:08:19.711,0:08:23.228 при опитите ни да получим [br]типична, средна, основна тенденция. 0:08:23.228,0:08:25.667 Но начините са много различни. 0:08:25.667,0:08:27.388 И когато учим все повече статистика, 0:08:27.388,0:08:29.538 ще видим, че те са [br]подходящи за различни неща. 0:08:29.556,0:08:31.576 Средното аритметично[br]се използва много често. 0:08:31.577,0:08:34.587 Медианата е подходяща, ако[br]имаш някакво странно число, 0:08:34.592,0:08:37.915 което би изкривило[br]средното аритметично. 0:08:37.936,0:08:41.275 Модата може също да бъде полезна[br]в ситуации като тази, 0:08:41.292,0:08:43.347 особено ако имаме [br]едно число, което 0:08:43.347,0:08:45.838 се показва много по-често. 0:08:45.838,0:08:47.548 Както и да е, ще приключим дотук. 0:08:47.549,0:08:52.564 И в следващите няколко клипа ще[br]изучаваме статистиката дори по-подробно.