1 00:00:02,006 --> 00:00:05,016 В това видео ще разгледаме едно понятие, което според някои 2 00:00:05,016 --> 00:00:10,003 е най-важното понятие в цялата статистика. 3 00:00:10,003 --> 00:00:13,057 Всъщност, ако разгледаме която и да е научна дисциплина, можем 4 00:00:13,057 --> 00:00:15,925 да заключим, че това е най-важното понятие. 5 00:00:15,925 --> 00:00:19,000 Всъщност съм казвал, че е някак тъжно, че това понятие 6 00:00:19,000 --> 00:00:21,055 не се разглежда в задължителната програма. 7 00:00:21,055 --> 00:00:24,729 Всеки трябва да е запознат с него, тъй като засяга всички страни 8 00:00:24,729 --> 00:00:27,538 на нашия живот, и това е нормалното разпределение, 9 00:00:27,538 --> 00:00:31,000 известно и като Гаусовото разпределение или камбановидната крива. 10 00:00:31,000 --> 00:00:35,027 И за да ти дам малко предварителна информация за същността му, 11 00:00:35,027 --> 00:00:39,096 тази информация може и да ти се стори доста странна, 12 00:00:39,096 --> 00:00:42,098 но се надявам, че докато гледаш това видео, ще разбереш 13 00:00:42,098 --> 00:00:45,003 каква е същността на това понятие. 14 00:00:45,003 --> 00:00:47,614 Гаусовото разпределение или нормалното разпределение, 15 00:00:47,614 --> 00:00:50,025 това са две имена на едно и също нещо. 16 00:00:50,025 --> 00:00:52,092 Всъщност на Гаус му е хрумнала идеята. 17 00:00:52,092 --> 00:00:56,020 Мисля, че е изследвал някакви астрономически явления, 18 00:00:56,020 --> 00:00:57,018 когато го е дефинирал. 19 00:00:57,018 --> 00:00:59,074 Но то е вероятностна функция на плътността, подобно на 20 00:00:59,074 --> 00:01:00,099 Поасоновото разпределение, за което говорихме. 21 00:01:00,099 --> 00:01:02,007 Същото е. 22 00:01:02,007 --> 00:01:05,037 И за да ти дам предварителна информация, то изглежда така. 23 00:01:05,037 --> 00:01:08,076 Вероятността да получиш произволно х – става дума за 24 00:01:08,076 --> 00:01:12,015 клас функции на вероятностното разпределение. 25 00:01:12,015 --> 00:01:14,051 Такива са и биномното разпределение, и Поасоновото 26 00:01:14,051 --> 00:01:18,073 разпределение, те се основават на няколко параметъра. 27 00:01:18,073 --> 00:01:20,783 Обикновено в повечето учебници го изписват по този начин 28 00:01:20,783 --> 00:01:23,034 и ако имаме време, бих искал да го 29 00:01:23,034 --> 00:01:25,057 трансформирам алгебрично, за да ти покажа по-ясно 30 00:01:25,057 --> 00:01:26,814 как всъщност работи. 31 00:01:26,814 --> 00:01:29,014 Или може би да ти дам малко информация за това как е започнала цялата 32 00:01:29,014 --> 00:01:30,014 тази история. 33 00:01:30,014 --> 00:01:32,706 Няма да го докажа в това видео, не това е нашата цел сега. 34 00:01:32,706 --> 00:01:35,012 Въпреки, че искам да го направя и най-вероятно ще се сблъскаме 35 00:01:35,012 --> 00:01:38,056 с някои прегледни математически трансформации. 36 00:01:38,056 --> 00:01:40,060 Ако сте с учител по математика и ментор, на други учители, сигурно 37 00:01:40,060 --> 00:01:42,065 ще е добре да потърсите в Уикипедия "формила на Стърлинг", 38 00:01:42,065 --> 00:01:43,806 наистина е вълнуващо. 39 00:01:43,806 --> 00:01:47,093 Формулата всъщност дава приближение на факториели 40 00:01:47,093 --> 00:01:48,999 чрез непрекъсната функция. 41 00:01:48,999 --> 00:01:52,939 Но сега няма да навлизам в подробности. 42 00:01:53,015 --> 00:01:56,089 Нормалното разпределение е 1 върху, така се изписва 43 00:01:56,089 --> 00:01:59,089 обикновено, върху стандартното отклонение по 44 00:01:59,089 --> 00:02:08,022 корен квадратен от два пъти пи, цялото по е на степен минус 1/2. 45 00:02:08,022 --> 00:02:11,926 Е, бих искал да го напиша по този начин, помни се по-лесно, 46 00:02:11,926 --> 00:02:17,686 по каквато стойност искаш да получиш, минус средната стойност на 47 00:02:17,686 --> 00:02:21,021 разпределението, разделена на стандартното отклонение на 48 00:02:21,021 --> 00:02:24,094 разпределението, цялото на квадрат. 49 00:02:24,094 --> 00:02:26,084 И така, ако се замислиш, добре е да отбележим този 50 00:02:26,084 --> 00:02:28,028 факт в този момент. 51 00:02:28,028 --> 00:02:30,846 Това е разстоянието от средната стойност и ние го делим на 52 00:02:30,846 --> 00:02:33,021 стандартното отклонение на нашето разпределение. 53 00:02:33,021 --> 00:02:35,047 Това е графика на нормалното разпределение, която съм 54 00:02:35,047 --> 00:02:38,050 подготвил, лилавата линия представлява нормалното разпределение. 55 00:02:38,050 --> 00:02:41,313 Основната цел на това упражнение... знам, че малко прескачам този път... 56 00:02:41,313 --> 00:02:44,043 е да покажа, че нормалното разпределение е добро 57 00:02:44,043 --> 00:02:47,541 приближение на биномното разпределение и обратното, 58 00:02:47,541 --> 00:02:52,041 ако имаме достатъчно наблюдения в нашето биномно разпределение, 59 00:02:52,041 --> 00:02:54,096 и това ще го обсъдим след малко. 60 00:02:54,096 --> 00:02:56,678 Според мен логиката ни за този член тук 61 00:02:56,678 --> 00:03:00,053 е интересна, тъй като казваме, че определяме разстоянието 62 00:03:00,053 --> 00:03:03,031 от средната стойност, разделяме на стандартното отклонение. 63 00:03:03,031 --> 00:03:07,069 И така този член тук показва колко стандартни отклонения 64 00:03:07,069 --> 00:03:09,786 е разликата от средната стойност. 65 00:03:09,786 --> 00:03:12,012 Това всъщност се нарича стандартна стойност, или z-стойност. 66 00:03:12,012 --> 00:03:15,056 Забелязал съм, че статистиката е пълна с много думи, много 67 00:03:15,056 --> 00:03:17,706 дефиниции и всички те звучат много сложно. Ето 68 00:03:17,706 --> 00:03:19,698 например стандартна z-стойност. 69 00:03:19,698 --> 00:03:25,034 Но самото понятие е пределно ясно. 70 00:03:25,034 --> 00:03:29,054 Да кажем, че имам вероятностно разпределение и получа някаква 71 00:03:29,054 --> 00:03:32,037 стойност, х, която е тук, и е на 3 и половина стандартни 72 00:03:32,037 --> 00:03:35,019 отклонения от средната, тогава нейната стандартна 73 00:03:35,019 --> 00:03:36,489 стойност е 3 и половина. 74 00:03:36,489 --> 00:03:39,021 Както и да е, нека се съсредоточим върху целта на това видео. 75 00:03:39,021 --> 00:03:42,088 И така, това е графиката на нормалното разпределение, на 76 00:03:42,088 --> 00:03:44,093 вероятностната функция на плътността на 77 00:03:44,093 --> 00:03:46,034 нормалното разпределение. 78 00:03:46,034 --> 00:03:49,037 Но как сме я получили? И което е по-важно, 79 00:03:49,037 --> 00:03:51,009 в края на това видео най-малкото трябва да можеш да кажеш, че 80 00:03:51,009 --> 00:03:54,077 това е добро приближение на биномното разпределение, 81 00:03:54,077 --> 00:03:58,002 ако вземеш достатъчно наблюдения. 82 00:03:58,002 --> 00:04:00,075 И това е вълнуващото за нормалното разпределение, 83 00:04:00,075 --> 00:04:03,093 че вземаме сумата, ще направя отделно видео 84 00:04:03,093 --> 00:04:07,099 за централната гранична теорема, Но, ако сумирате много 85 00:04:07,099 --> 00:04:12,011 независими наблюдения, като броят им клони към безкрайност, 86 00:04:12,011 --> 00:04:14,037 макар и разпределението на тези наблюдения да не е 87 00:04:14,037 --> 00:04:18,530 задължително нормално, разпределението на тяхната сума 88 00:04:18,530 --> 00:04:21,066 ще се приближава до нормално разпределение. 89 00:04:21,066 --> 00:04:22,788 Ще поговоря повече на тази тема по-късно. 90 00:04:22,788 --> 00:04:27,025 Но именно поради тази причина е добре да предполагаме, че именно 91 00:04:27,025 --> 00:04:28,955 това разпределение лежи в основата на много феномени -- 92 00:04:28,955 --> 00:04:31,049 от опитите да моделираме времето до моделите на взаимодействие между 93 00:04:31,049 --> 00:04:34,699 лекарствата и пациента, и ние ще обсъдим кога това допускане работи 94 00:04:34,699 --> 00:04:36,488 и кога не върши добра работа. 95 00:04:36,488 --> 00:04:39,656 Например, понякога хората допускат, че нормалното разпределение работи 96 00:04:39,656 --> 00:04:42,018 във финансовата сфера, а ние сме свидетели на финансовата 97 00:04:42,018 --> 00:04:44,012 криза и как тя доведе до крах много други сфери. 98 00:04:44,012 --> 00:04:45,736 Но нека се върнем към нашето упражнение. 99 00:04:45,736 --> 00:04:47,007 Това тук е електронна таблица. 100 00:04:47,007 --> 00:04:51,063 Току-що направих фона черен, можеш да свалиш файла от 101 00:04:51,063 --> 00:05:01,081 khanacademy.org/downloads. Всъщност, там ще можеш да 102 00:05:01,081 --> 00:05:03,037 видиш всички файлове, които могат да се свалят. 103 00:05:03,037 --> 00:05:07,845 Точно този не е качен още, ще го кача след като запиша 104 00:05:07,845 --> 00:05:09,523 видеото. Името на файла е: 105 00:05:09,523 --> 00:05:18,567 NormalDistribution.xls. 106 00:05:18,567 --> 00:05:21,513 Ако отидеш на адрес khanacademy.org/download/ 107 00:05:21,513 --> 00:05:23,920 ще видиш всички файлове и сред тях ще откриеш и тази таблица. 108 00:05:23,920 --> 00:05:26,094 Бих искал да те насърча да си поиграеш с нея и ако искаш – 109 00:05:26,094 --> 00:05:28,606 да създадеш и други таблици, докато експериемнтираш. 110 00:05:28,606 --> 00:05:32,061 И така, тази таблица, тя всъщност представлява една игра, или нека 111 00:05:32,061 --> 00:05:35,354 си представим, че стоя на улицата и си подхврлям монета, подхвърлям 112 00:05:35,354 --> 00:05:37,024 си една монета, която не е фалшива. 113 00:05:37,024 --> 00:05:44,056 Ако се падне тура, това е тура, ще отстъпя назад или нека 114 00:05:44,056 --> 00:05:46,077 да направя стъпка вляво. 115 00:05:46,077 --> 00:05:51,069 И ако се падне ези, ще направя стъпка вдясно. 116 00:05:51,069 --> 00:05:53,643 И така, в общия случай, имам... това е една монета, която не е 117 00:05:53,643 --> 00:05:56,027 фалшива... имам 50% шанс да направя стъпка 118 00:05:56,027 --> 00:05:59,451 вляво и 50% шанс да направя стъпка вдясно. 119 00:05:59,451 --> 00:06:03,002 И така, според моята логика, ако ти кажа, че съм хвърлил 120 00:06:03,002 --> 00:06:06,062 монетата хиляда пъти, ще се движа 121 00:06:06,062 --> 00:06:07,604 ту наляво, ту надясно. 122 00:06:07,604 --> 00:06:10,036 Ако случайно се падне няколко пъти тура, може и 123 00:06:10,036 --> 00:06:13,010 да се преместиш доста наляво. 124 00:06:13,010 --> 00:06:16,287 Ако се падне няколко пъти ези, ще минете надясно. 125 00:06:16,287 --> 00:06:20,074 А вече знаем, че шансовете да се падне няколко пъти ези или 126 00:06:20,074 --> 00:06:24,067 много повече пъти тура са доста по-малки от шанса 127 00:06:24,067 --> 00:06:28,068 резултатът да е равен или почти равен. 128 00:06:28,068 --> 00:06:41,728 И така тук, това, което съм направил... Нека минем по-надолу, 129 00:06:41,728 --> 00:06:48,098 тъй като не искам да изгубя цялото нещо... това, което направих тук, е 130 00:06:48,098 --> 00:06:50,094 дребно допускане и бих се зарадвал, ако го попълниш и 131 00:06:50,094 --> 00:06:52,031 промениш, както ти харесва. 132 00:06:52,031 --> 00:06:55,029 Това са броя стъпки, които съм направил. 133 00:06:55,029 --> 00:06:58,098 Това е средният брой стъпки наляво и съм изчислил 134 00:06:58,098 --> 00:07:01,025 вероятността и така сме изчислили и средната на 135 00:07:01,025 --> 00:07:02,670 това биномно разпределение. 136 00:07:02,670 --> 00:07:06,050 Средната стойност на биномното разпределение всъщност 137 00:07:06,050 --> 00:07:09,039 представлява вероятността да направя стъпка наляво по 138 00:07:09,039 --> 00:07:11,013 общия брой опити. 139 00:07:11,013 --> 00:07:13,762 И така, това е равно на 5, и така обясняваме това число. 140 00:07:13,762 --> 00:07:17,014 А сега и дисперсията... Не съм сигурен дали минахме 141 00:07:17,014 --> 00:07:19,016 това и трябва да го докажа, но планирам да направя 142 00:07:19,016 --> 00:07:22,050 друго видео за дисперсията на биномното разпределение. 143 00:07:22,050 --> 00:07:27,030 И така, дисперсията всъщност е равна на броя на опитите, 144 00:07:27,030 --> 00:07:32,742 10, по вероятността да направя стъпка наляво или по своему да 145 00:07:32,742 --> 00:07:36,014 имам успешен опит, тук дефинирам стъпка наляво като успешен 146 00:07:36,014 --> 00:07:40,063 опит, разбира се, би могло да е и дясно, умножено по вероятността 147 00:07:40,063 --> 00:07:44,049 от 1 минус успешния опит, т.е. неуспешния опит. 148 00:07:44,049 --> 00:07:46,037 В този случай двете събития са с еднаква вероятност, затова и 149 00:07:46,037 --> 00:07:48,055 резултатът е 2,5. 150 00:07:48,055 --> 00:07:49,640 И всичко това е показано в електронната таблица. 151 00:07:49,640 --> 00:07:52,037 Ако кликнеш на самата клетка, ще можеш да видиш конкретната 152 00:07:52,037 --> 00:07:53,039 формула, която съм използвал. 153 00:07:53,039 --> 00:07:54,857 Имай предвид, че понякога нещата изглеждат 154 00:07:54,857 --> 00:07:55,673 объркващи в Excel. 155 00:07:55,673 --> 00:07:57,036 Тук става дума за корен квадратен от това число. 156 00:07:57,036 --> 00:07:59,012 Стандартното отклонение е просто корен 157 00:07:59,012 --> 00:08:00,054 квадратен от дисперсията. 158 00:08:00,054 --> 00:08:04,045 С други думи, корен квадратен от 2,5. 159 00:08:04,045 --> 00:08:08,062 И така, нека видим какво се казва тук... ОК, каква е 160 00:08:08,062 --> 00:08:10,050 вероятността да не направя никакви стъпки? 161 00:08:10,050 --> 00:08:14,017 И така, направил съм общо 10 стъпки... Правим това, за да разберем 162 00:08:14,017 --> 00:08:17,537 логиката на таблицата... Каква е вероятността да 163 00:08:17,537 --> 00:08:20,836 не направя никакви стъпки наляво, ако съм направил общо 10 стъпки? 164 00:08:20,836 --> 00:08:23,001 И само да уточним, ако не направя никакви крачки наляво, това означава, 165 00:08:23,001 --> 00:08:25,011 съм направил 10 крачки надясно. 166 00:08:25,011 --> 00:08:27,043 Изчислявам тази вероятност... Тук трябваше да съм 167 00:08:27,043 --> 00:08:31,064 теглил една черта... Изчислявам тази вероятност, 168 00:08:31,064 --> 00:08:34,071 като използвам биномното разпределение. 169 00:08:34,071 --> 00:08:37,926 И как съм направил това? Каква е вероятността, 170 00:08:37,926 --> 00:08:41,300 ако съм направил общо 10 стъпки, да... 171 00:08:41,300 --> 00:08:44,080 Само ще сменя цветовете, 172 00:08:44,080 --> 00:08:46,340 за да стане по-интересно. 173 00:08:46,340 --> 00:08:48,016 Дали има лилаво тук? 174 00:08:48,016 --> 00:08:51,023 Ще използвам синьото. 175 00:08:51,023 --> 00:08:54,180 И така синьо за биномното разпределение. 176 00:08:54,180 --> 00:08:58,060 Тук са показани всички стъпки, колко са те? 177 00:08:58,060 --> 00:09:00,491 Стъпките са общо 10. 178 00:09:00,491 --> 00:09:04,430 И така, 10 факториел, това е като броя опити, които съм провел. 179 00:09:04,430 --> 00:09:08,492 От тези 10 стъпки, решавам, че ще направя 0 стъпки наляво. 180 00:09:08,492 --> 00:09:14,038 И така, 0 факториел, умножено по факториел от 10 минус 0. 181 00:09:14,038 --> 00:09:16,038 Това е 10 над 0. 182 00:09:16,038 --> 00:09:19,668 Решавам, че от общо 10 стъпки 0 са наляво. 183 00:09:19,668 --> 00:09:23,679 Умножено по вероятността от 0 стъпки наляво, т.е. това е вероятността 184 00:09:23,679 --> 00:09:28,011 да направя стъпка наляво. Направил съм 0 такива, по вероятността 185 00:09:28,011 --> 00:09:31,624 да направя стъпка надясно, а от тези съм направил 10. 186 00:09:31,624 --> 00:09:35,004 И така получаваме числото 0,001. 187 00:09:35,004 --> 00:09:37,070 Така ни диктува биномното разпределение. 188 00:09:37,070 --> 00:09:44,052 А после, по подобен начин, това е равно на 10 факториел върху 1 факториел, 189 00:09:44,052 --> 00:09:47,007 умножено по 10 минус 1 факториел. 190 00:09:47,007 --> 00:09:47,082 Така получавам това число. 191 00:09:47,082 --> 00:09:50,064 И отново, ако кликнеш върху самата клетка в таблицата, 192 00:09:50,064 --> 00:09:51,096 ще видите обяснението. 193 00:09:51,096 --> 00:09:53,001 Направил съм го много пъти. 194 00:09:53,001 --> 00:09:54,609 Това е просто една биномна сметка. 195 00:09:54,609 --> 00:09:59,008 И след това, тук, след този ред, това можеш 196 00:09:59,008 --> 00:10:00,451 просто да не го гледаш. 197 00:10:00,451 --> 00:10:02,782 То е тук, за да мога да разиграя различни сценарии. 198 00:10:02,782 --> 00:10:09,049 Например, ако отворим моята таблица, и вместо да направим 199 00:10:09,049 --> 00:10:17,548 10 стъпки, решим да направим 20 стъпки, тогава всичко се променя. 200 00:10:17,548 --> 00:10:23,040 Затова и тук долу, от определена стъпка нататък, 201 00:10:23,040 --> 00:10:26,012 цялото нещо като че ли се повтаря. 202 00:10:26,012 --> 00:10:28,000 Ще те оставя да помислиш защо съм го направил така. 203 00:10:28,000 --> 00:10:30,020 Може би трябваше да направя по-прегледна таблица. 204 00:10:30,020 --> 00:10:33,489 Но това не променя точковата диаграма, която съм направил. 205 00:10:33,489 --> 00:10:38,016 Ето, графиката в синьо, която едва се вижда, заради лилавото, 206 00:10:38,016 --> 00:10:39,679 което е почти върху нея. 207 00:10:39,679 --> 00:10:43,055 Хм, нека я направя по-малка, за да се вижда по-добре. 208 00:10:43,055 --> 00:10:48,008 Да предположим, че съм направил само 6 стъпки. 209 00:10:48,008 --> 00:10:51,020 Всъщност, все още е трудно да се забележи разликата между двете. 210 00:10:51,020 --> 00:10:54,059 Нека повторя, целта на упражнението е да видиш, че 211 00:10:54,059 --> 00:10:56,417 нормалното разпределение е добро приближение. 212 00:10:56,417 --> 00:10:58,073 Но те са толкова подобни, че дори не можем да забележим 213 00:10:58,073 --> 00:10:59,482 разликата на моята графика. 214 00:10:59,482 --> 00:11:02,010 Ако направиш само 4 стъпки, ОК, мисля, че тук може да се види. 215 00:11:02,010 --> 00:11:04,631 Синьото тук е... 216 00:11:04,631 --> 00:11:08,816 Нека да активирам инструмента за рисуване. 217 00:11:10,032 --> 00:11:12,083 Синята крива е някъде тук. 218 00:11:12,083 --> 00:11:14,470 Това е биномното разпределение. 219 00:11:14,470 --> 00:11:18,390 Тук има само няколко точки. Ето, точките стигат само до тук. 220 00:11:18,390 --> 00:11:21,598 Тук са случаите, в които правя 0 стъпки наляво, 1 стъпка наляво, 2 стъпки наляво, 221 00:11:21,598 --> 00:11:23,473 3 стъпки наляво, 4 стъпки наляво. 222 00:11:23,473 --> 00:11:25,645 След това правя графиката и виждам каква е вероятността, 223 00:11:25,645 --> 00:11:27,424 ако използвам биномното разпределение. 224 00:11:27,424 --> 00:11:29,551 А ето тук е и моята крайна позиция, нали така? 225 00:11:29,551 --> 00:11:33,626 Ако направя 0 стъпки наляво, тогава правя 4 стъпки надясно, 226 00:11:33,626 --> 00:11:36,009 така че моята крайна позиция е на 4, и това е 227 00:11:36,009 --> 00:11:37,875 ето този сценарий тук. 228 00:11:37,875 --> 00:11:41,622 Нека сменя цвета отново и да върна жълтото, за да се вижда по-добре. 229 00:11:44,049 --> 00:11:49,663 Ако направя 4 стъпки наляво, тогава правя 0 стъпки надясно и 230 00:11:49,663 --> 00:11:52,077 крайната ми позиция е на минус 4. 231 00:11:52,077 --> 00:11:54,002 Това е ето тук. 232 00:11:54,002 --> 00:11:58,498 Ако направя по равен брой стъпки в двете посоки, това е този сценарий, 233 00:11:58,498 --> 00:12:00,610 ще съм в неутрална позиция. 234 00:12:00,610 --> 00:12:02,234 Ще съм останал в средата ето тук. 235 00:12:02,234 --> 00:12:05,036 Ако направя 2 стъпки надясно и след това 2 стъпки наляво, или 236 00:12:05,036 --> 00:12:07,062 обратното, първо направя 2 стъпки наляво и после направя 237 00:12:07,062 --> 00:12:09,075 2 стъпки надясно, все се озовавам тук. 238 00:12:09,075 --> 00:12:12,462 Надявам се това да ти звучи смислено. 239 00:12:12,462 --> 00:12:13,968 Телефонът ми звъни. 240 00:12:13,968 --> 00:12:17,695 Няма да вдигна, тъй като нормалното разпределение е твърде важна тема. 241 00:12:17,695 --> 00:12:21,004 Всъщност деветседмичният ми син гледа това видео, така че за първи път 242 00:12:21,004 --> 00:12:23,020 имам публика наживо. 243 00:12:23,020 --> 00:12:27,029 Той може и да запомни нещо за нормалното разпределение. 244 00:12:27,029 --> 00:12:30,064 И така, синята линия ето тук, вероятно ще трябва да я повторя 245 00:12:30,064 --> 00:12:35,047 с жълто, за да я виждаш, е графиката на биномното 246 00:12:35,047 --> 00:12:36,050 разпределение. 247 00:12:36,050 --> 00:12:40,062 Аз съм свързал точките, но все още можеш да видиш, 248 00:12:40,062 --> 00:12:42,051 че биномното разпределение изглежда горе-долу така. 249 00:12:42,051 --> 00:12:47,520 Това е вероятността да се озовеш на минус 4. 250 00:12:47,520 --> 00:12:51,566 Това е вероятността да се озовеш на минус 2. 251 00:12:51,566 --> 00:12:55,038 Това е вероятността да не отидеш 252 00:12:55,038 --> 00:12:57,494 никъде. 253 00:12:57,494 --> 00:13:06,002 А това е вероятността да се озовеш 2 крачки надясно. 254 00:13:06,002 --> 00:13:09,050 Нека поправя и това, трябва да е тук някъде. А това – 4 надясно. 255 00:13:09,050 --> 00:13:11,066 Това е биномното разпределение. Аз просто отбелязах на графиката 256 00:13:11,066 --> 00:13:14,016 стойностите, дадени тук. 257 00:13:14,049 --> 00:13:16,051 Това е 0,375, това е 0,375. 258 00:13:16,051 --> 00:13:18,000 Това е височината на другото. 259 00:13:18,000 --> 00:13:21,032 И така, това, което исках да ти покажа, е, че нормалното 260 00:13:21,032 --> 00:13:24,472 разпределение е добро приближение на биномното разпределение. 261 00:13:24,472 --> 00:13:29,344 И така, това, което исках да обясня е, че нормалното 262 00:13:29,344 --> 00:13:34,087 разпределение ми казва каква е вероятността 263 00:13:34,087 --> 00:13:38,017 да направя точно 0 крачки наляво. 264 00:13:38,017 --> 00:13:42,025 Тук нещата са малко по-сложни, защото нормалното разпределение... 265 00:13:42,025 --> 00:13:45,477 Биномното разпределение е дискретно вероятностно разпределение. 266 00:13:45,487 --> 00:13:48,010 Можеш да погледнеш тази диаграма или тук и да попиташ каква е 267 00:13:48,010 --> 00:13:56,567 вероятността да направиш точно 1 стъпка наляво и 3 надясно, 268 00:13:56,567 --> 00:13:58,015 за да се озовеш на това място? 269 00:13:58,015 --> 00:14:00,052 Добре, просто поглеждаш тази графика и казваш: "О, това е 270 00:14:00,052 --> 00:14:02,029 този сценарий, 271 00:14:02,029 --> 00:14:05,010 Точно казах каква е тази вероятност, тя е 0,25. 272 00:14:05,010 --> 00:14:07,609 И си казваш:,"О, имам 25% шанс да се озова 273 00:14:07,609 --> 00:14:12,000 2 стъпки надясно." 274 00:14:12,000 --> 00:14:14,009 Това е 25% шанс. 275 00:14:14,009 --> 00:14:17,599 Нормалното разпределение е непрекъснато вероятностно 276 00:14:17,599 --> 00:14:20,017 разпределение, което означава, че представлява непрекъсната крива. 277 00:14:20,017 --> 00:14:22,012 То изглежда по този начин, прилича на камбановидна крива, която 278 00:14:22,012 --> 00:14:26,039 стига до безкрайността и се приближава до 0 в двата си края. 279 00:14:26,039 --> 00:14:28,009 Изглежда горе-долу така. 280 00:14:28,009 --> 00:14:30,003 Това е едно непрекъснато вероятностно разпределение. 281 00:14:30,003 --> 00:14:31,079 Не можеш просто да избереш някаква точка и да попиташ 282 00:14:31,079 --> 00:14:35,025 каква е вероятността да се озовеш 2 стъпки надясно. 283 00:14:35,025 --> 00:14:37,338 Защото ако попиташ това, истинската вероятност 284 00:14:37,338 --> 00:14:39,788 това да се случи точно така... мда, трябва да гледаш видеото, 285 00:14:39,788 --> 00:14:42,016 посветено на плътността на вероятностните функции, но... 286 00:14:42,016 --> 00:14:45,026 вероятността да се озовеш точно 2 стъпки надясно, 287 00:14:45,026 --> 00:14:48,050 искам да кажа точно, с точност до атома, е близо до 0. 288 00:14:48,050 --> 00:14:51,042 В действителност трябва да уточниш някакъв интервал около тази стойност. 289 00:14:51,042 --> 00:14:56,089 Интервалът, който аз разглеждам, е 2 стъпки плюс половин 290 00:14:56,089 --> 00:14:58,033 стъпка във всяка посока. 291 00:14:58,033 --> 00:14:58,069 Нали така? 292 00:14:58,069 --> 00:15:00,037 Ако говорим за стъпки. 293 00:15:00,037 --> 00:15:03,084 За да го разбереш по-добре, ето какво съм направил – взех стойността на 294 00:15:03,084 --> 00:15:07,027 функцията на вероятностната плътност. 295 00:15:07,027 --> 00:15:09,060 И сега ще ти покажа как съм получил тази стойност. 296 00:15:09,060 --> 00:15:12,045 И след това умножавам това по 1. 297 00:15:12,045 --> 00:15:14,058 И така получавам тази площ. 298 00:15:14,058 --> 00:15:17,062 И използвам това като приближение за тази площ. 299 00:15:17,062 --> 00:15:19,058 Ако наистина искаме да сме прецизни в това, което правим, 300 00:15:19,058 --> 00:15:22,430 за да получим по-добро приближение, можем да вземем интеграла 301 00:15:22,430 --> 00:15:26,075 на тази крива между тези две точки. 302 00:15:26,075 --> 00:15:27,997 По-късно ще го направим. 303 00:15:27,997 --> 00:15:30,008 Но засега бих искал да ти покажа логиката, да ти дам увереност за това, че 304 00:15:30,008 --> 00:15:32,047 биномното разпределение наистина се припокрива с 305 00:15:32,047 --> 00:15:33,377 нормалното разпределение. 306 00:15:33,377 --> 00:15:36,028 И така, как съм получил това число тук? 307 00:15:36,028 --> 00:15:41,297 Добре, каква е вероятността за... О, не, нека използвам това число тук, 308 00:15:41,297 --> 00:15:47,160 не искам да работя с 0 стъпки.. каква е вероятността да направя 1 крачка наляво? 309 00:15:47,160 --> 00:15:49,650 Приехме, че стъпките наляво са успех. 310 00:15:49,657 --> 00:15:52,385 Каква е вероятността... 311 00:15:52,385 --> 00:15:59,008 И така, вероятността от 1, това е равно на 1, разделено на стандартното отклонение. 312 00:15:59,008 --> 00:16:02,045 Когато направихме само 4 крачки, стандартното отклонение беше 1. 313 00:16:02,045 --> 00:16:03,077 И така 1, разделено на 1. 314 00:16:03,077 --> 00:16:04,095 Всъщност, нека променя това. 315 00:16:04,095 --> 00:16:08,033 защото трябва да е.. да е... нека го променя. 316 00:16:08,033 --> 00:16:12,854 Да изберем по-голямо число. 317 00:16:12,854 --> 00:16:13,804 Не съм сигурен... 318 00:16:13,804 --> 00:16:16,474 Да се върнем към примера с 10-те стъпки. 319 00:16:16,474 --> 00:16:19,010 Добре. 320 00:16:19,010 --> 00:16:20,415 И така, ако това е 10. 321 00:16:20,415 --> 00:16:24,035 И нека пак активирам инструмента за рисуване 322 00:16:24,035 --> 00:16:28,090 И така, тази сметка тук.. 323 00:16:28,090 --> 00:16:30,098 Нека да извършим тази сметка. 324 00:16:30,098 --> 00:16:34,065 Всъщност, ще е по-добре да направим тази сметка. 325 00:16:34,065 --> 00:16:37,015 И така, каква е вероятността да съм направил 2 стъпки наляво? 326 00:16:37,015 --> 00:16:39,794 Ако съм направил 2 стъпки наляво, а общо стъпките са 10, значи имам 327 00:16:39,794 --> 00:16:42,979 8 стъпки надясно и следователно накрая съм 6 стъпки надясно. 328 00:16:42,979 --> 00:16:46,009 И това отговаря на тази точка тук. 329 00:16:46,009 --> 00:16:47,196 И така, каква е вероятността? 330 00:16:47,196 --> 00:16:49,007 Как да я определя, като използвам функцията на вероятностната 331 00:16:49,007 --> 00:16:50,026 плътност? 332 00:16:50,026 --> 00:16:51,374 Как да определя тази височина? 333 00:16:51,374 --> 00:16:56,014 Добре, да кажем, че вероятността да направя 2 стъпки наляво, така се 334 00:16:56,014 --> 00:16:58,012 смята и ако отидеш върху клетката в електронната таблица, ще 335 00:16:58,012 --> 00:17:04,015 видиш това... Вероятността е равна на 1, разделено на стандартното отклонение, 336 00:17:04,015 --> 00:17:11,035 1,581 (просто съм направил препратка към клетката там), 337 00:17:11,035 --> 00:17:14,999 умножено по корен квадратен от 2 пъти пи. 338 00:17:15,049 --> 00:17:18,088 Винаги се изумявам как така е умножено по пи е равно на 339 00:17:18,088 --> 00:17:19,094 минус 1. 340 00:17:19,094 --> 00:17:21,008 Но ето ти още един изумителен факт. 341 00:17:21,008 --> 00:17:25,052 С натрупването на повече опити, изведнъж получаваме 342 00:17:25,052 --> 00:17:28,074 формула, която съдържа е, пи и корен квадратен, но идеята е, 343 00:17:28,074 --> 00:17:30,030 тези числа непрекъснато се появяват. 344 00:17:30,030 --> 00:17:33,028 Това носи информация за "Реда във вселената", 345 00:17:33,028 --> 00:17:34,011 Ред с главно Р. 346 00:17:34,011 --> 00:17:42,780 Но нека продължим, всичко това, умножено по е на минус 1/2 по х. 347 00:17:42,780 --> 00:17:46,030 И така, опитваме се да намерим х, т.е. два успешни опита. 348 00:17:46,030 --> 00:17:54,077 Да направим точно 2 стъпки наляво, значи 2 минус средната стойност. 349 00:17:54,077 --> 00:18:01,000 А средната стойност е 5, и става 2 минус 5, разделено на стандартното 350 00:18:01,000 --> 00:18:10,016 отклонение, което е 1,581, и цялото това на квадрат. 351 00:18:10,016 --> 00:18:12,967 Така получаваме това число. 352 00:18:13,161 --> 00:18:18,058 И така, казах ти, че тази формула просто ми дава 353 00:18:18,058 --> 00:18:21,054 тази стойност тук. 354 00:18:21,054 --> 00:18:25,030 Ако искам да изчисля с точност тази вероятност, 355 00:18:25,030 --> 00:18:27,016 ми трябва тази площ. 356 00:18:27,016 --> 00:18:30,020 Ако просто използвам една права, нейната площ е 0. 357 00:18:30,074 --> 00:18:36,000 Нека ти напомня, в този случай можем да сме само 2 крачки настрани, 358 00:18:36,000 --> 00:18:37,606 тъй като се интересуваме от точния брой крачки. 359 00:18:37,606 --> 00:18:40,239 Но нормалното разпределение е непрекъсната функция на 360 00:18:40,239 --> 00:18:44,027 вероятностната плътност, т.е. може да ни каже каква е 361 00:18:44,027 --> 00:18:48,572 вероятността да сме направили 2,183 стъпки. 362 00:18:48,572 --> 00:18:51,090 Това, разбира се, може да се случи само, ако всеки път 363 00:18:51,090 --> 00:18:53,032 правим безкрайно малки стъпки. 364 00:18:53,032 --> 00:18:54,042 Но това е употребата на разпределението. 365 00:18:54,042 --> 00:18:56,009 То се получава, когато започнеш да 366 00:18:56,009 --> 00:18:56,094 правиш безкраен брой стъпки. 367 00:18:56,094 --> 00:18:59,030 Но то може да се използва като приближение на дискретното. 368 00:18:59,030 --> 00:19:01,507 И начинът това да стане е да кажеш каква е вероятността да съм 369 00:19:01,507 --> 00:19:03,015 в рамките на една стъпка от тази точка. 370 00:19:03,015 --> 00:19:05,040 И така, умножавам тази височина, която 371 00:19:05,040 --> 00:19:08,652 съм изчислил тук, по 1. 372 00:19:08,652 --> 00:19:13,038 И така, нека приемем, че това тук има основа 1, за да пресметнем 373 00:19:13,038 --> 00:19:15,010 площта, която използвам като приближение. 374 00:19:15,010 --> 00:19:19,022 И така, просто умножаваме това по 1 и получаваме това число тук. 375 00:19:19,022 --> 00:19:20,024 И нека само да ти покажа. 376 00:19:20,024 --> 00:19:26,004 Дори и само при 10 опита, кривите, нормалното разпределение 377 00:19:26,004 --> 00:19:28,054 тук е в лилаво, а биномното разпределение 378 00:19:28,054 --> 00:19:29,014 е в синьо. 379 00:19:29,014 --> 00:19:31,006 И така, те са почти една върху друга. 380 00:19:31,006 --> 00:19:35,060 Докато броят стъпки беше малък, те се различаваха. 381 00:19:35,060 --> 00:19:39,085 Но колкото повече стъпки правим, толкова повече те се сливат, 382 00:19:39,085 --> 00:19:41,031 почти се припокриват, и аз бих искал да те окуража 383 00:19:41,031 --> 00:19:42,070 да си поиграеш с електронната таблица. 384 00:19:42,070 --> 00:19:46,017 Всъщност, нека ти покажа, че те се припокриват. 385 00:19:46,017 --> 00:19:48,053 Единият от листовете в тази електронна таблица е посветен на припокриването, 386 00:19:48,053 --> 00:19:52,018 ако кликнеш върху „convergence”, ще го видиш. 387 00:19:52,018 --> 00:19:54,045 Това е същото нещо, но исках да ти покажа какво 388 00:19:54,045 --> 00:19:58,094 се случва във всяка една точка. 389 00:19:58,094 --> 00:20:02,054 Нека ти дам малко разяснения за тази таблица. 390 00:20:02,054 --> 00:20:04,003 И така, това е вероятността да се придвижа 391 00:20:04,003 --> 00:20:06,056 наляво и надясно, нали така? 392 00:20:06,056 --> 00:20:09,005 С други думи, фиксирам някаква точка и казвам каква е 393 00:20:09,005 --> 00:20:11,032 вероятността, а ти можеш да смениш тази точка, вероятността 394 00:20:11,032 --> 00:20:13,011 крайната ми позиция да е 10. 395 00:20:13,011 --> 00:20:18,072 А това всъщност ти казва, че ако направя 10 стъпки, за да се 396 00:20:18,072 --> 00:20:21,032 озова накрая в позиция 10 надясно, значи трябва да направя 10 стъпки 397 00:20:21,032 --> 00:20:23,991 надясно и 0 стъпки наляво. 398 00:20:26,023 --> 00:20:31,076 Ако направя 20 стъпки, за да се озова 10 стъпки надясно, ще трябва да 399 00:20:31,076 --> 00:20:34,057 направя 15 стъпки надясно и 5 наляво. 400 00:20:34,057 --> 00:20:37,077 По подобен начин, ако направя общо 80 стъпки, ако хвърля монетата 80 пъти, 401 00:20:37,077 --> 00:20:41,057 за да определя дали да пристъпя надясно или наляво, за да се озова 402 00:20:41,057 --> 00:20:46,043 10 стъпки надясно, трябва да направя 45 стъпки надясно и 35 наляво в 403 00:20:46,043 --> 00:20:48,762 прозволен ред и действително ще се озова 10 крачки надясно. 404 00:20:48,762 --> 00:20:52,092 И така, това, което искам да разбера, е, ако започна да увеличавам общия 405 00:20:52,092 --> 00:20:58,065 брой хвърляния на монетата, тук максимумът е 170, та, ако 406 00:20:58,065 --> 00:21:01,034 хвърля монетата безкраен брой пъти, искам да разбера каква е 407 00:21:01,034 --> 00:21:03,753 вероятността моята крайна позиция да бъде 408 00:21:03,753 --> 00:21:05,007 10 стъпки надясно. 409 00:21:05,007 --> 00:21:08,088 И искам да ти покажа, че колкото повече хвърляния правя, толкова 410 00:21:08,088 --> 00:21:11,073 повече нормалното разпределение става по-добро и по-добро 411 00:21:11,073 --> 00:21:15,025 приближение на биномното разпределение. 412 00:21:15,025 --> 00:21:18,050 И така, тук е пресметната биномната вероятност, точно 413 00:21:18,050 --> 00:21:21,003 както го правихме и преди, и ако кликнеш върху клетката, ще можеш 414 00:21:21,003 --> 00:21:22,790 да видиш формулата. 415 00:21:22,790 --> 00:21:26,017 Стъпките наляво се приемат за успешен опит. 416 00:21:26,401 --> 00:21:32,092 И така, това е 10 над 0, а ние знаем какво означава това. 417 00:21:32,092 --> 00:21:36,083 Това означава 10 факториел върху 0 факториел, разделено на факториел от 418 00:21:36,083 --> 00:21:43,021 10 минус 0, умножено по 0,5 на 0-ва степен и по 0,5 на 10-та степен. 419 00:21:43,021 --> 00:21:45,168 Така получаваме това число тук. 420 00:21:45,168 --> 00:21:52,053 Ако отидем на това тук, нека видим, това тук е изчислено... 421 00:21:52,053 --> 00:21:53,072 Всъщност, нека го напиша, тъй като според мен 422 00:21:53,072 --> 00:21:54,028 ще е интересно. 423 00:21:54,028 --> 00:21:58,053 Направил съм общо 60 стъпки, следователно 60 факториел, 424 00:21:58,053 --> 00:22:03,219 разделено на, трябват ми 25 стъпки наляво, следователно 25 факториел. 425 00:22:03,219 --> 00:22:09,050 И така, това е факториел от 60 минус 25, умножено по вероятността за 426 00:22:09,050 --> 00:22:12,050 стъпка наляво, а тези стъпки са 25, умножено по вероятността за 427 00:22:12,050 --> 00:22:17,085 стъпка надясно, а пък тези стъпки са 35. 428 00:22:17,085 --> 00:22:21,049 И така, този ред просто показва биномната вероятност, 429 00:22:21,049 --> 00:22:23,039 вероятността, която ни показва биномното разпределение. 430 00:22:23,039 --> 00:22:25,022 А след това са пресметнати средната и дисперсията за всеки от 431 00:22:25,022 --> 00:22:27,033 тези сценарии и можеш да видиш формулите, 432 00:22:27,033 --> 00:22:30,004 но средната стойност е просто вероятността да направиш 433 00:22:30,004 --> 00:22:32,678 стъпка наляво, разделена на общия брой стъпки. 434 00:22:32,678 --> 00:22:36,025 А дисперсията е вероятността за лява стъпка по вероятността за 435 00:22:36,025 --> 00:22:38,016 дясна стъпка по общия брой крачки. 436 00:22:38,016 --> 00:22:40,067 А след това и вероятността от нормалното разпределение. 437 00:22:40,067 --> 00:22:43,080 И така, нека повторя, просто използвам тази вероятност. 438 00:22:43,080 --> 00:22:45,030 Получавам и нейното приближение по същия начин. 439 00:22:45,030 --> 00:22:49,033 Ето, например за този сценарий. 440 00:22:49,033 --> 00:22:51,061 Ексел има функция, която да пресмята нормалното разпределние, но аз 441 00:22:51,061 --> 00:22:53,075 всъщност съм въвел формулата, тъй като исках да ти покажа 442 00:22:53,075 --> 00:22:58,039 какво се крие под тази функция на Ексел. 443 00:22:58,091 --> 00:23:04,076 И така, всъщност казвам, каква е вероятността да направя 25 стъпки наляво? 444 00:23:04,076 --> 00:23:06,772 Не, извинявам се, 45 стъпки наляво. 445 00:23:06,772 --> 00:23:14,689 И така, вероятността за 45 стъпки наляво е равна на 1 446 00:23:14,689 --> 00:23:17,393 разделено на стандартното отклонение. 447 00:23:17,393 --> 00:23:20,043 И така, в този сценарий стандартното отклонение е 448 00:23:20,043 --> 00:23:21,502 корен квадратен от 25. 449 00:23:21,502 --> 00:23:32,091 И така, 5, по корен квадратен от 2 пъти пи, цялото по е на степен минус 1/2 по 45 минус 450 00:23:32,091 --> 00:23:37,078 средната, т.е. минус 50, разделено на стандартното отклонение, което 451 00:23:37,078 --> 00:23:41,000 пресметнахме, че е 5, цялото на квадрат. 452 00:23:41,000 --> 00:23:45,005 И така, тази сметка ми казва каква е вероятността в този случай, според 453 00:23:45,005 --> 00:23:48,009 нормалното разпределение с това стандартно отклонение 454 00:23:48,009 --> 00:23:51,001 и с тази средна стойност. След това умножавам това по 1. Това не 455 00:23:51,001 --> 00:23:53,027 се вижда във формулата, тъй като не изписвам „по 1” 456 00:23:53,027 --> 00:23:55,001 за да намеря площта под кривата. 457 00:23:55,001 --> 00:23:57,038 Причината е, че нали си спомняш, това е непрекъсната 458 00:23:57,038 --> 00:23:58,048 вероятностна функция. 459 00:23:58,048 --> 00:24:01,853 Това тук просто ми дава стойността, но за да изчисля вероятността да 460 00:24:01,853 --> 00:24:03,728 се озова в рамките на интервал от 1 стъпка, аз трябва 461 00:24:03,728 --> 00:24:05,021 да умножа по 1. 462 00:24:05,021 --> 00:24:06,033 Всъщност това са приближения. 463 00:24:06,033 --> 00:24:08,031 В действителност би трябвало да взема интеграла от тази точка до тази, 464 00:24:08,031 --> 00:24:11,090 но и този правоъгълник е доста добро приближение. 465 00:24:11,090 --> 00:24:17,905 В тази таблица ти показвам, че с увеличаване на броя на стъпките. 466 00:24:17,905 --> 00:24:22,605 разликата между това, което ви казва нормалното разпределение, 467 00:24:22,605 --> 00:24:25,662 и това, което ти казва биномното разпределение, 468 00:24:25,662 --> 00:24:27,795 става все по-малка и по-малка. 469 00:24:27,795 --> 00:24:30,783 Става въпрос за вероятността накрая да се озовеш 470 00:24:30,783 --> 00:24:32,009 10 крачки надясно. 471 00:24:32,009 --> 00:24:35,003 Разбира се, ти можеш да промениш числото тук. 472 00:24:35,003 --> 00:24:37,023 Нека го променя, за да ти покажа. 473 00:24:37,023 --> 00:24:38,036 Можеш да решиш да пресметнеш вероятността да се озовеш 474 00:24:38,036 --> 00:24:43,787 15 крачки надясно. 475 00:24:43,787 --> 00:25:02,568 Хм, тук нещо не е наред. Нека проверя. При 12 се припокриват. И после при 13.... 476 00:25:02,568 --> 00:25:04,557 Мисля, че има някаква грешка с променливата запетая, 477 00:25:04,557 --> 00:25:07,008 защото при работа с факториели на големи числа не работи така, 478 00:25:07,008 --> 00:25:08,076 както очаквам. 479 00:25:08,076 --> 00:25:18,052 Но ако пробваш с 3, 5 или 10... Не, не, нещо странно се случва. 480 00:25:18,052 --> 00:25:20,059 Може да се наложи да увеличиш числата още повече. 481 00:25:20,059 --> 00:25:23,081 При 10 крачки, двете разпределения определено се припокриват. 482 00:25:23,081 --> 00:25:26,004 А аз ще се опитам да разбера защо получавам такива странни графики. 483 00:25:26,004 --> 00:25:31,091 За 11... Хм, всичко е объркано. 484 00:25:31,091 --> 00:25:35,010 Вероятно, когато заснемам екрана, нещата се объркват. Но както и да е... 485 00:25:35,010 --> 00:25:37,056 Целта на това упражнение беше да ти покаже, че ако искаш да изчислиш 486 00:25:37,056 --> 00:25:41,466 вероятността да се озовеш 10 крачки надясно, колкото повече 487 00:25:41,466 --> 00:25:44,813 пъти хвърляш монетата, толкова повече нормалното 488 00:25:44,813 --> 00:25:49,083 разпределение се превръща в по-добро приближение на това, 489 00:25:49,083 --> 00:25:51,543 което в действителност е биномно разпределение. 490 00:25:51,543 --> 00:25:54,022 И с приближаване на безкрайността, двете разпределение всъщност 491 00:25:54,022 --> 00:25:55,011 се сливат едно с друго. 492 00:25:55,011 --> 00:25:57,055 Както и да е, това е краят на това видео. 493 00:25:57,055 --> 00:25:59,028 Всъщност, ще направя още няколко филмчета за нормалното 494 00:25:59,028 --> 00:26:02,002 разпределение, тъй като то е толкова важно. 495 00:26:02,002 --> 00:26:03,878 До скоро.