< Return to Video

Statistics: Sample Variance

  • 0:01 - 0:03
    Дане відео є новітницьким
  • 0:03 - 0:06
    з багатьох причин.
  • 0:06 - 0:10
    Перша причина - я збираюся надати вам
    вступ до розбіжності вибірки,
  • 0:10 - 0:12
    що само по собі є дуже цікавим.
  • 0:12 - 0:15
    І я спробую записати це відео у HD якості.
  • 0:15 - 0:16
    І сподіваюся, ви зможете переглядати
    більш велике та чітке відео
  • 0:16 - 0:17
    ніж це було до того.
  • 0:17 - 0:19
    Ми ще побачимо як воно буде.
  • 0:19 - 0:22
    Отож, це певним чином дослід, який ми
    проведемо разом.
  • 0:22 - 0:25
    Перш ніж почати розгляд розбіжності
    вибірки, я гадаю,
  • 0:25 - 0:28
    що повчальним буде перегляд розбіжності
  • 0:28 - 0:29
    загальної сукупності.
  • 0:29 - 0:32
    І ми порівняємо їх формули.
  • 0:32 - 0:35
    Розбіжність загальної сукупності, а це
    грецька
  • 0:35 - 0:36
    літера сиґма.
  • 0:36 - 0:37
    Маленька сиґма у квадраті.
  • 0:37 - 0:38
    Це означає розбіжність.
  • 0:38 - 0:41
    Я знаю це дивно, що розбіжність вже
  • 0:41 - 0:42
    має квадрат у собі.
  • 0:42 - 0:43
    Ви ж не підносите до
    квадрату змінну.
  • 0:43 - 0:44
    А це змінна.
  • 0:44 - 0:46
    Сиґма у квадраті
    означає розбіжність.
  • 0:46 - 0:47
    Насправді, нумо запишу це.
  • 0:47 - 0:48
    Це дорівнює розбіжності.
  • 0:52 - 0:55
    І це дорівнює, ви берете кожне значення,
  • 0:55 - 0:59
    і ми назвемо їх х
    з нижнім індексом і.
  • 0:59 - 1:02
    Ми беремо кожне значення, з’ясовуємо
    як далеко воно знаходиться від
  • 1:02 - 1:09
    середнього значення загальної сукупності,
    підносимо це до квадрату, а тоді знаходимо
  • 1:09 - 1:11
    середнє арифметичне усього цього.
  • 1:11 - 1:13
    Отож, ми знаходимое дане середньо
    арифметичне і додаємо це усе.
  • 1:13 - 1:15
    Ми починаємо від і=1.
  • 1:15 - 1:18
    Від найпершого значення і так далі
    аж до n-го значення.
  • 1:18 - 1:20
    А тоді, усереднено,
    ми додаємо їх усіх та
  • 1:20 - 1:22
    згодом ділимо на n.
  • 1:22 - 1:26
    Отож, розбіжність це середня величина
    цих квадратних відстаней
  • 1:26 - 1:27
    кожного значення від
    середнього значення.
  • 1:27 - 1:30
    І просто аби надати вам
    знову розуміння, то тут, по суті
  • 1:30 - 1:33
    сказано, усереднено, як далеко
    приблизно є кожне з цих
  • 1:33 - 1:34
    значень від даної середини.
  • 1:34 - 1:36
    Це найкращий шлях міркування
    про дану розбіжність.
  • 1:36 - 1:38
    А тепер що якщо ми
    маємо справу...Це ж було
  • 1:38 - 1:39
    для загальної
    сукупності, правильно?
  • 1:39 - 1:42
    А ми сказали, якщо ми
    бажаємо з’ясувати розбіжність
  • 1:42 - 1:45
    людського зросту у країні, то буде дуже
    важко
  • 1:45 - 1:46
    з’ясувати дану розбіжність для загальної
    сукупності.
  • 1:46 - 1:49
    Нам би знадобилося піти і, по суті,
    виміряти
  • 1:49 - 1:50
    зріст кожної людини.
  • 1:50 - 1:51
    А усього є 250 мільйонів людей у країні.
  • 1:51 - 1:55
    Або ж що якщо для певної загальної
    сукупності просто
  • 1:55 - 1:57
    цілковито неможливо отриматі дані
  • 1:57 - 1:58
    або певну випадкову
    змінну величину.
  • 1:58 - 1:59
    І ми поговоримо про
    це більше згодом.
  • 1:59 - 2:03
    Отож, у більшості випадків вам насправді
    треба оцінити цю розбіжність
  • 2:03 - 2:05
    знаходячи розбіжність вибірки.
  • 2:05 - 2:07
    Таким же чином ви можете не мати
    середнього значення загальної сукупності,
  • 2:07 - 2:10
    але можливо ви забажаєте оцінити його
    за допомогою знаходження
  • 2:10 - 2:11
    середнього значення вибірки.
  • 2:11 - 2:14
    І ми вивчимо це у даному першому відео.
  • 2:14 - 2:18
    Якщо це... якщо це уся загальна
    сукупність.
  • 2:18 - 2:20
    Це мільйони значень або ж навіть значення
  • 2:20 - 2:22
    у майбутньому, які ви ніколи зможете
    отримати, оскільки
  • 2:22 - 2:23
    це випадкова змінна величина.
  • 2:23 - 2:25
    Отож, це загальна сукупність.
  • 2:27 - 2:32
    Вам може бути потрібно просто оцінити
    речі шляхом проглядання вибірки.
  • 2:32 - 2:35
    І це насправді є суттю того, що
    відбувається у підсумковій
  • 2:35 - 2:36
    статистиці.
  • 2:36 - 2:39
    З’ясовуючи описову
    статистику щодо вибірки,
  • 2:39 - 2:41
    ми створюємо підсумки щодо
    загальної сукупності.
  • 2:41 - 2:45
    Нумо спробуємо виконати це для 100
    людей і поглянемо чи це матиме
  • 2:45 - 2:47
    статистично істотні результати, таке
    виконання буде
  • 2:47 - 2:49
    ймовірно працювати і для загальної
    сукупності загалом.
  • 2:49 - 2:50
    Отож, про що тут йдеться.
  • 2:50 - 2:52
    Дійсно важливо розуміти
    відмінності позначень
  • 2:52 - 2:54
    вибірки та загальної сукупності.
  • 2:54 - 2:58
    І важливо бути здатним знайти статистичні
    показники вибірки які,
  • 2:58 - 3:00
    у більшості випадків, можуть описати
    дану загальну сукупність або ж допомогти
  • 3:00 - 3:04
    нам оцінити параметри загальної
    сукупності.
  • 3:04 - 3:07
    Отож, чому дорівнює дане середнє
    значення?... Нумо перепишемо ці визначення.
  • 3:07 - 3:09
    Чому дорівнює середнє значення загальної
    сукупності?
  • 3:09 - 3:10
    Зроблю це бузковим.
  • 3:10 - 3:12
    Бузкове для загальної сукупності.
  • 3:12 - 3:14
    Середнє значення загальної сукупності.
  • 3:14 - 3:20
    Ви просто берете кожне з цих значень у
    загальній сукупності, хі-те.
  • 3:20 - 3:22
    Додаєте їх.
  • 3:22 - 3:24
    Починаємо з найпершого значення,
    а тоді рухаємося далі
  • 3:24 - 3:26
    аж до n-го значення.
  • 3:26 - 3:27
    І ділимо це на n.
  • 3:27 - 3:28
    Ми додаємо їх усі
    і ділимо на n.
  • 3:28 - 3:29
    Це дане середнє
    значення.
  • 3:29 - 3:30
    Отож, тоді підставимо
    це у дану формулу.
  • 3:30 - 3:33
    І ми побачимо як далеко знаходиться
    кожне значення від цього
  • 3:33 - 3:34
    центрального значення, від цього
    середнього значення.
  • 3:34 - 3:36
    І ми отримаємо розбіжність.
  • 3:36 - 3:40
    А тепер, що ж трапиться, якщо
    ми зробимо це для вибірки?
  • 3:40 - 3:43
    Якщо нам треба оцінити середнє значення
    загальної сукупності за допомогою
  • 3:43 - 3:47
    певного чину обчислення середнього
    значення вибірки, то найкраще що я
  • 3:47 - 3:49
    можу придумати... І справді це певного
    роду винайдені формули.
  • 3:49 - 3:51
    Свого часу люди сказали: "Що є кращим
  • 3:51 - 3:52
    способом для обрання вибірки?"
  • 3:52 - 3:55
    Ну, усе що ми в змозі насправді зробити
    так це знайти середню величину вибірки.
  • 3:55 - 3:57
    І це буде нашим середнім
    значенням вибірки.
  • 3:57 - 3:59
    І ми вивчили з першого відео, що це
    позначається...
  • 3:59 - 4:00
    Дана формула майже
    така ж сама як і ця.
  • 4:00 - 4:02
    Просто ці позначення різні.
  • 4:02 - 4:05
    Замість використання мю, ми
    використовуємо тут х з рискою нагорі.
  • 4:05 - 4:09
    Середнє значення вибірки дорівнює,
    знову ж таки ми беремо кожне з цих
  • 4:09 - 4:12
    значень тепер для вибірки, а не для усієї
    загальної сукупності.
  • 4:12 - 4:16
    Додаємо їх від найпершого значення і
  • 4:16 - 4:17
    так далі до n-го значення, правильно?
  • 4:17 - 4:21
    Нам сказано, що є
    n значень у цій вибірці.
  • 4:21 - 4:23
    А тоді ми ділимо це на кількість значень,
    що ми маємо.
  • 4:23 - 4:24
    Цілком правильно.
  • 4:24 - 4:26
    Це насправді така
    ж сама формула.
  • 4:26 - 4:28
    Це спосіб, згідно якого, я знаходив середнє
    значення для загальної сукупності,
  • 4:28 - 4:30
    а для вибірки ми знайшли середнє
    значення таким же чином.
  • 4:30 - 4:33
    І це можливо гарна оцінка середнього
    значення
  • 4:33 - 4:34
    загальної сукупності.
  • 4:34 - 4:36
    Тепер же стає цікавіше, коли ми
    говоримо вже про розбіжність.
  • 4:36 - 4:39
    Отож, вашою природньою реакцією є
    Гаразд, я маю цю вибірку.
  • 4:39 - 4:43
    Якщо мені треба оцінити розбіжність
    загальної сукупності, то чому б
  • 4:43 - 4:45
    просто не застосувати таку ж саму формулу
  • 4:45 - 4:46
    і для вибірки?
  • 4:46 - 4:49
    Отож, я міг би сказати... І це є насправді
    розбіжністю вибірки.
  • 4:49 - 4:55
    Для цієї формули використовується
    позначення s у квадраті.
  • 4:55 - 4:58
    Отож, сиґма це грецька
    літера рівнозначна s.
  • 4:58 - 5:00
    Тепер ми маємо
    справу з вибіркою,
  • 5:00 - 5:01
    ми просто пишемо s тут.
  • 5:01 - 5:02
    Отож? це розбіжність вибірки.
  • 5:02 - 5:04
    Нумо запишу це.
  • 5:04 - 5:05
    Розбіжність вибірки.
  • 5:12 - 5:16
    Це...Ми можемо просто сказати,
    що можливо гарним способом є знайти
  • 5:16 - 5:17
    розбіжність вибірки таким
    же самим чином.
  • 5:17 - 5:24
    Нумо знайдемо відстань
    кожного значення вибірки.
  • 5:24 - 5:27
    З’ясуємо як далеко воно від нашого
    середнього значення вибірки.
  • 5:27 - 5:29
    Тут ми використали середнє значення
    загальної сукупності, але зараз ми
  • 5:29 - 5:31
    використаємо середнє значення вибірки,
    оскільки це усе що у нас є.
  • 5:31 - 5:33
    Ми не знаємо чому дорівнює середнє
    значення загальної сукупності, тому
  • 5:33 - 5:36
    що не в змозі поглянути на усю загальну
    сукупність.
  • 5:36 - 5:36
    Піднесемо це до квадрату.
  • 5:36 - 5:38
    Це зробить дане число додатнім
    та має й інші властивості,
  • 5:38 - 5:40
    про які ми поговоримо згодом.
  • 5:40 - 5:43
    А тоді знаходимо середню величину
    усіх цих квадратних відстаней.
  • 5:43 - 5:45
    Отож, ви берете це з... Ви додаєте це усе.
  • 5:45 - 5:47
    І тут ми маємо n складових, правильно?
  • 5:47 - 5:49
    Маленьке n.
  • 5:49 - 5:52
    І ми ділимо на маленьке n.
  • 5:52 - 5:53
    І ви скажете: "Ну,
    це гарна оцінка."
  • 5:53 - 5:56
    Якою б не була ця розбіжність, це
    може бути гарною оцінкою
  • 5:56 - 5:57
    для загальної
    сукупності загалом.
  • 5:57 - 6:01
    Насправді це те, що деякі люди часто
    мають на думці, коли вони говорять
  • 6:01 - 6:02
    про розбіжність вибірки.
  • 6:02 - 6:05
    І іноді це насправді так.
  • 6:05 - 6:08
    Вони використовують тут маленьке n.
  • 6:08 - 6:10
    І причина, згідно якої вони чинять так
    полягає у тому, що ми ділимо на n.
  • 6:10 - 6:12
    І ви запитаєте: "Сале, що
    ж тут за проблема?"
  • 6:12 - 6:14
    І дана проблема... І надам вам певного
    розуміння цього, оскільки це
  • 6:14 - 6:16
    є насправді чимось, що зазвичай
    турбрує мій розум.
  • 6:16 - 6:19
    І я все ще щиро борюся з
  • 6:19 - 6:22
    розумінням цього.
  • 6:22 - 6:25
    Ну я маю розуміння цього, але це
    певним чином суворо
  • 6:25 - 6:27
    доводе мені, що це напевно саме цей
    випадок.
  • 6:27 - 6:28
    Але поміркуємо про це.
  • 6:28 - 6:30
    Якщо ми маємо низку
    чисел і я намалюю
  • 6:30 - 6:33
    числову пряму тут.
  • 6:33 - 6:36
    Якщо я намалюю числову пряму тут...
    Скажімо, ви знаєте що...
  • 6:36 - 6:39
    Скажімо, я маю низку чисел у
    моїй загальній сукупності.
  • 6:39 - 6:42
    Скажімо... я збираюся навмання
    обрати низку
  • 6:42 - 6:44
    чисел з моєї загальної сукупності.
  • 6:44 - 6:46
    І одні з них, що
    праворуч, є більшими
  • 6:46 - 6:47
    ніж ті, що ліворуч.
  • 6:49 - 6:53
    І якщо ми обираємо вибірку з
    них, можливо я оберу...
  • 6:53 - 6:55
    Ця вибірка є випадковою.
  • 6:55 - 6:56
    Нам насправді треба обрати
    випадкову вибірку.
  • 6:56 - 6:58
    Нам не треба жодних
    викривлень тут.
  • 6:58 - 7:03
    Отож, можливо, я оберу це, це, це
  • 7:03 - 7:05
    і це, правильно?
  • 7:05 - 7:07
    І тоді якщо ми знайшли середнє
    значення для цього числа,
  • 7:07 - 7:08
    цього, цього
    і цього числа.
  • 7:08 - 7:10
    Воно буде десь
    тут посередині.
  • 7:10 - 7:11
    А може бути десь ось тут.
  • 7:11 - 7:13
    А тоді якщо мені треба з’ясувати
    розбіжність вибірки використовуючи
  • 7:13 - 7:17
    цю формулу, тоді скажемо - Гаразд, ця
    квадратна відстань плюс ця
  • 7:17 - 7:21
    квадратна відстань плюс ця квадратна
    відстань плюс
  • 7:21 - 7:24
    ця квадратна відстань і знаходимо
    середню величину для них усіх.
  • 7:24 - 7:25
    А тоді я міг би
    отримати це число.
  • 7:25 - 7:28
    І це, ймовірно, було б доволі гарне
    наближення до
  • 7:28 - 7:30
    розбіжності цієї усієї загальної
    сукупності.
  • 7:30 - 7:32
    Середнє значення загальної
    сукупності ймовірно буде...
  • 7:32 - 7:33
    я не знаю.
  • 7:33 - 7:35
    Воно могло б бути доволі близько
    до цього.
  • 7:35 - 7:37
    Якщо ми насправді узяли усі ці значення
    і знайшли їх середню величину,
  • 7:37 - 7:39
    то можливо вони знаходяться десь тут.
  • 7:39 - 7:41
    А тоді якщо ми з’ясуємо дану
    розбіжність, то вона ймовірно буде
  • 7:41 - 7:44
    доволі близько до середньої величини
    усіх цих ліній,правильно?
  • 7:44 - 7:47
    Усіх даних відстаней розбіжності вибірки,
    правильно?
  • 7:47 - 7:47
    Цілком правильно.
  • 7:47 - 7:48
    Отож ви скажете:
    "Агов, Сале.
  • 7:48 - 7:50
    Це виглядає доволі непогано тепер.
  • 7:50 - 7:52
    Але при цьому є невеличка пастка."
  • 7:52 - 7:55
    Що якщо... При цьому завжди є ймовірність,
    що замість
  • 7:55 - 7:57
    обрання цих певного роду дуже добре
    розподілених чисел з моєї
  • 7:57 - 8:01
    вибірки, що якщо трапиться обрати
    це число, це
  • 8:01 - 8:04
    і це число у якості моєї... і скажімо
    це число,
  • 8:04 - 8:05
    у якості моєї вибірки?
  • 8:05 - 8:08
    Якою б не була наша вибірка,
    дане середнє значення
  • 8:08 - 8:10
    завжди буде посередині
    цього, правильно?
  • 8:10 - 8:13
    Отож, у цьому випадку, наше середнє
    значення вибірки може бути тут.
  • 8:13 - 8:15
    Отже, усі ці числа, ви можете
    сказати, що це число
  • 8:15 - 8:18
    не надто далеко від цього числа, це число
    не надто далеко, а тоді
  • 8:18 - 8:19
    й це число не надто далеко.
  • 8:19 - 8:22
    Наша розбіжність вибірки, коли ми
    робимо це таким чином, може
  • 8:22 - 8:24
    виявитися трохи занизькою.
  • 8:24 - 8:27
    Оскільки, усі ці числа, вони доволі....
    вони
  • 8:27 - 8:29
    майже за визначенням будуть
    доволі близько знаходитися
  • 8:29 - 8:30
    до даного середнього
    значення кожного з них.
  • 8:30 - 8:35
    Але у цьому випадку, наша вибірка певним
    чином викривлена і
  • 8:35 - 8:38
    дане справжнє середнє значення загальної
    сукупності знаходиться десь тут.
  • 8:38 - 8:41
    Отож, справжня розбіжність цієї вибірки,
    якщо б ви насправді
  • 8:41 - 8:44
    знали дане середнє значення... я знаю
    це трохи спантеличує.
  • 8:44 - 8:45
    Якщо б ви насправді знали
    дане середнє значення, то
  • 8:45 - 8:47
    ви б сказали ого.
  • 8:47 - 8:48
    Ви б з’ясували,
    що ці відстані, що
  • 8:48 - 8:51
    вони є набагато більшими.
  • 8:51 - 8:54
    Уся суть того, що я кажу
    полягає у тому, що коли ми
  • 8:54 - 8:58
    обираємо вибірку, то при цьому є певний
    шанс, що середнє значення вашої вибірки
  • 8:58 - 9:00
    доволі близьке до середнього значення
    загальної сукупності,правильно?
  • 9:00 - 9:03
    Можливо середнє значення вашої
    вибірки тут, а середнє значення
  • 9:03 - 9:04
    вашої загальної
    сукупності тут.
  • 9:04 - 9:06
    І тоді ця формула ймовірно
    спрацює доволі добре,
  • 9:06 - 9:08
    принаймні надасть вам
    значення вибірки і з’ясує
  • 9:08 - 9:09
    чому дорівнює дана розбіжність.
  • 9:09 - 9:14
    Але при цьому є суттєвий шанс, що
    середнє значення вашої вибірки...
  • 9:14 - 9:17
    Ваша вибірка завжди буде співпадати
    з вашої вибіркою даних, правильно?
  • 9:17 - 9:19
    Це завжди буде осердям даних вашої
    вибірки.
  • 9:19 - 9:21
    Але цілком можливо, що середнє значення
    даної загальної сукупності
  • 9:21 - 9:23
    буде за межами
    даних вашої вибірки.
  • 9:23 - 9:25
    Може статися так, що ви оберете те,
  • 9:25 - 9:28
    що не містить справжнього середнього
    значення даної загальної сукупності.
  • 9:28 - 9:32
    І тоді ця розбіжність вибірки підрахована
    таким чином буде
  • 9:32 - 9:35
    насправді недооцінювати справжню
    розбіжність
  • 9:35 - 9:36
    загальної сукупності,
    правильно?
  • 9:36 - 9:38
    Оскільки, ці значення завжди будуть ближче
    до свого власного середнього значення,
  • 9:38 - 9:40
    ніж до середнього значення
    загальної сукупності.
  • 9:40 - 9:43
    І якщо ви розумієте щиро
    хоча б 10% цього,
  • 9:43 - 9:46
    то ви є дуже досвідченим
    щодо статистики студентом.
  • 9:46 - 9:49
    Але я кажу усе це аби надати вам, як я
    сподіваюсь, певне
  • 9:49 - 9:54
    розуміння задля усвідомлення того, що
    це часто недооцінюють.
  • 9:54 - 9:57
    Ця формула часто недооцінює справжню
  • 9:57 - 9:59
    розбіжність загальної сукупності.
  • 9:59 - 10:01
    І при цьому є формула, і це
    насправді доведено краще,
  • 10:01 - 10:05
    ніж це роблю я, що
    вважається кращою,
  • 10:05 - 10:08
    неупередженою оцінкою
  • 10:08 - 10:09
    розбіжності загальної сукупності.
  • 10:09 - 10:11
    Або ж неупередженою розбіжністю
    вибірки.
  • 10:11 - 10:14
    І іноді це позначається просто знову ж
    таки літерою s у квадраті.
  • 10:14 - 10:19
    Іноді, це позначаєтья за допомогою
    n мінус 1 у квадраті.
  • 10:19 - 10:21
    І я покажу вам чому.
  • 10:21 - 10:22
    Це майже однакові речі.
  • 10:22 - 10:25
    Ви берете кожне значення, з’ясовуєте
    як далеко вони є
  • 10:25 - 10:28
    від даного середнього значення вибірки.
  • 10:28 - 10:29
    Підносите це до квадрату.
  • 10:29 - 10:32
    А тоді знаходите середню величину цих
    квадратів, окрім
  • 10:32 - 10:33
    однієї невеличкої різниці.
  • 10:33 - 10:36
    Від і=1 до i=n.
  • 10:36 - 10:39
    Замість того, щоб ділити на n, ви ділите
    на трохи
  • 10:39 - 10:42
    менше число.
  • 10:42 - 10:44
    Ви ділите на n мінус 1.
  • 10:44 - 10:47
    Отож, коли ви ділите на n
    мінус 1 замість ділення
  • 10:47 - 10:50
    на n, то ви отримуєте
    дещо більше число тут.
  • 10:50 - 10:51
    І виявляється, що це насправді
  • 10:51 - 10:52
    значно краща оцінка.
  • 10:52 - 10:55
    І одного дня я збираюся написати
    комп’ютерну програму
  • 10:55 - 10:57
    аби принаймні довести собі дослідницьким
    чином, що це є
  • 10:57 - 11:02
    кращою оцінкою розбіжності загальної
    сукупності.
  • 11:02 - 11:03
    І ви могли б обчислити
    це таким же чином.
  • 11:03 - 11:05
    Просто діліть на n мінус 1.
  • 11:05 - 11:07
    Кажучи іншим словами...
    Насправді, ні.
  • 11:07 - 11:08
    Мій час збіг.
  • 11:08 - 11:10
    Тут я вас полишаю.
  • 11:10 - 11:11
    І згодом у наступному
    відео, ми зробимо
  • 11:11 - 11:13
    двійко обчислень просто аби ви
    не переобтяжувалися
  • 11:13 - 11:13
    цими ідеями.
  • 11:13 - 11:15
    Оскільки, ми міркуємо
    дещо абстрактно.
  • 11:15 - 11:17
    Побачимося у наступному відео.
Title:
Statistics: Sample Variance
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
11:18

Ukrainian subtitles

Revisions