< Return to Video

Дисперсионен анализ 1 - Пресмятане на общата вариация

  • 0:01 - 0:02
    В това видео и в следващите няколко видеа
  • 0:02 - 0:05
    ще направим много изчисления,
  • 0:05 - 0:08
    свързани с този набор от данни ето тук.
  • 0:08 - 0:10
    И се надявам, че като преминем през тези изчисления,
  • 0:10 - 0:14
    това ще ти покаже логиката на
    дисперсионния анализ.
  • 0:14 - 0:15
    (ANOVA - Analysis of variance ).
  • 0:15 - 0:17
    Първото нещо, което искам да направя в това видео,
  • 0:17 - 0:20
    е да изчисля общия сбор на квадратите.
  • 0:20 - 0:23
    Ще наричам това вариация (SST).
  • 0:23 - 0:25
    Вариация – общ сбор на квадратите (SST).
  • 0:25 - 0:27
    Можеш да гледаш на това като на числителя,
  • 0:27 - 0:28
    когато изчисляваш дисперсията.
  • 0:28 - 0:31
    Ще вземеш разстоянията между всяка от тези точки информация
  • 0:31 - 0:33
    и средната им стойност,
  • 0:33 - 0:35
    ще ги повдигнеш на квадрат и ще вземеш този сбор.
  • 0:35 - 0:37
    Няма да делим на степените на свобода,
  • 0:37 - 0:39
    което обикновено бихме направили,
  • 0:39 - 0:41
    ако изчислявахме дисперсията на извадката.
  • 0:41 - 0:42
    Колко ще е това?
  • 0:42 - 0:47
    Първо трябва да намерим средната стойност на всички тези неща.
  • 0:47 - 0:50
    Ще наричам това обща средна стойност.
  • 0:50 - 0:52
    И след малко ще ти покажа,
  • 0:52 - 0:54
    че това е същото нещо като средната стойност
  • 0:54 - 0:57
    на средните стойности на всяка от тези групи с данни.
  • 0:57 - 0:59
    Нека изчислим голямата средна стойност.
  • 0:59 - 1:10
    Тя ще е 3 + 2 + 1 + 5 + 3 + 4 +
  • 1:10 - 1:16
    + 5 + 6 + 7.
  • 1:16 - 1:21
    Имаме 9 точки информация, така че ще делим на 9.
  • 1:21 - 1:23
    На колко ще е равно това?
  • 1:23 - 1:26
    3 + 2 + 1 е 6.
  • 1:26 - 1:28
    6 плюс... нека събера.
  • 1:28 - 1:30
    Това са 6.
  • 1:30 - 1:36
    5 + 3 + 4 е 12.
  • 1:36 - 1:41
    И накрая 5 + 6 + 7 е 18.
  • 1:41 - 1:44
    6 плюс 12 е 18; плюс 18 е 36;
  • 1:44 - 1:46
    делено на 9 е равно на 4.
  • 1:46 - 1:48
    Нека ти покажа, че това е точно същото нещо
  • 1:48 - 1:50
    като средната стойност на средните стойности на групите.
  • 1:50 - 1:53
    Средната стойност на група 1 –
  • 1:53 - 1:55
    нека направя това в същия зелен цвят –
  • 1:55 - 1:58
    средната стойност на група 1 тук е 3 + 2 + 1.
  • 1:58 - 2:01
    Това е 6, делено на 3 точки информац ия –
  • 2:01 - 2:04
    това ще е равно на 2.
  • 2:04 - 2:08
    Средната стойност на група 2...сборът тук е 12.
  • 2:08 - 2:10
    Видяхме това ето тук.
  • 2:10 - 2:14
    5 + 3 + 4 е 12, делено на 3, е 4 –
  • 2:14 - 2:16
    понеже имаме 3 точки информация.
  • 2:16 - 2:20
    Средната стойност на група 3 –
  • 2:20 - 2:25
    5 + 6 + 7 е 18, делено на 3, е 6.
  • 2:25 - 2:28
    Ако вземеш средната стойност на средните стойности на групите, което е друг начин
  • 2:28 - 2:30
    да гледаш на тази обща средна стойност,
  • 2:30 - 2:32
    ще имаш 2 + 4 + 6, което е 12,
  • 2:32 - 2:34
    делено на трите средни стойности.
  • 2:34 - 2:36
    И отново получаваш 4.
  • 2:36 - 2:37
    Можеш да гледаш на това като средната стойност
  • 2:37 - 2:39
    на всички точки информация във всички групи
  • 2:39 - 2:42
    или като средната стойност на средните стойности на всяка от тези групи.
  • 2:42 - 2:43
    Но както и да си го представиш, сега, когато го изчислихме,
  • 2:43 - 2:47
    можем да получим общия сбор на квадратите.
  • 2:47 - 2:49
    Нека направим това.
  • 2:49 - 2:54
    Това ще е равно на (3 минус 4) –
  • 2:54 - 3:00
    четворката е това четири тук – на квадрат, плюс (2 минус 4)
  • 3:00 - 3:03
    на квадрат, плюс (1 минус 4) на квадрат.
  • 3:03 - 3:05
    Сега ще включа тези, които са в лилаво.
  • 3:05 - 3:13
    Плюс (5 минус 4) на квадрат, плюс (3 минус 4) на квадрат,
  • 3:13 - 3:16
    плюс (4 минус 4) на квадрат.
  • 3:16 - 3:19
    Нека скролна малко надолу.
  • 3:19 - 3:25
    Сега имаме само три останали, плюс (5 минус 4) на квадрат,
  • 3:25 - 3:31
    плюс (6 минус 4) на квадрат, плюс (7 минус 4) на квадрат.
  • 3:31 - 3:33
    Колко ни дава това?
  • 3:33 - 3:36
    Тук горе това ще е равно на 3 минус 4.
  • 3:36 - 3:37
    Разликата е 1.
  • 3:37 - 3:39
    Повдигаш на квадрат.
  • 3:39 - 3:42
    Всъщност е -1, но повдигаш на квадрат и получаваш 1,
  • 3:42 - 3:48
    плюс – -2 на квадрат е 4 – плюс -3 на квадрат.
  • 3:48 - 3:51
    -3 на квадрат е 9.
  • 3:51 - 3:54
    После тук в цикламено имаме 5 минус 4,
  • 3:54 - 3:56
    което е 1, на квадрат пак е 1.
  • 3:56 - 3:57
    (3 минус 4) на квадрат е 1.
  • 3:57 - 3:59
    Повдигаш на квадрат и отново е 1.
  • 3:59 - 4:01
    После 4 минус 4 е просто 0.
  • 4:01 - 4:03
    Просто ще напишем 0 тук,
  • 4:03 - 4:05
    за да ти покажа, че пресметнахме това.
  • 4:05 - 4:07
    После имаме тези последни три точки информация.
  • 4:07 - 4:09
    (5 минус 4) на квадрат.
  • 4:09 - 4:10
    Това е 1.
  • 4:10 - 4:12
    (6 минус 4) на квадрат.
  • 4:12 - 4:13
    Това е 4.
  • 4:13 - 4:15
    Това е 2 на квадрат.
  • 4:15 - 4:19
    След това плюс...7 минус 4 е 3, на квадрат, е 9.
  • 4:19 - 4:22
    На колко ще е равно това?
  • 4:22 - 4:28
    Имам 1 + 4 + 9.
  • 4:28 - 4:29
    Това е 5 + 9.
  • 4:29 - 4:33
    Това тук е 14.
  • 4:33 - 4:35
    5 плюс... Да, 14.
  • 4:35 - 4:37
    После имаме още веднъж 14 ето тук,
  • 4:37 - 4:39
    понеже имаме 1 + 4 + 9.
  • 4:39 - 4:42
    Тоест това тук също е 14.
  • 4:42 - 4:43
    После тук имаме 2.
  • 4:43 - 4:46
    Това ще е 28 (14 по 2)...
  • 4:46 - 4:50
    14 плюс 14 е 28, плюс 2 е 30.
  • 4:50 - 4:53
    Това е равно на 30.
  • 4:53 - 4:56
    Общият сбор на квадратите (вариацията) –
  • 4:56 - 4:57
    ако искахме дисперсията,
  • 4:57 - 5:00
    щяхме да разделим това на степените на свобода.
  • 5:00 - 5:03
    Много пъти учихме за степените на свобода,
  • 5:03 - 5:07
    така че, да кажем, че имаме –
  • 5:07 - 5:09
    знаем, че имаме m групи тук.
  • 5:09 - 5:11
    Нека запиша това като m и...
  • 5:11 - 5:13
    Няма да доказвам стриктно това тук,
  • 5:13 - 5:16
    но искам да ти покажа откъде идват някои от тези странни формули,
  • 5:16 - 5:19
    които се появяват в книгите по статистика,
  • 5:19 - 5:21
    без да го доказвам подробно.
  • 5:21 - 5:23
    По-скоро, за да ти покажа логиката.
  • 5:23 - 5:25
    Тук имаме m групи.
  • 5:25 - 5:32
    Всяка група има n членове.
  • 5:32 - 5:34
    Колко общо члена имаме?
  • 5:34 - 5:37
    Имаме m по n или 9.
  • 5:37 - 5:38
    3 по 3 общо членове.
  • 5:38 - 5:42
    Степените ни на свобода – и, помни –
  • 5:42 - 5:44
    колкото точки информация имаш,
  • 5:44 - 5:46
    толкова минус 1 степени на свобода имаш.
  • 5:46 - 5:53
    Понеже ако приемеш, че знаеш средната стойност на средните стойности,
  • 5:53 - 5:58
    тогава само 9 минус 1,
  • 5:58 - 6:00
    само 8 от тези ще ти дадат нова информация.
  • 6:00 - 6:03
    Понеже ако знаеш това, можеш да пресметнеш последното.
  • 6:03 - 6:05
    Или дори не трябва да е последното.
  • 6:05 - 6:08
    Ако имаш другите осем, можеш да пресметнеш това.
  • 6:08 - 6:09
    Ако имаш осем от тях, винаги можеш
  • 6:09 - 6:12
    да пресметнеш деветото, като използваш
  • 6:12 - 6:14
    средната стойност на средните стойности.
  • 6:14 - 6:16
    Един начин да мислиш за това е, че има
  • 6:16 - 6:18
    само 8 независими измервания тук.
  • 6:18 - 6:22
    Или ако искаме да говорим принципно ,
  • 6:22 - 6:28
    има m по n (това ни дава общия брой данни
  • 6:28 - 6:34
    в извадките) минус 1 степени на свобода.
  • 6:34 - 6:38
    Ако изчислявахме дисперсията тук,
  • 6:38 - 6:42
    просто щяхме да разделим 30 на m по n минус 1
  • 6:42 - 6:45
    или това е друг начин да кажем 8 степени на свобода
  • 6:45 - 6:46
    за този пример.
  • 6:46 - 6:48
    Ще вземем 30 делено на 8
  • 6:48 - 6:50
    и ще имаме дисперсията за цялата група –
  • 6:50 - 6:53
    за групата от 9, когато ги комбинираш.
  • 6:53 - 6:54
    Ще приключим тук с това видео.
  • 6:54 - 6:56
    В следващото видео ще опитаме да намерим
  • 6:56 - 7:06
    колко от тази обща вариация – колко от този общ сбор на квадратите,
  • 7:06 - 7:10
    идва от вариацията вътре във всяка една от тези групи,
  • 7:10 - 7:14
    в сравнение с вариацията между групите.
  • 7:14 - 7:17
    Мисля, че разбра откъде идва целият този дисперсионен анализ.
  • 7:17 - 7:21
    Това е в смисъл, че има вариация за цялата тази извадка от девет елемента,
  • 7:21 - 7:25
    но част от тази вариация, ако тези групи са различни по някакъв начин.
  • 7:25 - 7:29
    може да дойде от факта, че данните са в различни групи (междугрупова вариация),
  • 7:29 - 7:31
    както и от вариацията вътре в самите групи (вътрешногрупова вариация).
  • 7:31 - 7:35
    Ще пресметнем тези две неща и ще видим, че те ще имат сбор,
  • 7:35 - 7:38
    равен на общата вариация, на общия сбор на квадратите.
Title:
Дисперсионен анализ 1 - Пресмятане на общата вариация
Description:

Запознаване с дисперсионния анализ (ANOVA). Абревиатурата ANOVA е съкращение на термина на английски език - Analysis of variance. Пресмятане на общата вариация (общата сума на квадратите - SST). Абревиатурата SST е съкращение на термина на английски език - Sum of Squares Total.

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:39

Bulgarian subtitles

Revisions Compare revisions