-
-
В това видео и в следващите няколко видеа
-
ще направим няколко изчисления
-
за този набор данни тук.
-
И се надявам, че като преминем през тези изчисления,
-
това ще ти покаже логиката на
дисперсионния анализ .
-
Първото нещо, което искам да направя в това видео,
-
е да изчисля общия сбор на квадратите.
-
Ще наричам това вариация (SST).
-
Вариация – общ сбор на квадратите (SST).
-
Можеш да гледаш на това като на числителя,
-
когато изчисляваш дисперсията.
-
Ще вземеш разстоянието между всяка от тези точки информация
-
и средната стойност на всички тези точки информация,
-
ще ги повдигнеш на квадрат и ще вземеш този сбор.
-
Няма да делим на степента на свобода,
-
което обикновено бихме направили,
-
ако изчислявахме дисперсията на извадката.
-
Колко ще е това?
-
Първо трябва да намерим средната стойност на всички тези неща.
-
Ще наричам това обща средна стойност.
-
И след малко ще ти покажа,
-
че това е същото нещо като средната стойност
-
на средните стойности на всеки от тези набори данни.
-
Нека изчислим голямата средна стойност.
-
Тя ще е 3 + 2 + 1 + 5 + 3 + 4 +
-
+ 5 + 6 + 7.
-
Имаме 9 точки информация, така че ще делим на 9.
-
На колко ще е равно това?
-
3 + 2 + 1 е 6.
-
6 плюс... нека събера.
-
Това са 6.
-
5 + 3 + 4 е 12.
-
И накрая 5 + 6 + 7 е 18.
-
6 плюс 12 е 18; плюс 18 е 36;
-
делено на 9 е равно на 4.
-
Нека ти покажа, че това е точно същото нещо
-
като средната стойност на средните стойности на групите.
-
Средната стойност на група 1 –
-
нека направя това в същия зелен цвят –
-
средната стойност на група 1 тук е 3 + 2 + 1.
-
Това е 6, делено на 3 точки информац ия –
-
това ще е равно на 2.
-
Средната стойност на група 2...сборът тук е 12.
-
Видяхме това ето тук.
-
5 + 3 + 4 е 12, делено на 3, е 4 –
-
понеже имаме 3 точки информация.
-
Средната стойност на група 3 –
-
5 + 6 + 7 е 18, делено на 3, е 6.
-
Ако вземеш средната стойност на средните стойности на групите, което е друг начин
-
да гледаш на тази обща средна стойност,
-
ще имаш 2 + 4 + 6, което е 12,
-
делено на трите средни стойности.
-
И отново получаваш 4.
-
Можеш да гледаш на това като средната стойност
-
на всички точки информация във всички групи
-
или като средната стойност на средните стойности на всяка от тези групи.
-
Но както и да си го представиш, сега, когато го изчислихме,
-
можем да открием общия сбор на квадратите.
-
Нека направим това.
-
Това ще е равно на (3 минус 4) –
-
четворката е това четири тук – на квадрат, плюс (2 минус 4)
-
на квадрат, плюс (1 минус 4) на квадрат.
-
Сега ще включа тези, които са в лилаво.
-
Плюс (5 минус 4) на квадрат, плюс (3 минус 4) на квадрат,
-
плюс (4 минус 4) на квадрат.
-
Нека скролна малко надолу.
-
Сега имаме само три останали, плюс (5 минус 4) на квадрат,
-
плюс (6 минус 4) на квадрат, плюс (7 минус 4) на квадрат.
-
Колко ни дава това?
-
Тук горе това ще е равно на 3 минус 4.
-
Разликата е 1.
-
Повдигаш на квадрат.
-
Всъщност е -1, но повдигаш на квадрат и получаваш 1,
-
плюс – -2 на квадрат е 4 – плюс -3 на квадрат.
-
-3 на квадрат е 9.
-
После тук в цикламено имаме 5 минус 4,
-
което е 1, на квадрат пак е 1.
-
(3 минус 4) на квадрат е 1.
-
Повдигаш на квадрат и отново е 1.
-
После 4 минус 4 е просто 0.
-
Просто ще напишем 0 тук,
-
за да ти покажа, че пресметнахме това.
-
После имаме тези последни три точки информация.
-
(5 минус 4) на квадрат.
-
Това е 1.
-
(6 минус 4) на квадрат.
-
Това е 4.
-
Това е 2 на квадрат.
-
След това плюс...7 минус 4 е 3, на квадрат, е 9.
-
На колко ще е равно това?
-
Имам 1 + 4 + 9.
-
Това е 5 + 9.
-
Това тук е 14.
-
5 плюс... Да, 14.
-
После имаме още веднъж 14 ето тук,
-
понеже имаме 1 + 4 + 9.
-
Тоест това тук също е 14.
-
После тук имаме 2.
-
Това ще е 28 – 14 по 2;
-
14 плюс 14 е 28 – плюс 2 е 30.
-
Това е равно на 30.
-
Общият сбор на квадратите (вариацията) –
-
ако искахме дисперсията,
-
щяхме да разделим това на степените на свобода.
-
Много пъти учихме за степените на свобода,
-
така че, да кажем, че имаме –
-
знаем, че имаме m групи тук.
-
Нека запиша това като m и...
-
Няма да доказвам стриктно това тук,
-
но искам да ти покажа откъде идват някои от тези странни формули,
-
които се появяват в книгите по статистика,
-
без да го доказвам подробно.
-
По-скоро, за да ти покажа логиката.
-
Тук имаме m групи.
-
Всяка група има n членове.
-
Колко общо члена имаме?
-
Имаме m по n или 9.
-
3 по 3 общо членове.
-
Степените ни на свобода – и, помни –
-
колкото точки информация имаш,
-
толкова минус 1 степени на свобода имаш.
-
Понеже ако приемеш, че знаеш средната стойност на средните стойности,
-
тогава само 9 минус 1,
-
само 8 от тези ще ти дадат нова информация.
-
Понеже ако знаеш това, можеш да пресметнеш последното.
-
Или дори не трябва да е последното.
-
Ако имаш другите осем, можеш да пресметнеш това.
-
Ако имаш осем от тях, винаги можеш
-
да пресметнеш деветото, като използваш
-
средната стойност на средните стойности.
-
Един начин да мислиш за това е, че има
-
само 8 независими измервания тук.
-
Или ако искаме да говорим принципно ,
-
има m по n – това ни дава общия брой извадки –
-
минус 1 степени на свобода.
-
Ако изчислявахме дисперсията тук,
-
просто щяхме да разделим 30 на m по n минус 1
-
или това е друг начин да кажем 8 степени на свобода
-
за този пример.
-
Ще вземем 30 делено на 8
-
и ще имаме дисперсията за цялата група –
-
за групата от 9, когато ги комбинираш.
-
Ще приключим тук с това видео.
-
В следващото видео ще опитаме да намерим
-
колко от тази обща вариация – колко от този общ сбор на квадратите,
-
идва от вариацията във всяка от тези групи,
-
в сравнение с вариацията между групите.
-
Мисля, че разбра откъде идва целият този дисперсионен анализ.
-
Това е в смисъл, че има вариация за цялата тази извадка от девет елемента,
-
но част от тази вариация, ако тези групи са различни по някакъв начин.
-
може да дойде от факта, че са в различни групи (междугрупова вариация),
-
вместо от вариацията вътре в самите групи (вътрешногрупова вариация).
-
Ще пресметнем тези две неща и ще видим, че те ще имат сбор,
-
равен на общата вариация, на общия сбор на квадратите.