0:00:00.680,0:00:02.400 В това видео и в следващите няколко видеа 0:00:02.400,0:00:05.120 ще направим много изчисления, 0:00:05.120,0:00:07.500 свързани с този набор от данни ето тук. 0:00:07.500,0:00:09.840 И се надявам, че като преминем през тези изчисления, 0:00:09.850,0:00:13.540 това ще ти покаже логиката на [br]дисперсионния анализ. 0:00:13.540,0:00:14.540 (ANOVA - Analysis of variance ). 0:00:14.540,0:00:17.060 Първото нещо, което искам да направя в това видео, 0:00:17.060,0:00:19.940 е да изчисля общия сбор на квадратите. 0:00:19.940,0:00:22.740 Ще наричам това вариация (SST). 0:00:22.740,0:00:24.830 Вариация – общ сбор на квадратите (SST). 0:00:24.830,0:00:27.170 Можеш да гледаш на това като на числителя, 0:00:27.170,0:00:28.450 когато изчисляваш дисперсията. 0:00:28.450,0:00:30.700 Ще вземеш разстоянията между всяка от тези точки информация 0:00:30.700,0:00:33.440 и средната им стойност, 0:00:33.440,0:00:35.260 ще ги повдигнеш на квадрат и ще вземеш този сбор. 0:00:35.260,0:00:37.320 Няма да делим на степените на свобода, 0:00:37.320,0:00:38.843 което обикновено бихме направили, 0:00:38.843,0:00:40.920 ако изчислявахме дисперсията на извадката. 0:00:40.920,0:00:42.180 Колко ще е това? 0:00:42.180,0:00:46.920 Първо трябва да намерим средната стойност на всички тези неща. 0:00:46.920,0:00:50.449 Ще наричам това обща средна стойност. 0:00:50.449,0:00:51.990 И след малко ще ти покажа, 0:00:51.990,0:00:53.863 че това е същото нещо като средната стойност 0:00:53.863,0:00:56.750 на средните стойности на всяка от тези групи с данни. 0:00:56.750,0:00:58.920 Нека изчислим голямата средна стойност. 0:00:58.920,0:01:09.720 Тя ще е 3 + 2 + 1 + 5 + 3 + 4 + 0:01:09.720,0:01:15.940 + 5 + 6 + 7. 0:01:16.000,0:01:21.400 Имаме 9 точки информация, така че ще делим на 9. 0:01:21.400,0:01:23.280 На колко ще е равно това? 0:01:23.280,0:01:26.320 3 + 2 + 1 е 6. 0:01:26.320,0:01:28.160 6 плюс... нека събера. 0:01:28.160,0:01:30.040 Това са 6. 0:01:30.040,0:01:36.010 5 + 3 + 4 е 12. 0:01:36.010,0:01:40.550 И накрая 5 + 6 + 7 е 18. 0:01:40.550,0:01:44.180 6 плюс 12 е 18; плюс 18 е 36; 0:01:44.180,0:01:45.994 делено на 9 е равно на 4. 0:01:45.994,0:01:48.160 Нека ти покажа, че това е точно същото нещо 0:01:48.160,0:01:49.940 като средната стойност на средните стойности на групите. 0:01:49.940,0:01:52.580 Средната стойност на група 1 – 0:01:52.580,0:01:54.580 нека направя това в същия зелен цвят – 0:01:54.580,0:01:58.350 средната стойност на група 1 тук е 3 + 2 + 1. 0:01:58.350,0:02:01.420 Това е 6, делено на 3 точки информац ия – 0:02:01.420,0:02:03.600 това ще е равно на 2. 0:02:03.600,0:02:08.460 Средната стойност на група 2...сборът тук е 12. 0:02:08.460,0:02:09.740 Видяхме това ето тук. 0:02:09.740,0:02:14.000 5 + 3 + 4 е 12, делено на 3, е 4 – 0:02:14.000,0:02:15.820 понеже имаме 3 точки информация. 0:02:15.820,0:02:20.220 Средната стойност на група 3 – 0:02:20.220,0:02:24.780 5 + 6 + 7 е 18, делено на 3, е 6. 0:02:24.790,0:02:28.020 Ако вземеш средната стойност на средните стойности на групите, което е друг начин 0:02:28.020,0:02:29.504 да гледаш на тази обща средна стойност, 0:02:29.504,0:02:31.664 ще имаш 2 + 4 + 6, което е 12, 0:02:31.664,0:02:34.040 делено на трите средни стойности. 0:02:34.040,0:02:35.520 И отново получаваш 4. 0:02:35.520,0:02:37.160 Можеш да гледаш на това като средната стойност 0:02:37.160,0:02:38.820 на всички точки информация във всички групи 0:02:38.830,0:02:41.505 или като средната стойност на средните стойности на всяка от тези групи. 0:02:41.505,0:02:43.380 Но както и да си го представиш, сега, когато го изчислихме, 0:02:43.380,0:02:46.780 можем да получим общия сбор на квадратите. 0:02:46.780,0:02:48.590 Нека направим това. 0:02:48.590,0:02:53.950 Това ще е равно на (3 минус 4) – 0:02:53.950,0:02:59.730 четворката е това четири тук – на квадрат, плюс (2 минус 4) 0:02:59.730,0:03:03.280 на квадрат, плюс (1 минус 4) на квадрат. 0:03:03.280,0:03:05.490 Сега ще включа тези, които са в лилаво. 0:03:05.490,0:03:12.960 Плюс (5 минус 4) на квадрат, плюс (3 минус 4) на квадрат, 0:03:12.960,0:03:15.760 плюс (4 минус 4) на квадрат. 0:03:15.770,0:03:19.320 Нека скролна малко надолу. 0:03:19.320,0:03:25.330 Сега имаме само три останали, плюс (5 минус 4) на квадрат, 0:03:25.330,0:03:31.210 плюс (6 минус 4) на квадрат, плюс (7 минус 4) на квадрат. 0:03:31.210,0:03:32.770 Колко ни дава това? 0:03:32.770,0:03:36.500 Тук горе това ще е равно на 3 минус 4. 0:03:36.500,0:03:37.480 Разликата е 1. 0:03:37.490,0:03:38.730 Повдигаш на квадрат. 0:03:38.730,0:03:41.810 Всъщност е -1, но повдигаш на квадрат и получаваш 1, 0:03:41.810,0:03:48.320 плюс – -2 на квадрат е 4 – плюс -3 на квадрат. 0:03:48.320,0:03:50.700 -3 на квадрат е 9. 0:03:50.700,0:03:53.570 После тук в цикламено имаме 5 минус 4, 0:03:53.570,0:03:55.640 което е 1, на квадрат пак е 1. 0:03:55.640,0:03:57.420 (3 минус 4) на квадрат е 1. 0:03:57.420,0:03:59.320 Повдигаш на квадрат и отново е 1. 0:03:59.320,0:04:00.964 После 4 минус 4 е просто 0. 0:04:00.964,0:04:03.130 Просто ще напишем 0 тук, 0:04:03.130,0:04:05.344 за да ти покажа, че пресметнахме това. 0:04:05.344,0:04:07.260 После имаме тези последни три точки информация. 0:04:07.260,0:04:09.180 (5 минус 4) на квадрат. 0:04:09.180,0:04:09.760 Това е 1. 0:04:09.760,0:04:11.800 (6 минус 4) на квадрат. 0:04:11.800,0:04:13.330 Това е 4. 0:04:13.330,0:04:14.850 Това е 2 на квадрат. 0:04:14.850,0:04:19.370 След това плюс...7 минус 4 е 3, на квадрат, е 9. 0:04:19.370,0:04:22.230 На колко ще е равно това? 0:04:22.230,0:04:27.560 Имам 1 + 4 + 9. 0:04:27.560,0:04:29.100 Това е 5 + 9. 0:04:29.100,0:04:33.260 Това тук е 14. 0:04:33.260,0:04:35.100 5 плюс... Да, 14. 0:04:35.110,0:04:37.290 После имаме още веднъж 14 ето тук, 0:04:37.290,0:04:39.270 понеже имаме 1 + 4 + 9. 0:04:39.270,0:04:41.880 Тоест това тук също е 14. 0:04:41.880,0:04:43.200 После тук имаме 2. 0:04:43.200,0:04:45.780 Това ще е 28 (14 по 2)... 0:04:45.780,0:04:50.300 14 плюс 14 е 28, плюс 2 е 30. 0:04:50.300,0:04:53.140 Това е равно на 30. 0:04:53.140,0:04:55.620 Общият сбор на квадратите (вариацията) – 0:04:55.620,0:04:57.440 ако искахме дисперсията, 0:04:57.450,0:04:59.760 щяхме да разделим това на степените на свобода. 0:04:59.760,0:05:03.200 Много пъти учихме за степените на свобода, 0:05:03.200,0:05:06.840 така че, да кажем, че имаме – 0:05:06.840,0:05:08.710 знаем, че имаме m групи тук. 0:05:08.710,0:05:10.800 Нека запиша това като m и... 0:05:10.800,0:05:12.540 Няма да доказвам стриктно това тук, 0:05:12.540,0:05:16.140 но искам да ти покажа откъде идват някои от тези странни формули, 0:05:16.140,0:05:18.700 които се появяват в книгите по статистика, 0:05:18.700,0:05:21.020 без да го доказвам подробно. 0:05:21.020,0:05:22.780 По-скоро, за да ти покажа логиката. 0:05:22.780,0:05:25.460 Тук имаме m групи. 0:05:25.460,0:05:32.120 Всяка група има n членове. 0:05:32.120,0:05:34.180 Колко общо члена имаме? 0:05:34.180,0:05:36.800 Имаме m по n или 9. 0:05:36.800,0:05:38.490 3 по 3 общо членове. 0:05:38.490,0:05:41.510 Степените ни на свобода – и, помни – 0:05:41.510,0:05:43.960 колкото точки информация имаш, 0:05:43.960,0:05:46.300 толкова минус 1 степени на свобода имаш. 0:05:46.300,0:05:52.540 Понеже ако приемеш, че знаеш средната стойност на средните стойности, 0:05:52.540,0:05:57.880 тогава само 9 минус 1, 0:05:57.885,0:06:00.260 само 8 от тези ще ти дадат нова информация. 0:06:00.260,0:06:03.005 Понеже ако знаеш това, можеш да пресметнеш последното. 0:06:03.005,0:06:04.880 Или дори не трябва да е последното. 0:06:04.880,0:06:07.629 Ако имаш другите осем, можеш да пресметнеш това. 0:06:07.629,0:06:09.420 Ако имаш осем от тях, винаги можеш 0:06:09.420,0:06:11.660 да пресметнеш деветото, като използваш 0:06:11.660,0:06:13.897 средната стойност на средните стойности. 0:06:13.897,0:06:15.730 Един начин да мислиш за това е, че има 0:06:15.730,0:06:17.710 само 8 независими измервания тук. 0:06:17.710,0:06:22.470 Или ако искаме да говорим принципно , 0:06:22.470,0:06:27.810 има m по n (това ни дава общия брой данни 0:06:27.810,0:06:33.540 в извадките) минус 1 степени на свобода. 0:06:33.800,0:06:37.920 Ако изчислявахме дисперсията тук, 0:06:37.920,0:06:41.640 просто щяхме да разделим 30 на m по n минус 1 0:06:41.640,0:06:44.760 или това е друг начин да кажем 8 степени на свобода 0:06:44.760,0:06:46.220 за този пример. 0:06:46.220,0:06:48.160 Ще вземем 30 делено на 8 0:06:48.160,0:06:50.100 и ще имаме дисперсията за цялата група – 0:06:50.100,0:06:52.800 за групата от 9, когато ги комбинираш. 0:06:52.800,0:06:54.440 Ще приключим тук с това видео. 0:06:54.440,0:06:55.971 В следващото видео ще опитаме да намерим 0:06:55.980,0:07:06.200 колко от тази обща вариация – колко от този общ сбор на квадратите, 0:07:06.200,0:07:09.840 идва от вариацията вътре във всяка една от тези групи, 0:07:09.840,0:07:13.760 в сравнение с вариацията между групите. 0:07:13.760,0:07:17.354 Мисля, че разбра откъде идва целият този дисперсионен анализ. 0:07:17.360,0:07:20.880 Това е в смисъл, че има вариация за цялата тази извадка от девет елемента, 0:07:20.890,0:07:24.580 но част от тази вариация, ако тези групи са различни по някакъв начин. 0:07:24.580,0:07:28.735 може да дойде от факта, че данните са в различни групи (междугрупова вариация), 0:07:28.735,0:07:31.350 както и от вариацията вътре в самите групи (вътрешногрупова вариация). 0:07:31.350,0:07:34.528 Ще пресметнем тези две неща и ще видим, че те ще имат сбор, 0:07:34.528,0:07:38.000 равен на общата вариация, на общия сбор на квадратите.