1 00:00:00,000 --> 00:00:00,680 2 00:00:00,680 --> 00:00:02,400 В това видео и в следващите няколко видеа 3 00:00:02,400 --> 00:00:05,120 ще направим няколко изчисления 4 00:00:05,120 --> 00:00:07,500 за този набор данни тук. 5 00:00:07,500 --> 00:00:09,840 И се надявам, че като преминем през тези изчисления, 6 00:00:09,850 --> 00:00:14,540 това ще ти покаже логиката на дисперсионния анализ . 7 00:00:14,540 --> 00:00:17,060 Първото нещо, което искам да направя в това видео, 8 00:00:17,060 --> 00:00:19,940 е да изчисля общия сбор на квадратите. 9 00:00:19,940 --> 00:00:22,740 Ще наричам това вариация (SST). 10 00:00:22,740 --> 00:00:24,830 Вариация – общ сбор на квадратите (SST). 11 00:00:24,830 --> 00:00:27,170 Можеш да гледаш на това като на числителя, 12 00:00:27,170 --> 00:00:28,450 когато изчисляваш дисперсията. 13 00:00:28,450 --> 00:00:30,700 Ще вземеш разстоянието между всяка от тези точки информация 14 00:00:30,700 --> 00:00:33,440 и средната стойност на всички тези точки информация, 15 00:00:33,440 --> 00:00:35,260 ще ги повдигнеш на квадрат и ще вземеш този сбор. 16 00:00:35,260 --> 00:00:37,320 Няма да делим на степента на свобода, 17 00:00:37,320 --> 00:00:38,843 което обикновено бихме направили, 18 00:00:38,843 --> 00:00:40,920 ако изчислявахме дисперсията на извадката. 19 00:00:40,920 --> 00:00:42,180 Колко ще е това? 20 00:00:42,180 --> 00:00:46,920 Първо трябва да намерим средната стойност на всички тези неща. 21 00:00:46,920 --> 00:00:50,449 Ще наричам това обща средна стойност. 22 00:00:50,449 --> 00:00:51,990 И след малко ще ти покажа, 23 00:00:51,990 --> 00:00:53,863 че това е същото нещо като средната стойност 24 00:00:53,863 --> 00:00:56,750 на средните стойности на всеки от тези набори данни. 25 00:00:56,750 --> 00:00:58,920 Нека изчислим голямата средна стойност. 26 00:00:58,920 --> 00:01:09,720 Тя ще е 3 + 2 + 1 + 5 + 3 + 4 + 27 00:01:09,720 --> 00:01:15,940 + 5 + 6 + 7. 28 00:01:16,000 --> 00:01:21,400 Имаме 9 точки информация, така че ще делим на 9. 29 00:01:21,400 --> 00:01:23,280 На колко ще е равно това? 30 00:01:23,280 --> 00:01:26,320 3 + 2 + 1 е 6. 31 00:01:26,320 --> 00:01:28,160 6 плюс... нека събера. 32 00:01:28,160 --> 00:01:30,040 Това са 6. 33 00:01:30,040 --> 00:01:36,010 5 + 3 + 4 е 12. 34 00:01:36,010 --> 00:01:40,550 И накрая 5 + 6 + 7 е 18. 35 00:01:40,550 --> 00:01:44,180 6 плюс 12 е 18; плюс 18 е 36; 36 00:01:44,180 --> 00:01:45,994 делено на 9 е равно на 4. 37 00:01:45,994 --> 00:01:48,160 Нека ти покажа, че това е точно същото нещо 38 00:01:48,160 --> 00:01:49,940 като средната стойност на средните стойности на групите. 39 00:01:49,940 --> 00:01:52,580 Средната стойност на група 1 – 40 00:01:52,580 --> 00:01:54,580 нека направя това в същия зелен цвят – 41 00:01:54,580 --> 00:01:58,350 средната стойност на група 1 тук е 3 + 2 + 1. 42 00:01:58,350 --> 00:02:01,420 Това е 6, делено на 3 точки информац ия – 43 00:02:01,420 --> 00:02:03,600 това ще е равно на 2. 44 00:02:03,600 --> 00:02:08,460 Средната стойност на група 2...сборът тук е 12. 45 00:02:08,460 --> 00:02:09,740 Видяхме това ето тук. 46 00:02:09,740 --> 00:02:14,000 5 + 3 + 4 е 12, делено на 3, е 4 – 47 00:02:14,000 --> 00:02:15,820 понеже имаме 3 точки информация. 48 00:02:15,820 --> 00:02:20,220 Средната стойност на група 3 – 49 00:02:20,220 --> 00:02:24,780 5 + 6 + 7 е 18, делено на 3, е 6. 50 00:02:24,790 --> 00:02:28,020 Ако вземеш средната стойност на средните стойности на групите, което е друг начин 51 00:02:28,020 --> 00:02:29,504 да гледаш на тази обща средна стойност, 52 00:02:29,504 --> 00:02:31,664 ще имаш 2 + 4 + 6, което е 12, 53 00:02:31,664 --> 00:02:34,040 делено на трите средни стойности. 54 00:02:34,040 --> 00:02:35,520 И отново получаваш 4. 55 00:02:35,520 --> 00:02:37,160 Можеш да гледаш на това като средната стойност 56 00:02:37,160 --> 00:02:38,820 на всички точки информация във всички групи 57 00:02:38,830 --> 00:02:41,505 или като средната стойност на средните стойности на всяка от тези групи. 58 00:02:41,505 --> 00:02:43,380 Но както и да си го представиш, сега, когато го изчислихме, 59 00:02:43,380 --> 00:02:46,780 можем да открием общия сбор на квадратите. 60 00:02:46,780 --> 00:02:48,590 Нека направим това. 61 00:02:48,590 --> 00:02:53,950 Това ще е равно на (3 минус 4) – 62 00:02:53,950 --> 00:02:59,730 четворката е това четири тук – на квадрат, плюс (2 минус 4) 63 00:02:59,730 --> 00:03:03,280 на квадрат, плюс (1 минус 4) на квадрат. 64 00:03:03,280 --> 00:03:05,490 Сега ще включа тези, които са в лилаво. 65 00:03:05,490 --> 00:03:12,960 Плюс (5 минус 4) на квадрат, плюс (3 минус 4) на квадрат, 66 00:03:12,960 --> 00:03:15,760 плюс (4 минус 4) на квадрат. 67 00:03:15,770 --> 00:03:19,320 Нека скролна малко надолу. 68 00:03:19,320 --> 00:03:25,330 Сега имаме само три останали, плюс (5 минус 4) на квадрат, 69 00:03:25,330 --> 00:03:31,210 плюс (6 минус 4) на квадрат, плюс (7 минус 4) на квадрат. 70 00:03:31,210 --> 00:03:32,770 Колко ни дава това? 71 00:03:32,770 --> 00:03:36,500 Тук горе това ще е равно на 3 минус 4. 72 00:03:36,500 --> 00:03:37,480 Разликата е 1. 73 00:03:37,490 --> 00:03:38,730 Повдигаш на квадрат. 74 00:03:38,730 --> 00:03:41,810 Всъщност е -1, но повдигаш на квадрат и получаваш 1, 75 00:03:41,810 --> 00:03:48,320 плюс – -2 на квадрат е 4 – плюс -3 на квадрат. 76 00:03:48,320 --> 00:03:50,700 -3 на квадрат е 9. 77 00:03:50,700 --> 00:03:53,570 После тук в цикламено имаме 5 минус 4, 78 00:03:53,570 --> 00:03:55,640 което е 1, на квадрат пак е 1. 79 00:03:55,640 --> 00:03:57,420 (3 минус 4) на квадрат е 1. 80 00:03:57,420 --> 00:03:59,320 Повдигаш на квадрат и отново е 1. 81 00:03:59,320 --> 00:04:00,964 После 4 минус 4 е просто 0. 82 00:04:00,964 --> 00:04:03,130 Просто ще напишем 0 тук, 83 00:04:03,130 --> 00:04:05,344 за да ти покажа, че пресметнахме това. 84 00:04:05,344 --> 00:04:07,260 После имаме тези последни три точки информация. 85 00:04:07,260 --> 00:04:09,180 (5 минус 4) на квадрат. 86 00:04:09,180 --> 00:04:09,760 Това е 1. 87 00:04:09,760 --> 00:04:11,800 (6 минус 4) на квадрат. 88 00:04:11,800 --> 00:04:13,330 Това е 4. 89 00:04:13,330 --> 00:04:14,850 Това е 2 на квадрат. 90 00:04:14,850 --> 00:04:19,370 След това плюс...7 минус 4 е 3, на квадрат, е 9. 91 00:04:19,370 --> 00:04:22,230 На колко ще е равно това? 92 00:04:22,230 --> 00:04:27,560 Имам 1 + 4 + 9. 93 00:04:27,560 --> 00:04:29,100 Това е 5 + 9. 94 00:04:29,100 --> 00:04:33,260 Това тук е 14. 95 00:04:33,260 --> 00:04:35,100 5 плюс... Да, 14. 96 00:04:35,110 --> 00:04:37,290 После имаме още веднъж 14 ето тук, 97 00:04:37,290 --> 00:04:39,270 понеже имаме 1 + 4 + 9. 98 00:04:39,270 --> 00:04:41,880 Тоест това тук също е 14. 99 00:04:41,880 --> 00:04:43,200 После тук имаме 2. 100 00:04:43,200 --> 00:04:45,780 Това ще е 28 – 14 по 2; 101 00:04:45,780 --> 00:04:50,300 14 плюс 14 е 28 – плюс 2 е 30. 102 00:04:50,300 --> 00:04:53,140 Това е равно на 30. 103 00:04:53,140 --> 00:04:55,620 Общият сбор на квадратите (вариацията) – 104 00:04:55,620 --> 00:04:57,440 ако искахме дисперсията, 105 00:04:57,450 --> 00:04:59,760 щяхме да разделим това на степените на свобода. 106 00:04:59,760 --> 00:05:03,200 Много пъти учихме за степените на свобода, 107 00:05:03,200 --> 00:05:06,840 така че, да кажем, че имаме – 108 00:05:06,840 --> 00:05:08,710 знаем, че имаме m групи тук. 109 00:05:08,710 --> 00:05:10,800 Нека запиша това като m и... 110 00:05:10,800 --> 00:05:12,540 Няма да доказвам стриктно това тук, 111 00:05:12,540 --> 00:05:16,140 но искам да ти покажа откъде идват някои от тези странни формули, 112 00:05:16,140 --> 00:05:18,700 които се появяват в книгите по статистика, 113 00:05:18,700 --> 00:05:21,020 без да го доказвам подробно. 114 00:05:21,020 --> 00:05:22,780 По-скоро, за да ти покажа логиката. 115 00:05:22,780 --> 00:05:25,460 Тук имаме m групи. 116 00:05:25,460 --> 00:05:32,120 Всяка група има n членове. 117 00:05:32,120 --> 00:05:34,180 Колко общо члена имаме? 118 00:05:34,180 --> 00:05:36,800 Имаме m по n или 9. 119 00:05:36,800 --> 00:05:38,490 3 по 3 общо членове. 120 00:05:38,490 --> 00:05:41,510 Степените ни на свобода – и, помни – 121 00:05:41,510 --> 00:05:43,960 колкото точки информация имаш, 122 00:05:43,960 --> 00:05:46,300 толкова минус 1 степени на свобода имаш. 123 00:05:46,300 --> 00:05:52,540 Понеже ако приемеш, че знаеш средната стойност на средните стойности, 124 00:05:52,540 --> 00:05:57,880 тогава само 9 минус 1, 125 00:05:57,885 --> 00:06:00,260 само 8 от тези ще ти дадат нова информация. 126 00:06:00,260 --> 00:06:03,005 Понеже ако знаеш това, можеш да пресметнеш последното. 127 00:06:03,005 --> 00:06:04,880 Или дори не трябва да е последното. 128 00:06:04,880 --> 00:06:07,629 Ако имаш другите осем, можеш да пресметнеш това. 129 00:06:07,629 --> 00:06:09,420 Ако имаш осем от тях, винаги можеш 130 00:06:09,420 --> 00:06:11,660 да пресметнеш деветото, като използваш 131 00:06:11,660 --> 00:06:13,897 средната стойност на средните стойности. 132 00:06:13,897 --> 00:06:15,730 Един начин да мислиш за това е, че има 133 00:06:15,730 --> 00:06:17,710 само 8 независими измервания тук. 134 00:06:17,710 --> 00:06:22,470 Или ако искаме да говорим принципно , 135 00:06:22,470 --> 00:06:27,810 има m по n – това ни дава общия брой извадки – 136 00:06:27,810 --> 00:06:33,540 минус 1 степени на свобода. 137 00:06:33,800 --> 00:06:37,920 Ако изчислявахме дисперсията тук, 138 00:06:37,920 --> 00:06:41,640 просто щяхме да разделим 30 на m по n минус 1 139 00:06:41,640 --> 00:06:44,760 или това е друг начин да кажем 8 степени на свобода 140 00:06:44,760 --> 00:06:46,220 за този пример. 141 00:06:46,220 --> 00:06:48,160 Ще вземем 30 делено на 8 142 00:06:48,160 --> 00:06:50,100 и ще имаме дисперсията за цялата група – 143 00:06:50,100 --> 00:06:52,800 за групата от 9, когато ги комбинираш. 144 00:06:52,800 --> 00:06:54,440 Ще приключим тук с това видео. 145 00:06:54,440 --> 00:06:55,971 В следващото видео ще опитаме да намерим 146 00:06:55,980 --> 00:07:06,200 колко от тази обща вариация – колко от този общ сбор на квадратите, 147 00:07:06,200 --> 00:07:09,840 идва от вариацията във всяка от тези групи, 148 00:07:09,840 --> 00:07:13,760 в сравнение с вариацията между групите. 149 00:07:13,760 --> 00:07:17,354 Мисля, че разбра откъде идва целият този дисперсионен анализ. 150 00:07:17,360 --> 00:07:20,880 Това е в смисъл, че има вариация за цялата тази извадка от девет елемента, 151 00:07:20,890 --> 00:07:24,580 но част от тази вариация, ако тези групи са различни по някакъв начин. 152 00:07:24,580 --> 00:07:28,735 може да дойде от факта, че са в различни групи (междугрупова вариация), 153 00:07:28,735 --> 00:07:31,350 вместо от вариацията вътре в самите групи (вътрешногрупова вариация). 154 00:07:31,350 --> 00:07:34,528 Ще пресметнем тези две неща и ще видим, че те ще имат сбор, 155 00:07:34,528 --> 00:07:38,000 равен на общата вариация, на общия сбор на квадратите.