1 00:00:00,441 --> 00:00:07,657 I denne video, og i de næste videoer, skal vi se på en række udregninger omkring dette datasæt lige her. 2 00:00:07,657 --> 00:00:12,608 og forhåbentligt, ved at gennegå disse beregninger, vil vi kunne få en intuitiv fornemmelse om hvad denne varians- 3 00:00:12,608 --> 00:00:18,941 analyse handler om. Det første vi skal gøre i denne video, er at beregne den totale kvadrat-sum. 4 00:00:18,941 --> 00:00:27,455 Så det kalder vi TKS (SST). Totale kvadrat-sum. Og den udgør tælleren når 5 00:00:27,455 --> 00:00:31,576 vi skal beregne variansen. Vi finder forskellen mellem hvert af disse tal 6 00:00:31,576 --> 00:00:36,078 tager gennemsnittet af dem, herefter kvadratet og så finder vi summen. Vi dividerer egentligt ikke med 7 00:00:36,078 --> 00:00:40,732 frihedsgraden, hvilket man normalt ville gøre hvis man skulle beregne variansen. 8 00:00:40,763 --> 00:00:45,279 Men hvad bliver det? Det første vi skal gøre, er at beregne gennemsnittet af 9 00:00:45,279 --> 00:00:49,692 alle disse tal her. Vi kalder det for det totale gennemsnit. 10 00:00:49,692 --> 00:00:53,359 Lad os vise, at det er det samme som gennemsnittet 11 00:00:53,359 --> 00:00:59,013 af alle gennemsnit af disse tal. Lad os beregne det totale gennemsnit. 12 00:00:59,013 --> 00:01:16,152 Det bliver 3 + 2 + 1, 3 + 2 + 1 + 5 + 3 + 4 + 5 + 6 + 7 ... plus 5 + 6 + 7 13 00:01:16,152 --> 00:01:22,102 Og så har vi 9 tal. Vi har 9 tal, så derfor skal vi dividere med 9. 14 00:01:22,102 --> 00:01:30,354 Så bliver det lig med: 3 + 2 + 1 er 6. Det skriver vi lige her. 15 00:01:30,385 --> 00:01:43,944 5 + 3 + 4, det er 12. Og så 5 + 6 + 7 er 18. Og så 6 + 12 er 18 + en til 18 er 36. 16 00:01:43,944 --> 00:01:50,241 divideret med 9 giver det 4. Lad os vise, at det er præcis det samme som gennemsnittet af gennemsnittene. 17 00:01:50,302 --> 00:01:57,056 Så gennemsnittet af den første gruppe her, som står med grøn 18 00:01:57,056 --> 00:02:03,856 er 3 + 2 + 1, det giver 6, divideret med 3, det bliver 2. 19 00:02:03,856 --> 00:02:12,677 Gennemsnittet af gruppe 2: summen er 12, det så vi lige her, 5 + 3 + 4 er 12, 20 00:02:12,677 --> 00:02:21,846 divideret med 3 er 4. Og så bliver gennemsnittet af gruppe 3: 5 + 6 + 7, det bliver 18. 21 00:02:21,846 --> 00:02:27,256 18 divideret med 3 giver 6. Så hvis vi tager gennemsnittet af gennemsnittene 22 00:02:27,256 --> 00:02:31,015 som er det totale gennemsnit, har vi 2 + 4 + 6 23 00:02:31,015 --> 00:02:35,892 som er 12, divideret med de 3 gennemsnit her, så får vi også 4. 24 00:02:35,892 --> 00:02:38,933 Så vi kan betragte det som gennemsnittet af alle tallene i alle 3 grupper 25 00:02:38,933 --> 00:02:43,600 eller som gennemsnittet af gennemsnittet for hver af disse grupper. Uanset hvad, så kommer vi frem til det samme, 26 00:02:43,600 --> 00:02:48,836 og nu kan vi finde den totale kvadratsum. Så lad os gøre det. 27 00:02:48,836 --> 00:02:57,887 Så det bliver lig med 3 - 4, det er 4-tallet lige her, i anden plus 28 00:02:57,887 --> 00:03:05,667 2 - 4 i anden + 1 - 4 i anden, nu tager vi de tal herovre i anden række: 29 00:03:05,667 --> 00:03:16,031 + 5 - 4 i anden + 3 - 4 i anden + 4 - 4 i anden 30 00:03:16,031 --> 00:03:20,667 Vi rykker lige skærmen lidt. Nu har vi kun 3 tal tilbage. 31 00:03:20,667 --> 00:03:32,887 + 5 - 4 i anden + 6 - 4 i anden plus 7 - 4 i anden. Og hvad bliver det? 32 00:03:32,887 --> 00:03:38,436 Først har vi 3 - 4, det giver minus 1, men fordi vi opløfter det i anden 33 00:03:38,436 --> 00:03:42,200 får vi altså plus 1, eller bare 1, plus 34 00:03:42,200 --> 00:03:51,000 Her har vi minus 2 i anden, som giver 4 + minus 3 i anden, det giver 9. 35 00:03:51,000 --> 00:03:57,698 Og så bruger vi lige den anden farve. 5 - 4 er 1, opløftet i anden er det stadig 1. 3 - 4 i anden er 1, 36 00:03:57,698 --> 00:04:03,210 og 4 - 4 i anden er 0, men vi skriver det alligevel her 37 00:04:03,210 --> 00:04:06,985 for at vise at vi har husket at regne det ud. Og så har vi de sidste 3 datasæt. 38 00:04:06,985 --> 00:04:16,667 5 - 4 i anden, giver 1. 6 - 4 i anden giver 4, det er det samme som 2 i anden, + 7 - 4 giver 3 39 00:04:16,667 --> 00:04:24,952 opløftet i anden giver det 9. Hvad bliver den totale kvadratsum så? 40 00:04:25,629 --> 00:04:33,436 Vi har 1 + 4 + 9 her ovre, det er 5 + 9. Det giver 14. 41 00:04:33,436 --> 00:04:39,638 Det må også give 14 herovre til højre, da det er de samme tal. 42 00:04:39,638 --> 00:04:43,632 Og til sidst har vi 1 plus 1 her i midten, og det bliver 2. 43 00:04:43,632 --> 00:04:55,056 Så vi har 2 gange 14, det er 28, plus 2, det giver 30. Så det er vores totale kvadratsum 44 00:04:55,056 --> 00:04:59,561 Og faktisk, hvis vi ville have variansen skulle vi dividere dette med frihedsgraden. 45 00:04:59,561 --> 00:05:05,551 Og de her er flere gange frihedsgraden. Så lad os sige, lad os sige at vi har m grupper her. 46 00:05:05,551 --> 00:05:11,031 Vi skriver lige m her. Og vi skal ikke 47 00:05:11,031 --> 00:05:14,236 bevise det stringent, men vi skal vise 48 00:05:14,236 --> 00:05:18,740 hvor nogle af disse underlige formler i statistik kommer fra, 49 00:05:18,740 --> 00:05:25,667 så vi har en ide om det. Vi har m grupper her 50 00:05:25,667 --> 00:05:34,344 og hver gruppe har n medlemmer. Så hvor mange medlemmer har vi så? 51 00:05:34,344 --> 00:05:41,498 Vi har m gange n, eller i vore tilfælde 9. Det vil sige i alt 3 gange 3 medlemmer. Så frihedsgraden 52 00:05:41,498 --> 00:05:47,800 er - uanset hvor mange tal man har - antal tal, minus 1. Hvis vi kender 53 00:05:47,800 --> 00:05:52,800 gennemsnittet af alle gennemsnit, 54 00:05:52,800 --> 00:05:59,323 så behøver man kun at sige n minus 1. Her altså 9 minus 1. Kun 8 af disse tal vil give os 55 00:05:59,323 --> 00:06:04,471 ny information, for hvis du kender 8 tal, og gennemsnittet af alle gennemsnit, så kan du beregne det sidste tal, eller det behøver ikke engang at være 56 00:06:04,471 --> 00:06:09,824 den sidste, hvis vi kender de andre 8, så kan vi beregne denne. Så hvis man har 8 af dem, kan man altid beregne 57 00:06:09,824 --> 00:06:16,600 det 9'ende tal, ved at bruge gennemsnittet af alle gennemsnit. En måde at tænke på det på er, at der kun er 8 selvstændige 58 00:06:16,600 --> 00:06:22,883 tal her. Hvis vi ser på det mere generelt, er der 59 00:06:22,883 --> 00:06:30,397 m gange n, som giver antal tal, minus 1 frihedsgrad. 60 00:06:33,720 --> 00:06:41,810 Hvis vi vil beregne variansen her, dividerer vi bare 30 med m gange n, minus 1. 61 00:06:41,810 --> 00:06:47,077 Sagt på en anden måde, 8 frihedsgrader i dette eksempel. Vi tager 30 62 00:06:47,077 --> 00:06:53,000 divideret med 8 og det giver rent faktisk variansen for denne gruppe med 9 tal. 63 00:06:53,000 --> 00:06:58,533 Vi slutter denne video. I den næste video skal vi prøve at finde ud af hvor stor en del af denne samlede 64 00:06:58,533 --> 00:07:08,333 varians, der kommer fra 65 00:07:08,333 --> 00:07:14,313 hver sin del af denne gruppe overfor afvigelsen imellem grupperne. Vi tror at, 66 00:07:14,313 --> 00:07:19,667 vi vil få en forståelse for, hvor hele denne varians-analyse kommer fra. Her er variansen 67 00:07:19,667 --> 00:07:24,800 for hele denne samling af 9 tal, men dele af variansen, hvis disse grupper er forskellige fra hinanden, 68 00:07:24,800 --> 00:07:31,267 vil komme fra den forskellighed der findes imellem grupperne, over for variansen som kommer inde fra 69 00:07:31,267 --> 00:07:34,564 gruppen. Vi skal beregne disse to ting og vi vil se at de kommer til gå op 70 00:07:34,579 --> 99:59:59,999 i den samlede kvadrat sum varians.