0:00:00.441,0:00:07.657 I denne video, og i de næste videoer, skal vi se på en række udregninger omkring dette datasæt lige her. 0:00:07.657,0:00:12.608 og forhåbentligt, ved at gennegå disse beregninger, vil vi kunne få en intuitiv fornemmelse om hvad denne varians- 0:00:12.608,0:00:18.941 analyse handler om. Det første vi skal gøre i denne video, er at beregne den totale kvadrat-sum. 0:00:18.941,0:00:27.455 Så det kalder vi TKS (SST). Totale kvadrat-sum. Og den udgør tælleren når 0:00:27.455,0:00:31.576 vi skal beregne variansen. Vi finder forskellen mellem hvert af disse tal 0:00:31.576,0:00:36.078 tager gennemsnittet af dem, herefter kvadratet og så finder vi summen. Vi dividerer egentligt ikke med 0:00:36.078,0:00:40.732 frihedsgraden, hvilket man normalt ville gøre hvis man skulle beregne variansen. 0:00:40.763,0:00:45.279 Men hvad bliver det? Det første vi skal gøre, er at beregne gennemsnittet af 0:00:45.279,0:00:49.692 alle disse tal her. Vi kalder det for det totale gennemsnit. 0:00:49.692,0:00:53.359 Lad os vise, at det er det samme som gennemsnittet 0:00:53.359,0:00:59.013 af alle gennemsnit af disse tal. Lad os beregne det totale gennemsnit. 0:00:59.013,0:01:16.152 Det bliver 3 + 2 + 1, 3 + 2 + 1 + 5 + 3 + 4 + 5 + 6 + 7 ... plus 5 + 6 + 7 0:01:16.152,0:01:22.102 Og så har vi 9 tal. Vi har 9 tal, så derfor skal vi dividere med 9. 0:01:22.102,0:01:30.354 Så bliver det lig med: 3 + 2 + 1 er 6. Det skriver vi lige her. 0:01:30.385,0:01:43.944 5 + 3 + 4, det er 12. Og så 5 + 6 + 7 er 18. Og så 6 + 12 er 18 + en til 18 er 36. 0:01:43.944,0:01:50.241 divideret med 9 giver det 4. Lad os vise, at det er præcis det samme som gennemsnittet af gennemsnittene. 0:01:50.302,0:01:57.056 Så gennemsnittet af den første gruppe her, som står med grøn 0:01:57.056,0:02:03.856 er 3 + 2 + 1, det giver 6, divideret med 3, det bliver 2. 0:02:03.856,0:02:12.677 Gennemsnittet af gruppe 2: summen er 12, det så vi lige her, 5 + 3 + 4 er 12, 0:02:12.677,0:02:21.846 divideret med 3 er 4. Og så bliver gennemsnittet af gruppe 3: 5 + 6 + 7, det bliver 18. 0:02:21.846,0:02:27.256 18 divideret med 3 giver 6. Så hvis vi tager gennemsnittet af gennemsnittene 0:02:27.256,0:02:31.015 som er det totale gennemsnit, har vi 2 + 4 + 6 0:02:31.015,0:02:35.892 som er 12, divideret med de 3 gennemsnit her, så får vi også 4. 0:02:35.892,0:02:38.933 Så vi kan betragte det som gennemsnittet af alle tallene i alle 3 grupper 0:02:38.933,0:02:43.600 eller som gennemsnittet af gennemsnittet for hver af disse grupper. Uanset hvad, så kommer vi frem til det samme, 0:02:43.600,0:02:48.836 og nu kan vi finde den totale kvadratsum. Så lad os gøre det. 0:02:48.836,0:02:57.887 Så det bliver lig med 3 - 4, det er 4-tallet lige her, i anden plus 0:02:57.887,0:03:05.667 2 - 4 i anden + 1 - 4 i anden, nu tager vi de tal herovre i anden række: 0:03:05.667,0:03:16.031 + 5 - 4 i anden + 3 - 4 i anden + 4 - 4 i anden 0:03:16.031,0:03:20.667 Vi rykker lige skærmen lidt. Nu har vi kun 3 tal tilbage. 0:03:20.667,0:03:32.887 + 5 - 4 i anden + 6 - 4 i anden plus 7 - 4 i anden. Og hvad bliver det? 0:03:32.887,0:03:38.436 Først har vi 3 - 4, det giver minus 1, men fordi vi opløfter det i anden 0:03:38.436,0:03:42.200 får vi altså plus 1, eller bare 1, plus 0:03:42.200,0:03:51.000 Her har vi minus 2 i anden, som giver 4 + minus 3 i anden, det giver 9. 0:03:51.000,0:03:57.698 Og så bruger vi lige den anden farve. 5 - 4 er 1, opløftet i anden er det stadig 1. 3 - 4 i anden er 1, 0:03:57.698,0:04:03.210 og 4 - 4 i anden er 0, men vi skriver det alligevel her 0:04:03.210,0:04:06.985 for at vise at vi har husket at regne det ud. Og så har vi de sidste 3 datasæt. 0:04:06.985,0:04:16.667 5 - 4 i anden, giver 1. 6 - 4 i anden giver 4, det er det samme som 2 i anden, + 7 - 4 giver 3 0:04:16.667,0:04:24.952 opløftet i anden giver det 9. Hvad bliver den totale kvadratsum så? 0:04:25.629,0:04:33.436 Vi har 1 + 4 + 9 her ovre, det er 5 + 9. Det giver 14. 0:04:33.436,0:04:39.638 Det må også give 14 herovre til højre, da det er de samme tal. 0:04:39.638,0:04:43.632 Og til sidst har vi 1 plus 1 her i midten, og det bliver 2. 0:04:43.632,0:04:55.056 Så vi har 2 gange 14, det er 28, plus 2, det giver 30. Så det er vores totale kvadratsum 0:04:55.056,0:04:59.561 Og faktisk, hvis vi ville have variansen skulle vi dividere dette med frihedsgraden. 0:04:59.561,0:05:05.551 Og de her er flere gange frihedsgraden. Så lad os sige, lad os sige at vi har m grupper her. 0:05:05.551,0:05:11.031 Vi skriver lige m her. Og vi skal ikke 0:05:11.031,0:05:14.236 bevise det stringent, men vi skal vise 0:05:14.236,0:05:18.740 hvor nogle af disse underlige formler i statistik kommer fra, 0:05:18.740,0:05:25.667 så vi har en ide om det. Vi har m grupper her 0:05:25.667,0:05:34.344 og hver gruppe har n medlemmer. Så hvor mange medlemmer har vi så? 0:05:34.344,0:05:41.498 Vi har m gange n, eller i vore tilfælde 9. Det vil sige i alt 3 gange 3 medlemmer. Så frihedsgraden 0:05:41.498,0:05:47.800 er - uanset hvor mange tal man har - antal tal, minus 1. Hvis vi kender 0:05:47.800,0:05:52.800 gennemsnittet af alle gennemsnit, 0:05:52.800,0:05:59.323 så behøver man kun at sige n minus 1. Her altså 9 minus 1. Kun 8 af disse tal vil give os 0:05:59.323,0:06:04.471 ny information, for hvis du kender 8 tal, og gennemsnittet af alle gennemsnit, så kan du beregne det sidste tal, eller det behøver ikke engang at være 0:06:04.471,0:06:09.824 den sidste, hvis vi kender de andre 8, så kan vi beregne denne. Så hvis man har 8 af dem, kan man altid beregne 0:06:09.824,0:06:16.600 det 9'ende tal, ved at bruge gennemsnittet af alle gennemsnit. En måde at tænke på det på er, at der kun er 8 selvstændige 0:06:16.600,0:06:22.883 tal her. Hvis vi ser på det mere generelt, er der 0:06:22.883,0:06:30.397 m gange n, som giver antal tal, minus 1 frihedsgrad. 0:06:33.720,0:06:41.810 Hvis vi vil beregne variansen her, dividerer vi bare 30 med m gange n, minus 1. 0:06:41.810,0:06:47.077 Sagt på en anden måde, 8 frihedsgrader i dette eksempel. Vi tager 30 0:06:47.077,0:06:53.000 divideret med 8 og det giver rent faktisk variansen for denne gruppe med 9 tal. 0:06:53.000,0:06:58.533 Vi slutter denne video. I den næste video skal vi prøve at finde ud af hvor stor en del af denne samlede 0:06:58.533,0:07:08.333 varians, der kommer fra 0:07:08.333,0:07:14.313 hver sin del af denne gruppe overfor afvigelsen imellem grupperne. Vi tror at, 0:07:14.313,0:07:19.667 vi vil få en forståelse for, hvor hele denne varians-analyse kommer fra. Her er variansen 0:07:19.667,0:07:24.800 for hele denne samling af 9 tal, men dele af variansen, hvis disse grupper er forskellige fra hinanden, 0:07:24.800,0:07:31.267 vil komme fra den forskellighed der findes imellem grupperne, over for variansen som kommer inde fra 0:07:31.267,0:07:34.564 gruppen. Vi skal beregne disse to ting og vi vil se at de kommer til gå op 0:07:34.579,99:59:59.999 i den samlede kvadrat sum varians.