-
I denne video, og i de næste videoer, skal vi se på en række udregninger omkring dette datasæt lige her.
-
og forhåbentligt, ved at gennegå disse beregninger, vil vi kunne få en intuitiv fornemmelse om hvad denne varians-
-
analyse handler om. Det første vi skal gøre i denne video, er at beregne den totale kvadrat-sum.
-
Så det kalder vi TKS (SST). Totale kvadrat-sum. Og den udgør tælleren når
-
vi skal beregne variansen. Vi finder forskellen mellem hvert af disse tal
-
tager gennemsnittet af dem, herefter kvadratet og så finder vi summen. Vi dividerer egentligt ikke med
-
frihedsgraden, hvilket man normalt ville gøre hvis man skulle beregne variansen.
-
Men hvad bliver det? Det første vi skal gøre, er at beregne gennemsnittet af
-
alle disse tal her. Vi kalder det for det totale gennemsnit.
-
Lad os vise, at det er det samme som gennemsnittet
-
af alle gennemsnit af disse tal. Lad os beregne det totale gennemsnit.
-
Det bliver 3 + 2 + 1, 3 + 2 + 1 + 5 + 3 + 4 + 5 + 6 + 7 ... plus 5 + 6 + 7
-
Og så har vi 9 tal. Vi har 9 tal, så derfor skal vi dividere med 9.
-
Så bliver det lig med: 3 + 2 + 1 er 6. Det skriver vi lige her.
-
5 + 3 + 4, det er 12. Og så 5 + 6 + 7 er 18. Og så 6 + 12 er 18 + en til 18 er 36.
-
divideret med 9 giver det 4. Lad os vise, at det er præcis det samme som gennemsnittet af gennemsnittene.
-
Så gennemsnittet af den første gruppe her, som står med grøn
-
er 3 + 2 + 1, det giver 6, divideret med 3, det bliver 2.
-
Gennemsnittet af gruppe 2: summen er 12, det så vi lige her, 5 + 3 + 4 er 12,
-
divideret med 3 er 4. Og så bliver gennemsnittet af gruppe 3: 5 + 6 + 7, det bliver 18.
-
18 divideret med 3 giver 6. Så hvis vi tager gennemsnittet af gennemsnittene
-
som er det totale gennemsnit, har vi 2 + 4 + 6
-
som er 12, divideret med de 3 gennemsnit her, så får vi også 4.
-
Så vi kan betragte det som gennemsnittet af alle tallene i alle 3 grupper
-
eller som gennemsnittet af gennemsnittet for hver af disse grupper. Uanset hvad, så kommer vi frem til det samme,
-
og nu kan vi finde den totale kvadratsum. Så lad os gøre det.
-
Så det bliver lig med 3 - 4, det er 4-tallet lige her, i anden plus
-
2 - 4 i anden + 1 - 4 i anden, nu tager vi de tal herovre i anden række:
-
+ 5 - 4 i anden + 3 - 4 i anden + 4 - 4 i anden
-
Vi rykker lige skærmen lidt. Nu har vi kun 3 tal tilbage.
-
+ 5 - 4 i anden + 6 - 4 i anden plus 7 - 4 i anden. Og hvad bliver det?
-
Først har vi 3 - 4, det giver minus 1, men fordi vi opløfter det i anden
-
får vi altså plus 1, eller bare 1, plus
-
Her har vi minus 2 i anden, som giver 4 + minus 3 i anden, det giver 9.
-
Og så bruger vi lige den anden farve. 5 - 4 er 1, opløftet i anden er det stadig 1. 3 - 4 i anden er 1,
-
og 4 - 4 i anden er 0, men vi skriver det alligevel her
-
for at vise at vi har husket at regne det ud. Og så har vi de sidste 3 datasæt.
-
5 - 4 i anden, giver 1. 6 - 4 i anden giver 4, det er det samme som 2 i anden, + 7 - 4 giver 3
-
opløftet i anden giver det 9. Hvad bliver den totale kvadratsum så?
-
Vi har 1 + 4 + 9 her ovre, det er 5 + 9. Det giver 14.
-
Det må også give 14 herovre til højre, da det er de samme tal.
-
Og til sidst har vi 1 plus 1 her i midten, og det bliver 2.
-
Så vi har 2 gange 14, det er 28, plus 2, det giver 30. Så det er vores totale kvadratsum
-
Og faktisk, hvis vi ville have variansen skulle vi dividere dette med frihedsgraden.
-
Og de her er flere gange frihedsgraden. Så lad os sige, lad os sige at vi har m grupper her.
-
Vi skriver lige m her. Og vi skal ikke
-
bevise det stringent, men vi skal vise
-
hvor nogle af disse underlige formler i statistik kommer fra,
-
så vi har en ide om det. Vi har m grupper her
-
og hver gruppe har n medlemmer. Så hvor mange medlemmer har vi så?
-
Vi har m gange n, eller i vore tilfælde 9. Det vil sige i alt 3 gange 3 medlemmer. Så frihedsgraden
-
er - uanset hvor mange tal man har - antal tal, minus 1. Hvis vi kender
-
gennemsnittet af alle gennemsnit,
-
så behøver man kun at sige n minus 1. Her altså 9 minus 1. Kun 8 af disse tal vil give os
-
ny information, for hvis du kender 8 tal, og gennemsnittet af alle gennemsnit, så kan du beregne det sidste tal, eller det behøver ikke engang at være
-
den sidste, hvis vi kender de andre 8, så kan vi beregne denne. Så hvis man har 8 af dem, kan man altid beregne
-
det 9'ende tal, ved at bruge gennemsnittet af alle gennemsnit. En måde at tænke på det på er, at der kun er 8 selvstændige
-
tal her. Hvis vi ser på det mere generelt, er der
-
m gange n, som giver antal tal, minus 1 frihedsgrad.
-
Hvis vi vil beregne variansen her, dividerer vi bare 30 med m gange n, minus 1.
-
Sagt på en anden måde, 8 frihedsgrader i dette eksempel. Vi tager 30
-
divideret med 8 og det giver rent faktisk variansen for denne gruppe med 9 tal.
-
Vi slutter denne video. I den næste video skal vi prøve at finde ud af hvor stor en del af denne samlede
-
varians, der kommer fra
-
hver sin del af denne gruppe overfor afvigelsen imellem grupperne. Vi tror at,
-
vi vil få en forståelse for, hvor hele denne varians-analyse kommer fra. Her er variansen
-
for hele denne samling af 9 tal, men dele af variansen, hvis disse grupper er forskellige fra hinanden,
-
vil komme fra den forskellighed der findes imellem grupperne, over for variansen som kommer inde fra
-
gruppen. Vi skal beregne disse to ting og vi vil se at de kommer til gå op
-
i den samlede kvadrat sum varians.