I denne video, og i de næste videoer, skal vi se på en række udregninger omkring dette datasæt lige her.
og forhåbentligt, ved at gennegå disse beregninger, vil vi kunne få en intuitiv fornemmelse om hvad denne varians-
analyse handler om. Det første vi skal gøre i denne video, er at beregne den totale kvadrat-sum.
Så det kalder vi TKS (SST). Totale kvadrat-sum. Og den udgør tælleren når
vi skal beregne variansen. Vi finder forskellen mellem hvert af disse tal
tager gennemsnittet af dem, herefter kvadratet og så finder vi summen. Vi dividerer egentligt ikke med
frihedsgraden, hvilket man normalt ville gøre hvis man skulle beregne variansen.
Men hvad bliver det? Det første vi skal gøre, er at beregne gennemsnittet af
alle disse tal her. Vi kalder det for det totale gennemsnit.
Lad os vise, at det er det samme som gennemsnittet
af alle gennemsnit af disse tal. Lad os beregne det totale gennemsnit.
Det bliver 3 + 2 + 1, 3 + 2 + 1 + 5 + 3 + 4 + 5 + 6 + 7 ... plus 5 + 6 + 7
Og så har vi 9 tal. Vi har 9 tal, så derfor skal vi dividere med 9.
Så bliver det lig med: 3 + 2 + 1 er 6. Det skriver vi lige her.
5 + 3 + 4, det er 12. Og så 5 + 6 + 7 er 18. Og så 6 + 12 er 18 + en til 18 er 36.
divideret med 9 giver det 4. Lad os vise, at det er præcis det samme som gennemsnittet af gennemsnittene.
Så gennemsnittet af den første gruppe her, som står med grøn
er 3 + 2 + 1, det giver 6, divideret med 3, det bliver 2.
Gennemsnittet af gruppe 2: summen er 12, det så vi lige her, 5 + 3 + 4 er 12,
divideret med 3 er 4. Og så bliver gennemsnittet af gruppe 3: 5 + 6 + 7, det bliver 18.
18 divideret med 3 giver 6. Så hvis vi tager gennemsnittet af gennemsnittene
som er det totale gennemsnit, har vi 2 + 4 + 6
som er 12, divideret med de 3 gennemsnit her, så får vi også 4.
Så vi kan betragte det som gennemsnittet af alle tallene i alle 3 grupper
eller som gennemsnittet af gennemsnittet for hver af disse grupper. Uanset hvad, så kommer vi frem til det samme,
og nu kan vi finde den totale kvadratsum. Så lad os gøre det.
Så det bliver lig med 3 - 4, det er 4-tallet lige her, i anden plus
2 - 4 i anden + 1 - 4 i anden, nu tager vi de tal herovre i anden række:
+ 5 - 4 i anden + 3 - 4 i anden + 4 - 4 i anden
Vi rykker lige skærmen lidt. Nu har vi kun 3 tal tilbage.
+ 5 - 4 i anden + 6 - 4 i anden plus 7 - 4 i anden. Og hvad bliver det?
Først har vi 3 - 4, det giver minus 1, men fordi vi opløfter det i anden
får vi altså plus 1, eller bare 1, plus
Her har vi minus 2 i anden, som giver 4 + minus 3 i anden, det giver 9.
Og så bruger vi lige den anden farve. 5 - 4 er 1, opløftet i anden er det stadig 1. 3 - 4 i anden er 1,
og 4 - 4 i anden er 0, men vi skriver det alligevel her
for at vise at vi har husket at regne det ud. Og så har vi de sidste 3 datasæt.
5 - 4 i anden, giver 1. 6 - 4 i anden giver 4, det er det samme som 2 i anden, + 7 - 4 giver 3
opløftet i anden giver det 9. Hvad bliver den totale kvadratsum så?
Vi har 1 + 4 + 9 her ovre, det er 5 + 9. Det giver 14.
Det må også give 14 herovre til højre, da det er de samme tal.
Og til sidst har vi 1 plus 1 her i midten, og det bliver 2.
Så vi har 2 gange 14, det er 28, plus 2, det giver 30. Så det er vores totale kvadratsum
Og faktisk, hvis vi ville have variansen skulle vi dividere dette med frihedsgraden.
Og de her er flere gange frihedsgraden. Så lad os sige, lad os sige at vi har m grupper her.
Vi skriver lige m her. Og vi skal ikke
bevise det stringent, men vi skal vise
hvor nogle af disse underlige formler i statistik kommer fra,
så vi har en ide om det. Vi har m grupper her
og hver gruppe har n medlemmer. Så hvor mange medlemmer har vi så?
Vi har m gange n, eller i vore tilfælde 9. Det vil sige i alt 3 gange 3 medlemmer. Så frihedsgraden
er - uanset hvor mange tal man har - antal tal, minus 1. Hvis vi kender
gennemsnittet af alle gennemsnit,
så behøver man kun at sige n minus 1. Her altså 9 minus 1. Kun 8 af disse tal vil give os
ny information, for hvis du kender 8 tal, og gennemsnittet af alle gennemsnit, så kan du beregne det sidste tal, eller det behøver ikke engang at være
den sidste, hvis vi kender de andre 8, så kan vi beregne denne. Så hvis man har 8 af dem, kan man altid beregne
det 9'ende tal, ved at bruge gennemsnittet af alle gennemsnit. En måde at tænke på det på er, at der kun er 8 selvstændige
tal her. Hvis vi ser på det mere generelt, er der
m gange n, som giver antal tal, minus 1 frihedsgrad.
Hvis vi vil beregne variansen her, dividerer vi bare 30 med m gange n, minus 1.
Sagt på en anden måde, 8 frihedsgrader i dette eksempel. Vi tager 30
divideret med 8 og det giver rent faktisk variansen for denne gruppe med 9 tal.
Vi slutter denne video. I den næste video skal vi prøve at finde ud af hvor stor en del af denne samlede
varians, der kommer fra
hver sin del af denne gruppe overfor afvigelsen imellem grupperne. Vi tror at,
vi vil få en forståelse for, hvor hele denne varians-analyse kommer fra. Her er variansen
for hele denne samling af 9 tal, men dele af variansen, hvis disse grupper er forskellige fra hinanden,
vil komme fra den forskellighed der findes imellem grupperne, over for variansen som kommer inde fra
gruppen. Vi skal beregne disse to ting og vi vil se at de kommer til gå op
i den samlede kvadrat sum varians.