< Return to Video

ANOVA 1 - Calculating SST (Total Sum of Squares)

  • 0:00 - 0:08
    I denne video, og i de næste videoer, skal vi se på en række udregninger omkring dette datasæt lige her.
  • 0:08 - 0:13
    og forhåbentligt, ved at gennegå disse beregninger, vil vi kunne få en intuitiv fornemmelse om hvad denne varians-
  • 0:13 - 0:19
    analyse handler om. Det første vi skal gøre i denne video, er at beregne den totale kvadrat-sum.
  • 0:19 - 0:27
    Så det kalder vi TKS (SST). Totale kvadrat-sum. Og den udgør tælleren når
  • 0:27 - 0:32
    vi skal beregne variansen. Vi finder forskellen mellem hvert af disse tal
  • 0:32 - 0:36
    tager gennemsnittet af dem, herefter kvadratet og så finder vi summen. Vi dividerer egentligt ikke med
  • 0:36 - 0:41
    frihedsgraden, hvilket man normalt ville gøre hvis man skulle beregne variansen.
  • 0:41 - 0:45
    Men hvad bliver det? Det første vi skal gøre, er at beregne gennemsnittet af
  • 0:45 - 0:50
    alle disse tal her. Vi kalder det for det totale gennemsnit.
  • 0:50 - 0:53
    Lad os vise, at det er det samme som gennemsnittet
  • 0:53 - 0:59
    af alle gennemsnit af disse tal. Lad os beregne det totale gennemsnit.
  • 0:59 - 1:16
    Det bliver 3 + 2 + 1, 3 + 2 + 1 + 5 + 3 + 4 + 5 + 6 + 7 ... plus 5 + 6 + 7
  • 1:16 - 1:22
    Og så har vi 9 tal. Vi har 9 tal, så derfor skal vi dividere med 9.
  • 1:22 - 1:30
    Så bliver det lig med: 3 + 2 + 1 er 6. Det skriver vi lige her.
  • 1:30 - 1:44
    5 + 3 + 4, det er 12. Og så 5 + 6 + 7 er 18. Og så 6 + 12 er 18 + en til 18 er 36.
  • 1:44 - 1:50
    divideret med 9 giver det 4. Lad os vise, at det er præcis det samme som gennemsnittet af gennemsnittene.
  • 1:50 - 1:57
    Så gennemsnittet af den første gruppe her, som står med grøn
  • 1:57 - 2:04
    er 3 + 2 + 1, det giver 6, divideret med 3, det bliver 2.
  • 2:04 - 2:13
    Gennemsnittet af gruppe 2: summen er 12, det så vi lige her, 5 + 3 + 4 er 12,
  • 2:13 - 2:22
    divideret med 3 er 4. Og så bliver gennemsnittet af gruppe 3: 5 + 6 + 7, det bliver 18.
  • 2:22 - 2:27
    18 divideret med 3 giver 6. Så hvis vi tager gennemsnittet af gennemsnittene
  • 2:27 - 2:31
    som er det totale gennemsnit, har vi 2 + 4 + 6
  • 2:31 - 2:36
    som er 12, divideret med de 3 gennemsnit her, så får vi også 4.
  • 2:36 - 2:39
    Så vi kan betragte det som gennemsnittet af alle tallene i alle 3 grupper
  • 2:39 - 2:44
    eller som gennemsnittet af gennemsnittet for hver af disse grupper. Uanset hvad, så kommer vi frem til det samme,
  • 2:44 - 2:49
    og nu kan vi finde den totale kvadratsum. Så lad os gøre det.
  • 2:49 - 2:58
    Så det bliver lig med 3 - 4, det er 4-tallet lige her, i anden plus
  • 2:58 - 3:06
    2 - 4 i anden + 1 - 4 i anden, nu tager vi de tal herovre i anden række:
  • 3:06 - 3:16
    + 5 - 4 i anden + 3 - 4 i anden + 4 - 4 i anden
  • 3:16 - 3:21
    Vi rykker lige skærmen lidt. Nu har vi kun 3 tal tilbage.
  • 3:21 - 3:33
    + 5 - 4 i anden + 6 - 4 i anden plus 7 - 4 i anden. Og hvad bliver det?
  • 3:33 - 3:38
    Først har vi 3 - 4, det giver minus 1, men fordi vi opløfter det i anden
  • 3:38 - 3:42
    får vi altså plus 1, eller bare 1, plus
  • 3:42 - 3:51
    Her har vi minus 2 i anden, som giver 4 + minus 3 i anden, det giver 9.
  • 3:51 - 3:58
    Og så bruger vi lige den anden farve. 5 - 4 er 1, opløftet i anden er det stadig 1. 3 - 4 i anden er 1,
  • 3:58 - 4:03
    og 4 - 4 i anden er 0, men vi skriver det alligevel her
  • 4:03 - 4:07
    for at vise at vi har husket at regne det ud. Og så har vi de sidste 3 datasæt.
  • 4:07 - 4:17
    5 - 4 i anden, giver 1. 6 - 4 i anden giver 4, det er det samme som 2 i anden, + 7 - 4 giver 3
  • 4:17 - 4:25
    opløftet i anden giver det 9. Hvad bliver den totale kvadratsum så?
  • 4:26 - 4:33
    Vi har 1 + 4 + 9 her ovre, det er 5 + 9. Det giver 14.
  • 4:33 - 4:40
    Det må også give 14 herovre til højre, da det er de samme tal.
  • 4:40 - 4:44
    Og til sidst har vi 1 plus 1 her i midten, og det bliver 2.
  • 4:44 - 4:55
    Så vi har 2 gange 14, det er 28, plus 2, det giver 30. Så det er vores totale kvadratsum
  • 4:55 - 5:00
    Og faktisk, hvis vi ville have variansen skulle vi dividere dette med frihedsgraden.
  • 5:00 - 5:06
    Og de her er flere gange frihedsgraden. Så lad os sige, lad os sige at vi har m grupper her.
  • 5:06 - 5:11
    Vi skriver lige m her. Og vi skal ikke
  • 5:11 - 5:14
    bevise det stringent, men vi skal vise
  • 5:14 - 5:19
    hvor nogle af disse underlige formler i statistik kommer fra,
  • 5:19 - 5:26
    så vi har en ide om det. Vi har m grupper her
  • 5:26 - 5:34
    og hver gruppe har n medlemmer. Så hvor mange medlemmer har vi så?
  • 5:34 - 5:41
    Vi har m gange n, eller i vore tilfælde 9. Det vil sige i alt 3 gange 3 medlemmer. Så frihedsgraden
  • 5:41 - 5:48
    er - uanset hvor mange tal man har - antal tal, minus 1. Hvis vi kender
  • 5:48 - 5:53
    gennemsnittet af alle gennemsnit,
  • 5:53 - 5:59
    så behøver man kun at sige n minus 1. Her altså 9 minus 1. Kun 8 af disse tal vil give os
  • 5:59 - 6:04
    ny information, for hvis du kender 8 tal, og gennemsnittet af alle gennemsnit, så kan du beregne det sidste tal, eller det behøver ikke engang at være
  • 6:04 - 6:10
    den sidste, hvis vi kender de andre 8, så kan vi beregne denne. Så hvis man har 8 af dem, kan man altid beregne
  • 6:10 - 6:17
    det 9'ende tal, ved at bruge gennemsnittet af alle gennemsnit. En måde at tænke på det på er, at der kun er 8 selvstændige
  • 6:17 - 6:23
    tal her. Hvis vi ser på det mere generelt, er der
  • 6:23 - 6:30
    m gange n, som giver antal tal, minus 1 frihedsgrad.
  • 6:34 - 6:42
    Hvis vi vil beregne variansen her, dividerer vi bare 30 med m gange n, minus 1.
  • 6:42 - 6:47
    Sagt på en anden måde, 8 frihedsgrader i dette eksempel. Vi tager 30
  • 6:47 - 6:53
    divideret med 8 og det giver rent faktisk variansen for denne gruppe med 9 tal.
  • 6:53 - 6:59
    Vi slutter denne video. I den næste video skal vi prøve at finde ud af hvor stor en del af denne samlede
  • 6:59 - 7:08
    varians, der kommer fra
  • 7:08 - 7:14
    hver sin del af denne gruppe overfor afvigelsen imellem grupperne. Vi tror at,
  • 7:14 - 7:20
    vi vil få en forståelse for, hvor hele denne varians-analyse kommer fra. Her er variansen
  • 7:20 - 7:25
    for hele denne samling af 9 tal, men dele af variansen, hvis disse grupper er forskellige fra hinanden,
  • 7:25 - 7:31
    vil komme fra den forskellighed der findes imellem grupperne, over for variansen som kommer inde fra
  • 7:31 - 7:35
    gruppen. Vi skal beregne disse to ting og vi vil se at de kommer til gå op
  • 7:35 - 6000:00
    i den samlede kvadrat sum varians.
Title:
ANOVA 1 - Calculating SST (Total Sum of Squares)
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:39

Danish subtitles

Revisions