< Return to Video

ANOVA 1 - Calculating SST (Total Sum of Squares)

  • 0:00 - 0:08
    In diesem und folgenden Videos werden wir ein paar Berechnungen mit diesem Datensatz hier machen.
  • 0:08 - 0:13
    Und hoffentlich gibt euch diese Übung ein Gefühl dafür, worum es bei der Varianzanalyse geht.
  • 0:13 - 0:19
    Als erstes möchte ich die gesamte Quadratsumme berechnen.
  • 0:19 - 0:27
    Die sogenannte SST ("sums of squares total").
    Ihr könnt das als den Zähler ansehen, wenn es an die
  • 0:27 - 0:32
    Berechnung der Varianz geht. Wir nehmen also die Distanz zwischen jedem dieser Datenpunkte
  • 0:32 - 0:36
    und den Mittelwert all dieser Datenpunkte, quadrieren sie und summieren sie auf. Wir teilen
  • 0:36 - 0:41
    nicht durch den Freiheitsgrad, wie man es normalerweise bei der Berechnung der Stichprobenvarianz macht.
  • 0:41 - 0:45
    Wie gehen wir das an? Zuerst müssen wir den Mittelwert
  • 0:45 - 0:50
    all dieser Zahlen berechnen. Ich werde das "grand Mittel" nennen.
  • 0:50 - 0:53
    Ich werde das "grand Mittel" nennen. Und gleich seht ihr, dass es das gleiche ist,
  • 0:53 - 0:59
    wie der Mittelwert der Mittelwerte dieser Datensätze.
  • 0:59 - 1:16
    Also lasst uns das "grand Mittel" (den übergeordneten Mittelwert) berechnen.
  • 1:16 - 1:22
    Insgesamt sind das neun Datenpunkte, also werden wir durch neun teilen.
  • 1:22 - 1:30
    Was kommt dabei raus, wenn wir die Zahlen addieren? 3+2+1...
  • 1:30 - 1:44
    ...+5+6+7 = 36
  • 1:44 - 1:50
    Und 36 geteilt durch 9 = 4. Und das ist der Mittelwert der Mittelwerte der drei Datensätze.
  • 1:50 - 1:57
    Der Mittelwert dieser grünen Gruppe hier links
  • 1:57 - 2:04
    ist 3 + 2 + 1 = 6. Und 6 geteilt durch 3 Datenpunkte ist gleich 2.
  • 2:04 - 2:13
    Der Mittelwert der Gruppe 2... Die Summe hier ist 12, denn 5 plus 3 plus 4 ist 12.
  • 2:13 - 2:22
    Und 12 geteilt durch 3 ist 4. Denn wir haben drei Datenpunkte. Und der Mittelwert der Gruppe 3: 5 + 6 + 7 = 18.
  • 2:22 - 2:27
    18 geteilt durch 3 ist 6. Also, wenn wir den Mittelwert der Mittel nehmen wollen
  • 2:27 - 2:31
    also das "grand Mittel", dann haben wir 2+4+6 = 12
  • 2:31 - 2:36
    Und 12 geteilt durch 3 ist 4 - wie wir vorhin schon gerechnet haben..
  • 2:36 - 2:39
    Man kann es also als übergeordneten Mittelwert über alle Daten sehen
  • 2:39 - 2:44
    oder als Mittelwert der Mittelwerte jeder Gruppe. Und da wir den MIttelwert jetzt berechnet haben
  • 2:44 - 2:49
    können wir nun die Quadratsummen berechnen.
    Los geht's.
  • 2:49 - 2:58
    SST ("sums of squares total") entspricht 3 -4... diese 4, die wir gerade berechnet haben... zum Quadrat
  • 2:58 - 3:06
    SST = (3-4)^2 + (2 - 4)^2 + (1-4)^2...und jetzt kommen die lila Zahlen...
  • 3:06 - 3:16
    ...+ (5-4)^2 + (3-4)^2 + (4-4)^2
  • 3:16 - 3:21
    ...+ (5-4)^2 + (3-4)^2 + (4-4)^2
    Jetzt fehlen noch die letzten drei....
  • 3:21 - 3:33
    ...+ (5-4)^2 + (6-4)^2 + (7-4)^2.
    Und was kommt dabei raus?
  • 3:33 - 3:38
    Das erste hier, 3 minus 4, ist gleich 1....
  • 3:38 - 3:42
    ...also eigentlich gleich -1,
    und das zum Quadrat ist 1.
  • 3:42 - 3:51
    Plus -2 zum Quadrat ist gleich 4,
    plus -3 zum Quadrat ist 9.
  • 3:51 - 3:58
    Und hier in Magenta haben wir: 5-4=1, zum Quadrat immer noch 1. (3-4)^2 ist 1.
  • 3:58 - 4:03
    Und 4-4 ist 0, also schreiben wir die 0 hier hin
  • 4:03 - 4:07
    nur um zu sehen, dass wir das wirklich gerechnet haben. Und jetzt zu den letzten Datenpunkten.
  • 4:07 - 4:17
    5 minus 4 zum Quadrat ist 1. 6 minus 4 zum Quadrat ist 4. 7 minus 4 ist 3, ...
  • 4:17 - 4:25
    ...zum Quadrat ist 9. Wir haben also 1 plus 4 plus 9.
  • 4:26 - 4:33
    Und 1 plus 4 plus 9, also 5 plus 9, das gibt 14.
  • 4:33 - 4:40
    Genau, 14. Und wir haben noch mal 14 genau hier, denn hier haben wir auch 1 plus 4 plus 9.
  • 4:40 - 4:44
    also ist das hier auch 14. Und dann haben wir hier noch 2
  • 4:44 - 4:55
    14 mal 2, also 14 plus 14 ist 28, plus 2 ist 30. Unser SST ("sums of squares total") ist also 30.
  • 4:55 - 5:00
    Und um die Varianz zu berechnen, würden wir das einfach durch die Freiheitsgrade teilen.
  • 5:00 - 5:06
    Und das hier ist ein Vielfaches der Freiheitsgrade hier. Sagen wir also, wir haben
  • 5:06 - 5:11
    sagen wir wir haben m Gruppen hier. Und ich
  • 5:11 - 5:14
    werde hier nicht den kompletten Beweis führen, aber
  • 5:14 - 5:19
    ich will euch zeigen, wo diese seltsamen Formeln herkommen, die in Statistik auftauchen.
  • 5:19 - 5:26
    Ich will nicht den kompletten Beweis führen, sondern euch nur ein Gefühl dafür geben. Wir haben also m Gruppen
  • 5:26 - 5:34
    und jede Gruppe hat n Elemente. Wie viele Elemente haben wir also insgesamt?
  • 5:34 - 5:41
    Nun, wir haben m mal n oder 9, richtig? 3 mal 3 Elemente. an Freiheitsgraden
  • 5:41 - 5:48
    haben wir also genauso viele wie Datenpunkte minus 1 Freiheitsgrad.
  • 5:48 - 5:53
    Denn wenn ihr den Mittelwert der Mittelwerte kennen würdet, also angenommen, ihr würdet ihn kennen,
  • 5:53 - 5:59
    dann würdet ihr nur durch 9 minus 1, also durch 8 dieser Datenpunkte neue Informationen erhalten
  • 5:59 - 6:04
    denn den neunten Datenpunkt könnten ihr aus den anderen selbst errechnen.
  • 6:04 - 6:10
    denn den neunten Datenpunkt könnten ihr aus den anderen selbst errechnen.
  • 6:10 - 6:17
    Den 9. könntet ihr über den MIttelwert der Mittelwert und die anderen acht berechnen. Es gibt also nur
  • 6:17 - 6:23
    acht unabhängige Messwerte hier. Oder genereller gesprochen: Es gibt
  • 6:23 - 6:30
    m mal n (also die Gesamtzahl der Datenpunkte) minus 1 Freiheitsgrade.
  • 6:34 - 6:42
    Und um die Varianz zu berechnen, würden wir einfach die 30 durch m mal n -1 teilen.
  • 6:42 - 6:47
    Oder anders gesagt: Ihr teilt die 30 durch die 8 Freiheitsgrade
  • 6:47 - 6:53
    und damit habt ihr die varianz für diese gesamte Gruppe an neun Messwerten.
  • 6:53 - 6:59
    Ich belasse es in diesem Video dabei. Im nächsten Video versuchen wir herauszufinden, wie viel dieser
  • 6:59 - 7:08
    Gesamtvarianz, also dieser gesamten Quadratsummen, der gesamten Abweichung durch die Variation
  • 7:08 - 7:14
    innerhalb dieser Gruppen versus der Variation zwischen der Gruppen kommt. Und ich denke
  • 7:14 - 7:20
    ihr werdet ein Gefühl dafür bekommen, worum es bei dieser Varianzanalyse geht. Es gibt Varianz innerhalb
  • 7:20 - 7:25
    der gesamten Stichprobe (also der neun Datenpunkte), aber ein Teil der Varianz könnte
  • 7:25 - 7:31
    auch daher kommen, dass die drei Gruppen unterschiedlich sind. Es geht also darum, die Varianz innerhalb der Gruppen
  • 7:31 - 7:35
    und die Varianz zwischen den Gruppen zu berechnen. Und wenn wir das machen, werden wir sehen, dass sie sich
  • 7:35 - 6000:00
    zu unserer Gesamtvarianz aufsummieren.
Title:
ANOVA 1 - Calculating SST (Total Sum of Squares)
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:39

German subtitles

Revisions