< Return to Video

ANOVA 1 - Calculating SST (Total Sum of Squares)

  • 0:00 - 0:08
    In deze en de volgende video's zullen
    berekeningen met de dataset worden gedaan
  • 0:08 - 0:13
    En hopelijk krijg je door de berekeningen
    een intuïtief gevoel waarover
  • 0:13 - 0:18
    de variantie analyse over gaat. Als eerst
    gaan we de totale kwadraatsom berekenen
  • 0:23 - 0:27
    Ik noem dat 'SST'.
    En dit kan je zien als de noemer wanneer
  • 0:27 - 0:32
    je de variantie berekent. We nemen gewoon
    de afstand tussen elk van deze datapunten
  • 0:32 - 0:36
    en het gemiddelde van al de datapunten kwadrateren
    ze en nemen daar de som van, we delen ze niet echt
  • 0:36 - 0:41
    door de vrijheidsgraden wat je normaal zou
    doen als de streekproefvariantie berekent.
  • 0:41 - 0:45
    Wat gaat dit worden? Het eerste wat
    we moeten uitzoeken is het gemiddelde
  • 0:45 - 0:48
    van al deze dingen.
    En ik ga dat het totale gemiddelde.
  • 0:51 - 0:53
    Ik noem dat het totale gemiddelde, ik laat
    zien dat het hetzelfde, als het gemiddelde
  • 0:53 - 0:59
    van het gemiddelde is van deze data sets.
    Laten we het totale gemiddelde uitrekenen
  • 0:59 - 1:16
    Dus dat wordt 3 + 2 + 1. 3 + 2 +1 + 5 +3
    +4 + 5 + 6 + 7....+ 5 + 6 +7
  • 1:16 - 1:22
    En dan hebben we negen datapunten.
    Dus we gaan delen door 9 en dan
  • 1:22 - 1:30
    is dit gelijk aan 3+2+1 = 6, 6 +,
    Dus wordt 6. 5 +
  • 1:30 - 1:44
    3 + 4 = 12 en dan 5 + 6 + 7 = 18
    Dan 6 + 12 = 18, + 18 = 36
  • 1:44 - 1:50
    gedeeld door negen is = 4 dit is gelijk
    aan het gemiddelde van de gemiddelden
  • 1:50 - 1:57
    Het gemiddelde van groep 1, dat in het
    groen aangegeven is
  • 1:57 - 2:04
    3 + 2 + 1, dat is 6, gedeeld door 3
    datapunten, en dat is gelijk aan 2.
  • 2:04 - 2:13
    Het gemiddelde van groep 2, met als
    som 12: 5 + 3 + 4 = 12, gedeeld door
  • 2:13 - 2:22
    3 is 4, omdat we drie datapunten hebben.
    Dan het gemiddelde van groep 3, 5+6+7 =18
  • 2:22 - 2:27
    gedeeld door 3 = 6. Dus als je het
    gemiddelde van gemiddelden neemt,
  • 2:27 - 2:31
    wat het totale gemiddelde is,
    heb je 2 + 4 + 6
  • 2:31 - 2:36
    wat 12 is, deelt door 3,
    waardoor je wederom 4 krijgt
  • 2:36 - 2:39
    Dus je kan dit zien als het gemiddelde
    van alle data en alle groepen
  • 2:39 - 2:44
    of als het gemiddelde van elk van groepen
    nu het totale gemiddelde berekend is
  • 2:44 - 2:49
    kunnen we berekenen wat de totale
    kwadraatsom is. Dus laten we dat doen
  • 2:49 - 2:58
    Dus dat gaat gelijk zijn aan:
    (3 - 4)^2,
    +
  • 2:58 - 3:06
    (2 - 4 )^2 + (1 - 4)^2,
    nu doen we de groep in het paars,
  • 3:06 - 3:16
    + (5 - 4^2) + (3 - 4^2) + (4 - 4^2)
  • 3:16 - 3:21
    Ik ga nu hier naar toe, +( 4 - 4^2).
    Nu zijn er nog drie over.
  • 3:21 - 3:33
    + (5 - 4)^2 + (6 - 4^2) + (7 - 4)^2.
    Wat geeft dit ons?
  • 3:33 - 3:38
    Dus hier gaat de eerste gelijk zijn aan,
    3 - 4 het verschil = 1, wat je kwadrateerd
  • 3:38 - 3:42
    Je krijgt eh, het is eigenlijk -1,
    wat je kwadrateerd waardoor je 1 krijgt
  • 3:42 - 3:51
    +, je krijgt (-2)^2 = 4 + (-3)^2.
    (-3)^2 = 9
  • 3:51 - 3:58
    En dan hebben we hier in het paars:
    5 - 4 = 1, 1^2 = 1, (3 - 4)^2 = 1, je
  • 3:58 - 4:03
    kwadrateert en krijg je nog steeds 1 en
    4-4 = 0. Dus kunnen we 0 opschrijven
  • 4:03 - 4:07
    En dan hebben we deze laatste drie
    datapunten
  • 4:07 - 4:17
    (5 - 4)^2 = 1. (6 - 4)^2 = 4,
    het is 2^2. En dan + 7 - 4 = 3^2 = 9
  • 4:17 - 4:25
    Waar gaat dit gelijk aan zijn?
    Dus ik heb 1 + 4 + 9
  • 4:26 - 4:33
    1 + 4 + 9. Wat 5 plus 9 is.
    Dit hier is 15, toch?
  • 4:33 - 4:40
    jup 14. En we hebben nog een 14 hier,
    omdat we 1 + 4 + 9 hebben
  • 4:40 - 4:44
    Dus dat daar is ook 14, en dan hebben we
    2 hier. Dus het gaat
  • 4:44 - 4:55
    28 wezen, 14*2, 14+14 = 28 +2 = 30,
    Dus onze totale kwadraatsom
  • 4:55 - 5:00
    Als we de variantie willen hebben.
    Moeten we het delen door de vrijheidsgrade
  • 5:00 - 5:06
    En deze zijn verschillende malen de
    vrijheidsgraden. Dus laten we zeggen dat
  • 5:06 - 5:11
    We hebben m groepen hier. En ik ga niet
  • 5:11 - 5:14
    dingen rigoureus bewijzen, maar ik wil
    jullie laten zien
  • 5:14 - 5:19
    waar sommige van deze rare formules
    in de statistiek vandaan komen
  • 5:19 - 5:26
    zonder het te bewijzen, maar meer
    om een intuïtie te geven.Er zijn m groepen
  • 5:26 - 5:34
    Elke groep heeft n leden.
    Dus hoeveel leden hebben we?
  • 5:34 - 5:41
    We hebben m*n = 9. 3 keer 3 leden.
    Dus vrijheidsgraden, zoals je herinnert,
  • 5:41 - 5:48
    hebben we zoveel vrijheidsgraden - 1.
    Omdat als je weet
  • 5:48 - 5:53
    Als je het totale gemiddelde wist, als je
    aanneemt dat je dat wist
  • 5:53 - 5:55
    Dan zouden alleen 9 - 1 = 8 van deze,
    zouden er 8
  • 5:58 - 6:00
    je maar nieuwe informatie geven omdat als
    je dat wist kon je de laatste berekenen
  • 6:04 - 6:10
    als je de andere 8 hebt kan je
    altijd de negende berekenen,
  • 6:10 - 6:17
    door gebruik te maken van de totale
    kwadraatsom. Er zijn dus 8 onafhankelijke
  • 6:17 - 6:23
    metingen hier of als je algemeen
    wil praten, m keer n.
  • 6:23 - 6:30
    m keer n is het totale aantal steekproeven
    - 1 vrijheidsgraden.
  • 6:34 - 6:42
    En als je de variantie wil berekenen moet
    je 30 delen door m keer n - 1.
  • 6:42 - 6:47
    In dit voorbeeld zijn er dus 8
    vrijheidsgraden. Je neemt 30
  • 6:47 - 6:53
    gedeeld door 8, waardoor je de variantie
    van de gehele groep van 9 krijgt.
  • 6:53 - 6:58
    Ik verlaat jullie nu in deze video. In de
    volgende video word bekeken hoeveel van de
  • 7:03 - 7:08
    totale variantie, de totale kwdraatsom,
    komt van de variantie.
  • 7:08 - 7:14
    in elk van deze groepen versus variantie
    tussen groepen. Ik denk dat je
  • 7:14 - 7:20
    een idee krijgt waar deze hele analyse
    vandaan komt. Daar is de variantie
  • 7:20 - 7:25
    van de gehele steekproef van 9 maar als
    deze groepen verschillend zijn
  • 7:25 - 7:28
    komt dit wellicht door devariantie van in
    een groep, versus variantie in
  • 7:31 - 7:35
    een groep. We gaan deze twee dingen
    berekenen en gaan zien dat dit gezamelijk
  • 7:39 - 7:39
    de totale kwadraatsom omvat.
Title:
ANOVA 1 - Calculating SST (Total Sum of Squares)
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:39

Dutch subtitles

Revisions