-
In deze en de volgende video's zullen
berekeningen met de dataset worden gedaan
-
En hopelijk krijg je door de berekeningen
een intuïtief gevoel waarover
-
de variantie analyse over gaat. Als eerst
gaan we de totale kwadraatsom berekenen
-
Ik noem dat 'SST'.
En dit kan je zien als de noemer wanneer
-
je de variantie berekent. We nemen gewoon
de afstand tussen elk van deze datapunten
-
en het gemiddelde van al de datapunten kwadrateren
ze en nemen daar de som van, we delen ze niet echt
-
door de vrijheidsgraden wat je normaal zou
doen als de streekproefvariantie berekent.
-
Wat gaat dit worden? Het eerste wat
we moeten uitzoeken is het gemiddelde
-
van al deze dingen.
En ik ga dat het totale gemiddelde.
-
Ik noem dat het totale gemiddelde, ik laat
zien dat het hetzelfde, als het gemiddelde
-
van het gemiddelde is van deze data sets.
Laten we het totale gemiddelde uitrekenen
-
Dus dat wordt 3 + 2 + 1. 3 + 2 +1 + 5 +3
+4 + 5 + 6 + 7....+ 5 + 6 +7
-
En dan hebben we negen datapunten.
Dus we gaan delen door 9 en dan
-
is dit gelijk aan 3+2+1 = 6, 6 +,
Dus wordt 6. 5 +
-
3 + 4 = 12 en dan 5 + 6 + 7 = 18
Dan 6 + 12 = 18, + 18 = 36
-
gedeeld door negen is = 4 dit is gelijk
aan het gemiddelde van de gemiddelden
-
Het gemiddelde van groep 1, dat in het
groen aangegeven is
-
3 + 2 + 1, dat is 6, gedeeld door 3
datapunten, en dat is gelijk aan 2.
-
Het gemiddelde van groep 2, met als
som 12: 5 + 3 + 4 = 12, gedeeld door
-
3 is 4, omdat we drie datapunten hebben.
Dan het gemiddelde van groep 3, 5+6+7 =18
-
gedeeld door 3 = 6. Dus als je het
gemiddelde van gemiddelden neemt,
-
wat het totale gemiddelde is,
heb je 2 + 4 + 6
-
wat 12 is, deelt door 3,
waardoor je wederom 4 krijgt
-
Dus je kan dit zien als het gemiddelde
van alle data en alle groepen
-
of als het gemiddelde van elk van groepen
nu het totale gemiddelde berekend is
-
kunnen we berekenen wat de totale
kwadraatsom is. Dus laten we dat doen
-
Dus dat gaat gelijk zijn aan:
(3 - 4)^2,
+
-
(2 - 4 )^2 + (1 - 4)^2,
nu doen we de groep in het paars,
-
+ (5 - 4^2) + (3 - 4^2) + (4 - 4^2)
-
Ik ga nu hier naar toe, +( 4 - 4^2).
Nu zijn er nog drie over.
-
+ (5 - 4)^2 + (6 - 4^2) + (7 - 4)^2.
Wat geeft dit ons?
-
Dus hier gaat de eerste gelijk zijn aan,
3 - 4 het verschil = 1, wat je kwadrateerd
-
Je krijgt eh, het is eigenlijk -1,
wat je kwadrateerd waardoor je 1 krijgt
-
+, je krijgt (-2)^2 = 4 + (-3)^2.
(-3)^2 = 9
-
En dan hebben we hier in het paars:
5 - 4 = 1, 1^2 = 1, (3 - 4)^2 = 1, je
-
kwadrateert en krijg je nog steeds 1 en
4-4 = 0. Dus kunnen we 0 opschrijven
-
En dan hebben we deze laatste drie
datapunten
-
(5 - 4)^2 = 1. (6 - 4)^2 = 4,
het is 2^2. En dan + 7 - 4 = 3^2 = 9
-
Waar gaat dit gelijk aan zijn?
Dus ik heb 1 + 4 + 9
-
1 + 4 + 9. Wat 5 plus 9 is.
Dit hier is 15, toch?
-
jup 14. En we hebben nog een 14 hier,
omdat we 1 + 4 + 9 hebben
-
Dus dat daar is ook 14, en dan hebben we
2 hier. Dus het gaat
-
28 wezen, 14*2, 14+14 = 28 +2 = 30,
Dus onze totale kwadraatsom
-
Als we de variantie willen hebben.
Moeten we het delen door de vrijheidsgrade
-
En deze zijn verschillende malen de
vrijheidsgraden. Dus laten we zeggen dat
-
We hebben m groepen hier. En ik ga niet
-
dingen rigoureus bewijzen, maar ik wil
jullie laten zien
-
waar sommige van deze rare formules
in de statistiek vandaan komen
-
zonder het te bewijzen, maar meer
om een intuïtie te geven.Er zijn m groepen
-
Elke groep heeft n leden.
Dus hoeveel leden hebben we?
-
We hebben m*n = 9. 3 keer 3 leden.
Dus vrijheidsgraden, zoals je herinnert,
-
hebben we zoveel vrijheidsgraden - 1.
Omdat als je weet
-
Als je het totale gemiddelde wist, als je
aanneemt dat je dat wist
-
Dan zouden alleen 9 - 1 = 8 van deze,
zouden er 8
-
je maar nieuwe informatie geven omdat als
je dat wist kon je de laatste berekenen
-
als je de andere 8 hebt kan je
altijd de negende berekenen,
-
door gebruik te maken van de totale
kwadraatsom. Er zijn dus 8 onafhankelijke
-
metingen hier of als je algemeen
wil praten, m keer n.
-
m keer n is het totale aantal steekproeven
- 1 vrijheidsgraden.
-
En als je de variantie wil berekenen moet
je 30 delen door m keer n - 1.
-
In dit voorbeeld zijn er dus 8
vrijheidsgraden. Je neemt 30
-
gedeeld door 8, waardoor je de variantie
van de gehele groep van 9 krijgt.
-
Ik verlaat jullie nu in deze video. In de
volgende video word bekeken hoeveel van de
-
totale variantie, de totale kwdraatsom,
komt van de variantie.
-
in elk van deze groepen versus variantie
tussen groepen. Ik denk dat je
-
een idee krijgt waar deze hele analyse
vandaan komt. Daar is de variantie
-
van de gehele steekproef van 9 maar als
deze groepen verschillend zijn
-
komt dit wellicht door devariantie van in
een groep, versus variantie in
-
een groep. We gaan deze twee dingen
berekenen en gaan zien dat dit gezamelijk
-
de totale kwadraatsom omvat.