In deze en de volgende video's zullen
berekeningen met de dataset worden gedaan
En hopelijk krijg je door de berekeningen
een intuïtief gevoel waarover
de variantie analyse over gaat. Als eerst
gaan we de totale kwadraatsom berekenen
Ik noem dat 'SST'.
En dit kan je zien als de noemer wanneer
je de variantie berekent. We nemen gewoon
de afstand tussen elk van deze datapunten
en het gemiddelde van al de datapunten kwadrateren
ze en nemen daar de som van, we delen ze niet echt
door de vrijheidsgraden wat je normaal zou
doen als de streekproefvariantie berekent.
Wat gaat dit worden? Het eerste wat
we moeten uitzoeken is het gemiddelde
van al deze dingen.
En ik ga dat het totale gemiddelde.
Ik noem dat het totale gemiddelde, ik laat
zien dat het hetzelfde, als het gemiddelde
van het gemiddelde is van deze data sets.
Laten we het totale gemiddelde uitrekenen
Dus dat wordt 3 + 2 + 1. 3 + 2 +1 + 5 +3
+4 + 5 + 6 + 7....+ 5 + 6 +7
En dan hebben we negen datapunten.
Dus we gaan delen door 9 en dan
is dit gelijk aan 3+2+1 = 6, 6 +,
Dus wordt 6. 5 +
3 + 4 = 12 en dan 5 + 6 + 7 = 18
Dan 6 + 12 = 18, + 18 = 36
gedeeld door negen is = 4 dit is gelijk
aan het gemiddelde van de gemiddelden
Het gemiddelde van groep 1, dat in het
groen aangegeven is
3 + 2 + 1, dat is 6, gedeeld door 3
datapunten, en dat is gelijk aan 2.
Het gemiddelde van groep 2, met als
som 12: 5 + 3 + 4 = 12, gedeeld door
3 is 4, omdat we drie datapunten hebben.
Dan het gemiddelde van groep 3, 5+6+7 =18
gedeeld door 3 = 6. Dus als je het
gemiddelde van gemiddelden neemt,
wat het totale gemiddelde is,
heb je 2 + 4 + 6
wat 12 is, deelt door 3,
waardoor je wederom 4 krijgt
Dus je kan dit zien als het gemiddelde
van alle data en alle groepen
of als het gemiddelde van elk van groepen
nu het totale gemiddelde berekend is
kunnen we berekenen wat de totale
kwadraatsom is. Dus laten we dat doen
Dus dat gaat gelijk zijn aan:
(3 - 4)^2,
+
(2 - 4 )^2 + (1 - 4)^2,
nu doen we de groep in het paars,
+ (5 - 4^2) + (3 - 4^2) + (4 - 4^2)
Ik ga nu hier naar toe, +( 4 - 4^2).
Nu zijn er nog drie over.
+ (5 - 4)^2 + (6 - 4^2) + (7 - 4)^2.
Wat geeft dit ons?
Dus hier gaat de eerste gelijk zijn aan,
3 - 4 het verschil = 1, wat je kwadrateerd
Je krijgt eh, het is eigenlijk -1,
wat je kwadrateerd waardoor je 1 krijgt
+, je krijgt (-2)^2 = 4 + (-3)^2.
(-3)^2 = 9
En dan hebben we hier in het paars:
5 - 4 = 1, 1^2 = 1, (3 - 4)^2 = 1, je
kwadrateert en krijg je nog steeds 1 en
4-4 = 0. Dus kunnen we 0 opschrijven
En dan hebben we deze laatste drie
datapunten
(5 - 4)^2 = 1. (6 - 4)^2 = 4,
het is 2^2. En dan + 7 - 4 = 3^2 = 9
Waar gaat dit gelijk aan zijn?
Dus ik heb 1 + 4 + 9
1 + 4 + 9. Wat 5 plus 9 is.
Dit hier is 15, toch?
jup 14. En we hebben nog een 14 hier,
omdat we 1 + 4 + 9 hebben
Dus dat daar is ook 14, en dan hebben we
2 hier. Dus het gaat
28 wezen, 14*2, 14+14 = 28 +2 = 30,
Dus onze totale kwadraatsom
Als we de variantie willen hebben.
Moeten we het delen door de vrijheidsgrade
En deze zijn verschillende malen de
vrijheidsgraden. Dus laten we zeggen dat
We hebben m groepen hier. En ik ga niet
dingen rigoureus bewijzen, maar ik wil
jullie laten zien
waar sommige van deze rare formules
in de statistiek vandaan komen
zonder het te bewijzen, maar meer
om een intuïtie te geven.Er zijn m groepen
Elke groep heeft n leden.
Dus hoeveel leden hebben we?
We hebben m*n = 9. 3 keer 3 leden.
Dus vrijheidsgraden, zoals je herinnert,
hebben we zoveel vrijheidsgraden - 1.
Omdat als je weet
Als je het totale gemiddelde wist, als je
aanneemt dat je dat wist
Dan zouden alleen 9 - 1 = 8 van deze,
zouden er 8
je maar nieuwe informatie geven omdat als
je dat wist kon je de laatste berekenen
als je de andere 8 hebt kan je
altijd de negende berekenen,
door gebruik te maken van de totale
kwadraatsom. Er zijn dus 8 onafhankelijke
metingen hier of als je algemeen
wil praten, m keer n.
m keer n is het totale aantal steekproeven
- 1 vrijheidsgraden.
En als je de variantie wil berekenen moet
je 30 delen door m keer n - 1.
In dit voorbeeld zijn er dus 8
vrijheidsgraden. Je neemt 30
gedeeld door 8, waardoor je de variantie
van de gehele groep van 9 krijgt.
Ik verlaat jullie nu in deze video. In de
volgende video word bekeken hoeveel van de
totale variantie, de totale kwdraatsom,
komt van de variantie.
in elk van deze groepen versus variantie
tussen groepen. Ik denk dat je
een idee krijgt waar deze hele analyse
vandaan komt. Daar is de variantie
van de gehele steekproef van 9 maar als
deze groepen verschillend zijn
komt dit wellicht door devariantie van in
een groep, versus variantie in
een groep. We gaan deze twee dingen
berekenen en gaan zien dat dit gezamelijk
de totale kwadraatsom omvat.