1 00:00:00,441 --> 00:00:07,657 In deze en de volgende video's zullen berekeningen met de dataset worden gedaan 2 00:00:07,657 --> 00:00:12,608 En hopelijk krijg je door de berekeningen een intuïtief gevoel waarover 3 00:00:12,608 --> 00:00:17,557 de variantie analyse over gaat. Als eerst gaan we de totale kwadraatsom berekenen 4 00:00:22,506 --> 00:00:27,455 Ik noem dat 'SST'. En dit kan je zien als de noemer wanneer 5 00:00:27,455 --> 00:00:31,576 je de variantie berekent. We nemen gewoon de afstand tussen elk van deze datapunten 6 00:00:31,576 --> 00:00:36,078 en het gemiddelde van al de datapunten kwadrateren ze en nemen daar de som van, we delen ze niet echt 7 00:00:36,078 --> 00:00:40,732 door de vrijheidsgraden wat je normaal zou doen als de streekproefvariantie berekent. 8 00:00:40,763 --> 00:00:45,279 Wat gaat dit worden? Het eerste wat we moeten uitzoeken is het gemiddelde 9 00:00:45,279 --> 00:00:47,972 van al deze dingen. En ik ga dat het totale gemiddelde. 10 00:00:50,665 --> 00:00:53,359 Ik noem dat het totale gemiddelde, ik laat zien dat het hetzelfde, als het gemiddelde 11 00:00:53,359 --> 00:00:59,013 van het gemiddelde is van deze data sets. Laten we het totale gemiddelde uitrekenen 12 00:00:59,013 --> 00:01:16,152 Dus dat wordt 3 + 2 + 1. 3 + 2 +1 + 5 +3 +4 + 5 + 6 + 7....+ 5 + 6 +7 13 00:01:16,152 --> 00:01:22,102 En dan hebben we negen datapunten. Dus we gaan delen door 9 en dan 14 00:01:22,102 --> 00:01:30,354 is dit gelijk aan 3+2+1 = 6, 6 +, Dus wordt 6. 5 + 15 00:01:30,385 --> 00:01:43,944 3 + 4 = 12 en dan 5 + 6 + 7 = 18 Dan 6 + 12 = 18, + 18 = 36 16 00:01:43,944 --> 00:01:50,241 gedeeld door negen is = 4 dit is gelijk aan het gemiddelde van de gemiddelden 17 00:01:50,302 --> 00:01:57,056 Het gemiddelde van groep 1, dat in het groen aangegeven is 18 00:01:57,056 --> 00:02:03,856 3 + 2 + 1, dat is 6, gedeeld door 3 datapunten, en dat is gelijk aan 2. 19 00:02:03,856 --> 00:02:12,677 Het gemiddelde van groep 2, met als som 12: 5 + 3 + 4 = 12, gedeeld door 20 00:02:12,677 --> 00:02:21,846 3 is 4, omdat we drie datapunten hebben. Dan het gemiddelde van groep 3, 5+6+7 =18 21 00:02:21,846 --> 00:02:27,256 gedeeld door 3 = 6. Dus als je het gemiddelde van gemiddelden neemt, 22 00:02:27,256 --> 00:02:31,015 wat het totale gemiddelde is, heb je 2 + 4 + 6 23 00:02:31,015 --> 00:02:35,892 wat 12 is, deelt door 3, waardoor je wederom 4 krijgt 24 00:02:35,892 --> 00:02:38,933 Dus je kan dit zien als het gemiddelde van alle data en alle groepen 25 00:02:38,933 --> 00:02:43,600 of als het gemiddelde van elk van groepen nu het totale gemiddelde berekend is 26 00:02:43,600 --> 00:02:48,836 kunnen we berekenen wat de totale kwadraatsom is. Dus laten we dat doen 27 00:02:48,836 --> 00:02:57,887 Dus dat gaat gelijk zijn aan: (3 - 4)^2, + 28 00:02:57,887 --> 00:03:05,667 (2 - 4 )^2 + (1 - 4)^2, nu doen we de groep in het paars, 29 00:03:05,667 --> 00:03:16,031 + (5 - 4^2) + (3 - 4^2) + (4 - 4^2) 30 00:03:16,031 --> 00:03:20,667 Ik ga nu hier naar toe, +( 4 - 4^2). Nu zijn er nog drie over. 31 00:03:20,667 --> 00:03:32,887 + (5 - 4)^2 + (6 - 4^2) + (7 - 4)^2. Wat geeft dit ons? 32 00:03:32,887 --> 00:03:38,436 Dus hier gaat de eerste gelijk zijn aan, 3 - 4 het verschil = 1, wat je kwadrateerd 33 00:03:38,436 --> 00:03:42,200 Je krijgt eh, het is eigenlijk -1, wat je kwadrateerd waardoor je 1 krijgt 34 00:03:42,200 --> 00:03:51,000 +, je krijgt (-2)^2 = 4 + (-3)^2. (-3)^2 = 9 35 00:03:51,000 --> 00:03:57,698 En dan hebben we hier in het paars: 5 - 4 = 1, 1^2 = 1, (3 - 4)^2 = 1, je 36 00:03:57,698 --> 00:04:03,210 kwadrateert en krijg je nog steeds 1 en 4-4 = 0. Dus kunnen we 0 opschrijven 37 00:04:03,210 --> 00:04:06,985 En dan hebben we deze laatste drie datapunten 38 00:04:06,985 --> 00:04:16,667 (5 - 4)^2 = 1. (6 - 4)^2 = 4, het is 2^2. En dan + 7 - 4 = 3^2 = 9 39 00:04:16,667 --> 00:04:24,952 Waar gaat dit gelijk aan zijn? Dus ik heb 1 + 4 + 9 40 00:04:25,629 --> 00:04:33,436 1 + 4 + 9. Wat 5 plus 9 is. Dit hier is 15, toch? 41 00:04:33,436 --> 00:04:39,638 jup 14. En we hebben nog een 14 hier, omdat we 1 + 4 + 9 hebben 42 00:04:39,638 --> 00:04:43,632 Dus dat daar is ook 14, en dan hebben we 2 hier. Dus het gaat 43 00:04:43,632 --> 00:04:55,056 28 wezen, 14*2, 14+14 = 28 +2 = 30, Dus onze totale kwadraatsom 44 00:04:55,056 --> 00:04:59,561 Als we de variantie willen hebben. Moeten we het delen door de vrijheidsgrade 45 00:04:59,561 --> 00:05:05,551 En deze zijn verschillende malen de vrijheidsgraden. Dus laten we zeggen dat 46 00:05:05,551 --> 00:05:11,031 We hebben m groepen hier. En ik ga niet 47 00:05:11,031 --> 00:05:14,236 dingen rigoureus bewijzen, maar ik wil jullie laten zien 48 00:05:14,236 --> 00:05:18,740 waar sommige van deze rare formules in de statistiek vandaan komen 49 00:05:18,740 --> 00:05:25,667 zonder het te bewijzen, maar meer om een intuïtie te geven.Er zijn m groepen 50 00:05:25,667 --> 00:05:34,344 Elke groep heeft n leden. Dus hoeveel leden hebben we? 51 00:05:34,344 --> 00:05:41,498 We hebben m*n = 9. 3 keer 3 leden. Dus vrijheidsgraden, zoals je herinnert, 52 00:05:41,498 --> 00:05:47,800 hebben we zoveel vrijheidsgraden - 1. Omdat als je weet 53 00:05:47,800 --> 00:05:52,800 Als je het totale gemiddelde wist, als je aanneemt dat je dat wist 54 00:05:52,800 --> 00:05:55,249 Dan zouden alleen 9 - 1 = 8 van deze, zouden er 8 55 00:05:57,698 --> 00:06:00,147 je maar nieuwe informatie geven omdat als je dat wist kon je de laatste berekenen 56 00:06:04,471 --> 00:06:09,824 als je de andere 8 hebt kan je altijd de negende berekenen, 57 00:06:09,824 --> 00:06:16,600 door gebruik te maken van de totale kwadraatsom. Er zijn dus 8 onafhankelijke 58 00:06:16,600 --> 00:06:22,883 metingen hier of als je algemeen wil praten, m keer n. 59 00:06:22,883 --> 00:06:30,397 m keer n is het totale aantal steekproeven - 1 vrijheidsgraden. 60 00:06:33,720 --> 00:06:41,810 En als je de variantie wil berekenen moet je 30 delen door m keer n - 1. 61 00:06:41,810 --> 00:06:47,077 In dit voorbeeld zijn er dus 8 vrijheidsgraden. Je neemt 30 62 00:06:47,077 --> 00:06:53,000 gedeeld door 8, waardoor je de variantie van de gehele groep van 9 krijgt. 63 00:06:53,000 --> 00:06:58,111 Ik verlaat jullie nu in deze video. In de volgende video word bekeken hoeveel van de 64 00:07:03,222 --> 00:07:08,333 totale variantie, de totale kwdraatsom, komt van de variantie. 65 00:07:08,333 --> 00:07:14,313 in elk van deze groepen versus variantie tussen groepen. Ik denk dat je 66 00:07:14,313 --> 00:07:19,667 een idee krijgt waar deze hele analyse vandaan komt. Daar is de variantie 67 00:07:19,667 --> 00:07:24,800 van de gehele steekproef van 9 maar als deze groepen verschillend zijn 68 00:07:24,800 --> 00:07:28,054 komt dit wellicht door devariantie van in een groep, versus variantie in 69 00:07:31,308 --> 00:07:34,564 een groep. We gaan deze twee dingen berekenen en gaan zien dat dit gezamelijk 70 00:07:38,516 --> 00:07:38,516 de totale kwadraatsom omvat.