WEBVTT 00:00:00.494 --> 00:00:07.699 Vi nu börjar vår resa i en värld av statistik, vilket verkligen är ett sätt 00:00:07.699 --> 00:00:11.411 Data att förstå eller hantera dem. 00:00:11.411 --> 00:00:14.531 Statistik behandlar endast data. 00:00:14.531 --> 00:00:19.044 Och om vi börjar vår resa i en värld av statistik. 00:00:19.044 --> 00:00:23.615 är vi driva en mängd så kallade "beskrivande" (beskrivande) statistik. 00:00:23.615 --> 00:00:29.728 Om vi har en mängd uppgifter och vill berätta en del om all information utan att ge dem alla uppgifter, 00:00:29.728 --> 00:00:34.196 kan vi på något sätt beskriva dem med en mindre uppsättning tal? 00:00:34.196 --> 00:00:35.692 Vi vill koncentrera mig på den. 00:00:35.692 --> 00:00:39.096 Vi vill bygga vårt verktyg av beskrivande statistik 00:00:39.096 --> 00:00:52.059 sedan kan vi börja att extrahera slutsatser från data, dra slutsatser och göra bedömningar, att härleda mycket från den. 00:00:52.059 --> 00:00:55.130 Deduktiva statistik att härleda slutsatser. 00:00:55.130 --> 00:00:56.760 Hur kan vi beskriva data? 00:00:56.760 --> 00:01:03.808 Vi säger: vi har en hel del nummer vi kallar data. 00:01:03.808 --> 00:01:06.379 Vi mäta höjden på våra växter i vår trädgård. 00:01:06.379 --> 00:01:08.897 Vi har 6 växter och höjder: 00:01:08.897 --> 00:01:18.159 4 Tum, 3 tum, 1 tum, 6 tum, har en annan 1 tum och en 7 tum. 00:01:18.159 --> 00:01:23.097 Och nu: någon från en mycket utrymme att inte se dina växter, som frågar: 00:01:23.097 --> 00:01:33.829 "är dina växter?" Och han vill höra bara ett nummer som representerar alla olika höjder av dina växter. 00:01:33.829 --> 00:01:36.907 Hur gör du det? 00:01:36.907 --> 00:01:44.427 Hur hittar jag ett antal typiska? Kanske det genomsnittliga antalet? 00:01:44.427 --> 00:01:52.712 Eller de som inträffar oftast? Eller ett nummer som representerar genomsnittligt? 00:01:52.712 --> 00:01:57.194 Om du begär det, har du samma saker som folk 00:01:57.194 --> 00:01:59.113 Vem uppfann den beskrivande statistiken. 00:01:59.113 --> 00:02:01.048 Hur kan vi göra det? 00:02:01.048 --> 00:02:15.040 De började med idén om det genomsnittliga värdet. Idag har genomsnittligt en särskild betydelse, och alla dem som talar, tror det aritmetiska medelvärdet, som vi ser. 00:02:15.040 --> 00:02:18.481 Men i statistiken, genomsnittligt betyder något mer allmänt: 00:02:18.481 --> 00:02:38.897 Ge mig några "typiska", eller ge mig en "medelstora" nummer. Eller ge mig en central referensvärdet. 00:02:38.897 --> 00:02:50.664 Så än en gång: du har en mängd tal och måste på något sätt försöka representera dem genom ett enda tal som är typiskt eller representerar i mitten. 00:02:50.664 --> 00:02:55.095 Och som du ser, det finns många typer av medelvärden. 00:02:55.095 --> 00:03:03.865 Först är det som du är mest bekant med, är det aritmetiska medelvärdet. 00:03:03.865 --> 00:03:13.843 Jag skriver det i gult.Aritmetiska medelvärdet. 00:03:13.843 --> 00:03:22.193 Arithemetisch är ett substantiv som ett adjektiv är det aritmetiska. 00:03:22.193 --> 00:03:26.761 Det är summan av alla tal, delat 00:03:26.761 --> 00:03:29.756 - och detta är en av definition som vi hittat bra- 00:03:29.756 --> 00:03:35.581 summan av alla betala geteuilt med antalet siffror som vi har. 00:03:35.581 --> 00:03:39.809 Vad innebär den arithemtische denna datamängd? 00:03:39.809 --> 00:03:56.157 Det är 4 + 3 + 1 + 6 + 1 + 7 dividerat med antalet värden. Vi har 6 värden, så att vi delar med 6, och vi får: 00:03:56.157 --> 00:04:14.776 4 + 3 = 7 + 1 = 8 + 6 = 14 + 1 = 15 + 7 = 22 00:04:14.776 --> 00:04:29.606 allt detta är 3 delat med 6 fyra sjätte, thats 3 två utomstående, som vi också kan skriva som en 3 punkt 6. 00:04:29.606 --> 00:04:40.768 Vi kan skriva detta i någon form och det är en slags representativt, det har en central referens. 00:04:40.768 --> 00:04:44.043 Som sagt, är det en mänsklig uppfinning. 00:04:44.043 --> 00:04:50.345 Det finns inga religiösa krav att definiera det aritmetiska medelvärdet. 00:04:50.345 --> 00:05:00.446 Det är inte som i upptäckten av cirkeln, som härrör från observationer av Weltlalls. 00:05:00.446 --> 00:05:04.440 Det är en mänsklig Konstruiuktion som vi anser vara användbara. 00:05:04.440 --> 00:05:10.765 Nu finns det andra sätt att mäta ett genomsnitt för att hitta en "typisk" eller genomsnittliga. 00:05:10.765 --> 00:05:23.812 Det andra, mycket typiska sättet att skriver median(Wert) och jag median i rosa. 00:05:23.812 --> 00:05:28.024 Och medianen innebär att hitta den mellersta nummer. 00:05:28.024 --> 00:05:32.764 Om du tilldelar alla dina siffror och hitta det medium som är medianen. 00:05:32.764 --> 00:05:36.543 Så, vad är medianen här mängden data? 00:05:36.543 --> 00:05:48.641 Vi försöker räkna ut. Vi försöker att koppla dem till storlek. 00:05:48.641 --> 00:05:52.691 Vi har en email1, andra 1, 3, 4, 6 och 7. Vad är det genomsnittliga antalet? 00:05:52.691 --> 00:06:02.765 Du kan se att vi betalar ett jämnt tal har, finns det inget mitten nummer, finns det två mittersta talen. 00:06:02.765 --> 00:06:04.762 3 och 4. 00:06:04.762 --> 00:06:10.856 Och i fall där du har två mittersta talen du ta mellanting mellan de två talen, 00:06:10.856 --> 00:06:14.842 Detta innebär att det aritmetiska medelvärdet av dessa två siffror att hitta medianen. 00:06:14.842 --> 00:06:25.096 Medianvärdet från 3 och 4 här är i mitten, som är 3,5. I det här fallet är så median 3,5. 00:06:25.096 --> 00:06:31.946 Om det har ett jämnt antal siffror, är medianen det aritmetiska medelvärdet av de två mittersta talen. 00:06:31.946 --> 00:06:35.761 Om du har ett udda antal siffror, är det lite lättare. 00:06:35.761 --> 00:06:38.730 För att göra detta kommer jag ge er en annan uppsättning med data. 00:06:38.730 --> 00:06:41.829 Det är mängden data och jag har redan beställt det: 00:06:41.829 --> 00:06:57.723 Våra uppgifter som är 0,0,7, 50,10.000 och 1 000 000. 00:06:57.723 --> 00:07:02.945 En galen mängd data. I denna situation, vad är medianen? 00:07:02.945 --> 00:07:08.249 Vi har 5 nummer, ett udda tal. Det är lätt att ta reda på det genomsnittliga antalet. 00:07:08.249 --> 00:07:14.476 Medianen är det nummer som är större än två tal och mindre än de andra två. 00:07:14.476 --> 00:07:19.481 Detta är exakt i mitten. I detta fall är 50 vårt median. 00:07:19.481 --> 00:07:28.629 Nu tredje mätningen av en central referens är den minst vanliga: spärrad värdet. 00:07:28.629 --> 00:07:43.712 Det låter komplicerat, men det är uppenbart att det är den grundläggande idén: modala värdet sker det oftast nummer i en uppsättning data. 00:07:43.712 --> 00:07:47.879 Och vad är det modala värdet? Om alla värden förekommer endast en gång, finns det inga modala värde. 00:07:47.879 --> 00:08:05.280 Men vad är spärrat värdet i våra uppgifter? Vi har bara en 4, en 3, men vi har 2 de, vi har en 6 och 7. 00:08:05.280 --> 00:08:17.690 Oftast förekommer är 1. Så är det modala värdet 1. 00:08:17.690 --> 00:08:28.307 Du kan se olika typer av att hitta ett genomsnitt allt annorlunda och vi studerar statistik se 00:08:28.307 --> 00:08:31.012 att det är bra för olika saker. 00:08:31.012 --> 00:08:33.508 Detta används mycket ofta för olika saker, 00:08:33.508 --> 00:08:38.146 Medianen är viktigt när du har en hel del crazy siffror, att mildra det aritmetiska medelvärdet. 00:08:38.146 --> 00:08:45.647 Det modala värdet kan också vara användbart i situationer där ett visst värde förekommer flera gånger. 00:08:45.647 --> 00:08:52.700 OK, som vore det för tillfället. Vi kommer att utforska mer djupt statistik i nästa video.