0:00:00.494,0:00:07.699 Vi vil nu begynde vores rejse ind i en verden af statistik, 0:00:07.699,0:00:11.411 som i virkeligheden er en måde at forstå og arbejde med forskellige data. 0:00:11.411,0:00:14.531 Statistik handler altså om data. 0:00:14.531,0:00:19.044 I starten af vores rejse ind i statistikkens verden 0:00:19.044,0:00:23.615 vil vi arbejde meget med det, vi kalder for beskrivende statistik. 0:00:23.615,0:00:29.728 Vi vil fokusere på, 0:00:29.728,0:00:34.196 hvordan vi kan fortælle noget om en stor mængde data. 0:00:34.196,0:00:35.692 Det er det, vi skal snakke om. 0:00:35.692,0:00:39.096 Når vi har arbejdet med den beskrivende statistik, 0:00:39.096,0:00:52.059 kan vi begynde at fortolke og konkludere og arbejde os endnu længere ind i statistikkens verden. 0:00:52.059,0:00:55.130 Lad os nu begynde at se på, hvordan vi kan beskrive data. 0:00:55.130,0:00:56.760 Lad os sige, vi har nogle tal, som vi siger er vores data. 0:00:56.760,0:01:03.808 Måske måler vi højden af planter i vores have. 0:01:03.808,0:01:06.379 Lad os sige, at vi har 6 planter med følgende højder: 0:01:06.379,0:01:08.897 4 centimeter, 3 centimeter, 1 centimeter, 6 centimeter og endnu en 1 centimeter og 7 centimeter. 0:01:08.897,0:01:18.159 Lad os sige, at der er nogen, der ikke har set vores planter, der spørger os om følgende: 0:01:18.159,0:01:23.097 Hvor høje er jeres planter? De vil kun høre et tal, der repræsenterer alle de forskellige højder, vores planter har. 0:01:23.097,0:01:33.829 Hvordan skal vi besvare det spørgsmål? 0:01:33.829,0:01:36.907 Lad os tænke over det. Måske kan vi finde en typisk højde eller måske kan vi finde et tal, der repræsenterer midten af de forskellige højder. 0:01:36.907,0:01:44.427 Måske vil vi sige den højde, der forekommer flest gange eller måske vil vi sige den højde, der er i midten, hvis vi stiller højderne op i rækkefølge. 0:01:44.427,0:01:52.712 Hvis vi finder frem til nogle af de tal, 0:01:52.712,0:01:57.194 arbejder vi med beskrivende statistik. Det er det, det går ud på. 0:01:57.194,0:01:59.113 Hvordan kan vi så gøre det? 0:01:59.113,0:02:01.048 Lad os starte med at snakke om statistiske mål. Statiske mål. Vi bruger ofte ordet gennemsnit i vores hverdag, men det har faktisk en helt speciel betydning i matematikken, og det er et statistisk mål. 0:02:01.048,0:02:15.040 Statistiske mål, og vi snakker her om statistiske mål, der skal finde os frem til, hvad der er midten af vores data, 0:02:15.040,0:02:18.481 kan være mål, der giver os det typiske tal eller det midterste tal. Det er en måde at finde midten af vores datasæt på. 0:02:18.481,0:02:38.897 Vi har altså en masse tal her, og vi vil gerne repræsentere dem med kun et tal, som på en eller anden måde repræsenterer de her tal. 0:02:38.897,0:02:50.664 Vi har flere forskellige statistiske mål. 0:02:50.664,0:02:55.095 Det første, som man msåke kender, er middelværdi. Det kalder vi også for gennemsnit. 0:02:55.095,0:03:03.865 Vi kan også kalde det for det aritmetiske gennemsnit. 0:03:03.865,0:03:13.843 Middelværdien eller gennemsnittet er i virkeligheden 0:03:13.843,0:03:22.193 summen af alle vores tal divideret med antallet af tal. 0:03:22.193,0:03:26.761 Det er altså summen af alle tal divideret med antallet af tal. 0:03:26.761,0:03:29.756 . 0:03:29.756,0:03:35.581 Hvad er den aritmetiske middelværdi i det her datasæt? 0:03:35.581,0:03:39.809 Lad os regne det ud. Vi har først 4 plus 3 plus 1 plus 6 plus 1 plus 7. Det står over antallet af observationer, vi har gjort os. Altså antallet af data. VI har 6 observationer, så vi dividerer med 6. 0:03:39.809,0:03:56.157 Vi får, at 4 plus 3 er 7. Plus 1 er 8. Plus 6 er 14. Plus 1 er 15. Plus 7 er 22. 7, 8, 14, 15, 22. Ja, det passer. Det står over 6. 0:03:56.157,0:04:14.776 Det her kan vi skrive som et blandet tal. 6 går op i 22 tre gange med en rest på 4. Det er altså 3 og 4/6, som er det samme som 3 og 2/3. Vi kan også skrive det som et decimaltal: 3,6, og der er uendeligt mange 6-taller efter 3. 0:04:14.776,0:04:29.606 Vi kan skrive det på alle de her måde, men middelværdien er altså en måde at repræsentere midten af datasættet med et statistisk mål. 0:04:29.606,0:04:40.768 Det er kloge matematikere, der har fundet på de her måder 0:04:40.768,0:04:44.043 at beskrive vores data på. 0:04:44.043,0:04:50.345 Det er altså menneskeskabte måder at beskrive vores data på, 0:04:50.345,0:05:00.446 og dem har vi fundet brugbare. Det er ikke nogle måder, vi har fundet i en eller anden bog - det er nogle, vi selv har fundet på. 0:05:00.446,0:05:04.440 Vi kan dog også repræsentere midten af vores datasæt på andre måder end ved at kigge på middelværdien. 0:05:04.440,0:05:10.765 Ofte snakker man om medianen. Det skriver vi med lyserød. 0:05:10.765,0:05:23.812 Medianen er i virkeligheden den midterste observation. 0:05:23.812,0:05:28.024 Hvis vi stiller alle observationer op i rækkefølge og finder den midterste, har vi vores median. 0:05:28.024,0:05:32.764 Hvad er vores median her? 0:05:32.764,0:05:36.543 Hvad er medianen i det her datasæt? 0:05:36.543,0:05:48.641 Vi har 1, 1, 3, 4, 6 og 7. Hvilket tal er det midterste? 0:05:48.641,0:05:52.691 Vi har et lige antal observationer her. Det vil sige, at ingen observation er alene i midten. 0:05:52.691,0:06:02.765 Vi har 2 tal i midten, og det er 3 og 4. 0:06:02.765,0:06:04.762 I de tilfælde, hvor vi har 2 tal i midten, finder vi middelværdien af de 2. 0:06:04.762,0:06:10.856 Middelværdien af de 2 tal er vores median. 0:06:10.856,0:06:14.842 Medianen er altså middelværdien af 3 og 4, og det er 3,5. Medianen her er 3,5. 0:06:14.842,0:06:25.096 Hvis vi har et lige antal observationer, er medianen altså middelværdien af de 2 midterste observationer. 0:06:25.096,0:06:31.946 Hvis vi har et ulige anal observationer, er det lidt lettere. 0:06:31.946,0:06:35.761 Lad os lave et nyt datasæt og lave et eksempel med det. 0:06:35.761,0:06:38.730 Vi har nogle observationer her, der allerede står i rækkefølge. 0:06:38.730,0:06:41.829 Vores observationer er 0, 0, 7, 50, 10.000 og 1.000.000. 0:06:41.829,0:06:57.723 Det er nogle store tal. Hvad er vores median her? 0:06:57.723,0:07:02.945 Vi har 5 observationer, og det er et ulige antal. Det er let at finde den midterste observation her. 0:07:02.945,0:07:08.249 Medianen er tallet, der er større end 2 af tallene og mindre end 2 af tallene. 0:07:08.249,0:07:14.476 Det er midten. I det her tilfælde er medianen 50. 0:07:14.476,0:07:19.481 Vi har et statistisk mål mere, som vi kan bruge til at sige noget om midten af vores datasæt. Det er det, vi bruger mindst, og det hedder typetal. 0:07:19.481,0:07:28.629 Det lyder måske svært, men det er faktisk det letteste at finde. Typetallet er den observation, der forekommer flest gange i et datasæt. 0:07:28.629,0:07:43.712 Hvis alle observationer er der 1 gang, har vi ikke et typetal. 0:07:43.712,0:07:47.879 Hvad er typetallet i vores datasæt? Vi har et 4-tal, et 3-tal, men vi har to 1-taller, vi har et 6-tal og et 7-tal. 0:07:47.879,0:08:05.280 Her er den observation, der forekommer flest gange 1, og derfor er vores typetal 1. 0:08:05.280,0:08:17.690 Der er altså forskellige måder at repræsentere midten af et datasæt. 0:08:17.690,0:08:28.307 I statistikken bruger vi de forskellige statiske mål til forskellige ting. 0:08:28.307,0:08:31.012 Middelværdien er nok den vi bruger mest, og den man hører mest om i hverdagen. 0:08:31.012,0:08:33.508 Medianen er vigtig, når vi har en masse mærkelige tal og ikke lige kan regne middelværdien ud. 0:08:33.508,0:08:38.146 Typetallet kan være smart, hvis nogle observationer forekommer rigtig mange gange. 0:08:38.146,0:08:45.647 I den næste video skal vi snakke mere om statistik.