WEBVTT 00:00:00.494 --> 00:00:07.699 Vi vil nu begynde vores rejse ind i en verden af statistik, 00:00:07.699 --> 00:00:11.411 som i virkeligheden er en måde at forstå og arbejde med forskellige data. 00:00:11.411 --> 00:00:14.531 Statistik handler altså om data. 00:00:14.531 --> 00:00:19.044 I starten af vores rejse ind i statistikkens verden 00:00:19.044 --> 00:00:23.615 vil vi arbejde meget med det, vi kalder for beskrivende statistik. 00:00:23.615 --> 00:00:29.728 Vi vil fokusere på, 00:00:29.728 --> 00:00:34.196 hvordan vi kan fortælle noget om en stor mængde data. 00:00:34.196 --> 00:00:35.692 Det er det, vi skal snakke om. 00:00:35.692 --> 00:00:39.096 Når vi har arbejdet med den beskrivende statistik, 00:00:39.096 --> 00:00:52.059 kan vi begynde at fortolke og konkludere og arbejde os endnu længere ind i statistikkens verden. 00:00:52.059 --> 00:00:55.130 Lad os nu begynde at se på, hvordan vi kan beskrive data. 00:00:55.130 --> 00:00:56.760 Lad os sige, vi har nogle tal, som vi siger er vores data. 00:00:56.760 --> 00:01:03.808 Måske måler vi højden af planter i vores have. 00:01:03.808 --> 00:01:06.379 Lad os sige, at vi har 6 planter med følgende højder: 00:01:06.379 --> 00:01:08.897 4 centimeter, 3 centimeter, 1 centimeter, 6 centimeter og endnu en 1 centimeter og 7 centimeter. 00:01:08.897 --> 00:01:18.159 Lad os sige, at der er nogen, der ikke har set vores planter, der spørger os om følgende: 00:01:18.159 --> 00:01:23.097 Hvor høje er jeres planter? De vil kun høre et tal, der repræsenterer alle de forskellige højder, vores planter har. 00:01:23.097 --> 00:01:33.829 Hvordan skal vi besvare det spørgsmål? 00:01:33.829 --> 00:01:36.907 Lad os tænke over det. Måske kan vi finde en typisk højde eller måske kan vi finde et tal, der repræsenterer midten af de forskellige højder. 00:01:36.907 --> 00:01:44.427 Måske vil vi sige den højde, der forekommer flest gange eller måske vil vi sige den højde, der er i midten, hvis vi stiller højderne op i rækkefølge. 00:01:44.427 --> 00:01:52.712 Hvis vi finder frem til nogle af de tal, 00:01:52.712 --> 00:01:57.194 arbejder vi med beskrivende statistik. Det er det, det går ud på. 00:01:57.194 --> 00:01:59.113 Hvordan kan vi så gøre det? 00:01:59.113 --> 00:02:01.048 Lad os starte med at snakke om statistiske mål. Statiske mål. Vi bruger ofte ordet gennemsnit i vores hverdag, men det har faktisk en helt speciel betydning i matematikken, og det er et statistisk mål. 00:02:01.048 --> 00:02:15.040 Statistiske mål, og vi snakker her om statistiske mål, der skal finde os frem til, hvad der er midten af vores data, 00:02:15.040 --> 00:02:18.481 kan være mål, der giver os det typiske tal eller det midterste tal. Det er en måde at finde midten af vores datasæt på. 00:02:18.481 --> 00:02:38.897 Vi har altså en masse tal her, og vi vil gerne repræsentere dem med kun et tal, som på en eller anden måde repræsenterer de her tal. 00:02:38.897 --> 00:02:50.664 Vi har flere forskellige statistiske mål. 00:02:50.664 --> 00:02:55.095 Det første, som man msåke kender, er middelværdi. Det kalder vi også for gennemsnit. 00:02:55.095 --> 00:03:03.865 Vi kan også kalde det for det aritmetiske gennemsnit. 00:03:03.865 --> 00:03:13.843 Middelværdien eller gennemsnittet er i virkeligheden 00:03:13.843 --> 00:03:22.193 summen af alle vores tal divideret med antallet af tal. 00:03:22.193 --> 00:03:26.761 Det er altså summen af alle tal divideret med antallet af tal. 00:03:26.761 --> 00:03:29.756 . 00:03:29.756 --> 00:03:35.581 Hvad er den aritmetiske middelværdi i det her datasæt? 00:03:35.581 --> 00:03:39.809 Lad os regne det ud. Vi har først 4 plus 3 plus 1 plus 6 plus 1 plus 7. Det står over antallet af observationer, vi har gjort os. Altså antallet af data. VI har 6 observationer, så vi dividerer med 6. 00:03:39.809 --> 00:03:56.157 Vi får, at 4 plus 3 er 7. Plus 1 er 8. Plus 6 er 14. Plus 1 er 15. Plus 7 er 22. 7, 8, 14, 15, 22. Ja, det passer. Det står over 6. 00:03:56.157 --> 00:04:14.776 Det her kan vi skrive som et blandet tal. 6 går op i 22 tre gange med en rest på 4. Det er altså 3 og 4/6, som er det samme som 3 og 2/3. Vi kan også skrive det som et decimaltal: 3,6, og der er uendeligt mange 6-taller efter 3. 00:04:14.776 --> 00:04:29.606 Vi kan skrive det på alle de her måde, men middelværdien er altså en måde at repræsentere midten af datasættet med et statistisk mål. 00:04:29.606 --> 00:04:40.768 Det er kloge matematikere, der har fundet på de her måder 00:04:40.768 --> 00:04:44.043 at beskrive vores data på. 00:04:44.043 --> 00:04:50.345 Det er altså menneskeskabte måder at beskrive vores data på, 00:04:50.345 --> 00:05:00.446 og dem har vi fundet brugbare. Det er ikke nogle måder, vi har fundet i en eller anden bog - det er nogle, vi selv har fundet på. 00:05:00.446 --> 00:05:04.440 Vi kan dog også repræsentere midten af vores datasæt på andre måder end ved at kigge på middelværdien. 00:05:04.440 --> 00:05:10.765 Ofte snakker man om medianen. Det skriver vi med lyserød. 00:05:10.765 --> 00:05:23.812 Medianen er i virkeligheden den midterste observation. 00:05:23.812 --> 00:05:28.024 Hvis vi stiller alle observationer op i rækkefølge og finder den midterste, har vi vores median. 00:05:28.024 --> 00:05:32.764 Hvad er vores median her? 00:05:32.764 --> 00:05:36.543 Hvad er medianen i det her datasæt? 00:05:36.543 --> 00:05:48.641 Vi har 1, 1, 3, 4, 6 og 7. Hvilket tal er det midterste? 00:05:48.641 --> 00:05:52.691 Vi har et lige antal observationer her. Det vil sige, at ingen observation er alene i midten. 00:05:52.691 --> 00:06:02.765 Vi har 2 tal i midten, og det er 3 og 4. 00:06:02.765 --> 00:06:04.762 I de tilfælde, hvor vi har 2 tal i midten, finder vi middelværdien af de 2. 00:06:04.762 --> 00:06:10.856 Middelværdien af de 2 tal er vores median. 00:06:10.856 --> 00:06:14.842 Medianen er altså middelværdien af 3 og 4, og det er 3,5. Medianen her er 3,5. 00:06:14.842 --> 00:06:25.096 Hvis vi har et lige antal observationer, er medianen altså middelværdien af de 2 midterste observationer. 00:06:25.096 --> 00:06:31.946 Hvis vi har et ulige anal observationer, er det lidt lettere. 00:06:31.946 --> 00:06:35.761 Lad os lave et nyt datasæt og lave et eksempel med det. 00:06:35.761 --> 00:06:38.730 Vi har nogle observationer her, der allerede står i rækkefølge. 00:06:38.730 --> 00:06:41.829 Vores observationer er 0, 0, 7, 50, 10.000 og 1.000.000. 00:06:41.829 --> 00:06:57.723 Det er nogle store tal. Hvad er vores median her? 00:06:57.723 --> 00:07:02.945 Vi har 5 observationer, og det er et ulige antal. Det er let at finde den midterste observation her. 00:07:02.945 --> 00:07:08.249 Medianen er tallet, der er større end 2 af tallene og mindre end 2 af tallene. 00:07:08.249 --> 00:07:14.476 Det er midten. I det her tilfælde er medianen 50. 00:07:14.476 --> 00:07:19.481 Vi har et statistisk mål mere, som vi kan bruge til at sige noget om midten af vores datasæt. Det er det, vi bruger mindst, og det hedder typetal. 00:07:19.481 --> 00:07:28.629 Det lyder måske svært, men det er faktisk det letteste at finde. Typetallet er den observation, der forekommer flest gange i et datasæt. 00:07:28.629 --> 00:07:43.712 Hvis alle observationer er der 1 gang, har vi ikke et typetal. 00:07:43.712 --> 00:07:47.879 Hvad er typetallet i vores datasæt? Vi har et 4-tal, et 3-tal, men vi har to 1-taller, vi har et 6-tal og et 7-tal. 00:07:47.879 --> 00:08:05.280 Her er den observation, der forekommer flest gange 1, og derfor er vores typetal 1. 00:08:05.280 --> 00:08:17.690 Der er altså forskellige måder at repræsentere midten af et datasæt. 00:08:17.690 --> 00:08:28.307 I statistikken bruger vi de forskellige statiske mål til forskellige ting. 00:08:28.307 --> 00:08:31.012 Middelværdien er nok den vi bruger mest, og den man hører mest om i hverdagen. 00:08:31.012 --> 00:08:33.508 Medianen er vigtig, når vi har en masse mærkelige tal og ikke lige kan regne middelværdien ud. 00:08:33.508 --> 00:08:38.146 Typetallet kan være smart, hvis nogle observationer forekommer rigtig mange gange. 00:08:38.146 --> 00:08:45.647 I den næste video skal vi snakke mere om statistik.