-
Vi vil nu begynde vores rejse ind i en verden af statistik,
-
som i virkeligheden er en måde at forstå og arbejde med forskellige data.
-
Statistik handler altså om data.
-
I starten af vores rejse ind i statistikkens verden
-
vil vi arbejde meget med det, vi kalder for beskrivende statistik.
-
Vi vil fokusere på,
-
hvordan vi kan fortælle noget om en stor mængde data.
-
Det er det, vi skal snakke om.
-
Når vi har arbejdet med den beskrivende statistik,
-
kan vi begynde at fortolke og konkludere og arbejde os endnu længere ind i statistikkens verden.
-
Lad os nu begynde at se på, hvordan vi kan beskrive data.
-
Lad os sige, vi har nogle tal, som vi siger er vores data.
-
Måske måler vi højden af planter i vores have.
-
Lad os sige, at vi har 6 planter med følgende højder:
-
4 centimeter, 3 centimeter, 1 centimeter, 6 centimeter og endnu en 1 centimeter og 7 centimeter.
-
Lad os sige, at der er nogen, der ikke har set vores planter, der spørger os om følgende:
-
Hvor høje er jeres planter? De vil kun høre et tal, der repræsenterer alle de forskellige højder, vores planter har.
-
Hvordan skal vi besvare det spørgsmål?
-
Lad os tænke over det. Måske kan vi finde en typisk højde eller måske kan vi finde et tal, der repræsenterer midten af de forskellige højder.
-
Måske vil vi sige den højde, der forekommer flest gange eller måske vil vi sige den højde, der er i midten, hvis vi stiller højderne op i rækkefølge.
-
Hvis vi finder frem til nogle af de tal,
-
arbejder vi med beskrivende statistik. Det er det, det går ud på.
-
Hvordan kan vi så gøre det?
-
Lad os starte med at snakke om statistiske mål. Statiske mål. Vi bruger ofte ordet gennemsnit i vores hverdag, men det har faktisk en helt speciel betydning i matematikken, og det er et statistisk mål.
-
Statistiske mål, og vi snakker her om statistiske mål, der skal finde os frem til, hvad der er midten af vores data,
-
kan være mål, der giver os det typiske tal eller det midterste tal. Det er en måde at finde midten af vores datasæt på.
-
Vi har altså en masse tal her, og vi vil gerne repræsentere dem med kun et tal, som på en eller anden måde repræsenterer de her tal.
-
Vi har flere forskellige statistiske mål.
-
Det første, som man msåke kender, er middelværdi. Det kalder vi også for gennemsnit.
-
Vi kan også kalde det for det aritmetiske gennemsnit.
-
Middelværdien eller gennemsnittet er i virkeligheden
-
summen af alle vores tal divideret med antallet af tal.
-
Det er altså summen af alle tal divideret med antallet af tal.
-
.
-
Hvad er den aritmetiske middelværdi i det her datasæt?
-
Lad os regne det ud. Vi har først 4 plus 3 plus 1 plus 6 plus 1 plus 7. Det står over antallet af observationer, vi har gjort os. Altså antallet af data. VI har 6 observationer, så vi dividerer med 6.
-
Vi får, at 4 plus 3 er 7. Plus 1 er 8. Plus 6 er 14. Plus 1 er 15. Plus 7 er 22. 7, 8, 14, 15, 22. Ja, det passer. Det står over 6.
-
Det her kan vi skrive som et blandet tal. 6 går op i 22 tre gange med en rest på 4. Det er altså 3 og 4/6, som er det samme som 3 og 2/3. Vi kan også skrive det som et decimaltal: 3,6, og der er uendeligt mange 6-taller efter 3.
-
Vi kan skrive det på alle de her måde, men middelværdien er altså en måde at repræsentere midten af datasættet med et statistisk mål.
-
Det er kloge matematikere, der har fundet på de her måder
-
at beskrive vores data på.
-
Det er altså menneskeskabte måder at beskrive vores data på,
-
og dem har vi fundet brugbare. Det er ikke nogle måder, vi har fundet i en eller anden bog - det er nogle, vi selv har fundet på.
-
Vi kan dog også repræsentere midten af vores datasæt på andre måder end ved at kigge på middelværdien.
-
Ofte snakker man om medianen. Det skriver vi med lyserød.
-
Medianen er i virkeligheden den midterste observation.
-
Hvis vi stiller alle observationer op i rækkefølge og finder den midterste, har vi vores median.
-
Hvad er vores median her?
-
Hvad er medianen i det her datasæt?
-
Vi har 1, 1, 3, 4, 6 og 7. Hvilket tal er det midterste?
-
Vi har et lige antal observationer her. Det vil sige, at ingen observation er alene i midten.
-
Vi har 2 tal i midten, og det er 3 og 4.
-
I de tilfælde, hvor vi har 2 tal i midten, finder vi middelværdien af de 2.
-
Middelværdien af de 2 tal er vores median.
-
Medianen er altså middelværdien af 3 og 4, og det er 3,5. Medianen her er 3,5.
-
Hvis vi har et lige antal observationer, er medianen altså middelværdien af de 2 midterste observationer.
-
Hvis vi har et ulige anal observationer, er det lidt lettere.
-
Lad os lave et nyt datasæt og lave et eksempel med det.
-
Vi har nogle observationer her, der allerede står i rækkefølge.
-
Vores observationer er 0, 0, 7, 50, 10.000 og 1.000.000.
-
Det er nogle store tal. Hvad er vores median her?
-
Vi har 5 observationer, og det er et ulige antal. Det er let at finde den midterste observation her.
-
Medianen er tallet, der er større end 2 af tallene og mindre end 2 af tallene.
-
Det er midten. I det her tilfælde er medianen 50.
-
Vi har et statistisk mål mere, som vi kan bruge til at sige noget om midten af vores datasæt. Det er det, vi bruger mindst, og det hedder typetal.
-
Det lyder måske svært, men det er faktisk det letteste at finde. Typetallet er den observation, der forekommer flest gange i et datasæt.
-
Hvis alle observationer er der 1 gang, har vi ikke et typetal.
-
Hvad er typetallet i vores datasæt? Vi har et 4-tal, et 3-tal, men vi har to 1-taller, vi har et 6-tal og et 7-tal.
-
Her er den observation, der forekommer flest gange 1, og derfor er vores typetal 1.
-
Der er altså forskellige måder at repræsentere midten af et datasæt.
-
I statistikken bruger vi de forskellige statiske mål til forskellige ting.
-
Middelværdien er nok den vi bruger mest, og den man hører mest om i hverdagen.
-
Medianen er vigtig, når vi har en masse mærkelige tal og ikke lige kan regne middelværdien ud.
-
Typetallet kan være smart, hvis nogle observationer forekommer rigtig mange gange.
-
I den næste video skal vi snakke mere om statistik.