-
Ejeren af en restaurant vil gerne finde ud af, hvor hans gæster kommer fra.
-
En dag valgte han at indsamle data om den afstand i kilometer, som hans gæster havde rejst.
-
Han fik sine gæster til at fortælle, hvor langt de havde rejst for at komme til restauranten. Her er afstandene.
-
Han vil gerne lave et diagram, der hjælper ham med at forstå spredningen af afstandene.
-
Spredningen er et nøgleord her. Han vil også gerne kunne se medianen.
-
Hvilken form for diagram skal han lave?
-
Svaret til, hvilket diagram han skal bruge, er lidt lettere
-
end at lave selve diagrammet.
-
Det skal vi dog også gøre i den her video.
-
Vi skal altså visualisere spredningen i de observationer, restaurantejerne har.
-
Til det skal vi bruge et boksplot.
-
For at lave et boksblot skal vi kunne kvartilsættet for vores datasæt.
-
Det vl sige, medianen og medianen af de to halvdele af vores datasæt.
-
Når vi skal finde medianer er det altid en god ide at sætte vores observationer i rækkefølge.
-
Lad os gøre det.
-
Hvad er det mindste tal her? Det mindste tal er 2. Lad os markere det. Vi har endnu et 2-tal her.
-
Nu har vi brugt alle 2-tallene. Herefter har vi det her 3-tal og vi har det her 3-tal. Nu har vi vist bruge alle 3-tallene.
-
Herefter har vi det her 4-tal, og vi har det her 4-tal.
-
Har vi nogle 5-taller? Nej, det har vi ikke. Vi har dog et 6-tal.
-
Det er vist det eneste 6-tal. Er der 7-taller? Ja, vi har et 7-tal her.
-
Vi har vist glemt det her 1-tal, og vi har også glemt det her 1-tal. Dem skriver vi i starten af vores datasæt.
-
Begge 1-taller skriver vi før 2-tallerne.
-
Vi har altså enere, toere, trere, firere, ingen femmere, et 6-tal, et 7-tal og et 8-tal.
-
Har vi nogen 9-tal? Der er ingen 9-taller. Nogen 10-taller? Ja, der er et 10-tal.
-
Er der 11-taller? Ja, vi har et 11-tal. Er der 12-taller? Nej.
-
Vi har 14 og 15 her. Vi har også 20 og 22.
-
Nu har vi sat vores observationer i rækkefølge, og nu er det relativt let at finde de midterste observationer.
-
Det er medianen. Hvor mange observationer har vi?
-
1, 2, 3, 4, 5, 6, 7, 8, 9, 10
-
11, 12, 13, 14, 15, 16, 17.
-
Det midterste tal er altså det, der har 8 tal, der er større end det,
-
og 8 tal, der er mindre end det.
-
1, 2, 3, 4, 5, 6, 7, 8. Tallet 6 her er større end 8 af observationerne,
-
og hvis vi har talt rigtigt, er det også mindre end 8 af observationerne.
-
1, 2, 3, 4, 5, 6, 7, 8.
-
Det er det.
-
Det er vores median.
-
Når vi skal lave et boksplot, siger vi også, at vores median deler vores datasæt ind i 2 nye datasæt.
-
Nu skal vi finde medianen af hver af de datasæt.
-
Normalt siger man, at medianen for hele datasættet ikke er med i nogle af de andre datasæt.
-
Det er en god regel at huske.
-
.
-
Lad os første se på den halvdel med de laveste tal.
-
Hvad er medianen i den halvdel?
-
VI har 1, 2, 3, 4, 5, 6, 7, 8 observationer.
-
Vi vil altså have 2 tal i midten af datasættet.
-
De to midterste observationer er det her 2-tal og det her 3-tal.
-
Der er 3 observationer mindre end dem, og der er 3 observationer, der er større end dem.
-
For at finde medianen bliver vi nødt til at finde middelværdien af de to tal.
-
Middelværdien af 2 og 3 er 2,5.
-
2 plus 3 er 5. 5 divideret med 2 er 2,5.
-
Medianen af den laveste halvdel af vores datasæt er altså 2,5.
-
I den anden halvdel har vi også 8 observationer,
-
og vores to midterste observationer er 11 og 14.
-
Vi skal finde middelværdien af de to observationer. 11 plus 14 er 25.
-
Halvdelen af 25 er 12,5. 12,5 er lige præcis halvvejs mellem 11 og 14.
-
Nu har vi alle de informationer,
-
vi skal bruge for at lave vores boksplot.
-
Lad os tegne en flot tallinje her.
-
Det er vores tallinje.
-
Lad os sige, at det her er 0.
-
Tallinjen skal gå til mindst 22.
-
Det her er 0, det her er 5, det er er 10.
-
Det her er 15, og det her er 20.
-
Det her er 25, og vi kan fortsætte den lidt endnu.
-
Det her er 30 og 35.
-
Det kassen
-
i vores boksplot egentlig repræsenterer
-
er den midterste halvdel af vores datasæt.
-
Det vil sige alle de data,
-
der ligger mellem medianerne af vores to halvdele af datasættet.
-
Det er altså den her del,
-
som boksen repræsenterer.
-
Vi starter ved den nedre kvartil, som vi kalder medianen i den laveste halvdel, og den er 2,5.
-
Den første fjerdedel af vores observationer er altså ikke med i kassen.
-
Det her er 2,5.
-
2,5 er halvvejs mellem 0 og 5.
-
2,5 er her, og så har vi 12,5 her.
-
12,5 er her.
-
Sådan.
-
Det her er halvvejs mellem
-
10 og 15, og det er 12,5.
-
.
-
Det er altså vores øvre kvartil.
-
Den her boks repræsenterer altså den midterste halvdel
-
i vores datasæt.
-
Vi skal også vise, hvor medianen er. Det er faktisk også en af de ting, ejerne gerne vil finde.
-
Han vil gerne vide, hvad medianen er,
-
og den er 6.
-
Det kan vi afbilde her.
-
Det her er 6.
-
Nu skal vi endelig tegne halerne
-
på vores boks,
-
som viser variationsbredden i vores data.
-
Lad os gøre det i orange.
-
Vi skal altså se på hele datasættet her, og det går helt til 22.
-
Vores største observation er 22.
-
.
-
Vi tegner altså halen helt til 22,
-
og vores laveste observationer er 1,
-
som er her.
-
Vi skal altså have tegnet halen helt til 1.
-
Det her er vores boksplot. Nu er vi færdige.
-
I det her boksplot kan vi med det samme se medianen.
-
Det er stregen i vores boks.
-
Boksen viser den midterste halvdel af vores observationer,
-
og halerne fra boksen viser, hvor stor variationen i vores observationer er.
-
Det er smart.
-
Boksplottet viser altså både noget om variationen i vores data
-
og datasættets median.