-
Eieren av en restaurant ønsker å finne ut hvor hans gjester kommer fra.
-
En dag bestemte han seg for å samle inn data på avstand i kilometer, som hans gjester hadde reist.
-
Han fikk sine gjester til å fortelle hvor langt de hadde reist for å komme til restauranten. Her er avstandene.
-
Han ønsker å lage et diagram som hjelper ham til å forstå spredning av avstander.
-
Spredningen er stikkordet her. Han ønsker også å se medianen.
-
Hva slags diagram bør han lage?
-
Svaret på hvilket diagram han trenger er litt enklere
-
enn å lage selve diagrammet.
-
Det skal vi også gjøre i denne videoen.
-
Vi trenger derfor å visualisere spredning av observasjoner, restauranteiere har.
-
For det trenger vi et diagram.
-
For å lage et diagram skal vi kunne kvartilsættet for vårt datasett.
-
Det vil si, median og medianen av de to halvdelene av vårt datasett.
-
Når vi finner median er alltid en god idé å sette våre observasjoner i rekkefølge.
-
La oss gjøre det.
-
Hva er det minste tallet her? Den minste tallet er 2. La oss velge det. Vi har fortsatt et 2-tall til her.
-
Nå har vi brukt alle 2-tallene. Så har vi dette 3-tallet og dette 3-tallet. Nå har vi tatt alle 3-tallene.
-
Så har vi det her 4-tallet, og vi har dette 4-tallet.
-
Har vi noen 5-tall? Nei, det har vi ikke. Vi har dog et 6-tall.
-
Det er visst det eneste 6-tallet. Er det 7-tall? Ja, vi har et 7-tall her.
-
Vi har vist glemte dette1-tallet, og vi har også glemt dette 1-tallet. De vi skriver begynnelsen av datasettet vårt.
-
Begge 1-tallene skriver vi før 2-tallene.
-
Vi har altså enere, toere, treere, firere, ingen femmere, og et 6-tall, et 7-tall og et 8-tall.
-
Har vi noen 9-tall? Det er ingen 9-tall. Noen 10-tall? JA det er et 10-tall.
-
Er det 11-tall? Ja, vi har et 11-tall. Er det 12-tall? Nei.
-
Vi har 14 og 15 her. Vi har også 20 til 22.
-
Nå har vi satt observasjonene våres i rekkefølge, og nå er det relativt enkelt å finne de midterste observasjonene.
-
Det er medianen. Hvor mange observasjoner har vi?
-
1, 2, 3, 4, 5, 6, 7, 8, 9, 10
-
11, 12, 13, 14, 15, 16, 17.
-
Det midterste tallet er altså det, det har 8 tall, det er større enn det,
-
og 8 tall, som er mindre enn det.
-
1, 2, 3, 4, 5, 6, 7, 8. Tallet 6 her er større enn 8 av observasjonene,
-
og hvis vi hadde telt riktig, er det også mindre enn 8 av observasjonene.
-
1, 2, 3, 4, 5, 6, 7, 8.
-
Det var det.
-
Det er vår median.
-
Når vi lager et diagram, sier vi også, at vår median deler datasette vårt inn i 2 nye datasett.
-
Nå må vi finne medianen av hvert av datasettene.
-
Normalt sier man, at medianen for hele datasettet ikke er med i noen av de andre datasettene.
-
Det er en god regel å huske.
-
.
-
La oss først se på halvparten med de laveste tallene.
-
Hva er medianen i den halvdelen?
-
Vi har 1, 2, 3, 4, 5, 6, 7, 8 observasjoner.
-
Vi vil derfor ha 2 tall i midten av datasettet.
-
De to midterste observasjonene er det her 2-tallet og dette 3-tallet.
-
Det er 3 observasjoner mindre enn de, og det er 3 observasjoner, som er større enn de.
-
For å finne medianen, må vi finne gjennomsnittet av de to tallene.
-
Gjennomsnittet av 2 og 3 er 2.5.
-
2 pluss 3 er 5. 5 dividert med 2 er 2,5.
-
Medianen av den laveste halvdelen av datasettet vårt er altså 2,5.
-
I den andre halvparten har vi også 8 observasjoner,
-
og våre to midterste observasjonene er 11 og 14.
-
Vi skal finne middelverdien av de to observasjonene. 11 pluss 14 er 25.
-
Halvdelen av 25 er 12,5. 12,5 er nøyaktig halvveis mellom 11 og 14.
-
Nå har vi alle de opplysningene,
-
vi skal bruke for å lage diagrammet vårt.
-
La oss tegne en flott tallinje her.
-
Det er vår tallinje.
-
La oss si, at det her er 0.
-
Tallinjen skal gå til minst 22.
-
Det her er 0, det her er 5, det er 10.
-
Det her er 15, og det her er 20.
-
Det her er 25, og vi kan fortsette den litt til.
-
Det her er 30 og 35.
-
Søylen
-
i diagrammet vårt representerer egentlig
-
den midterste halvdelen av datasettet vårt.
-
Det vil si alle de dataene,
-
som ligger mellom medianene av våres to halvdeler av datasettet.
-
Det er altså den her delen,
-
som søylen representerer.
-
Vi starter på den nedre kvartil, som vi kaller medianen av nedre halvdel, og det er 2,5.
-
Første kvartal av våre observasjoner er ikke med i søylen.
-
Det her 2,5.
-
2.5 er halvveis mellom 0 og 5.
-
2.5 er her, og da har vi 12,5 her.
-
12.5 er her.
-
Sånn.
-
Dette er halvveis mellom
-
10 og 15, og det er 12,5.
-
.
-
Så det er vår øverste kvartil.
-
Denne søylen representerer altså den midterste halvdelen
-
i vår datasettet.
-
Vi må også vise medianen. Faktisk er dette en av de tingene eierne ønsker å finne.
-
Han ville gjerne vite hva medianen er,
-
og den er 6.
-
Det kan vi se her.
-
Det her er 6.
-
Nå er vi endelig trekke halene
-
på søylene,
-
som viser variasjonsbredden i datasettet vårt.
-
La oss gjøre det med oransje.
-
Vi skal altså se på hele datasettet her, og det går helt til 22.
-
Vår største observasjon er 22.
-
.
-
Vi trekker hele halen hele veien til 22,
-
og våre laveste observasjoner er 1,
-
som er her.
-
Vi må derfor ha trukket halen hele veien til den første
-
Dette er vårt diagram. Nå er vi ferdige.
-
I dette diagrammet kan vi med en gang se medianen.
-
Det er linjen i diagrammet.
-
Diagrammet viser den midterste halvdelen av våre observasjoner,
-
og halene fra søylene viser, hvor stor variasjonen i våre observasjoner er.
-
Det er smart.
-
Diagrammet viser altså både noe om variasjonen i våres data
-
og datasettets median.