< Return to Video

Constructing a box-and-whisker plot

  • 0:01 - 0:06
    Eieren av en restaurant ønsker å finne ut hvor hans gjester kommer fra.
  • 0:06 - 0:13
    En dag bestemte han seg for å samle inn data på avstand i kilometer, som hans gjester hadde reist.
  • 0:13 - 0:18
    Han fikk sine gjester til å fortelle hvor langt de hadde reist for å komme til restauranten. Her er avstandene.
  • 0:18 - 0:23
    Han ønsker å lage et diagram som hjelper ham til å forstå spredning av avstander.
  • 0:23 - 0:32
    Spredningen er stikkordet her. Han ønsker også å se medianen.
  • 0:32 - 0:37
    Hva slags diagram bør han lage?
  • 0:37 - 0:42
    Svaret på hvilket diagram han trenger er litt enklere
  • 0:42 - 0:45
    enn å lage selve diagrammet.
  • 0:45 - 0:50
    Det skal vi også gjøre i denne videoen.
  • 0:50 - 0:56
    Vi trenger derfor å visualisere spredning av observasjoner, restauranteiere har.
  • 0:56 - 1:01
    For det trenger vi et diagram.
  • 1:01 - 1:06
    For å lage et diagram skal vi kunne kvartilsættet for vårt datasett.
  • 1:06 - 1:10
    Det vil si, median og medianen av de to halvdelene av vårt datasett.
  • 1:10 - 1:12
    Når vi finner median er alltid en god idé å sette våre observasjoner i rekkefølge.
  • 1:12 - 1:17
    La oss gjøre det.
  • 1:17 - 1:25
    Hva er det minste tallet her? Den minste tallet er 2. La oss velge det. Vi har fortsatt et 2-tall til her.
  • 1:25 - 1:34
    Nå har vi brukt alle 2-tallene. Så har vi dette 3-tallet og dette 3-tallet. Nå har vi tatt alle 3-tallene.
  • 1:34 - 1:39
    Så har vi det her 4-tallet, og vi har dette 4-tallet.
  • 1:39 - 1:46
    Har vi noen 5-tall? Nei, det har vi ikke. Vi har dog et 6-tall.
  • 1:46 - 1:52
    Det er visst det eneste 6-tallet. Er det 7-tall? Ja, vi har et 7-tall her.
  • 1:52 - 2:01
    Vi har vist glemte dette1-tallet, og vi har også glemt dette 1-tallet. De vi skriver begynnelsen av datasettet vårt.
  • 2:01 - 2:05
    Begge 1-tallene skriver vi før 2-tallene.
  • 2:05 - 2:11
    Vi har altså enere, toere, treere, firere, ingen femmere, og et 6-tall, et 7-tall og et 8-tall.
  • 2:11 - 2:17
    Har vi noen 9-tall? Det er ingen 9-tall. Noen 10-tall? JA det er et 10-tall.
  • 2:17 - 2:23
    Er det 11-tall? Ja, vi har et 11-tall. Er det 12-tall? Nei.
  • 2:23 - 2:35
    Vi har 14 og 15 her. Vi har også 20 til 22.
  • 2:35 - 2:39
    Nå har vi satt observasjonene våres i rekkefølge, og nå er det relativt enkelt å finne de midterste observasjonene.
  • 2:39 - 2:42
    Det er medianen. Hvor mange observasjoner har vi?
  • 2:42 - 2:46
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10
  • 2:46 - 2:50
    11, 12, 13, 14, 15, 16, 17.
  • 2:50 - 2:54
    Det midterste tallet er altså det, det har 8 tall, det er større enn det,
  • 2:54 - 2:58
    og 8 tall, som er mindre enn det.
  • 2:58 - 3:00
    1, 2, 3, 4, 5, 6, 7, 8. Tallet 6 her er større enn 8 av observasjonene,
  • 3:00 - 3:07
    og hvis vi hadde telt riktig, er det også mindre enn 8 av observasjonene.
  • 3:07 - 3:10
    1, 2, 3, 4, 5, 6, 7, 8.
  • 3:10 - 3:13
    Det var det.
  • 3:13 - 3:18
    Det er vår median.
  • 3:18 - 3:26
    Når vi lager et diagram, sier vi også, at vår median deler datasette vårt inn i 2 nye datasett.
  • 3:26 - 3:29
    Nå må vi finne medianen av hvert av datasettene.
  • 3:29 - 3:33
    Normalt sier man, at medianen for hele datasettet ikke er med i noen av de andre datasettene.
  • 3:33 - 3:37
    Det er en god regel å huske.
  • 3:37 - 3:42
    .
  • 3:42 - 3:45
    La oss først se på halvparten med de laveste tallene.
  • 3:45 - 3:49
    Hva er medianen i den halvdelen?
  • 3:49 - 3:53
    Vi har 1, 2, 3, 4, 5, 6, 7, 8 observasjoner.
  • 3:53 - 3:57
    Vi vil derfor ha 2 tall i midten av datasettet.
  • 3:57 - 4:01
    De to midterste observasjonene er det her 2-tallet og dette 3-tallet.
  • 4:01 - 4:04
    Det er 3 observasjoner mindre enn de, og det er 3 observasjoner, som er større enn de.
  • 4:04 - 4:08
    For å finne medianen, må vi finne gjennomsnittet av de to tallene.
  • 4:08 - 4:13
    Gjennomsnittet av 2 og 3 er 2.5.
  • 4:13 - 4:17
    2 pluss 3 er 5. 5 dividert med 2 er 2,5.
  • 4:17 - 4:22
    Medianen av den laveste halvdelen av datasettet vårt er altså 2,5.
  • 4:22 - 4:27
    I den andre halvparten har vi også 8 observasjoner,
  • 4:27 - 4:33
    og våre to midterste observasjonene er 11 og 14.
  • 4:33 - 4:39
    Vi skal finne middelverdien av de to observasjonene. 11 pluss 14 er 25.
  • 4:39 - 4:48
    Halvdelen av 25 er 12,5. 12,5 er nøyaktig halvveis mellom 11 og 14.
  • 4:48 - 4:53
    Nå har vi alle de opplysningene,
  • 4:53 - 4:55
    vi skal bruke for å lage diagrammet vårt.
  • 4:55 - 5:02
    La oss tegne en flott tallinje her.
  • 5:02 - 5:08
    Det er vår tallinje.
  • 5:08 - 5:11
    La oss si, at det her er 0.
  • 5:11 - 5:14
    Tallinjen skal gå til minst 22.
  • 5:14 - 5:19
    Det her er 0, det her er 5, det er 10.
  • 5:19 - 5:23
    Det her er 15, og det her er 20.
  • 5:23 - 5:26
    Det her er 25, og vi kan fortsette den litt til.
  • 5:26 - 5:30
    Det her er 30 og 35.
  • 5:30 - 5:34
    Søylen
  • 5:34 - 5:38
    i diagrammet vårt representerer egentlig
  • 5:38 - 5:42
    den midterste halvdelen av datasettet vårt.
  • 5:42 - 5:46
    Det vil si alle de dataene,
  • 5:46 - 5:50
    som ligger mellom medianene av våres to halvdeler av datasettet.
  • 5:50 - 5:54
    Det er altså den her delen,
  • 5:54 - 5:57
    som søylen representerer.
  • 5:57 - 6:00
    Vi starter på den nedre kvartil, som vi kaller medianen av nedre halvdel, og det er 2,5.
  • 6:00 - 6:05
    Første kvartal av våre observasjoner er ikke med i søylen.
  • 6:05 - 6:09
    Det her 2,5.
  • 6:09 - 6:13
    2.5 er halvveis mellom 0 og 5.
  • 6:13 - 6:18
    2.5 er her, og da har vi 12,5 her.
  • 6:18 - 6:23
    12.5 er her.
  • 6:23 - 6:29
    Sånn.
  • 6:29 - 6:30
    Dette er halvveis mellom
  • 6:30 - 6:35
    10 og 15, og det er 12,5.
  • 6:35 - 6:38
    .
  • 6:38 - 6:42
    Så det er vår øverste kvartil.
  • 6:42 - 6:45
    Denne søylen representerer altså den midterste halvdelen
  • 6:45 - 6:49
    i vår datasettet.
  • 6:49 - 6:52
    Vi må også vise medianen. Faktisk er dette en av de tingene eierne ønsker å finne.
  • 6:52 - 6:55
    Han ville gjerne vite hva medianen er,
  • 6:55 - 6:59
    og den er 6.
  • 6:59 - 7:04
    Det kan vi se her.
  • 7:04 - 7:09
    Det her er 6.
  • 7:09 - 7:12
    Nå er vi endelig trekke halene
  • 7:12 - 7:16
    på søylene,
  • 7:16 - 7:19
    som viser variasjonsbredden i datasettet vårt.
  • 7:19 - 7:22
    La oss gjøre det med oransje.
  • 7:22 - 7:24
    Vi skal altså se på hele datasettet her, og det går helt til 22.
  • 7:24 - 7:27
    Vår største observasjon er 22.
  • 7:27 - 7:31
    .
  • 7:31 - 7:37
    Vi trekker hele halen hele veien til 22,
  • 7:37 - 7:41
    og våre laveste observasjoner er 1,
  • 7:41 - 7:44
    som er her.
  • 7:44 - 7:47
    Vi må derfor ha trukket halen hele veien til den første
  • 7:47 - 7:51
    Dette er vårt diagram. Nå er vi ferdige.
  • 7:51 - 7:54
    I dette diagrammet kan vi med en gang se medianen.
  • 7:54 - 7:57
    Det er linjen i diagrammet.
  • 7:57 - 8:02
    Diagrammet viser den midterste halvdelen av våre observasjoner,
  • 8:02 - 8:06
    og halene fra søylene viser, hvor stor variasjonen i våre observasjoner er.
  • 8:06 - 8:10
    Det er smart.
  • 8:10 - 8:13
    Diagrammet viser altså både noe om variasjonen i våres data
  • 8:13 - 8:17
    og datasettets median.
Title:
Constructing a box-and-whisker plot
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
08:18

Norwegian Bokmal subtitles

Revisions