< Return to Video

Constructing a box-and-whisker plot

  • 0:01 - 0:06
    Ejeren af en restaurant vil gerne finde ud af, hvor hans gæster kommer fra.
  • 0:06 - 0:13
    En dag valgte han at indsamle data om den afstand i kilometer, som hans gæster havde rejst.
  • 0:13 - 0:18
    Han fik sine gæster til at fortælle, hvor langt de havde rejst for at komme til restauranten. Her er afstandene.
  • 0:18 - 0:23
    Han vil gerne lave et diagram, der hjælper ham med at forstå spredningen af afstandene.
  • 0:23 - 0:32
    Spredningen er et nøgleord her. Han vil også gerne kunne se medianen.
  • 0:32 - 0:37
    Hvilken form for diagram skal han lave?
  • 0:37 - 0:42
    Svaret til, hvilket diagram han skal bruge, er lidt lettere
  • 0:42 - 0:45
    end at lave selve diagrammet.
  • 0:45 - 0:50
    Det skal vi dog også gøre i den her video.
  • 0:50 - 0:56
    Vi skal altså visualisere spredningen i de observationer, restaurantejerne har.
  • 0:56 - 1:01
    Til det skal vi bruge et boksplot.
  • 1:01 - 1:06
    For at lave et boksblot skal vi kunne kvartilsættet for vores datasæt.
  • 1:06 - 1:10
    Det vl sige, medianen og medianen af de to halvdele af vores datasæt.
  • 1:10 - 1:12
    Når vi skal finde medianer er det altid en god ide at sætte vores observationer i rækkefølge.
  • 1:12 - 1:17
    Lad os gøre det.
  • 1:17 - 1:25
    Hvad er det mindste tal her? Det mindste tal er 2. Lad os markere det. Vi har endnu et 2-tal her.
  • 1:25 - 1:34
    Nu har vi brugt alle 2-tallene. Herefter har vi det her 3-tal og vi har det her 3-tal. Nu har vi vist bruge alle 3-tallene.
  • 1:34 - 1:39
    Herefter har vi det her 4-tal, og vi har det her 4-tal.
  • 1:39 - 1:46
    Har vi nogle 5-taller? Nej, det har vi ikke. Vi har dog et 6-tal.
  • 1:46 - 1:52
    Det er vist det eneste 6-tal. Er der 7-taller? Ja, vi har et 7-tal her.
  • 1:52 - 2:01
    Vi har vist glemt det her 1-tal, og vi har også glemt det her 1-tal. Dem skriver vi i starten af vores datasæt.
  • 2:01 - 2:05
    Begge 1-taller skriver vi før 2-tallerne.
  • 2:05 - 2:11
    Vi har altså enere, toere, trere, firere, ingen femmere, et 6-tal, et 7-tal og et 8-tal.
  • 2:11 - 2:17
    Har vi nogen 9-tal? Der er ingen 9-taller. Nogen 10-taller? Ja, der er et 10-tal.
  • 2:17 - 2:23
    Er der 11-taller? Ja, vi har et 11-tal. Er der 12-taller? Nej.
  • 2:23 - 2:35
    Vi har 14 og 15 her. Vi har også 20 og 22.
  • 2:35 - 2:39
    Nu har vi sat vores observationer i rækkefølge, og nu er det relativt let at finde de midterste observationer.
  • 2:39 - 2:42
    Det er medianen. Hvor mange observationer har vi?
  • 2:42 - 2:46
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10
  • 2:46 - 2:50
    11, 12, 13, 14, 15, 16, 17.
  • 2:50 - 2:54
    Det midterste tal er altså det, der har 8 tal, der er større end det,
  • 2:54 - 2:58
    og 8 tal, der er mindre end det.
  • 2:58 - 3:00
    1, 2, 3, 4, 5, 6, 7, 8. Tallet 6 her er større end 8 af observationerne,
  • 3:00 - 3:07
    og hvis vi har talt rigtigt, er det også mindre end 8 af observationerne.
  • 3:07 - 3:10
    1, 2, 3, 4, 5, 6, 7, 8.
  • 3:10 - 3:13
    Det er det.
  • 3:13 - 3:18
    Det er vores median.
  • 3:18 - 3:26
    Når vi skal lave et boksplot, siger vi også, at vores median deler vores datasæt ind i 2 nye datasæt.
  • 3:26 - 3:29
    Nu skal vi finde medianen af hver af de datasæt.
  • 3:29 - 3:33
    Normalt siger man, at medianen for hele datasættet ikke er med i nogle af de andre datasæt.
  • 3:33 - 3:37
    Det er en god regel at huske.
  • 3:37 - 3:42
    .
  • 3:42 - 3:45
    Lad os første se på den halvdel med de laveste tal.
  • 3:45 - 3:49
    Hvad er medianen i den halvdel?
  • 3:49 - 3:53
    VI har 1, 2, 3, 4, 5, 6, 7, 8 observationer.
  • 3:53 - 3:57
    Vi vil altså have 2 tal i midten af datasættet.
  • 3:57 - 4:01
    De to midterste observationer er det her 2-tal og det her 3-tal.
  • 4:01 - 4:04
    Der er 3 observationer mindre end dem, og der er 3 observationer, der er større end dem.
  • 4:04 - 4:08
    For at finde medianen bliver vi nødt til at finde middelværdien af de to tal.
  • 4:08 - 4:13
    Middelværdien af 2 og 3 er 2,5.
  • 4:13 - 4:17
    2 plus 3 er 5. 5 divideret med 2 er 2,5.
  • 4:17 - 4:22
    Medianen af den laveste halvdel af vores datasæt er altså 2,5.
  • 4:22 - 4:27
    I den anden halvdel har vi også 8 observationer,
  • 4:27 - 4:33
    og vores to midterste observationer er 11 og 14.
  • 4:33 - 4:39
    Vi skal finde middelværdien af de to observationer. 11 plus 14 er 25.
  • 4:39 - 4:48
    Halvdelen af 25 er 12,5. 12,5 er lige præcis halvvejs mellem 11 og 14.
  • 4:48 - 4:53
    Nu har vi alle de informationer,
  • 4:53 - 4:55
    vi skal bruge for at lave vores boksplot.
  • 4:55 - 5:02
    Lad os tegne en flot tallinje her.
  • 5:02 - 5:08
    Det er vores tallinje.
  • 5:08 - 5:11
    Lad os sige, at det her er 0.
  • 5:11 - 5:14
    Tallinjen skal gå til mindst 22.
  • 5:14 - 5:19
    Det her er 0, det her er 5, det er er 10.
  • 5:19 - 5:23
    Det her er 15, og det her er 20.
  • 5:23 - 5:26
    Det her er 25, og vi kan fortsætte den lidt endnu.
  • 5:26 - 5:30
    Det her er 30 og 35.
  • 5:30 - 5:34
    Det kassen
  • 5:34 - 5:38
    i vores boksplot egentlig repræsenterer
  • 5:38 - 5:42
    er den midterste halvdel af vores datasæt.
  • 5:42 - 5:46
    Det vil sige alle de data,
  • 5:46 - 5:50
    der ligger mellem medianerne af vores to halvdele af datasættet.
  • 5:50 - 5:54
    Det er altså den her del,
  • 5:54 - 5:57
    som boksen repræsenterer.
  • 5:57 - 6:00
    Vi starter ved den nedre kvartil, som vi kalder medianen i den laveste halvdel, og den er 2,5.
  • 6:00 - 6:05
    Den første fjerdedel af vores observationer er altså ikke med i kassen.
  • 6:05 - 6:09
    Det her er 2,5.
  • 6:09 - 6:13
    2,5 er halvvejs mellem 0 og 5.
  • 6:13 - 6:18
    2,5 er her, og så har vi 12,5 her.
  • 6:18 - 6:23
    12,5 er her.
  • 6:23 - 6:29
    Sådan.
  • 6:29 - 6:30
    Det her er halvvejs mellem
  • 6:30 - 6:35
    10 og 15, og det er 12,5.
  • 6:35 - 6:38
    .
  • 6:38 - 6:42
    Det er altså vores øvre kvartil.
  • 6:42 - 6:45
    Den her boks repræsenterer altså den midterste halvdel
  • 6:45 - 6:49
    i vores datasæt.
  • 6:49 - 6:52
    Vi skal også vise, hvor medianen er. Det er faktisk også en af de ting, ejerne gerne vil finde.
  • 6:52 - 6:55
    Han vil gerne vide, hvad medianen er,
  • 6:55 - 6:59
    og den er 6.
  • 6:59 - 7:04
    Det kan vi afbilde her.
  • 7:04 - 7:09
    Det her er 6.
  • 7:09 - 7:12
    Nu skal vi endelig tegne halerne
  • 7:12 - 7:16
    på vores boks,
  • 7:16 - 7:19
    som viser variationsbredden i vores data.
  • 7:19 - 7:22
    Lad os gøre det i orange.
  • 7:22 - 7:24
    Vi skal altså se på hele datasættet her, og det går helt til 22.
  • 7:24 - 7:27
    Vores største observation er 22.
  • 7:27 - 7:31
    .
  • 7:31 - 7:37
    Vi tegner altså halen helt til 22,
  • 7:37 - 7:41
    og vores laveste observationer er 1,
  • 7:41 - 7:44
    som er her.
  • 7:44 - 7:47
    Vi skal altså have tegnet halen helt til 1.
  • 7:47 - 7:51
    Det her er vores boksplot. Nu er vi færdige.
  • 7:51 - 7:54
    I det her boksplot kan vi med det samme se medianen.
  • 7:54 - 7:57
    Det er stregen i vores boks.
  • 7:57 - 8:02
    Boksen viser den midterste halvdel af vores observationer,
  • 8:02 - 8:06
    og halerne fra boksen viser, hvor stor variationen i vores observationer er.
  • 8:06 - 8:10
    Det er smart.
  • 8:10 - 8:13
    Boksplottet viser altså både noget om variationen i vores data
  • 8:13 - 8:17
    og datasættets median.
Title:
Constructing a box-and-whisker plot
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
08:18

Danish subtitles

Revisions