< Return to Video

Gennemsnit og standardafvigelse versus median og middelspredning

  • 0:00 - 0:08
    Vi har 9 elever, der er færdiguddannet
    på en meget lille skole med kun 9 elever.
  • 0:08 - 0:14
    De vil gerne se på den centrale tendens
    for deres løn 1 år efter de blev færdige.
  • 0:14 - 0:16
    De vil også gerne se på spredningen
  • 0:16 - 0:20
    omkring den centrale tendens
    1 år efter de blev færdige.
  • 0:20 - 0:25
    De indtaster deres løn i
    en computer og her er de.
  • 0:25 - 0:27
    De bliver vist i tusinder.
  • 0:27 - 0:30
    De tjener 35000, 50000,
    50000, 50000, 56000
  • 0:30 - 0:35
    to tjener 60000, en tjener 75000
    og en tjener 250000.
  • 0:35 - 0:37
    Det går sørme godt for den person.
  • 0:37 - 0:43
    Computeren spytter disse parametre
    ud baseret på disse data.
  • 0:43 - 0:47
    Den giver to typiske mål
    for den centrale tendens.
  • 0:47 - 0:50
    Gennemsnittet er omkring 76,2.
  • 0:50 - 0:56
    Computeren lagde disse 9 tal sammen
    og dividerede med 9.
  • 0:56 - 0:58
    Medianen er 56.
  • 0:58 - 1:00
    Medianen er ret nem at udregne.
  • 1:00 - 1:05
    Du opstiller tallene i rækkefølge og
    finder det midterste tal, som her er 56.
  • 1:05 - 1:08
    Nu synes jeg, du skal sætte videoen
    på pause og overveje
  • 1:08 - 1:13
    for dette observationssæt,
    for populationen af lønninger,
  • 1:13 - 1:19
    hvilket mål for den centrale tendens
    er det bedre mål?
  • 1:19 - 1:21
    Okay, lad os se på det.
  • 1:21 - 1:26
    Jeg vil afbilde tallene på denne linje,
    så vi får en bedre fornemmelse af dem
  • 1:26 - 1:32
    og ikke blot ser dem som tal,
    men hvor de tal er i forhold til hinanden.
  • 1:32 - 1:35
    Lad os sige, dette er 0.
  • 1:35 - 1:41
    1, 2, 3, 4, 5.
  • 1:41 - 1:51
    Dette er 250 og dette er
    50, 100, 150, 200.
  • 1:51 - 1:58
    Hvis dette er 50,
    så ligger 40 her omkring.
  • 1:58 - 2:03
    Dette er 60, 70, 80 90.
  • 2:03 - 2:03
    Godt nok.
  • 2:03 - 2:06
    Jeg kunne måske have gjort det bedre.
  • 2:06 - 2:09
    60, 70, 80, 90.
  • 2:09 - 2:21
    Nej lad mig lige lave det pænere.
  • 2:21 - 2:27
    Hvis det er 40, så er det 30, 20 10.
  • 2:27 - 2:28
    Okay, det ser godt nok ud.
  • 2:28 - 2:30
    Lad os afbilde vores data.
  • 2:30 - 2:35
    1 elev tjener 35000, så det er lige her.
  • 2:35 - 2:42
    2 tjener 50000, nej 3 tjener 50000,
    så 1, 2 3.
  • 2:42 - 2:43
    Det viser jeg således.
  • 2:43 - 2:50
    1 tjener 56000, som er her omkring.
  • 2:50 - 2:54
    1 tjener 60000, nej 2 tjener 60000,
    sådan.
  • 2:54 - 3:00
    1 tjener 75000, så 60, 70 og 75000.
  • 3:00 - 3:02
    Det er her omkring.
  • 3:02 - 3:08
    Og 1 tjener 250000,
    så en løn er helt herover.
  • 3:08 - 3:11
    Vi udregner gennemsnittet til 76,2
  • 3:11 - 3:13
    --et mål for den centrale tendens--
  • 3:13 - 3:17
    og 76,2 er her.
  • 3:17 - 3:21
    Er det et godt mål for
    den centrale tendens?
  • 3:21 - 3:23
    Det synes jeg faktisk ikke,
  • 3:23 - 3:27
    fordi vores mål for den centrale tendens
    er højere end alle observationer
  • 3:27 - 3:28
    bortset fra en.
  • 3:28 - 3:34
    Grunden til det er, vores data er skævt
  • 3:34 - 3:38
    fordi denne ene observation
    ved 250000 dollars ligger
  • 3:38 - 3:45
    så langt fra resten af gruppen,
    at den trækker gennemsnittet op.
  • 3:45 - 3:47
    Det er noget du ofte ser.
  • 3:47 - 3:49
    Hvis du har data, der er skævt,
  • 3:49 - 3:54
    som med lønninger, hvor de fleste tjener
    50, 60 eller 70000 dollars og
  • 3:54 - 3:59
    der en der tjener 2 millioner dollars,
    så vil det trække gennemsnittet opad,
  • 3:59 - 4:03
    når du lægger dem sammen og
    dividerer med antallet af observationer.
  • 4:03 - 4:07
    I et sådan tilfælde, hvor en observation
    trækker gennemsnittet opad,
  • 4:07 - 4:10
    så er medianen mere standhaftig.
  • 4:10 - 4:14
    Medianen på 56 er lige her,
  • 4:14 - 4:17
    og den synes at give et meget
    bedre billede af den centrale tendens.
  • 4:17 - 4:19
    Tænk over det.
  • 4:19 - 4:26
    Selv hvis du i stedet for 250000
    havde 250 millioner,
  • 4:26 - 4:33
    som er et enormt beløb,
    der vil hæve gennemsnittet vildt meget,
  • 4:33 - 4:35
    så vil det faktisk ikke ændre medianen,
  • 4:35 - 4:38
    fordi for medianen er det ligegyldigt,
    hvor højt dette tal bliver.
  • 4:38 - 4:41
    Det kan være en trillion dollars
    eller en kvintillion dollars.
  • 4:41 - 4:44
    Medianen forbliver den samme.
  • 4:44 - 4:48
    Medianen er meget mere standhaftig,
    når du har et skævt observationssæt.
  • 4:48 - 4:52
    Gennemsnit giver lidt mere mening,
    når du har et symmetrisk observationssæt
  • 4:52 - 4:56
    eller hvis dine data ligger nogenlunde
    lige meget over og under gennemsnittet,
  • 4:56 - 4:59
    eller hvis det ikke er
    meget skæv i den ene retning,
  • 4:59 - 5:04
    især når vi kun har
    få observationer som her.
  • 5:04 - 5:10
    I dette tilfælde er medianen et meget
    bedre mål for den centrale tendens.
  • 5:10 - 5:12
    Hvad med spredningen?
  • 5:12 - 5:16
    Du siger måske, "men Sal du har allerede
    fortalt at gennemsnittet ikke er godt
  • 5:16 - 5:18
    og standardafvigelse er
    baseret på gennemsnittet."
  • 5:18 - 5:22
    Du tager hver af observation og
    finder afstanden til gennemsnittet,
  • 5:22 - 5:27
    tager kvadratet, finder summen og
    dividerer med antallet af observationer,
  • 5:27 - 5:30
    da vi udregner
    populationens standardafvigelse
  • 5:30 - 5:34
    og så tager du kvadratroden af det hele.
  • 5:34 - 5:37
    Da standardafvigelse er baseret
    på gennemsnittet,
  • 5:37 - 5:40
    som her ikke er et godt mål
    for den centrale tendens,
  • 5:40 - 5:45
    så vil standardafvigelsen også forvrænges.
  • 5:45 - 5:48
    Den her er meget stor.
  • 5:48 - 6:00
    Du kan se, denne ene observation er langt
    væk fra gennemsnittet og medianen,
  • 6:00 - 6:03
    mens de fleste andre observationer
    er meget tættere på.
  • 6:03 - 6:07
    I denne situation bør vi ikke
    blot bruge medianen,
  • 6:07 - 6:10
    men den interkvartile variationsbredde
    er også mere standhaftig.
  • 6:10 - 6:13
    Hvordan udregnes den
    interkvartile variationsbredde.
  • 6:13 - 6:14
    Du finder medianen og
  • 6:14 - 6:19
    så tager du den nedre halvdel af
    observationerne og finder dens median.
  • 6:19 - 6:21
    Det er 50 lige her.
  • 6:21 - 6:29
    Så tager du den øvre halvdel og medianen
    ligger mellem 60 og 75, så 67,5.
  • 6:29 - 6:31
    Hvis dette virker ukendt,
    så har vi mange videoer om
  • 6:31 - 6:34
    interkvartile variationsbredde,
    standardafvigelse,
  • 6:34 - 6:35
    median og gennemsnit.
  • 6:35 - 6:39
    Forskellen på disse to er 17,5.
  • 6:39 - 6:45
    Bemærk, afstanden mellem disse to
    er 17,5 og det vil ikke ændre sig,
  • 6:45 - 6:48
    selv hvis dette er 250 billioner dollars.
  • 6:48 - 6:56
    Disse to er mere standhaftige mål,
    når du har et skævt observationssæt.
  • 6:56 - 6:58
    Du må gerne her bide mærke i,
  • 6:58 - 7:00
    at gennemsnit og standardafvigelse
    ikke er dårlige,
  • 7:00 - 7:03
    når du har et nogenlunde
    symmetrisk observationssæt,
  • 7:03 - 7:07
    når du ikke har nogle væsentlige outliers,
    som forvrider observationssættet.
  • 7:07 - 7:10
    Her kan gennemsnit og standardafvigelse
    være ganske gode.
  • 7:10 - 7:14
    Men hvis du har noget der er meget
    skævt på grund af få observationer,
  • 7:14 - 7:19
    så bruges median som mål for
    den centrale tendens og
  • 7:19 - 7:23
    interkvartil variationsbredde for spredning
    omkring denne centrale tendens.
  • 7:23 - 7:26
    Det ser du ofte,
    når man snakker om indtægt,
  • 7:26 - 7:29
    da bruges medianen, da der kan være
    nogle skæve indtægter,
  • 7:29 - 7:30
    især i den høje ende.
  • 7:30 - 7:32
    Når vi ser på ting som huspriser,
  • 7:32 - 7:36
    så bruges medianen ofte
    mere end gennemsnittet,
  • 7:36 - 7:39
    fordi huspriserne i et kvarter ligger
  • 7:39 - 7:43
    måske på omkring 200000
    til 300000 dollars,
  • 7:43 - 7:48
    men så ligger der en kæmpe villa,
    der koster 100 millioner dollars.
  • 7:48 - 7:50
    Hvis du udregner gennemsnittet,
  • 7:50 - 7:57
    så vil det give et falsk billede af den
    centrale tendens for priserne i den by.
Title:
Gennemsnit og standardafvigelse versus median og middelspredning
Description:

Lær at vælge "foretrukne" mål for den centrale tendens og spredning, når outliers er til stede i et observationssæt.

I emnet Sammenfatning af kvantitative data skal vi gennemgå de mest almindelige mål for den centrale tendens, nemlig gennemsnit og median. Vi skal også se på forskellige mål for spredning eller variation, nemlig stikprøvespredning og interkvartil variationsbredde (middelspredning) samt bruge disse begreber til at afgøre, hvilke observationer der kan betragtes som outliers.

Khan Academy har en mission om at give gratis, verdensklasse undervisning til hvem som helst, hvor som helst. Vi tilbyder quizzer, opgaver, videoer og artikler inden for områder som matematik, kunst, computerprogrammering, økonomi, fysik, kemi, biologi, medicin, finans, historie, og meget mere. Vi giver lærere værktøjer og data som de kan bruge til at hjælpe deres elever med at udvikle deres færdigheder, vaner og tankegang, så de fremover kan have succes både i skolen og senere i livet. Khan Academy er oversat til mange sprog og over 15 millioner mennesker verden over lærer via Khan Academy hver måned. Khan Academy er et 501(c)(3) nonprofit selskab.

Giv en donation eller Bliv frivillig i dag!

https://www.khanacademy.org/donate

https://www.khanacademy.org/contribute

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:59

Danish subtitles

Revisions Compare revisions