< Return to Video

Statistics: Sample Variance

  • 0:01 - 0:03
    See video siin on pöördeline video
  • 0:03 - 0:05
    mitme põhjuse tõttu.
  • 0:05 - 0:10
    Üks, ma tutvustan teile valimi dispersiooni
  • 0:10 - 0:12
    mis on huvitav enda tõttu.
  • 0:12 - 0:15
    Ja ma üritan salvestada seda video kõrge kvaliteediga.
  • 0:15 - 0:16
    Ja loodetavasti näete seda suuremalt ja selgemalt
  • 0:16 - 0:17
    kui kunagi varem.
  • 0:17 - 0:19
    Aga vaatame kuidas see kõik välja kujuneb.
  • 0:19 - 0:22
    See on siis selline eksperiment olge siis kannatlik.
  • 0:22 - 0:25
    Aga enne kui asume dispersiooni kallale ma
  • 0:25 - 0:28
    arvan et oleks parem vaadata üle kogumi
  • 0:28 - 0:29
    dispersioon.
  • 0:29 - 0:32
    Ja me võime nende valemeid võrrelda.
  • 0:32 - 0:35
    Kogumi dispersioon -- ja see on kreeka täht
  • 0:35 - 0:36
    Sigma.
  • 0:36 - 0:37
    väike sigma ruudus.
  • 0:37 - 0:38
    See tähendab dispersiooni.
  • 0:38 - 0:41
    Ma tean et on imelik et muutuja omab juba
  • 0:41 - 0:42
    ruutu endas.
  • 0:42 - 0:43
    Te ei tõsta ruutu muutujat
  • 0:43 - 0:44
    See on muutuja
  • 0:44 - 0:46
    sigma ruudus on dispersioon.
  • 0:46 - 0:47
    Las ma panen selle siia kirja.
  • 0:47 - 0:48
    See on võrdne dispersiooniga.
  • 0:52 - 0:55
    Ja see on võrdne -- te võtate iga andme punkti -- ja
  • 0:55 - 0:59
    me kutsume seda x indeksiga i
  • 0:59 - 1:02
    Te võtate iga andme punkti, leiate kui kaugel on need
  • 1:02 - 1:09
    keskmisest antud kogumis, võtate selle ruutu ja siis võtate
  • 1:09 - 1:11
    keskmise kõigist neist.
  • 1:11 - 1:13
    Te siis võtate keskmise, liidate kõik kokku.
  • 1:13 - 1:14
    Lähete i-st mis on võrdne 1-ga
  • 1:14 - 1:18
    Et siis esimesest punktist, kuni n punktini.
  • 1:18 - 1:20
    Ja siis, keskmise jaoks, liidate kõik kokku ja
  • 1:20 - 1:22
    jagate n-ga
  • 1:22 - 1:26
    Et siis dispersioon on siis keskmine nende ruutude
  • 1:26 - 1:27
    kaugus igast punktist keskmisest.
  • 1:27 - 1:30
    Ja ma annan teile aimduse, et see põhimõtteliselt
  • 1:30 - 1:33
    ütleb, keskmine, kui kaugel eemal on iga
  • 1:33 - 1:34
    punkt keskkohast.
  • 1:34 - 1:36
    Nii on kõige parem mõelda dispersioonist.
  • 1:36 - 1:38
    Nüüd kui me tegeleme -- see oli
  • 1:38 - 1:39
    kogumi jaoks
  • 1:39 - 1:42
    Ja me ütlesime et kui me tahame leida dispersiooni
  • 1:42 - 1:45
    meeste pikkustest, siis see oleks väga rakse
  • 1:45 - 1:46
    välja arvutada kogumi dispersiooni.
  • 1:46 - 1:49
    Te peaksite minema ja põhimõtteliselt mõõtma
  • 1:49 - 1:50
    kõigi pikkused.
  • 1:50 - 1:51
    250 miljonit inimest.
  • 1:51 - 1:55
    Või kui mõne kogumi jaoks kus on täiesti
  • 1:55 - 1:57
    võimatu saada andmeid või
  • 1:57 - 1:58
    mingi suvalist muutujat.
  • 1:58 - 1:59
    Ja me tegeleme sellega hiljem rohkem.
  • 1:59 - 2:03
    Enamus ajast te tahate lihtsalt hinnata seda dispersiooni
  • 2:03 - 2:05
    võttes valimist dispersiooni.
  • 2:05 - 2:07
    Samamoodi et te ei suuda leida kogumi keskmist
  • 2:07 - 2:10
    aga võib-olla tahate hinnata seda saades
  • 2:10 - 2:11
    valimi keskmise.
  • 2:11 - 2:14
    Ja me õppisime seda esimeses videos.
  • 2:14 - 2:18
    Kui see-- kui see on kogu kogum.
  • 2:18 - 2:20
    See on miljoneid andmeid, või isegi
  • 2:20 - 2:22
    mõned andmed tulevikust mida teil pole kunagi võimalik saada sest
  • 2:22 - 2:23
    see on suvaline muutuja.
  • 2:23 - 2:24
    See on siis kogum.
  • 2:27 - 2:32
    Te tahte lihtsalt hinnata olukorda vaadates valimit.
  • 2:32 - 2:35
    See on tegelikult see mida enamus järelduslik
  • 2:35 - 2:36
    statistika räägib.
  • 2:36 - 2:39
    Leides kirjeldava statistka valimi kohta ja
  • 2:39 - 2:41
    teha järeldus kogu populatsioonist.
  • 2:41 - 2:45
    Las ma proovin seda 100 inimese peal ja kui sellel on
  • 2:45 - 2:47
    statistiliselt märkimisväärsed tulemused, siis see värk
  • 2:47 - 2:49
    peaks töötama ka kogumi terviku peal.
  • 2:49 - 2:50
    See siis ongi sellest.
  • 2:50 - 2:52
    Nii et on väga tähtis mõista mida see mõiste
  • 2:52 - 2:54
    valim versus kogum tähendab.
  • 2:54 - 2:58
    ja olla võimeline leidma statistikat valimis nii
  • 2:58 - 3:00
    nagu enamuse jaks, saab kirjeldada kogumit või aitab meil
  • 3:00 - 3:04
    seda hinnata, nad kutsuvad seda, kogumi parameetriteks.
  • 3:04 - 3:07
    Nii et mis on siis keskmine -- las ma kirjutan need definitsioonid.
  • 3:07 - 3:09
    Mis on kogumi keskmine.
  • 3:09 - 3:10
    Teen selle lillalt.
  • 3:10 - 3:12
    Lilla on kogumi jaoks.
  • 3:12 - 3:14
    Kogumi keskmine.
  • 3:14 - 3:20
    Võtate iga andme punkti kogumist, x i
  • 3:20 - 3:22
    Liidate need kokku.
  • 3:22 - 3:24
    Alustate esimese andme punktiga ja lähete kogu tee
  • 3:24 - 3:26
    kuni n- punktini välja.
  • 3:26 - 3:27
    Ja jagate siis n-ga
  • 3:27 - 3:28
    Liidate kõik kokku ja jagate n-ga
  • 3:28 - 3:29
    See on keskmine.
  • 3:29 - 3:30
    Siis panete selle siia valemisse.
  • 3:30 - 3:33
    Ja siis te näete kui kaugel iga punkt on sellest keskmisest
  • 3:33 - 3:34
    punktist, sellest keskmisest.
  • 3:34 - 3:36
    Ja siis saate dispersiooni.
  • 3:36 - 3:40
    Mis juhtub kui me teeme seda valimis?
  • 3:40 - 3:43
    Kui me tahame hinnata kogumi keskmist mingitmoodi
  • 3:43 - 3:47
    välja arvutades valimi keskmise siis parim asi mida ma
  • 3:47 - 3:49
    mõelda oskan -- ja tõesti need on nagu konstrueeritud valemid.
  • 3:49 - 3:51
    Need on inimesed kes on öelnud, et see on parim
  • 3:51 - 3:52
    seda teha.
  • 3:52 - 3:55
    Kõik mida me teha saame on et võtame keskmise meie valimist.
  • 3:55 - 3:57
    Ja see on valimi keskmine.
  • 3:57 - 3:59
    Ja me õppisime esimeses videos et see tähistus--
  • 3:59 - 4:00
    Valem on peaaegu identne sellega.
  • 4:00 - 4:02
    Lihtsalt tähistus on erinev.
  • 4:02 - 4:05
    Selle asemel et kirjutada müü, te kirjutate x mille kohal on joon.
  • 4:05 - 4:09
    Valimi keskmine on võrdne -- jällegi võtate iga
  • 4:09 - 4:12
    andme punkti valimist mitte kogumist
  • 4:12 - 4:16
    liidate kokku esimest kuni
  • 4:16 - 4:17
    n-ini
  • 4:17 - 4:21
    Nad ütlevad et seal on n andme punkti selles valimis.
  • 4:21 - 4:23
    Ja siis te jagate selle n-g
  • 4:23 - 4:24
    Hea küll.
  • 4:24 - 4:26
    See on põhimõtteliselt sama valem.
  • 4:26 - 4:28
    Viis kuidas ma võtsin kogumi keskmise ma ütlesin et kui
  • 4:28 - 4:30
    mul on lihtsalt valim, las ma võtan keskmise samamoodi.
  • 4:30 - 4:33
    Ja see on arvatavasti hea hinnang kogumi
  • 4:33 - 4:34
    keskmiseks.
  • 4:34 - 4:36
    Nüüd läheb huvitavaks kui me räägime dispersioonist.
  • 4:36 - 4:39
    Teie tavaline reaktsioon oleks OK, mul on see valim.
  • 4:39 - 4:43
    Kui ma tahan hinnata kogumi dispersiooni, miks
  • 4:43 - 4:45
    ma siis lihtsalt ei kasuta sama valemit põhimõtteliselt
  • 4:45 - 4:46
    valimi jaoks.
  • 4:46 - 4:49
    Ma võin öelda--see on tegelikult valimi dispersioon.
  • 4:49 - 4:55
    Nad kasutavad valemit s ruudus.
  • 4:55 - 4:58
    Sigma on nagu kreeka täht ekivalentne s-ga
  • 4:58 - 5:00
    Kui me tegeleme valimiga, me lihtsalt
  • 5:00 - 5:01
    kirjutame sinna s.
  • 5:01 - 5:02
    See on valimi dispersioon.
  • 5:02 - 5:03
    Las ma kirjutan selle siia.
  • 5:03 - 5:04
    Valimi dispersioon.
  • 5:12 - 5:16
    See on -- me võime öelda, võib-olla hea viis kuidas
  • 5:16 - 5:17
    leida valimi dispersioon on teha samamoodi.
  • 5:17 - 5:24
    Võtame vahemaa iga punkti kohta valimis.
  • 5:24 - 5:27
    leiame kui kaugel on need meie valimi keskmisest.
  • 5:27 - 5:29
    Siin me kasutasime kogumi keskmist, aga nüüd me lihtsalt
  • 5:29 - 5:31
    kasutame valimi keskmist sest see on kõik mis meil on.
  • 5:31 - 5:33
    Me ei tea mis kogumi keskmine on
  • 5:33 - 5:36
    ilma et vaataksime kogu kogumit.
  • 5:36 - 5:36
    Võtame selle ruutu.
  • 5:36 - 5:38
    See teeb selle positiivseks ja saab teised omadused,
  • 5:38 - 5:40
    Millest räägime hiljem.
  • 5:40 - 5:43
    Ja võtate keskmise kõigist nendest ruutudest.
  • 5:43 - 5:45
    te võtate need-- liidate need kõik kokku.
  • 5:45 - 5:47
    Ja seal on n arvu mida kokku liita
  • 5:47 - 5:48
    Väikene n
  • 5:48 - 5:52
    Ja jagate selle väikese n-ga
  • 5:52 - 5:53
    Ja siis võite öelda et see on hea hinnang.
  • 5:53 - 5:56
    Mis iganes dispersioon on, see võib olla hea hinnang
  • 5:56 - 5:57
    kogu populatsiooni jaoks.
  • 5:57 - 6:01
    Tegelikult on see millele inimesed tihti viitavad
  • 6:01 - 6:02
    kui nad räägivad valimi dispersioonist.
  • 6:02 - 6:05
    Ja mõnikord see isegi on viidatud sellele.
  • 6:05 - 6:08
    Nad panevad väikese n sinna.
  • 6:08 - 6:10
    Ja põhjus miks nad nii teevad sest me jagame selle väike n-ga
  • 6:10 - 6:12
    Ja te ütlete, Sal mis on probleem siin?
  • 6:12 - 6:14
    Ja probleem--Ja ma annan teile aimduse sest
  • 6:14 - 6:16
    See on tegelikult midagi mis mind on häirinud kaua.
  • 6:16 - 6:19
    Ja ma siiani tegelikult mässan
  • 6:19 - 6:22
    selle teemaga.
  • 6:22 - 6:25
    Mul on aimdus, aga rangem
  • 6:25 - 6:27
    tõestus endajaoks on teemaks.
  • 6:27 - 6:28
    Aga mõelge sellest.
  • 6:28 - 6:30
    Kui mul on hunnik numbreid ja ma joonistan
  • 6:30 - 6:33
    numbri joone siia.
  • 6:33 - 6:36
    Kui ma joonistan numbri joone siia--ütleme et see--
  • 6:36 - 6:39
    ja ütleme et mul on hunnik numbreid minu kogumis.
  • 6:39 - 6:42
    ütleme siis--ma panen suvalt mingid numbrid
  • 6:42 - 6:44
    siia kogumisse.
  • 6:44 - 6:46
    Ja need mis on paremal on suuremad kui need
  • 6:46 - 6:46
    mis on vasakul.
  • 6:49 - 6:53
    Ja kui me võtame valimi nendest, võib-olla ma võtan
  • 6:53 - 6:55
    valim on suvaline
  • 6:55 - 6:56
    Te tegelikult tahate võtta suvalise valimi.
  • 6:56 - 6:57
    Te ei taha seda kuskile poole viltuseks ajada.
  • 6:57 - 7:03
    Võib-olla ma võtan selle ja selle ja selle,
  • 7:03 - 7:05
    ja siis selle ka
  • 7:05 - 7:07
    Ja siis kui ma võtan nende numbri keskmse,
  • 7:07 - 7:08
    see number see number ja see number
  • 7:08 - 7:09
    Siis see oleks kuskil siin keskel.
  • 7:09 - 7:11
    See võiks olla kuskil siin.
  • 7:11 - 7:13
    Ja siis kui ma tahan leida valimi dispersiooni kasutades
  • 7:13 - 7:17
    seda valemit, ma võin öelda OK, see vahemaa ruudus pluss
  • 7:17 - 7:21
    see vahemik ruudus pluss see vahemik ruudus
  • 7:21 - 7:24
    jne ja leida nende keskmine.
  • 7:24 - 7:25
    Ja siis ma saan selle numbri.
  • 7:25 - 7:28
    See oleks arvatavasti üsna hea ümardus
  • 7:28 - 7:30
    kogumi dispersiooniks.
  • 7:30 - 7:32
    Kogumi keskmine on umbkaudu kuskil
  • 7:32 - 7:33
    ma ei teagi
  • 7:33 - 7:35
    See peaks olema päris lähedal sellele.
  • 7:35 - 7:37
    Kui me tegelikult võtame kõik andme punktid ja keskmise leiame
  • 7:37 - 7:39
    siis võib-olla see on kuskil siin.
  • 7:39 - 7:41
    Ja siis kui te leiate dispersiooni, siis see arvatavasti
  • 7:41 - 7:44
    oleks üsna lähedal keskmisele nende joonte juures.
  • 7:44 - 7:47
    Kõik valimi dispersiooni vahemikust õigus?
  • 7:47 - 7:47
    Selge see.
  • 7:47 - 7:48
    Te ütlete Hei Sal
  • 7:48 - 7:50
    See näeb päris hea välja juba.
  • 7:50 - 7:52
    Aga siin on üks väike konks.
  • 7:52 - 7:55
    Mis on kui-- Seal on alati tõenäosus et
  • 7:55 - 7:57
    võttes need enamvähem hästi jaotatud numbrid minu
  • 7:57 - 8:01
    valimist, mis juhtub kui ma võtan selle numbri, selle numbri
  • 8:01 - 8:04
    ja lisan selle numbri-- ja ütleme et see number
  • 8:04 - 8:05
    minu valimis?
  • 8:05 - 8:08
    Mis iganes teie valim on, teie valimi keskmine on
  • 8:08 - 8:10
    alati kõige keskel
  • 8:10 - 8:13
    Antud juhul, teie valimi keskmine peaks olema kuskil siin.
  • 8:13 - 8:15
    Et siis kõik need numbrid, te võite öelda ok see number ei ole
  • 8:15 - 8:18
    väga kaugel sellest numbrist, see number pole väga kaugel ja
  • 8:18 - 8:19
    see number ka pole.
  • 8:19 - 8:22
    Teie valimi dispersioon, kui te teete seda niimoodi,
  • 8:22 - 8:24
    tuleb välja liiga madal.
  • 8:24 - 8:27
    Sest kõik need numbrid, nad on üsna
  • 8:27 - 8:29
    nad on peaaegu nagu piiritletud, lähevad üsna lähedale
  • 8:29 - 8:30
    keskmisele igaüks.
  • 8:30 - 8:35
    Aga antud juhul teie valim on natukene viltune ja
  • 8:35 - 8:38
    tegelik keskmine kogumis on kuskil siin.
  • 8:38 - 8:41
    Et siis tegelik valimi dispersioon, kui teil on tegelikult
  • 8:41 - 8:44
    keskmine teada-- ma tean et see on natuke segane
  • 8:44 - 8:45
    Kui teil on keskmine teada, siis te
  • 8:45 - 8:47
    te võite öelda oh WOW
  • 8:47 - 8:48
    Te saaksite leida need vahemaad mis oleksid
  • 8:48 - 8:51
    palju rohkem.
  • 8:51 - 8:54
    Kogu selle asja point mida ma üritan öelda on et kui te võtate
  • 8:54 - 8:58
    valimi, siis seal on mingi võimalus et teie valimi keskmine on üsna
  • 8:58 - 9:00
    lähedal kogumi keskmisele
  • 9:00 - 9:03
    Võib-olla teie valimi keskmine on siin ja kogumi
  • 9:03 - 9:03
    keskmine siin.
  • 9:03 - 9:06
    Ja siis see valem võib isegi töötada päris hästi
  • 9:06 - 9:08
    vähemalt anda teile valimi andmepunktid ja leida
  • 9:08 - 9:09
    mis dispersioon on.
  • 9:09 - 9:14
    Aga seal on mõistlik võimalus et teie valimi keskmine, teie
  • 9:14 - 9:17
    valim on alati teie andmete valim õigus?
  • 9:17 - 9:19
    Alati saab see oleme teie andmete vahel valimis.
  • 9:19 - 9:21
    Aga on täiesti võimalik et kogumi keskmine on
  • 9:21 - 9:23
    väljaspool teie valimi punkte.-
  • 9:23 - 9:25
    Võib juhtuda et te just valite need numbrid
  • 9:25 - 9:28
    mis ei sisalda tegelikult kogumi keskmist.
  • 9:28 - 9:32
    Ja see valimi dispersioon arvutades nii
  • 9:32 - 9:35
    tegelikult alahindab tegelikku kogumi
  • 9:35 - 9:36
    dispersiooni.
  • 9:36 - 9:38
    Sest nad on alati üsna lähedal nende enda keskmisega
  • 9:38 - 9:40
    kui nad on kogumi keskmisele.
  • 9:40 - 9:43
    Ja kui te mõistate, isegi vähemalt 10%
  • 9:43 - 9:46
    sellest siis olete väga tasemel statistika õpilane.
  • 9:46 - 9:49
    Aga ma ütlen seda kõike et anda teile, loodetavasti
  • 9:49 - 9:54
    mingit aimdus et aru saada et seda tihti alahinnatakse.
  • 9:54 - 9:57
    See valem tihti alahinda tegelikku
  • 9:57 - 9:59
    kogumi dispersiooni.
  • 9:59 - 10:01
    Ja seal on valem, ja seda on tõestatud rohkem
  • 10:01 - 10:05
    rangemalt kui mina seda teen, seda arvestatakse kui
  • 10:05 - 10:08
    paremat või nad ütlevad erapooletu, hinnatakse
  • 10:08 - 10:09
    kogumi dispersiooni.
  • 10:09 - 10:11
    Või erapooletu valimi dispersioon.
  • 10:11 - 10:14
    Ja mõnikord see on lihtsalt märgitud s ruudus jällegi.
  • 10:14 - 10:19
    Mõnikord aga s n miinus 1 ruudus
  • 10:19 - 10:21
    Ja ma näitan teile miks.
  • 10:21 - 10:22
    See on peaaegu sama asi
  • 10:22 - 10:25
    Te võtate iga andme punkti, leiate kui kaugel need on
  • 10:25 - 10:28
    valimi keskmisest
  • 10:28 - 10:29
    Võtate need ruutu.
  • 10:29 - 10:32
    Ja siis te võtate keskmise nendest ruutudest väljaarvatud
  • 10:32 - 10:33
    üks väike erinev
  • 10:33 - 10:36
    i on võrnde 1ga kuni 1 võrdne n-ga
  • 10:36 - 10:39
    Selleasemel et jagada n-ga te jagate selle natukene
  • 10:39 - 10:42
    väiksema numbriga.
  • 10:42 - 10:44
    Jagate selle n-1 ga
  • 10:44 - 10:47
    Kui te jagate minu n-1 selle asemel et jagada
  • 10:47 - 10:50
    n-ga siis te saate natukene suurema numbri siia.
  • 10:50 - 10:51
    Ja tuleb välja et see on tegelikult
  • 10:51 - 10:52
    parem hinnang.
  • 10:52 - 10:55
    Ja ühel päeval ma kirjutan arvuti programmi mis vähemalt
  • 10:55 - 10:57
    tõestab mulle eksperimendi kaudu et see on
  • 10:57 - 11:02
    parem hinnang kogumi dispersiooniks.
  • 11:02 - 11:03
    Ja te arvutate seda samamoodi.
  • 11:03 - 11:05
    Lihtsalt jagate n-1 ga
  • 11:05 - 11:07
    Teine viis kuidas sellest mõelda, ja tegelikult ei-
  • 11:07 - 11:08
    Mul on aeg otsas.
  • 11:08 - 11:10
    Ma jätan teid siia nüüd.
  • 11:10 - 11:11
    Ja järgmises videos me teeme mõned
  • 11:11 - 11:13
    arvutused et te saaksite rohkem aru
  • 11:13 - 11:13
    nendest ideedest.
  • 11:13 - 11:15
    Sest me läheme üsna abstraktseks.
  • 11:15 - 11:17
    Näeme järgmises videos.
Title:
Statistics: Sample Variance
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
11:18

Estonian subtitles

Revisions