-
See video siin on pöördeline video
-
mitme põhjuse tõttu.
-
Üks, ma tutvustan teile valimi dispersiooni
-
mis on huvitav enda tõttu.
-
Ja ma üritan salvestada seda video kõrge kvaliteediga.
-
Ja loodetavasti näete seda suuremalt ja selgemalt
-
kui kunagi varem.
-
Aga vaatame kuidas see kõik välja kujuneb.
-
See on siis selline eksperiment olge siis kannatlik.
-
Aga enne kui asume dispersiooni kallale ma
-
arvan et oleks parem vaadata üle kogumi
-
dispersioon.
-
Ja me võime nende valemeid võrrelda.
-
Kogumi dispersioon -- ja see on kreeka täht
-
Sigma.
-
väike sigma ruudus.
-
See tähendab dispersiooni.
-
Ma tean et on imelik et muutuja omab juba
-
ruutu endas.
-
Te ei tõsta ruutu muutujat
-
See on muutuja
-
sigma ruudus on dispersioon.
-
Las ma panen selle siia kirja.
-
See on võrdne dispersiooniga.
-
Ja see on võrdne -- te võtate iga andme punkti -- ja
-
me kutsume seda x indeksiga i
-
Te võtate iga andme punkti, leiate kui kaugel on need
-
keskmisest antud kogumis, võtate selle ruutu ja siis võtate
-
keskmise kõigist neist.
-
Te siis võtate keskmise, liidate kõik kokku.
-
Lähete i-st mis on võrdne 1-ga
-
Et siis esimesest punktist, kuni n punktini.
-
Ja siis, keskmise jaoks, liidate kõik kokku ja
-
jagate n-ga
-
Et siis dispersioon on siis keskmine nende ruutude
-
kaugus igast punktist keskmisest.
-
Ja ma annan teile aimduse, et see põhimõtteliselt
-
ütleb, keskmine, kui kaugel eemal on iga
-
punkt keskkohast.
-
Nii on kõige parem mõelda dispersioonist.
-
Nüüd kui me tegeleme -- see oli
-
kogumi jaoks
-
Ja me ütlesime et kui me tahame leida dispersiooni
-
meeste pikkustest, siis see oleks väga rakse
-
välja arvutada kogumi dispersiooni.
-
Te peaksite minema ja põhimõtteliselt mõõtma
-
kõigi pikkused.
-
250 miljonit inimest.
-
Või kui mõne kogumi jaoks kus on täiesti
-
võimatu saada andmeid või
-
mingi suvalist muutujat.
-
Ja me tegeleme sellega hiljem rohkem.
-
Enamus ajast te tahate lihtsalt hinnata seda dispersiooni
-
võttes valimist dispersiooni.
-
Samamoodi et te ei suuda leida kogumi keskmist
-
aga võib-olla tahate hinnata seda saades
-
valimi keskmise.
-
Ja me õppisime seda esimeses videos.
-
Kui see-- kui see on kogu kogum.
-
See on miljoneid andmeid, või isegi
-
mõned andmed tulevikust mida teil pole kunagi võimalik saada sest
-
see on suvaline muutuja.
-
See on siis kogum.
-
Te tahte lihtsalt hinnata olukorda vaadates valimit.
-
See on tegelikult see mida enamus järelduslik
-
statistika räägib.
-
Leides kirjeldava statistka valimi kohta ja
-
teha järeldus kogu populatsioonist.
-
Las ma proovin seda 100 inimese peal ja kui sellel on
-
statistiliselt märkimisväärsed tulemused, siis see värk
-
peaks töötama ka kogumi terviku peal.
-
See siis ongi sellest.
-
Nii et on väga tähtis mõista mida see mõiste
-
valim versus kogum tähendab.
-
ja olla võimeline leidma statistikat valimis nii
-
nagu enamuse jaks, saab kirjeldada kogumit või aitab meil
-
seda hinnata, nad kutsuvad seda, kogumi parameetriteks.
-
Nii et mis on siis keskmine -- las ma kirjutan need definitsioonid.
-
Mis on kogumi keskmine.
-
Teen selle lillalt.
-
Lilla on kogumi jaoks.
-
Kogumi keskmine.
-
Võtate iga andme punkti kogumist, x i
-
Liidate need kokku.
-
Alustate esimese andme punktiga ja lähete kogu tee
-
kuni n- punktini välja.
-
Ja jagate siis n-ga
-
Liidate kõik kokku ja jagate n-ga
-
See on keskmine.
-
Siis panete selle siia valemisse.
-
Ja siis te näete kui kaugel iga punkt on sellest keskmisest
-
punktist, sellest keskmisest.
-
Ja siis saate dispersiooni.
-
Mis juhtub kui me teeme seda valimis?
-
Kui me tahame hinnata kogumi keskmist mingitmoodi
-
välja arvutades valimi keskmise siis parim asi mida ma
-
mõelda oskan -- ja tõesti need on nagu konstrueeritud valemid.
-
Need on inimesed kes on öelnud, et see on parim
-
seda teha.
-
Kõik mida me teha saame on et võtame keskmise meie valimist.
-
Ja see on valimi keskmine.
-
Ja me õppisime esimeses videos et see tähistus--
-
Valem on peaaegu identne sellega.
-
Lihtsalt tähistus on erinev.
-
Selle asemel et kirjutada müü, te kirjutate x mille kohal on joon.
-
Valimi keskmine on võrdne -- jällegi võtate iga
-
andme punkti valimist mitte kogumist
-
liidate kokku esimest kuni
-
n-ini
-
Nad ütlevad et seal on n andme punkti selles valimis.
-
Ja siis te jagate selle n-g
-
Hea küll.
-
See on põhimõtteliselt sama valem.
-
Viis kuidas ma võtsin kogumi keskmise ma ütlesin et kui
-
mul on lihtsalt valim, las ma võtan keskmise samamoodi.
-
Ja see on arvatavasti hea hinnang kogumi
-
keskmiseks.
-
Nüüd läheb huvitavaks kui me räägime dispersioonist.
-
Teie tavaline reaktsioon oleks OK, mul on see valim.
-
Kui ma tahan hinnata kogumi dispersiooni, miks
-
ma siis lihtsalt ei kasuta sama valemit põhimõtteliselt
-
valimi jaoks.
-
Ma võin öelda--see on tegelikult valimi dispersioon.
-
Nad kasutavad valemit s ruudus.
-
Sigma on nagu kreeka täht ekivalentne s-ga
-
Kui me tegeleme valimiga, me lihtsalt
-
kirjutame sinna s.
-
See on valimi dispersioon.
-
Las ma kirjutan selle siia.
-
Valimi dispersioon.
-
See on -- me võime öelda, võib-olla hea viis kuidas
-
leida valimi dispersioon on teha samamoodi.
-
Võtame vahemaa iga punkti kohta valimis.
-
leiame kui kaugel on need meie valimi keskmisest.
-
Siin me kasutasime kogumi keskmist, aga nüüd me lihtsalt
-
kasutame valimi keskmist sest see on kõik mis meil on.
-
Me ei tea mis kogumi keskmine on
-
ilma et vaataksime kogu kogumit.
-
Võtame selle ruutu.
-
See teeb selle positiivseks ja saab teised omadused,
-
Millest räägime hiljem.
-
Ja võtate keskmise kõigist nendest ruutudest.
-
te võtate need-- liidate need kõik kokku.
-
Ja seal on n arvu mida kokku liita
-
Väikene n
-
Ja jagate selle väikese n-ga
-
Ja siis võite öelda et see on hea hinnang.
-
Mis iganes dispersioon on, see võib olla hea hinnang
-
kogu populatsiooni jaoks.
-
Tegelikult on see millele inimesed tihti viitavad
-
kui nad räägivad valimi dispersioonist.
-
Ja mõnikord see isegi on viidatud sellele.
-
Nad panevad väikese n sinna.
-
Ja põhjus miks nad nii teevad sest me jagame selle väike n-ga
-
Ja te ütlete, Sal mis on probleem siin?
-
Ja probleem--Ja ma annan teile aimduse sest
-
See on tegelikult midagi mis mind on häirinud kaua.
-
Ja ma siiani tegelikult mässan
-
selle teemaga.
-
Mul on aimdus, aga rangem
-
tõestus endajaoks on teemaks.
-
Aga mõelge sellest.
-
Kui mul on hunnik numbreid ja ma joonistan
-
numbri joone siia.
-
Kui ma joonistan numbri joone siia--ütleme et see--
-
ja ütleme et mul on hunnik numbreid minu kogumis.
-
ütleme siis--ma panen suvalt mingid numbrid
-
siia kogumisse.
-
Ja need mis on paremal on suuremad kui need
-
mis on vasakul.
-
Ja kui me võtame valimi nendest, võib-olla ma võtan
-
valim on suvaline
-
Te tegelikult tahate võtta suvalise valimi.
-
Te ei taha seda kuskile poole viltuseks ajada.
-
Võib-olla ma võtan selle ja selle ja selle,
-
ja siis selle ka
-
Ja siis kui ma võtan nende numbri keskmse,
-
see number see number ja see number
-
Siis see oleks kuskil siin keskel.
-
See võiks olla kuskil siin.
-
Ja siis kui ma tahan leida valimi dispersiooni kasutades
-
seda valemit, ma võin öelda OK, see vahemaa ruudus pluss
-
see vahemik ruudus pluss see vahemik ruudus
-
jne ja leida nende keskmine.
-
Ja siis ma saan selle numbri.
-
See oleks arvatavasti üsna hea ümardus
-
kogumi dispersiooniks.
-
Kogumi keskmine on umbkaudu kuskil
-
ma ei teagi
-
See peaks olema päris lähedal sellele.
-
Kui me tegelikult võtame kõik andme punktid ja keskmise leiame
-
siis võib-olla see on kuskil siin.
-
Ja siis kui te leiate dispersiooni, siis see arvatavasti
-
oleks üsna lähedal keskmisele nende joonte juures.
-
Kõik valimi dispersiooni vahemikust õigus?
-
Selge see.
-
Te ütlete Hei Sal
-
See näeb päris hea välja juba.
-
Aga siin on üks väike konks.
-
Mis on kui-- Seal on alati tõenäosus et
-
võttes need enamvähem hästi jaotatud numbrid minu
-
valimist, mis juhtub kui ma võtan selle numbri, selle numbri
-
ja lisan selle numbri-- ja ütleme et see number
-
minu valimis?
-
Mis iganes teie valim on, teie valimi keskmine on
-
alati kõige keskel
-
Antud juhul, teie valimi keskmine peaks olema kuskil siin.
-
Et siis kõik need numbrid, te võite öelda ok see number ei ole
-
väga kaugel sellest numbrist, see number pole väga kaugel ja
-
see number ka pole.
-
Teie valimi dispersioon, kui te teete seda niimoodi,
-
tuleb välja liiga madal.
-
Sest kõik need numbrid, nad on üsna
-
nad on peaaegu nagu piiritletud, lähevad üsna lähedale
-
keskmisele igaüks.
-
Aga antud juhul teie valim on natukene viltune ja
-
tegelik keskmine kogumis on kuskil siin.
-
Et siis tegelik valimi dispersioon, kui teil on tegelikult
-
keskmine teada-- ma tean et see on natuke segane
-
Kui teil on keskmine teada, siis te
-
te võite öelda oh WOW
-
Te saaksite leida need vahemaad mis oleksid
-
palju rohkem.
-
Kogu selle asja point mida ma üritan öelda on et kui te võtate
-
valimi, siis seal on mingi võimalus et teie valimi keskmine on üsna
-
lähedal kogumi keskmisele
-
Võib-olla teie valimi keskmine on siin ja kogumi
-
keskmine siin.
-
Ja siis see valem võib isegi töötada päris hästi
-
vähemalt anda teile valimi andmepunktid ja leida
-
mis dispersioon on.
-
Aga seal on mõistlik võimalus et teie valimi keskmine, teie
-
valim on alati teie andmete valim õigus?
-
Alati saab see oleme teie andmete vahel valimis.
-
Aga on täiesti võimalik et kogumi keskmine on
-
väljaspool teie valimi punkte.-
-
Võib juhtuda et te just valite need numbrid
-
mis ei sisalda tegelikult kogumi keskmist.
-
Ja see valimi dispersioon arvutades nii
-
tegelikult alahindab tegelikku kogumi
-
dispersiooni.
-
Sest nad on alati üsna lähedal nende enda keskmisega
-
kui nad on kogumi keskmisele.
-
Ja kui te mõistate, isegi vähemalt 10%
-
sellest siis olete väga tasemel statistika õpilane.
-
Aga ma ütlen seda kõike et anda teile, loodetavasti
-
mingit aimdus et aru saada et seda tihti alahinnatakse.
-
See valem tihti alahinda tegelikku
-
kogumi dispersiooni.
-
Ja seal on valem, ja seda on tõestatud rohkem
-
rangemalt kui mina seda teen, seda arvestatakse kui
-
paremat või nad ütlevad erapooletu, hinnatakse
-
kogumi dispersiooni.
-
Või erapooletu valimi dispersioon.
-
Ja mõnikord see on lihtsalt märgitud s ruudus jällegi.
-
Mõnikord aga s n miinus 1 ruudus
-
Ja ma näitan teile miks.
-
See on peaaegu sama asi
-
Te võtate iga andme punkti, leiate kui kaugel need on
-
valimi keskmisest
-
Võtate need ruutu.
-
Ja siis te võtate keskmise nendest ruutudest väljaarvatud
-
üks väike erinev
-
i on võrnde 1ga kuni 1 võrdne n-ga
-
Selleasemel et jagada n-ga te jagate selle natukene
-
väiksema numbriga.
-
Jagate selle n-1 ga
-
Kui te jagate minu n-1 selle asemel et jagada
-
n-ga siis te saate natukene suurema numbri siia.
-
Ja tuleb välja et see on tegelikult
-
parem hinnang.
-
Ja ühel päeval ma kirjutan arvuti programmi mis vähemalt
-
tõestab mulle eksperimendi kaudu et see on
-
parem hinnang kogumi dispersiooniks.
-
Ja te arvutate seda samamoodi.
-
Lihtsalt jagate n-1 ga
-
Teine viis kuidas sellest mõelda, ja tegelikult ei-
-
Mul on aeg otsas.
-
Ma jätan teid siia nüüd.
-
Ja järgmises videos me teeme mõned
-
arvutused et te saaksite rohkem aru
-
nendest ideedest.
-
Sest me läheme üsna abstraktseks.
-
Näeme järgmises videos.