< Return to Video

Central Limit Theorem

  • 0:00 - 0:00
    -
  • 0:00 - 0:03
    V tomhle videu chci mluvit
  • 0:03 - 0:07
    o jednom z nejzákladnější konceptů ve statistice,
  • 0:07 - 0:09
    či dokonce v matematice obecně.
  • 0:09 - 0:10
    A to je centrální limitní věta.
  • 0:10 - 0:17
    -
  • 0:17 - 0:19
    Říká nám, že můžeme pracovat
  • 0:19 - 0:22
    s jakýmkoli pravděpodobnostním rozdělením s definovaným průměrem a rozptylem.
  • 0:22 - 0:24
    Jestli má toto rozdělení nějaký rozptyl, má i určitou
  • 0:24 - 0:25
    směrodatnou odchylku.
  • 0:25 - 0:28
    A může jít o spojité nebo diskrétní rozdělení.
  • 0:28 - 0:30
    Nakreslím sem diskrétní pravděpodobnostní rozdělení,
  • 0:30 - 0:33
    protože je jednodušší si jej představit, aspoň tedy pro účel tohoto videa.
  • 0:33 - 0:35
    Řekněme tedy, že mám nějakou pravděpodobnostní funkci
  • 0:35 - 0:37
    diskrétního pravděpodobnostního rozdělení.
  • 0:37 - 0:40
    Musíme být opatrní, aby nevypadalo příliš
  • 0:40 - 0:42
    jako normální rozdělení, protože bych Vám rád ukázal,
  • 0:42 - 0:44
    k čemu je dobrá centrální limitní věta.
  • 0:44 - 0:45
    Řekněme tedy, že mám nějaké takové rozdělení.
  • 0:45 - 0:47
    Řekněme, že zde máme hodnoty od 1 do 6,
  • 0:47 - 0:51
    tedy 1, 2, 3, 4, 5, 6.
  • 0:51 - 0:53
    Je to nějaká poblázněná kostka.
  • 0:53 - 0:55
    Máme velkou pravděpodobnost, že padne 1, ale téměř nemožné,
  • 0:55 - 0:58
    ne tak nakřivo... takže máme velkou pravděpodobnost,
  • 0:58 - 1:01
    že padne 1, téměř nulovou pravděpodobnost, že padne 2,
  • 1:01 - 1:03
    jakž takž pravděpodobnost, že padne 3 nebo 4,
  • 1:03 - 1:05
    velmi malou pravděpodobnost, že padne 5.
  • 1:05 - 1:08
    A velkou pravděpodobnost, že padne 6.
  • 1:08 - 1:10
    Tohle je tedy pravděpodobnostní funkce našeho rozdělení.
  • 1:10 - 1:13
    Tohle je symetrické, takže kdybych nakreslil průměr,
  • 1:13 - 1:15
    byl by někde tady.
  • 1:15 - 1:16
    Přibližně v polovině.
  • 1:16 - 1:18
    Tohle by byl náš průměr.
  • 1:18 - 1:20
    Směrodatná odchylka by byla -
  • 1:20 - 1:23
    řekněme takhle daleko od průměru.
  • 1:23 - 1:25
    Ale tohle je tedy pravděpodobnostní funkce
  • 1:25 - 1:26
    mého pravděpodobnostního rozdělení.
  • 1:26 - 1:29
    Tentokrát nebudu jenom dělat výběry z tohoto rozdělení,
  • 1:29 - 1:33
    které je popsáno danou pravděpodobnostní funkci.
  • 1:33 - 1:36
    Totiž, budu dělat výběry,
  • 1:36 - 1:39
    ale z nich spočítám průměr a podívám se
  • 1:39 - 1:42
    na četnost jednotlivých takto získaných průměrů.
  • 1:42 - 1:43
    Tím myslím aritmetický průměr.
  • 1:43 - 1:46
    Řekněme tedy... nejprve si musíme určit
  • 1:46 - 1:49
    velikost výběru, mohlo by to být jakékoli číslo,
  • 1:49 - 1:58
    ale řekněme, že budeme dělat výběry o velikosti 4.
  • 1:58 - 1:59
    Což znamená, že budeme vybírat 4
  • 1:59 - 2:00
    hodnoty z tohoto rozdělení.
  • 2:00 - 2:03
    Takže poprvé vezmeme 4 hodnoty.
  • 2:03 - 2:04
    Velikost našeho výběru se rovná 4.
  • 2:04 - 2:08
    Řekněme, že takto dostaneme 1, pak znovu 1,
  • 2:08 - 2:11
    pak 3 a pak 6.
  • 2:11 - 2:15
    Tohle je náš první výběr velikosti 4.
  • 2:15 - 2:17
    Vím, že terminologie je možná trochu matoucí.
  • 2:17 - 2:20
    Vybereme zkrátka 4 hodnoty, a to bude náš první výběr.
  • 2:20 - 2:23
    Vždycky, když mluvíme o výběrovém průměru
  • 2:23 - 2:26
    a výběrovém rozdělení výběrového průměru,
  • 2:26 - 2:30
    o čemž bude řeč v dalších videích,
  • 2:30 - 2:33
    jedná se o výběr několika hodnot z původního pravděpodobnostního rozdělení.
  • 2:33 - 2:36
    A velikost výběru nám říká,
  • 2:36 - 2:37
    kolik hodnot takto tedy vybereme.
  • 2:37 - 2:40
    Ale někdy se může terminologie zdát trochu matoucí,
  • 2:40 - 2:42
    protože někdo může nazývat výběrem pouze jednu z těchto hodnot.
  • 2:42 - 2:44
    Ale my máme hodnoty čtyři.
  • 2:44 - 2:46
    Máme výběr o velikosti 4.
  • 2:46 - 2:48
    A co teď udělám je, že je zprůměruji.
  • 2:48 - 2:51
    Takže řekněme, že průměr -
  • 2:51 - 2:55
    s tímhle musíme být opatrní - kolik je průměr těchto 4 hodnot?
  • 2:55 - 2:56
    1 plus 1 je 2.
  • 2:56 - 2:58
    2 plus 3 je 5.
  • 2:58 - 3:00
    5 plus 6 je 11.
  • 3:00 - 3:06
    11 děleno 4 je 2,75.
  • 3:06 - 3:11
    Tohle je náš první výběrový průměr z výběru o velikosti 4.
  • 3:11 - 3:12
    Zkusme udělat další.
  • 3:12 - 3:14
    Můj druhý výběr o velikosti 4 je tento.
  • 3:14 - 3:21
    Řekněme, že dostaneme 3, 4, pak další 3,
  • 3:21 - 3:22
    pak třeba 1.
  • 3:22 - 3:23
    Tentokrát nepadne šestka.
  • 3:23 - 3:25
    A 2 ani 5 nemůže padnout.
  • 3:25 - 3:27
    Pro tohoto rozdělení je to nemožné.
  • 3:27 - 3:29
    Protože pravděpodobnost,
    že padne 2 či 5, je rovna 0.
  • 3:29 - 3:31
    Takže nemůžu získat dvojku ani pětku.
  • 3:31 - 3:38
    Takže pro druhý výběr o velikosti 4
  • 3:38 - 3:42
    bude výběrový průměr roven 3 plus 4, což je 7.
  • 3:42 - 3:46
    7 plus 3 je 10 plus 1 je 11.
  • 3:46 - 3:50
    11 děleno 4 je zase 2,75.
  • 3:50 - 3:52
    Uděláme ještě jeden výběr, aby bylo jasné,
  • 3:52 - 3:53
    co to tady provádíme.
  • 3:53 - 3:55
    Takže ještě jeden... ve skutečnosti bychom jich dělali obrovské množství,
  • 3:55 - 3:57
    ale pro ilustraci už jen jeden.
  • 3:57 - 4:01
    Takže máme třetí výběr velikosti 4.
  • 4:01 - 4:03
    Vybereme tedy 4 hodnoty.
  • 4:03 - 4:06
    Náš výběr se skládá ze 4 hodnot z původního
  • 4:06 - 4:08
    bláznivého rozdělení.
  • 4:08 - 4:13
    Řekněme, že padne 1, 1, 6 a 6.
  • 4:13 - 4:19
    Takže náš třetí výběrový průměr se rovná 1 plus 1, což je 2,
  • 4:19 - 4:20
    2 plus 6 je 8.
  • 4:20 - 4:22
    8 plus 6 je 14.
  • 4:22 - 4:27
    14 děleno 4 je 3,5.
  • 4:27 - 4:30
    -
  • 4:30 - 4:33
    Takhle zjistíme výběrové průměry.
  • 4:33 - 4:37
    Pro každý výběr velikosti 4 spočítáme průměr.
  • 4:37 - 4:40
    A jakmile toto uděláme, zakreslíme jejich četnost.
  • 4:40 - 4:44
    A tohle pro Vás bude překvapení.
  • 4:44 - 4:46
    Takže zakreslíme četnost průměrů.
  • 4:46 - 4:49
    Řekněme, dobře, můj první výběrový průměr
  • 4:49 - 4:52
    byl roven 2,75.
  • 4:52 - 4:55
    Vlastně kreslíme četnost výběrových průměrů
  • 4:55 - 4:56
    z jednotlivých výběrů.
  • 4:56 - 4:59
    Poprvé jsme dostali 2,75.
  • 4:59 - 5:00
    Takže to sem zakreslíme.
  • 5:00 - 5:02
    Tohle je hodnota průměru z prvního výběru.
  • 5:02 - 5:05
    Podruhé jsme ale dostali také 2,75.
  • 5:05 - 5:07
    Takže to sem opět zakreslíme.
  • 5:07 - 5:08
    Dostali jsme tento průměr dvakrát.
  • 5:08 - 5:10
    Nakreslíme si sem četnost.
  • 5:10 - 5:11
    Pak jsme dostali hodnotu 3,5.
  • 5:11 - 5:14
    Mohli jsme získat řadu hodnot, třeba 3
  • 5:14 - 5:17
    nebo 3,25 nebo 3,5.
  • 5:17 - 5:20
    Nám zrovna vyšlo 3,5, což sem právě kreslím.
  • 5:20 - 5:21
    A co teď uděláme, bude, že budeme provádět
  • 5:21 - 5:23
    další a další výběry.
  • 5:23 - 5:25
    Třeba 10 000 výběrů.
  • 5:25 - 5:27
    Takže budeme dělat další výběry,
  • 5:27 - 5:30
    dokud jich nebude 10 000.
  • 5:30 - 5:31
    Prostě hromada výběrů.
  • 5:31 - 5:34
    A po čase tohle bude vypadat nějak takto.
  • 5:34 - 5:37
    Nakreslím to sem jenom jako tečky.
  • 5:37 - 5:41
    Takže když se na to podíváme,
  • 5:41 - 5:43
    tak tady máme všechny možné hodnoty, které bychom mohli získat.
  • 5:43 - 5:45
    Tak třeba 2,75 by mohlo být někde tady.
  • 5:45 - 5:49
    To bude takhle první tečka zde.
  • 5:49 - 5:52
    A druhá tečka bude právě zde.
  • 5:52 - 5:57
    A tahle třetí tečka zde odpovídá průměru 3,5.
  • 5:57 - 5:58
    Uděláme totéž 10 000 krát.
  • 5:58 - 5:59
    Budeme tedy mít 10 000 výběrových průměrů.
  • 5:59 - 6:00
    Tyhle průměry si sem
  • 6:00 - 6:02
    vždycky zakreslíme.
  • 6:02 - 6:04
    Zakreslíme tedy četnosti jednotlivých průměrů.
  • 6:04 - 6:07
    Budeme je zakreslovat
  • 6:07 - 6:08
    znovu a znovu.
  • 6:08 - 6:10
    A to, co uvidíte, je, že pokud budeme opakovaně provádět
  • 6:10 - 6:13
    výběry o velikosti 4,
  • 6:13 - 6:15
    začne se nám tohle podobat
  • 6:15 - 6:18
    přibližně normálnímu rozdělení.
  • 6:18 - 6:22
    Každá z těchto teček odpovídá výskytu jednoho výběrového průměru.
  • 6:22 - 6:25
    Když budeme navyšovat tento sloupec, znamená to,
  • 6:25 - 6:28
    že se nám opakovaně vyskytl výběrový průměr 2,75.
  • 6:28 - 6:30
    Po čase získáme něco, co bude
  • 6:30 - 6:33
    vypadat přibližně jako normální rozdělení.
  • 6:33 - 6:36
    A tohle je ta skvělá věc ohledně centrální limitní věty.
  • 6:36 - 6:39
    Tohle je ukázka platnosti centrální limitní věty
  • 6:39 - 6:42
    pro velikost výběru 4.
  • 6:42 - 6:45
    Toto byl výběr o velikosti 4.
  • 6:45 - 6:50
    Ale mohli bychom provést totéž s výběrem třeba o velikosti 20,
  • 6:50 - 6:52
    takže bychom místo 4 hodnot vždy vybrali 20 hodnot
  • 6:52 - 6:57
    z tohoto bláznivého rozdělení,
  • 6:57 - 7:00
    a pak těchto 20 hodnot zprůměrovali
  • 7:00 - 7:03
    a pak zakreslili výběrové průměry sem.
  • 7:03 - 7:05
    V tomto případě budeme mít rozdělení,
  • 7:05 - 7:07
    které bude vypadat přibližně takto, ale
  • 7:07 - 7:09
    o tom se pobavíme v dalších videích podrobněji.
  • 7:09 - 7:13
    Ale ukazuje se, že zakreslíme-li 10 000 výběrových průměrů,
  • 7:13 - 7:15
    bude platit následující:
  • 7:15 - 7:18
    bude se to ještě více blížit
  • 7:18 - 7:19
    normálnímu rozdělení.
  • 7:19 - 7:20
    A v dalších videích uvidíme, že ve skutečnosti
  • 7:20 - 7:24
    bude mít toto rozdělení menší... musím to říct jasně...
  • 7:24 - 7:26
    bude mít stejný průměr.
  • 7:26 - 7:27
    Tohle je průměr.
  • 7:27 - 7:29
    A tohle bude mít stejný průměr.
  • 7:29 - 7:31
    Ale bude to mít menší směrodatnou odchylku.
  • 7:31 - 7:34
    Měl bych tohle kreslit zespodu,
  • 7:34 - 7:34
    protože se to tady jakoby hromadí.
  • 7:34 - 7:37
    Tohle je první případ a další a další.
  • 7:37 - 7:39
    Ale po čase se to bude čím dál více blížit
  • 7:39 - 7:40
    normálnímu rozdělení.
  • 7:40 - 7:44
    A ve skutečnosti tedy - což je naprosto dokonalé ohledně
  • 7:44 - 7:53
    centrální limitní věty - ve skutečnosti s rostoucím rozsahem výběru
  • 7:53 - 7:55
    neboli když se výběr blíží nekonečnu,
  • 7:55 - 7:58
    se tohle bude blížit normálnímu rozdělení, i když nepotřebujeme ani
  • 7:58 - 7:59
    výběr velikosti blízko nekončenu.
  • 7:59 - 8:02
    I když máme třeba výběr o velikosti 10 nebo 20,
  • 8:02 - 8:04
    dostaneme se již blízko k normálnímu rozdělení.
  • 8:04 - 8:06
    Ve skutečnosti něco podobného vídáme i
  • 8:06 - 8:07
    v běžném životě.
  • 8:07 - 8:10
    Nejlepší je, že můžeme vyjít i z nějakého
  • 8:10 - 8:11
    bláznivého rozdělení.
  • 8:11 - 8:14
    Tohle rozdělení nemá s normálním rozdělením nic společného.
  • 8:14 - 8:16
    Zde jsme měli výběr o velikosti 4.
  • 8:16 - 8:20
    Ale mohli bychom mít výběr o velikosti 10 nebo 100,
  • 8:20 - 8:23
    pak bychom vybírali místo 4 hodnot 100 a zprůměrovali je,
  • 8:23 - 8:25
    načež bychom zakreslili četnosti těchto průměrů.
  • 8:25 - 8:27
    Opakovali bychom to s dalšími a dalšími výběry velikosti 100,
  • 8:27 - 8:28
    získali bychom průměr, znovu jej zakreslili.
  • 8:28 - 8:31
    A pokud bychom to udělali mnohokrát,
  • 8:31 - 8:33
    pokud bychom měli nekonečný počet těchto výběrů,
  • 8:33 - 8:35
    a zejména pokud bychom navíc měli výběry o velikosti nekonečno,
  • 8:35 - 8:38
    pak bychom dostali přesně normální rozdělení.
  • 8:38 - 8:39
    Tohle je ta bláznivá věc ohledně centrální limitní věty.
  • 8:39 - 8:42
    A netýká se to pouze výběrového průměru.
  • 8:42 - 8:45
    Zde jsme vždycky dělali výběrový průměr,
  • 8:45 - 8:47
    ale mohli bychom hodnoty třeba sčítat.
  • 8:47 - 8:49
    I tak by centrální limitní věta platila.
  • 8:49 - 8:51
    Což je opravdu užitečné.
  • 8:51 - 8:54
    Protože v běžném životě máme mnoho různých jevů,
  • 8:54 - 8:57
    bílkoviny narážející do sebe, lidé dělající potrhlosti,
  • 8:57 - 9:01
    nebo různé podivné lidské interakce.
  • 9:01 - 9:03
    A jejich pravděpodobnostní rozdělení
  • 9:03 - 9:04
    častokrát neznáme.
  • 9:04 - 9:07
    Ale to, co nám říká centrální limitní věta, je, že
  • 9:07 - 9:10
    pokud se tyto činnosti budou opakovat
  • 9:10 - 9:13
    za předpokladu, že mají stále stejné rozdělení,
  • 9:13 - 9:15
    pak zakreslíme-li četnost
  • 9:15 - 9:18
    průměrných hodnot, dostaneme normální
  • 9:18 - 9:19
    rozdělení.
  • 9:19 - 9:22
    A proto se ukazuje, že normální rozdělení
  • 9:22 - 9:27
    je ve statistice velmi dobrým způsobem,
  • 9:27 - 9:30
    jak aproximovat součty nebo průměry
  • 9:30 - 9:31
    mnohých jevů.
  • 9:31 - 9:34
    Normální rozdělení.
  • 9:34 - 9:36
    To, co ukážu v dalších videích, je
  • 9:36 - 9:38
    že tohle skutečně platí.
  • 9:38 - 9:41
    Že s rostoucím rozsahem výběru, tedy
  • 9:41 - 9:43
    s vyšším počtem n, a s rostoucím počtem opakování
  • 9:43 - 9:46
    získáme graf četností velmi, velmi blízký
  • 9:46 - 9:48
    normálnímu rozdělení.
  • 9:48 - 9:48
    -
Title:
Central Limit Theorem
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
09:49
Amara Bot edited Czech subtitles for Central Limit Theorem

Czech subtitles

Revisions