< Return to Video

Central Limit Theorem

  • 0:00 - 0:03
    In this video I want to talk about what is easily one of the
    在這段影片裡,我想簡單地談談一個
  • 0:03 - 0:07
    most fundamental and profound concepts in statistics and
    最基本和深刻的概念,在統計學以及
  • 0:07 - 0:09
    maybe in all of mathematics.
    也許是在所有的數學領域之中。
  • 0:09 - 0:10
    And that's the central limit theorem.
    而那就是「中央極限定理」。
  • 0:17 - 0:19
    它告訴我們的是我們可以先開始與任何
  • 0:19 - 0:22
    有明確的均值與方差的分佈。
  • 0:22 - 0:24
    如果有明確的方差,它具有明確
  • 0:24 - 0:25
    標準差。
  • 0:25 - 0:28
    它可以是一個連續的分佈或一個離散。
  • 0:28 - 0:30
    只是因為很容易,我就畫一個離散
  • 0:30 - 0:33
    想像一下至少為這段視頻的目的。
  • 0:33 - 0:35
    所以我們可以說我有一個謹慎的概率
  • 0:35 - 0:37
    分佈函數。
  • 0:37 - 0:40
    並要非常小心,不要讓它看起來什麼
  • 0:40 - 0:42
    正態分佈關閉,因為我想給你們看
  • 0:42 - 0:44
    中心極限定理的力量。
  • 0:44 - 0:45
    所以我們可以說我有分佈。
  • 0:45 - 0:47
    讓我們說它可以通過值 1
  • 0:47 - 0:51
    6: 1,2,3,4,5,6。
  • 0:51 - 0:53
    它是一種瘋狂的骰子。
  • 0:53 - 0:55
    這是很有可能獲得 1,倒不如說它是不可能的 — — 讓
  • 0:55 - 0:58
    我使直行-你的可能性很大
  • 0:58 - 1:01
    獲得 1,倒不如說它是不可能讓我們把 2,
  • 1:01 - 1:03
    說它是 OK 的 3 或 4 的可能性。
  • 1:03 - 1:05
    讓我們說這是不可能得到 5。
  • 1:05 - 1:08
    倒不如說它是為了得到 6 那很有可能。
  • 1:08 - 1:10
    這就是我的概率分佈函數。
  • 1:10 - 1:13
    要是要繪製一個意思,這是對稱的所以也許意味著
  • 1:13 - 1:15
    也許是這樣。
  • 1:15 - 1:16
    平均會中途。
  • 1:16 - 1:18
    所以,那將是我在那兒的意思。
  • 1:18 - 1:20
    標準差也許會看看 — — 它會
  • 1:20 - 1:23
    那麼遠,遠高於和低於平均值。
  • 1:23 - 1:25
    但這是我謹慎的概率
  • 1:25 - 1:26
    分佈函數。
  • 1:26 - 1:29
    現在什麼我就不在這裡,而不是只抽取樣本
  • 1:29 - 1:33
    這是所描述的這個概率的隨機變數
  • 1:33 - 1:36
    分佈函數,我要去抽取的樣本。
  • 1:36 - 1:39
    但我會平均樣本,然後再看看那些
  • 1:39 - 1:42
    樣本,看得到的平均值的頻率。
  • 1:42 - 1:43
    而當我說平均意思意思。
  • 1:43 - 1:46
    讓我們說,讓我說讓我們定義一些東西 — — 我
  • 1:46 - 1:49
    樣本大小和我可以把任何號碼放在這兒,但讓我們說
  • 1:49 - 1:58
    首先關閉我們嘗試 n 的樣本量是等於 4。
  • 1:58 - 1:59
    那手段是我要去取 4
  • 1:59 - 2:00
    這種標本。
  • 2:00 - 2:03
    所以我們可以說 4 採樣的第一次。
  • 2:03 - 2:04
    所以我的樣本量為 4。
  • 2:04 - 2:08
    讓我們說我得到 1,說我讓另一個 1,讓我們說
  • 2:08 - 2:11
    我 3,並且我得了 6。
  • 2:11 - 2:15
    所以,是我的第一個樣本的樣本大小 4。
  • 2:15 - 2:17
    我知道,因為這是很容易造成混亂的術語
  • 2:17 - 2:20
    4 樣本組成的示例。
  • 2:20 - 2:23
    但當我們談論均值和取樣
  • 2:23 - 2:26
    分佈的均值,我們再談一談
  • 2:26 - 2:30
    更多關於對下一步的一些視頻,通常的示例
  • 2:30 - 2:33
    指從您分發的樣本集。
  • 2:33 - 2:36
    樣本大小會告訴你多少你拍
  • 2:36 - 2:37
    從你的分佈。
  • 2:37 - 2:40
    但術語可能非常混亂,因為您可以
  • 2:40 - 2:42
    輕鬆地查看示例為其中之一。
  • 2:42 - 2:44
    但我們正在從這裡 4 樣本。
  • 2:44 - 2:46
    我們的樣本大小為 4。
  • 2:46 - 2:48
    要做的就是我會和他們平均。
  • 2:48 - 2:51
    所以讓我們說的意思 — — 去時要非常小心我
  • 2:51 - 2:55
    說平均-均值的大小 4 的這第一個示例是什麼呢?
  • 2:55 - 2:56
    1 加 1 等於 2。
  • 2:56 - 2:58
    2 加 3 等於 5。
  • 2:58 - 3:00
    5 加 6 是 11。
  • 3:00 - 3:06
    11 除以 4 是 2.75。
  • 3:06 - 3:11
    這是大小的我第一次的樣本平均值為我的第一個樣本 4。
  • 3:11 - 3:12
    讓我做另一個。
  • 3:12 - 3:14
    我的大小 4 的第二個示例。
  • 3:14 - 3:21
    讓我們說我得到的 3,4,讓我們說我得到另一個 3,
  • 3:21 - 3:22
    讓我們說我去 1。
  • 3:22 - 3:23
    我只是去 6 當時沒有發生。
  • 3:23 - 3:25
    並注意拿不出 2 或 5。
  • 3:25 - 3:27
    這是不可能的這種分佈。
  • 3:27 - 3:29
    2 或 5 的概率為零。
  • 3:29 - 3:31
    所以我不能有任何的 2 或 5 的在這裡。
  • 3:31 - 3:38
    所以對於這第二個示例的示例大小 4,我的樣本均值-
  • 3:38 - 3:42
    所以我第二個示例的意思要 3 加 4 是 7。
  • 3:42 - 3:46
    7 加 3 是 10 加 1 是 11。
  • 3:46 - 3:50
    再一次除以 4 11 是 2.75。
  • 3:50 - 3:52
    讓我做一個更多,因為我真的想清楚
  • 3:52 - 3:53
    我們正在做。
  • 3:53 - 3:55
    所以我做了一個更多 — — 其實我們要做上億
  • 3:55 - 3:57
    更多,但讓我來做一個更多的細節。
  • 3:57 - 4:01
    所以說我的第三個樣本的樣本 4 我讓 — — 一些我
  • 4:01 - 4:03
    去是變相 4 樣本。
  • 4:03 - 4:06
    因此我的樣本是從這原 4 樣本組成
  • 4:06 - 4:08
    瘋狂的分佈。
  • 4:08 - 4:13
    讓我們假設一下 1、 1、 6 和 6。
  • 4:13 - 4:19
    所以我的第三個樣本平均值將會 1 加 1 2。
  • 4:19 - 4:20
    2 加 6 是 8。
  • 4:20 - 4:22
    8 加 6 是 14。
  • 4:22 - 4:27
    14 除以 4 為 3.5 分。
  • 4:30 - 4:33
    當我找到的這些示例手段 — — 每個這樣的每個
  • 4:33 - 4:37
    我的樣本的樣本大小的 4 我想出一個意思 — — 和我一樣
  • 4:37 - 4:40
    每個我想它繪製的頻率分佈。
  • 4:40 - 4:44
    而這就是所有的一切都會驚奇你在幾秒鐘。
  • 4:44 - 4:46
    所以我繪製頻率分佈的這一切。
  • 4:46 - 4:49
    所以我說,好吧,我第一次品嘗我第一次
  • 4:49 - 4:52
    樣本平均值是 2.75。
  • 4:52 - 4:55
    所以我在計畫的實際示例手段的頻率
  • 4:55 - 4:56
    我獲得了每個樣本。
  • 4:56 - 4:59
    所以 2.75,我把它一次。
  • 4:59 - 5:00
    所以我會放一小塊。
  • 5:00 - 5:02
    這就是從那就在那兒。
  • 5:02 - 5:05
    並在下一次我還得到了 2.75。
  • 5:05 - 5:07
    這就是 2.75 那裡。
  • 5:07 - 5:08
    所以我把它兩次。
  • 5:08 - 5:10
    所以我會繪製的頻率就在那兒。
  • 5:10 - 5:11
    然後我得到了一個 3.5。
  • 5:11 - 5:14
    所以所有可能的值,我可能有 3、 能
  • 5:14 - 5:17
    3.25,我能有一個 3.5。
  • 5:17 - 5:20
    於是我了 3.5,所以我會繪製它就在那裡。
  • 5:20 - 5:21
    要做的就是我要保持
  • 5:21 - 5:23
    採取這些示例。
  • 5:23 - 5:25
    也許我會一萬人。
  • 5:25 - 5:27
    所以我會繼續採取這些示例。
  • 5:27 - 5:30
    所以我去一路到 s 10,000。
  • 5:30 - 5:31
    我只是做了一堆的這些。
  • 5:31 - 5:34
    隨著時間的推移,看起來像什麼是每個
  • 5:34 - 5:37
    我要去做點,因為我要去要縮小。
  • 5:37 - 5:41
    所以如果我這樣看著它,隨著時間推移,它仍然具有全部
  • 5:41 - 5:43
    值之一,它可能是能夠承擔。
  • 5:43 - 5:45
    你知道,2.75 可能在這兒。
  • 5:45 - 5:49
    所以這第一次點將會在這一權利這裡
  • 5:49 - 5:52
    就在那裡,這二人會正確的
  • 5:52 - 5:57
    然後一個 3.5 去那裡看看。
  • 5:57 - 5:58
    但我要去做它 10000 倍,所以我
  • 5:58 - 5:59
    要有 10000 次左右。
  • 5:59 - 6:00
    讓我們說,做到,我要去只是
  • 6:00 - 6:02
    保持對它們進行繪製。
  • 6:02 - 6:04
    我現在要保持策劃的頻率。
  • 6:04 - 6:07
    我只想保持對它們進行繪製和
  • 6:07 - 6:08
    反復。
  • 6:08 - 6:10
    你要去看就是很多,需要很多
  • 6:10 - 6:13
    4 大小的樣品。
  • 6:13 - 6:15
    我要去就要開始的東西
  • 6:15 - 6:18
    種近似正態分佈。
  • 6:18 - 6:22
    所以每個小圓代表樣本平均值的發生率。
  • 6:22 - 6:25
    所以,當我一直對此列的右側添加在這裡這意味著
  • 6:25 - 6:28
    我一直聽到 2.75 均值。
  • 6:28 - 6:30
    因此,隨著時間的推移,我要去有什麼,已經開始
  • 6:30 - 6:33
    近似正態分佈。
  • 6:33 - 6:36
    而這正是中心極限定理的有趣的事情。
  • 6:36 - 6:39
    所以中央的限制,而這是如此 — — 所以在
  • 6:39 - 6:42
    橙色,n 的情況是,等於 4。
  • 6:42 - 6:45
    這是 4 的樣本大小。
  • 6:45 - 6:50
    現在,如果我做同樣的事情也許 20 樣本大小。
  • 6:50 - 6:52
    所以在這種情況下而不只以 4 樣品從我
  • 6:52 - 6:57
    瘋狂的初始分配每個示例我帶 20
  • 6:57 - 7:00
    我隨機變數的實例和我平均那些 20,然後
  • 7:00 - 7:03
    我繪製均值在這裡。
  • 7:03 - 7:05
    所以在這種情況下,我要去有分佈
  • 7:05 - 7:07
    看起來像這樣。
  • 7:07 - 7:09
    更多的視頻中,我們將討論這。
  • 7:09 - 7:13
    但事實證明我要是出圖的示例手段 10,000
  • 7:13 - 7:15
    在這裡,我要去有這兩件事:
  • 7:15 - 7:18
    它要更接近正常
  • 7:18 - 7:19
    分佈。
  • 7:19 - 7:20
    我們打算在將來看到它實際上是的視頻和
  • 7:20 - 7:24
    前往有小 — — 嗯,讓我清楚 — — 它會
  • 7:24 - 7:26
    有相同的平均值。
  • 7:26 - 7:27
    這就是中庸。
  • 7:27 - 7:29
    這去有相同的平均值。
  • 7:29 - 7:31
    這會有較小的標準差。
  • 7:31 - 7:34
    所以我要繪製這些從底部因為
  • 7:34 - 7:34
    你種堆疊它。
  • 7:34 - 7:37
    一個你 1,然後另一個實例,然後另一個實例。
  • 7:37 - 7:39
    但這越來越多的探討
  • 7:39 - 7:40
    正態分佈。
  • 7:40 - 7:44
    所以,現實是 — — 這是關於超級酷的
  • 7:44 - 7:53
    中心極限定理 — — 作為樣本容量變得更大,
  • 7:53 - 7:55
    你甚至可以說或接近無限,但你
  • 7:55 - 7:58
    真的沒有達到目標,以便真正獲得無限接近于
  • 7:58 - 7:59
    接近正態分佈。
  • 7:59 - 8:02
    即使你的樣本大小為 10 或 20,你已經
  • 8:02 - 8:04
    已經非常接近于正態分佈。
  • 8:04 - 8:06
    事實上,約好逼近,正如我們所看到的
  • 8:06 - 8:07
    在我們的日常生活。
  • 8:07 - 8:10
    但酷的是我們可以從一些瘋狂開始
  • 8:10 - 8:11
    分佈,正確嗎?
  • 8:11 - 8:14
    這與正態分佈無關。
  • 8:14 - 8:16
    但如果我們有一個樣本大小 — — 這是 n 等於 4 — — 但如果我們
  • 8:16 - 8:20
    有 n 等於 10 的樣本量或 n 等於 100,和我們
  • 8:20 - 8:23
    其中的 4 這裡而不是 100,他們的平均和
  • 8:23 - 8:25
    然後繪製的平均水準,它的頻率。
  • 8:25 - 8:27
    然後我們採取 100 再次,他們的平均,
  • 8:27 - 8:28
    意思是,再次繪製的。
  • 8:28 - 8:31
    如果我們都這樣做了大量的時間,事實上,如果我們
  • 8:31 - 8:33
    這樣做無限的時間,我們會發現 — —
  • 8:33 - 8:35
    特別是,如果我們有無限的樣本 — — 我們
  • 8:35 - 8:38
    會找到完美的正態分佈。
  • 8:38 - 8:39
    這是瘋狂的事情。
  • 8:39 - 8:42
    並不會只是對採取樣本平均值。
  • 8:42 - 8:45
    在這裡我們把樣本平均值每一次,但也可以
  • 8:45 - 8:47
    此外採取樣本總和。
  • 8:47 - 8:49
    中心極限定理會仍然適用。
  • 8:49 - 8:51
    但這才是如此超有用的知識。
  • 8:51 - 8:54
    因為在生活中有各種各樣的過程,
  • 8:54 - 8:57
    撞到對方,人做著瘋狂的蛋白質
  • 8:57 - 9:01
    東西,人類以奇怪的方式進行交互。
  • 9:01 - 9:03
    你不知道的概率分佈
  • 9:03 - 9:04
    對於這些東西的任何功能。
  • 9:04 - 9:07
    他們告訴我們的中心極限定理是什麼,但如果我們
  • 9:07 - 9:10
    添加這些行動的一群,假定他們
  • 9:10 - 9:13
    所有具有相同的分佈,或如果我們採取中庸
  • 9:13 - 9:15
    所有這些行動統一起來的如果我們要繪製
  • 9:15 - 9:18
    這些手段的頻率,我們得到正常
  • 9:18 - 9:19
    分佈。
  • 9:19 - 9:22
    坦率地說是正態分佈顯示為什麼這樣
  • 9:22 - 9:27
    統計和為什麼坦白地說這是很好很多
  • 9:27 - 9:30
    逼近的總和或大量的手段
  • 9:30 - 9:31
    過程。
  • 9:31 - 9:34
    正態分佈。
  • 9:34 - 9:36
    我要向你們展示的下一個視頻是我其實是
  • 9:36 - 9:38
    要給你們看這是一個現實。
  • 9:38 - 9:41
    當您增加您的樣本,當你增加
  • 9:41 - 9:43
    你 n,如你花費了大量的樣本,你也許會
  • 9:43 - 9:46
    有一塊頻率看起來非常、 非常靠近
  • 9:46 - 9:48
    正態分佈。
Title:
Central Limit Theorem
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
09:49

Chinese (Traditional, Taiwan) subtitles

Incomplete

Revisions