< Return to Video

Statistics: Sample Variance

  • 0:01 - 0:03
    這段影片在這裡是動土儀式影片
  • 0:03 - 0:05
    多方面的原因。
  • 0:05 - 0:10
    一、 我要向您介紹的示例中,方差
  • 0:10 - 0:12
    這有趣它在其自己的權利。
  • 0:12 - 0:15
    我試圖在 HD 中記錄這段影片。
  • 0:15 - 0:16
    我希望你能看到它更大、 更清晰
  • 0:16 - 0:17
    比以往任何時候。
  • 0:17 - 0:19
    但我們將會看到如何,一切進展順利。
  • 0:19 - 0:22
    這就是有點實驗,所以和我一起承擔。
  • 0:22 - 0:25
    所以,只是之前我們進入的一個樣本,方差,但我
  • 0:25 - 0:28
    認爲這是有教育意義,審查方差
  • 0:28 - 0:29
    人口。
  • 0:29 - 0:32
    我們可以比較一下他們的公式。
  • 0:32 - 0:35
    人口 — — 的方差是這希臘
  • 0:35 - 0:36
    西格瑪的信。
  • 0:36 - 0:37
    小寫西格瑪的平方。
  • 0:37 - 0:38
    這意味著,方差。
  • 0:38 - 0:41
    我知道這很奇怪,已經一個變量
  • 0:41 - 0:42
    有一個正方形。
  • 0:42 - 0:43
    你不平方變量。
  • 0:43 - 0:44
    這是該變量。
  • 0:44 - 0:46
    西格瑪的平方的均方差。
  • 0:46 - 0:47
    其實,讓我寫下來。
  • 0:47 - 0:48
    這等於方差。
  • 0:52 - 0:55
    這就是等於 — — 你把每個數據點--和
  • 0:55 - 0:59
    我們打電話給他們 x 子我。
  • 0:59 - 1:02
    你把每個數據點的找出它從有多遠
  • 1:02 - 1:09
    人口,你平方米,意思是,然後,你取
  • 1:09 - 1:11
    所有的那些的平均水平。
  • 1:11 - 1:13
    以便您采取平均,你它們求和起來。
  • 1:13 - 1:14
    你從我去等於 1。
  • 1:14 - 1:18
    所以從第一點,一直到第 n 個點。
  • 1:18 - 1:20
    然後,以平均,你它們求和起來,並與
  • 1:20 - 1:22
    然後你除以 n。
  • 1:22 - 1:26
    所以造成差異的原因是這些平方距離的平均值
  • 1:26 - 1:27
    每個點的平均值。
  • 1:27 - 1:30
    並讓我給你的直覺,它本質上是
  • 1:30 - 1:33
    說,平均而言,每個人大概很遠的地方是
  • 1:33 - 1:34
    中間的點。
  • 1:34 - 1:36
    這是想到方差的最佳方法。
  • 1:36 - 1:38
    現在如果我們處理 — — 這是
  • 1:38 - 1:39
    人口、 正確嗎?
  • 1:39 - 1:42
    我們說: 如果我們想要弄清楚的方差
  • 1:42 - 1:45
    在該國的男人的高地,它將很難
  • 1:45 - 1:46
    找出人口的方差。
  • 1:46 - 1:49
    你必須去,本質上,測量
  • 1:49 - 1:50
    每個人的高度。
  • 1:50 - 1:51
    2 億 5000 萬人。
  • 1:51 - 1:55
    如果不是只是一些人口或
  • 1:55 - 1:57
    完全不可能有一些或數據
  • 1:57 - 1:58
    隨機變數。
  • 1:58 - 1:59
    我們去到更晚些時候。
  • 1:59 - 2:03
    因此很多的時候你真的想要估計這種差異
  • 2:03 - 2:05
    通過采取一個樣本的方差。
  • 2:05 - 2:07
    相同的方式,你不能均值的人口,
  • 2:07 - 2:10
    但也許你想估計它通過獲取
  • 2:10 - 2:11
    樣本的意思。
  • 2:11 - 2:14
    我們了解到,在這第一次的影片中。
  • 2:14 - 2:18
    如果這是 — — 如果這就是整個人口。
  • 2:18 - 2:20
    這就是數以百萬計的數據點,或甚至數據點中
  • 2:20 - 2:22
    你永遠無法得到,因爲它是的未來
  • 2:22 - 2:23
    一個隨機變數。
  • 2:23 - 2:24
    這就是人口。
  • 2:27 - 2:32
    您可能只想看一個樣本估計的事情。
  • 2:32 - 2:35
    這其實是大多數的推斷
  • 2:35 - 2:36
    所有有關統計數字。
  • 2:36 - 2:39
    找出有關樣本的敘述統計信息
  • 2:39 - 2:41
    並使人口有關的推論。
  • 2:41 - 2:45
    讓我試試 100 人,如果它似乎對這種藥
  • 2:45 - 2:47
    統計學意義的結果,這種藥會
  • 2:47 - 2:49
    可能的工作作爲一個整體人口。
  • 2:49 - 2:50
    所以,這是它是什麽有關。
  • 2:50 - 2:52
    它是很重要的是要了解這一概念
  • 2:52 - 2:54
    而不是人口的樣本。
  • 2:54 - 2:58
    並能夠找到一個樣本的統計數字,
  • 2:58 - 3:00
    大多數情況下,可以描述人口或幫助我們
  • 3:00 - 3:04
    估計,他們稱之爲,人口的參數。
  • 3:04 - 3:07
    那麽是什麽意思的一個 — — 讓我重寫這些定義。
  • 3:07 - 3:09
    人口的意思是什麽?
  • 3:09 - 3:10
    我會做的紫色。
  • 3:10 - 3:12
    人口的紫色。
  • 3:12 - 3:14
    人口的平均值。
  • 3:14 - 3:20
    你只是把每個數據點中的人口,x 我。
  • 3:20 - 3:22
    你他們總結。
  • 3:22 - 3:24
    你開始的第一次的數據點與你去所有
  • 3:24 - 3:26
    點到第 n 個數據的方式。
  • 3:26 - 3:27
    你除以 n。
  • 3:27 - 3:28
    你都對它們進行求和,除以 n。
  • 3:28 - 3:29
    這就是中庸。
  • 3:29 - 3:30
    那麽你將它插入此公式。
  • 3:30 - 3:33
    你可以看到每個點從那中央有多遠
  • 3:33 - 3:34
    這意味著從的點。
  • 3:34 - 3:36
    你方差。
  • 3:36 - 3:40
    現在怎麽樣如果我們做爲一個樣本?
  • 3:40 - 3:43
    好吧,如果我們想要估計的人口的平均值
  • 3:43 - 3:47
    以某種方式計算意味著一個樣本,最好的事情我可以
  • 3:47 - 3:49
    --認爲,這些真的是種工程的公式。
  • 3:49 - 3:51
    這些都是人類說: 好吧最好的什麽
  • 3:51 - 3:52
    選取的樣本的方法?
  • 3:52 - 3:55
    我們能做的好全是樣本的真的拿我們的平均。
  • 3:55 - 3:57
    而這正是樣本平均值。
  • 3:57 - 3:59
    我們學到了第一個影片中,該符號 — —
  • 3:59 - 4:00
    公式是這幾乎完全相同。
  • 4:00 - 4:02
    只是表示法的不同。
  • 4:02 - 4:05
    而不是編寫畝,你寫過它的一條線的 x。
  • 4:05 - 4:09
    樣本平均值是平等的 — — 再一次,你把每個
  • 4:09 - 4:12
    現在在該示例中,不在整個人口中的數據點。
  • 4:12 - 4:16
    你總結他們從第一項,然後到
  • 4:16 - 4:17
    第 n 個,對吧?
  • 4:17 - 4:21
    他們說在此示例中有 n 數據點。
  • 4:21 - 4:23
    然後您將其劃分的數據點你有數。
  • 4:23 - 4:24
    不夠公平。
  • 4:24 - 4:26
    這真是同一公式。
  • 4:26 - 4:28
    我拿了人口、 平均的方式我說,好吧,如果我
  • 4:28 - 4:30
    只是有一個樣本,讓我只是把意思相同的方式。
  • 4:30 - 4:33
    這可能是平均的好估計
  • 4:33 - 4:34
    人口。
  • 4:34 - 4:36
    現在它變得有趣起來,當我們談論方差。
  • 4:36 - 4:39
    所以你自然的反應是確定,我有此示例。
  • 4:39 - 4:43
    如果我想爲什麽估計人口的方差
  • 4:43 - 4:45
    不要只是申請此同一公式基本上
  • 4:45 - 4:46
    樣品嗎?
  • 4:46 - 4:49
    這樣可能會說 — — 而這是實際樣本變異數。
  • 4:49 - 4:55
    他們使用公式 s 平方。
  • 4:55 - 4:58
    所以西格瑪是善良的 s 希臘字母等效於。
  • 4:58 - 5:00
    所以現在當我們正在處理樣品,我們
  • 5:00 - 5:01
    只是寫那裏的 s。
  • 5:01 - 5:02
    所以這是樣本變異數。
  • 5:02 - 5:03
    讓我寫下來。
  • 5:03 - 5:04
    樣本變異數。
  • 5:12 - 5:16
    這是 — — 所以我們只是可能會說,嗯,也許采取的好方法
  • 5:16 - 5:17
    樣本變異數是做相同的方式。
  • 5:17 - 5:24
    讓我們花的每個示例中間點的距離。
  • 5:24 - 5:27
    找出我們的樣本平均值從有多遠。
  • 5:27 - 5:29
    在這裡我們使用人口平均,但現在我們只使用
  • 5:29 - 5:31
    因爲這就是全部的意思是該示例可以告知我們。
  • 5:31 - 5:33
    我們不知道什麽是人口平均
  • 5:33 - 5:36
    不看整個人口。
  • 5:36 - 5:36
    采取的廣場。
  • 5:36 - 5:38
    這使得變得積極,它有其他屬性,
  • 5:38 - 5:40
    這以後我們就去。
  • 5:40 - 5:43
    然後把所有這些平方距離的平均值。
  • 5:43 - 5:45
    所以你把它從 — — 你它們求和起來。
  • 5:45 - 5:47
    還有 n 他們到一些向上,正確嗎?
  • 5:47 - 5:48
    小寫字母 n。
  • 5:48 - 5:52
    你除以小寫字母 n。
  • 5:52 - 5:53
    你說,這是一個很好的估計。
  • 5:53 - 5:56
    也不管這種差異是什麽,那可能是一個很好的估計
  • 5:56 - 5:57
    爲整個人口。
  • 5:57 - 6:01
    其實這是有些人常常指甚麽時候他們
  • 6:01 - 6:02
    談樣本變異數。
  • 6:02 - 6:05
    而有時它會實際上被稱爲這。
  • 6:05 - 6:08
    他們沒有把小小寫字母 n。
  • 6:08 - 6:10
    他們爲什麽這樣做的原因是因爲我們除以 n 和。
  • 6:10 - 6:12
    而你說,Sal 這裡的問題是什麽?
  • 6:12 - 6:14
    與問題 — — 和我會給你的直覺,因爲這
  • 6:14 - 6:16
    其實是用來讓我記住的東西。
  • 6:16 - 6:19
    我仍坦率地竭力與
  • 6:19 - 6:22
    在它後面的直覺。
  • 6:22 - 6:25
    嗯,我有種嚴格的直覺,但更多的
  • 6:25 - 6:27
    證明它對自己,這肯定是案件。
  • 6:27 - 6:28
    但是想想這樣。
  • 6:28 - 6:30
    如果有一串數字,而我就畫
  • 6:30 - 6:33
    在這裡號線。
  • 6:33 - 6:36
    如果我畫號線在這裡,所以讓我們說你知道-
  • 6:36 - 6:39
    並讓我們說在我人口的一串數字。
  • 6:39 - 6:42
    現在,讓我們說 — — 我只要隨機把一大堆
  • 6:42 - 6:44
    在我的人口中的數字。
  • 6:44 - 6:46
    與右邊的這些是比大
  • 6:46 - 6:46
    那些向左。
  • 6:49 - 6:53
    如果我是采取的其中一個樣本,也許我就帶 — —
  • 6:53 - 6:55
    該示例中,它是隨機的。
  • 6:55 - 6:56
    實際上,你想要一個隨機樣本。
  • 6:56 - 6:57
    你不想以任何方式被扭曲。
  • 6:57 - 7:03
    所以也許我采取這一、 這一、 這種,
  • 7:03 - 7:05
    和這個,對吧?
  • 7:05 - 7:07
    要是采取的這一數字的平均值,然後,
  • 7:07 - 7:08
    號碼,該號碼,該號碼。
  • 7:08 - 7:09
    它將是地方在中間。
  • 7:09 - 7:11
    它可能是某個地方那邊。
  • 7:11 - 7:13
    然後如果我想要找出樣本變異數使用
  • 7:13 - 7:17
    這一公式,我會說這個距離平方加這確定
  • 7:17 - 7:21
    距離平方加此距離平方加上,
  • 7:21 - 7:24
    距離的平方和平均他們全力以赴。
  • 7:24 - 7:25
    並就此號碼。
  • 7:25 - 7:28
    這也許會是一個不錯的近似
  • 7:28 - 7:30
    這整個人口的方差。
  • 7:30 - 7:32
    人口的平均大概去
  • 7:32 - 7:33
    --我不知道。
  • 7:33 - 7:35
    它可能是這麽漂亮。
  • 7:35 - 7:37
    如果我們采取的所有數據點,平均爲他們,
  • 7:37 - 7:39
    也許他們就像這裡的地方。
  • 7:39 - 7:41
    然後如果你弄明白超差,它也許會是
  • 7:41 - 7:44
    很接近的所有這些行,右平均嗎?
  • 7:44 - 7:47
    所有的樣本變異數的距離,對吧?
  • 7:47 - 7:47
    不夠公平。
  • 7:47 - 7:48
    所以你說,嘿 Sal。
  • 7:48 - 7:50
    這現在看起來還不錯。
  • 7:50 - 7:52
    但有一個小小的漁獲量。
  • 7:52 - 7:55
    如果 — — 是始終是相反的機率
  • 7:55 - 7:57
    挑選這些種相當均勻的數字,在我
  • 7:57 - 8:01
    示例中,如果我碰巧撿此編號,此編號,
  • 8:01 - 8:04
    與這一數字爲我 — — 讓我們說這一數字
  • 8:04 - 8:05
    作爲我的樣本嗎?
  • 8:05 - 8:08
    你的樣本平均值是無論你的樣本是什麽,
  • 8:08 - 8:10
    總是會在它,是吧嗎?
  • 8:10 - 8:13
    所以在這種情況下,您的樣本平均值可能就在這裡。
  • 8:13 - 8:15
    所有這些號碼,所以你可能會說好的這個數字不是
  • 8:15 - 8:18
    這一數字,這個數字並不太遠,距離太遠,然後
  • 8:18 - 8:19
    這個數字不太遠。
  • 8:19 - 8:22
    所以你樣本變異數,當你做這種方式,可能會
  • 8:22 - 8:24
    有點低轉。
  • 8:24 - 8:27
    所有這些數字,因爲他們是漂亮 — — 它們,
  • 8:27 - 8:29
    幾乎被定義,將會非常接近
  • 8:29 - 8:30
    對方的意思。
  • 8:30 - 8:35
    但在這種情況下,您的示例種不均衡,
  • 8:35 - 8:38
    人口的實際意思是這裡的地方。
  • 8:38 - 8:41
    這樣的示例中,如果你實際上有實際差異
  • 8:41 - 8:44
    已知的意思 — — 我知道這是所有有點令人困惑。
  • 8:44 - 8:45
    如果你真的知道中庸,你會
  • 8:45 - 8:47
    有說哦哇。
  • 8:47 - 8:48
    你會發現這些距離,將
  • 8:48 - 8:51
    已經多得多。
  • 8:51 - 8:54
    整點我想說的是,當你帶
  • 8:54 - 8:58
    樣品,有一些你樣本平均值是漂亮的機會
  • 8:58 - 9:00
    關閉到人口平均,正確嗎?
  • 9:00 - 9:03
    也許你的樣本平均值是在這裡和你的人口
  • 9:03 - 9:03
    意思是在這裡。
  • 9:03 - 9:06
    然後此公式將可能計算出挺好的
  • 9:06 - 9:08
    至少給了您的示例數據點和弄
  • 9:08 - 9:09
    造成差異的原因是什麽。
  • 9:09 - 9:14
    但有一個合理的機會,你們的樣品的意思是 — — 你
  • 9:14 - 9:17
    示例總是將會在您的數據樣本,右內嗎?
  • 9:17 - 9:19
    它永遠你們的數據樣本中心。
  • 9:19 - 9:21
    但它是完全有可能是在總體平均值
  • 9:21 - 9:23
    您的數據樣本的外面。
  • 9:23 - 9:25
    可能只是你只是碰巧撿那些
  • 9:25 - 9:28
    不要包含實際人口平均。
  • 9:28 - 9:32
    然後此樣本變異數計算這種方式將和
  • 9:32 - 9:35
    實際上低估了實際人口
  • 9:35 - 9:36
    方差,正確嗎?
  • 9:36 - 9:38
    因爲他們總是會再接近自己的意思
  • 9:38 - 9:40
    比起對總體平均值。
  • 9:40 - 9:43
    如果你理解,坦白地說,甚至像 10 %
  • 9:43 - 9:46
    這一點,你是一個非常先進的統計學生。
  • 9:46 - 9:49
    但我說這只是給你,一切希望,一些
  • 9:49 - 9:54
    直覺來實現這往往會低估。
  • 9:54 - 9:57
    此公式往往會低估實際
  • 9:57 - 9:59
    總體方差。
  • 9:59 - 10:01
    有一個公式,和這實際上證明更多
  • 10:01 - 10:05
    嚴格比我會做,這被認爲是
  • 10:05 - 10:08
    好,或者他們會調用它的偏見,估計
  • 10:08 - 10:09
    總體方差。
  • 10:09 - 10:11
    或不帶偏見的樣本變異數。
  • 10:11 - 10:14
    而有時它只是由表示再次平方的 s。
  • 10:14 - 10:19
    有時它由減 1 平方此 s n 表示。
  • 10:19 - 10:21
    我會告訴你爲什麽。
  • 10:21 - 10:22
    它是幾乎同樣的事。
  • 10:22 - 10:25
    你采取的每個數據點,搞得他們
  • 10:25 - 10:28
    是從樣本平均值。
  • 10:28 - 10:29
    你平方他們。
  • 10:29 - 10:32
    然後你采取的那些平均平方,除外
  • 10:32 - 10:33
    對於一個細微的差別。
  • 10:33 - 10:36
    I = 1 到 I = n。
  • 10:36 - 10:39
    而不是除以 n,則除以略
  • 10:39 - 10:42
    較小的數目。
  • 10:42 - 10:44
    你除以 n 減 1。
  • 10:44 - 10:47
    因此,當您劃分我減 1 而不是除以 n
  • 10:47 - 10:50
    n,你要在這裡稍大一些。
  • 10:50 - 10:51
    原來這其實是
  • 10:51 - 10:52
    很多更準確的估計。
  • 10:52 - 10:55
    一天我要去至少寫到一個計算機程序
  • 10:55 - 10:57
    實驗證明它對我自己,這是
  • 10:57 - 11:02
    更好的總體方差估計值。
  • 11:02 - 11:03
    你會計算它同樣的方式。
  • 11:03 - 11:05
    你只是除以 n 減 1。
  • 11:05 - 11:07
    其他的方式來思考它 — — 事實上,沒有。
  • 11:07 - 11:08
    我失去了的時間。
  • 11:08 - 11:10
    我現在就會離開你。
  • 11:10 - 11:11
    然後在接下來的影片中,我們會做幾個
  • 11:11 - 11:13
    這樣你就不必太不知所措的計算
  • 11:13 - 11:13
    這些想法。
  • 11:13 - 11:15
    因爲我們的身體越來越有點抽象。
  • 11:15 - 11:17
    下一個影片在見到你。
Title:
Statistics: Sample Variance
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
11:18

Chinese (Traditional, Taiwan) subtitles

Incomplete

Revisions