Statistics: Sample Variance
-
0:01 - 0:03這段影片在這裡是動土儀式影片
-
0:03 - 0:05多方面的原因。
-
0:05 - 0:10一、 我要向您介紹的示例中,方差
-
0:10 - 0:12這有趣它在其自己的權利。
-
0:12 - 0:15我試圖在 HD 中記錄這段影片。
-
0:15 - 0:16我希望你能看到它更大、 更清晰
-
0:16 - 0:17比以往任何時候。
-
0:17 - 0:19但我們將會看到如何,一切進展順利。
-
0:19 - 0:22這就是有點實驗,所以和我一起承擔。
-
0:22 - 0:25所以,只是之前我們進入的一個樣本,方差,但我
-
0:25 - 0:28認爲這是有教育意義,審查方差
-
0:28 - 0:29人口。
-
0:29 - 0:32我們可以比較一下他們的公式。
-
0:32 - 0:35人口 — — 的方差是這希臘
-
0:35 - 0:36西格瑪的信。
-
0:36 - 0:37小寫西格瑪的平方。
-
0:37 - 0:38這意味著,方差。
-
0:38 - 0:41我知道這很奇怪,已經一個變量
-
0:41 - 0:42有一個正方形。
-
0:42 - 0:43你不平方變量。
-
0:43 - 0:44這是該變量。
-
0:44 - 0:46西格瑪的平方的均方差。
-
0:46 - 0:47其實,讓我寫下來。
-
0:47 - 0:48這等於方差。
-
0:52 - 0:55這就是等於 — — 你把每個數據點--和
-
0:55 - 0:59我們打電話給他們 x 子我。
-
0:59 - 1:02你把每個數據點的找出它從有多遠
-
1:02 - 1:09人口,你平方米,意思是,然後,你取
-
1:09 - 1:11所有的那些的平均水平。
-
1:11 - 1:13以便您采取平均,你它們求和起來。
-
1:13 - 1:14你從我去等於 1。
-
1:14 - 1:18所以從第一點,一直到第 n 個點。
-
1:18 - 1:20然後,以平均,你它們求和起來,並與
-
1:20 - 1:22然後你除以 n。
-
1:22 - 1:26所以造成差異的原因是這些平方距離的平均值
-
1:26 - 1:27每個點的平均值。
-
1:27 - 1:30並讓我給你的直覺,它本質上是
-
1:30 - 1:33說,平均而言,每個人大概很遠的地方是
-
1:33 - 1:34中間的點。
-
1:34 - 1:36這是想到方差的最佳方法。
-
1:36 - 1:38現在如果我們處理 — — 這是
-
1:38 - 1:39人口、 正確嗎?
-
1:39 - 1:42我們說: 如果我們想要弄清楚的方差
-
1:42 - 1:45在該國的男人的高地,它將很難
-
1:45 - 1:46找出人口的方差。
-
1:46 - 1:49你必須去,本質上,測量
-
1:49 - 1:50每個人的高度。
-
1:50 - 1:512 億 5000 萬人。
-
1:51 - 1:55如果不是只是一些人口或
-
1:55 - 1:57完全不可能有一些或數據
-
1:57 - 1:58隨機變數。
-
1:58 - 1:59我們去到更晚些時候。
-
1:59 - 2:03因此很多的時候你真的想要估計這種差異
-
2:03 - 2:05通過采取一個樣本的方差。
-
2:05 - 2:07相同的方式,你不能均值的人口,
-
2:07 - 2:10但也許你想估計它通過獲取
-
2:10 - 2:11樣本的意思。
-
2:11 - 2:14我們了解到,在這第一次的影片中。
-
2:14 - 2:18如果這是 — — 如果這就是整個人口。
-
2:18 - 2:20這就是數以百萬計的數據點,或甚至數據點中
-
2:20 - 2:22你永遠無法得到,因爲它是的未來
-
2:22 - 2:23一個隨機變數。
-
2:23 - 2:24這就是人口。
-
2:27 - 2:32您可能只想看一個樣本估計的事情。
-
2:32 - 2:35這其實是大多數的推斷
-
2:35 - 2:36所有有關統計數字。
-
2:36 - 2:39找出有關樣本的敘述統計信息
-
2:39 - 2:41並使人口有關的推論。
-
2:41 - 2:45讓我試試 100 人,如果它似乎對這種藥
-
2:45 - 2:47統計學意義的結果,這種藥會
-
2:47 - 2:49可能的工作作爲一個整體人口。
-
2:49 - 2:50所以,這是它是什麽有關。
-
2:50 - 2:52它是很重要的是要了解這一概念
-
2:52 - 2:54而不是人口的樣本。
-
2:54 - 2:58並能夠找到一個樣本的統計數字,
-
2:58 - 3:00大多數情況下,可以描述人口或幫助我們
-
3:00 - 3:04估計,他們稱之爲,人口的參數。
-
3:04 - 3:07那麽是什麽意思的一個 — — 讓我重寫這些定義。
-
3:07 - 3:09人口的意思是什麽?
-
3:09 - 3:10我會做的紫色。
-
3:10 - 3:12人口的紫色。
-
3:12 - 3:14人口的平均值。
-
3:14 - 3:20你只是把每個數據點中的人口,x 我。
-
3:20 - 3:22你他們總結。
-
3:22 - 3:24你開始的第一次的數據點與你去所有
-
3:24 - 3:26點到第 n 個數據的方式。
-
3:26 - 3:27你除以 n。
-
3:27 - 3:28你都對它們進行求和,除以 n。
-
3:28 - 3:29這就是中庸。
-
3:29 - 3:30那麽你將它插入此公式。
-
3:30 - 3:33你可以看到每個點從那中央有多遠
-
3:33 - 3:34這意味著從的點。
-
3:34 - 3:36你方差。
-
3:36 - 3:40現在怎麽樣如果我們做爲一個樣本?
-
3:40 - 3:43好吧,如果我們想要估計的人口的平均值
-
3:43 - 3:47以某種方式計算意味著一個樣本,最好的事情我可以
-
3:47 - 3:49--認爲,這些真的是種工程的公式。
-
3:49 - 3:51這些都是人類說: 好吧最好的什麽
-
3:51 - 3:52選取的樣本的方法?
-
3:52 - 3:55我們能做的好全是樣本的真的拿我們的平均。
-
3:55 - 3:57而這正是樣本平均值。
-
3:57 - 3:59我們學到了第一個影片中,該符號 — —
-
3:59 - 4:00公式是這幾乎完全相同。
-
4:00 - 4:02只是表示法的不同。
-
4:02 - 4:05而不是編寫畝,你寫過它的一條線的 x。
-
4:05 - 4:09樣本平均值是平等的 — — 再一次,你把每個
-
4:09 - 4:12現在在該示例中,不在整個人口中的數據點。
-
4:12 - 4:16你總結他們從第一項,然後到
-
4:16 - 4:17第 n 個,對吧?
-
4:17 - 4:21他們說在此示例中有 n 數據點。
-
4:21 - 4:23然後您將其劃分的數據點你有數。
-
4:23 - 4:24不夠公平。
-
4:24 - 4:26這真是同一公式。
-
4:26 - 4:28我拿了人口、 平均的方式我說,好吧,如果我
-
4:28 - 4:30只是有一個樣本,讓我只是把意思相同的方式。
-
4:30 - 4:33這可能是平均的好估計
-
4:33 - 4:34人口。
-
4:34 - 4:36現在它變得有趣起來,當我們談論方差。
-
4:36 - 4:39所以你自然的反應是確定,我有此示例。
-
4:39 - 4:43如果我想爲什麽估計人口的方差
-
4:43 - 4:45不要只是申請此同一公式基本上
-
4:45 - 4:46樣品嗎?
-
4:46 - 4:49這樣可能會說 — — 而這是實際樣本變異數。
-
4:49 - 4:55他們使用公式 s 平方。
-
4:55 - 4:58所以西格瑪是善良的 s 希臘字母等效於。
-
4:58 - 5:00所以現在當我們正在處理樣品,我們
-
5:00 - 5:01只是寫那裏的 s。
-
5:01 - 5:02所以這是樣本變異數。
-
5:02 - 5:03讓我寫下來。
-
5:03 - 5:04樣本變異數。
-
5:12 - 5:16這是 — — 所以我們只是可能會說,嗯,也許采取的好方法
-
5:16 - 5:17樣本變異數是做相同的方式。
-
5:17 - 5:24讓我們花的每個示例中間點的距離。
-
5:24 - 5:27找出我們的樣本平均值從有多遠。
-
5:27 - 5:29在這裡我們使用人口平均,但現在我們只使用
-
5:29 - 5:31因爲這就是全部的意思是該示例可以告知我們。
-
5:31 - 5:33我們不知道什麽是人口平均
-
5:33 - 5:36不看整個人口。
-
5:36 - 5:36采取的廣場。
-
5:36 - 5:38這使得變得積極,它有其他屬性,
-
5:38 - 5:40這以後我們就去。
-
5:40 - 5:43然後把所有這些平方距離的平均值。
-
5:43 - 5:45所以你把它從 — — 你它們求和起來。
-
5:45 - 5:47還有 n 他們到一些向上,正確嗎?
-
5:47 - 5:48小寫字母 n。
-
5:48 - 5:52你除以小寫字母 n。
-
5:52 - 5:53你說,這是一個很好的估計。
-
5:53 - 5:56也不管這種差異是什麽,那可能是一個很好的估計
-
5:56 - 5:57爲整個人口。
-
5:57 - 6:01其實這是有些人常常指甚麽時候他們
-
6:01 - 6:02談樣本變異數。
-
6:02 - 6:05而有時它會實際上被稱爲這。
-
6:05 - 6:08他們沒有把小小寫字母 n。
-
6:08 - 6:10他們爲什麽這樣做的原因是因爲我們除以 n 和。
-
6:10 - 6:12而你說,Sal 這裡的問題是什麽?
-
6:12 - 6:14與問題 — — 和我會給你的直覺,因爲這
-
6:14 - 6:16其實是用來讓我記住的東西。
-
6:16 - 6:19我仍坦率地竭力與
-
6:19 - 6:22在它後面的直覺。
-
6:22 - 6:25嗯,我有種嚴格的直覺,但更多的
-
6:25 - 6:27證明它對自己,這肯定是案件。
-
6:27 - 6:28但是想想這樣。
-
6:28 - 6:30如果有一串數字,而我就畫
-
6:30 - 6:33在這裡號線。
-
6:33 - 6:36如果我畫號線在這裡,所以讓我們說你知道-
-
6:36 - 6:39並讓我們說在我人口的一串數字。
-
6:39 - 6:42現在,讓我們說 — — 我只要隨機把一大堆
-
6:42 - 6:44在我的人口中的數字。
-
6:44 - 6:46與右邊的這些是比大
-
6:46 - 6:46那些向左。
-
6:49 - 6:53如果我是采取的其中一個樣本,也許我就帶 — —
-
6:53 - 6:55該示例中,它是隨機的。
-
6:55 - 6:56實際上,你想要一個隨機樣本。
-
6:56 - 6:57你不想以任何方式被扭曲。
-
6:57 - 7:03所以也許我采取這一、 這一、 這種,
-
7:03 - 7:05和這個,對吧?
-
7:05 - 7:07要是采取的這一數字的平均值,然後,
-
7:07 - 7:08號碼,該號碼,該號碼。
-
7:08 - 7:09它將是地方在中間。
-
7:09 - 7:11它可能是某個地方那邊。
-
7:11 - 7:13然後如果我想要找出樣本變異數使用
-
7:13 - 7:17這一公式,我會說這個距離平方加這確定
-
7:17 - 7:21距離平方加此距離平方加上,
-
7:21 - 7:24距離的平方和平均他們全力以赴。
-
7:24 - 7:25並就此號碼。
-
7:25 - 7:28這也許會是一個不錯的近似
-
7:28 - 7:30這整個人口的方差。
-
7:30 - 7:32人口的平均大概去
-
7:32 - 7:33--我不知道。
-
7:33 - 7:35它可能是這麽漂亮。
-
7:35 - 7:37如果我們采取的所有數據點,平均爲他們,
-
7:37 - 7:39也許他們就像這裡的地方。
-
7:39 - 7:41然後如果你弄明白超差,它也許會是
-
7:41 - 7:44很接近的所有這些行,右平均嗎?
-
7:44 - 7:47所有的樣本變異數的距離,對吧?
-
7:47 - 7:47不夠公平。
-
7:47 - 7:48所以你說,嘿 Sal。
-
7:48 - 7:50這現在看起來還不錯。
-
7:50 - 7:52但有一個小小的漁獲量。
-
7:52 - 7:55如果 — — 是始終是相反的機率
-
7:55 - 7:57挑選這些種相當均勻的數字,在我
-
7:57 - 8:01示例中,如果我碰巧撿此編號,此編號,
-
8:01 - 8:04與這一數字爲我 — — 讓我們說這一數字
-
8:04 - 8:05作爲我的樣本嗎?
-
8:05 - 8:08你的樣本平均值是無論你的樣本是什麽,
-
8:08 - 8:10總是會在它,是吧嗎?
-
8:10 - 8:13所以在這種情況下,您的樣本平均值可能就在這裡。
-
8:13 - 8:15所有這些號碼,所以你可能會說好的這個數字不是
-
8:15 - 8:18這一數字,這個數字並不太遠,距離太遠,然後
-
8:18 - 8:19這個數字不太遠。
-
8:19 - 8:22所以你樣本變異數,當你做這種方式,可能會
-
8:22 - 8:24有點低轉。
-
8:24 - 8:27所有這些數字,因爲他們是漂亮 — — 它們,
-
8:27 - 8:29幾乎被定義,將會非常接近
-
8:29 - 8:30對方的意思。
-
8:30 - 8:35但在這種情況下,您的示例種不均衡,
-
8:35 - 8:38人口的實際意思是這裡的地方。
-
8:38 - 8:41這樣的示例中,如果你實際上有實際差異
-
8:41 - 8:44已知的意思 — — 我知道這是所有有點令人困惑。
-
8:44 - 8:45如果你真的知道中庸,你會
-
8:45 - 8:47有說哦哇。
-
8:47 - 8:48你會發現這些距離,將
-
8:48 - 8:51已經多得多。
-
8:51 - 8:54整點我想說的是,當你帶
-
8:54 - 8:58樣品,有一些你樣本平均值是漂亮的機會
-
8:58 - 9:00關閉到人口平均,正確嗎?
-
9:00 - 9:03也許你的樣本平均值是在這裡和你的人口
-
9:03 - 9:03意思是在這裡。
-
9:03 - 9:06然後此公式將可能計算出挺好的
-
9:06 - 9:08至少給了您的示例數據點和弄
-
9:08 - 9:09造成差異的原因是什麽。
-
9:09 - 9:14但有一個合理的機會,你們的樣品的意思是 — — 你
-
9:14 - 9:17示例總是將會在您的數據樣本,右內嗎?
-
9:17 - 9:19它永遠你們的數據樣本中心。
-
9:19 - 9:21但它是完全有可能是在總體平均值
-
9:21 - 9:23您的數據樣本的外面。
-
9:23 - 9:25可能只是你只是碰巧撿那些
-
9:25 - 9:28不要包含實際人口平均。
-
9:28 - 9:32然後此樣本變異數計算這種方式將和
-
9:32 - 9:35實際上低估了實際人口
-
9:35 - 9:36方差,正確嗎?
-
9:36 - 9:38因爲他們總是會再接近自己的意思
-
9:38 - 9:40比起對總體平均值。
-
9:40 - 9:43如果你理解,坦白地說,甚至像 10 %
-
9:43 - 9:46這一點,你是一個非常先進的統計學生。
-
9:46 - 9:49但我說這只是給你,一切希望,一些
-
9:49 - 9:54直覺來實現這往往會低估。
-
9:54 - 9:57此公式往往會低估實際
-
9:57 - 9:59總體方差。
-
9:59 - 10:01有一個公式,和這實際上證明更多
-
10:01 - 10:05嚴格比我會做,這被認爲是
-
10:05 - 10:08好,或者他們會調用它的偏見,估計
-
10:08 - 10:09總體方差。
-
10:09 - 10:11或不帶偏見的樣本變異數。
-
10:11 - 10:14而有時它只是由表示再次平方的 s。
-
10:14 - 10:19有時它由減 1 平方此 s n 表示。
-
10:19 - 10:21我會告訴你爲什麽。
-
10:21 - 10:22它是幾乎同樣的事。
-
10:22 - 10:25你采取的每個數據點,搞得他們
-
10:25 - 10:28是從樣本平均值。
-
10:28 - 10:29你平方他們。
-
10:29 - 10:32然後你采取的那些平均平方,除外
-
10:32 - 10:33對於一個細微的差別。
-
10:33 - 10:36I = 1 到 I = n。
-
10:36 - 10:39而不是除以 n,則除以略
-
10:39 - 10:42較小的數目。
-
10:42 - 10:44你除以 n 減 1。
-
10:44 - 10:47因此,當您劃分我減 1 而不是除以 n
-
10:47 - 10:50n,你要在這裡稍大一些。
-
10:50 - 10:51原來這其實是
-
10:51 - 10:52很多更準確的估計。
-
10:52 - 10:55一天我要去至少寫到一個計算機程序
-
10:55 - 10:57實驗證明它對我自己,這是
-
10:57 - 11:02更好的總體方差估計值。
-
11:02 - 11:03你會計算它同樣的方式。
-
11:03 - 11:05你只是除以 n 減 1。
-
11:05 - 11:07其他的方式來思考它 — — 事實上,沒有。
-
11:07 - 11:08我失去了的時間。
-
11:08 - 11:10我現在就會離開你。
-
11:10 - 11:11然後在接下來的影片中,我們會做幾個
-
11:11 - 11:13這樣你就不必太不知所措的計算
-
11:13 - 11:13這些想法。
-
11:13 - 11:15因爲我們的身體越來越有點抽象。
-
11:15 - 11:17下一個影片在見到你。
- Title:
- Statistics: Sample Variance
- Description:
-
- Video Language:
- English
- Team:
Khan Academy
- Duration:
- 11:18
![]() |
Fran Ontanaya edited Chinese (Traditional, Taiwan) subtitles for Statistics: Sample Variance |