這段影片在這裡是動土儀式影片
多方面的原因。
一、 我要向您介紹的示例中,方差
這有趣它在其自己的權利。
我試圖在 HD 中記錄這段影片。
我希望你能看到它更大、 更清晰
比以往任何時候。
但我們將會看到如何,一切進展順利。
這就是有點實驗,所以和我一起承擔。
所以,只是之前我們進入的一個樣本,方差,但我
認爲這是有教育意義,審查方差
人口。
我們可以比較一下他們的公式。
人口 — — 的方差是這希臘
西格瑪的信。
小寫西格瑪的平方。
這意味著,方差。
我知道這很奇怪,已經一個變量
有一個正方形。
你不平方變量。
這是該變量。
西格瑪的平方的均方差。
其實,讓我寫下來。
這等於方差。
這就是等於 — — 你把每個數據點--和
我們打電話給他們 x 子我。
你把每個數據點的找出它從有多遠
人口,你平方米,意思是,然後,你取
所有的那些的平均水平。
以便您采取平均,你它們求和起來。
你從我去等於 1。
所以從第一點,一直到第 n 個點。
然後,以平均,你它們求和起來,並與
然後你除以 n。
所以造成差異的原因是這些平方距離的平均值
每個點的平均值。
並讓我給你的直覺,它本質上是
說,平均而言,每個人大概很遠的地方是
中間的點。
這是想到方差的最佳方法。
現在如果我們處理 — — 這是
人口、 正確嗎?
我們說: 如果我們想要弄清楚的方差
在該國的男人的高地,它將很難
找出人口的方差。
你必須去,本質上,測量
每個人的高度。
2 億 5000 萬人。
如果不是只是一些人口或
完全不可能有一些或數據
隨機變數。
我們去到更晚些時候。
因此很多的時候你真的想要估計這種差異
通過采取一個樣本的方差。
相同的方式,你不能均值的人口,
但也許你想估計它通過獲取
樣本的意思。
我們了解到,在這第一次的影片中。
如果這是 — — 如果這就是整個人口。
這就是數以百萬計的數據點,或甚至數據點中
你永遠無法得到,因爲它是的未來
一個隨機變數。
這就是人口。
您可能只想看一個樣本估計的事情。
這其實是大多數的推斷
所有有關統計數字。
找出有關樣本的敘述統計信息
並使人口有關的推論。
讓我試試 100 人,如果它似乎對這種藥
統計學意義的結果,這種藥會
可能的工作作爲一個整體人口。
所以,這是它是什麽有關。
它是很重要的是要了解這一概念
而不是人口的樣本。
並能夠找到一個樣本的統計數字,
大多數情況下,可以描述人口或幫助我們
估計,他們稱之爲,人口的參數。
那麽是什麽意思的一個 — — 讓我重寫這些定義。
人口的意思是什麽?
我會做的紫色。
人口的紫色。
人口的平均值。
你只是把每個數據點中的人口,x 我。
你他們總結。
你開始的第一次的數據點與你去所有
點到第 n 個數據的方式。
你除以 n。
你都對它們進行求和,除以 n。
這就是中庸。
那麽你將它插入此公式。
你可以看到每個點從那中央有多遠
這意味著從的點。
你方差。
現在怎麽樣如果我們做爲一個樣本?
好吧,如果我們想要估計的人口的平均值
以某種方式計算意味著一個樣本,最好的事情我可以
--認爲,這些真的是種工程的公式。
這些都是人類說: 好吧最好的什麽
選取的樣本的方法?
我們能做的好全是樣本的真的拿我們的平均。
而這正是樣本平均值。
我們學到了第一個影片中,該符號 — —
公式是這幾乎完全相同。
只是表示法的不同。
而不是編寫畝,你寫過它的一條線的 x。
樣本平均值是平等的 — — 再一次,你把每個
現在在該示例中,不在整個人口中的數據點。
你總結他們從第一項,然後到
第 n 個,對吧?
他們說在此示例中有 n 數據點。
然後您將其劃分的數據點你有數。
不夠公平。
這真是同一公式。
我拿了人口、 平均的方式我說,好吧,如果我
只是有一個樣本,讓我只是把意思相同的方式。
這可能是平均的好估計
人口。
現在它變得有趣起來,當我們談論方差。
所以你自然的反應是確定,我有此示例。
如果我想爲什麽估計人口的方差
不要只是申請此同一公式基本上
樣品嗎?
這樣可能會說 — — 而這是實際樣本變異數。
他們使用公式 s 平方。
所以西格瑪是善良的 s 希臘字母等效於。
所以現在當我們正在處理樣品,我們
只是寫那裏的 s。
所以這是樣本變異數。
讓我寫下來。
樣本變異數。
這是 — — 所以我們只是可能會說,嗯,也許采取的好方法
樣本變異數是做相同的方式。
讓我們花的每個示例中間點的距離。
找出我們的樣本平均值從有多遠。
在這裡我們使用人口平均,但現在我們只使用
因爲這就是全部的意思是該示例可以告知我們。
我們不知道什麽是人口平均
不看整個人口。
采取的廣場。
這使得變得積極,它有其他屬性,
這以後我們就去。
然後把所有這些平方距離的平均值。
所以你把它從 — — 你它們求和起來。
還有 n 他們到一些向上,正確嗎?
小寫字母 n。
你除以小寫字母 n。
你說,這是一個很好的估計。
也不管這種差異是什麽,那可能是一個很好的估計
爲整個人口。
其實這是有些人常常指甚麽時候他們
談樣本變異數。
而有時它會實際上被稱爲這。
他們沒有把小小寫字母 n。
他們爲什麽這樣做的原因是因爲我們除以 n 和。
而你說,Sal 這裡的問題是什麽?
與問題 — — 和我會給你的直覺,因爲這
其實是用來讓我記住的東西。
我仍坦率地竭力與
在它後面的直覺。
嗯,我有種嚴格的直覺,但更多的
證明它對自己,這肯定是案件。
但是想想這樣。
如果有一串數字,而我就畫
在這裡號線。
如果我畫號線在這裡,所以讓我們說你知道-
並讓我們說在我人口的一串數字。
現在,讓我們說 — — 我只要隨機把一大堆
在我的人口中的數字。
與右邊的這些是比大
那些向左。
如果我是采取的其中一個樣本,也許我就帶 — —
該示例中,它是隨機的。
實際上,你想要一個隨機樣本。
你不想以任何方式被扭曲。
所以也許我采取這一、 這一、 這種,
和這個,對吧?
要是采取的這一數字的平均值,然後,
號碼,該號碼,該號碼。
它將是地方在中間。
它可能是某個地方那邊。
然後如果我想要找出樣本變異數使用
這一公式,我會說這個距離平方加這確定
距離平方加此距離平方加上,
距離的平方和平均他們全力以赴。
並就此號碼。
這也許會是一個不錯的近似
這整個人口的方差。
人口的平均大概去
--我不知道。
它可能是這麽漂亮。
如果我們采取的所有數據點,平均爲他們,
也許他們就像這裡的地方。
然後如果你弄明白超差,它也許會是
很接近的所有這些行,右平均嗎?
所有的樣本變異數的距離,對吧?
不夠公平。
所以你說,嘿 Sal。
這現在看起來還不錯。
但有一個小小的漁獲量。
如果 — — 是始終是相反的機率
挑選這些種相當均勻的數字,在我
示例中,如果我碰巧撿此編號,此編號,
與這一數字爲我 — — 讓我們說這一數字
作爲我的樣本嗎?
你的樣本平均值是無論你的樣本是什麽,
總是會在它,是吧嗎?
所以在這種情況下,您的樣本平均值可能就在這裡。
所有這些號碼,所以你可能會說好的這個數字不是
這一數字,這個數字並不太遠,距離太遠,然後
這個數字不太遠。
所以你樣本變異數,當你做這種方式,可能會
有點低轉。
所有這些數字,因爲他們是漂亮 — — 它們,
幾乎被定義,將會非常接近
對方的意思。
但在這種情況下,您的示例種不均衡,
人口的實際意思是這裡的地方。
這樣的示例中,如果你實際上有實際差異
已知的意思 — — 我知道這是所有有點令人困惑。
如果你真的知道中庸,你會
有說哦哇。
你會發現這些距離,將
已經多得多。
整點我想說的是,當你帶
樣品,有一些你樣本平均值是漂亮的機會
關閉到人口平均,正確嗎?
也許你的樣本平均值是在這裡和你的人口
意思是在這裡。
然後此公式將可能計算出挺好的
至少給了您的示例數據點和弄
造成差異的原因是什麽。
但有一個合理的機會,你們的樣品的意思是 — — 你
示例總是將會在您的數據樣本,右內嗎?
它永遠你們的數據樣本中心。
但它是完全有可能是在總體平均值
您的數據樣本的外面。
可能只是你只是碰巧撿那些
不要包含實際人口平均。
然後此樣本變異數計算這種方式將和
實際上低估了實際人口
方差,正確嗎?
因爲他們總是會再接近自己的意思
比起對總體平均值。
如果你理解,坦白地說,甚至像 10 %
這一點,你是一個非常先進的統計學生。
但我說這只是給你,一切希望,一些
直覺來實現這往往會低估。
此公式往往會低估實際
總體方差。
有一個公式,和這實際上證明更多
嚴格比我會做,這被認爲是
好,或者他們會調用它的偏見,估計
總體方差。
或不帶偏見的樣本變異數。
而有時它只是由表示再次平方的 s。
有時它由減 1 平方此 s n 表示。
我會告訴你爲什麽。
它是幾乎同樣的事。
你采取的每個數據點,搞得他們
是從樣本平均值。
你平方他們。
然後你采取的那些平均平方,除外
對於一個細微的差別。
I = 1 到 I = n。
而不是除以 n,則除以略
較小的數目。
你除以 n 減 1。
因此,當您劃分我減 1 而不是除以 n
n,你要在這裡稍大一些。
原來這其實是
很多更準確的估計。
一天我要去至少寫到一個計算機程序
實驗證明它對我自己,這是
更好的總體方差估計值。
你會計算它同樣的方式。
你只是除以 n 減 1。
其他的方式來思考它 — — 事實上,沒有。
我失去了的時間。
我現在就會離開你。
然後在接下來的影片中,我們會做幾個
這樣你就不必太不知所措的計算
這些想法。
因爲我們的身體越來越有點抽象。
下一個影片在見到你。