這段影片在這裡是動土儀式影片 多方面的原因。 一、 我要向您介紹的示例中,方差 這有趣它在其自己的權利。 我試圖在 HD 中記錄這段影片。 我希望你能看到它更大、 更清晰 比以往任何時候。 但我們將會看到如何,一切進展順利。 這就是有點實驗,所以和我一起承擔。 所以,只是之前我們進入的一個樣本,方差,但我 認爲這是有教育意義,審查方差 人口。 我們可以比較一下他們的公式。 人口 — — 的方差是這希臘 西格瑪的信。 小寫西格瑪的平方。 這意味著,方差。 我知道這很奇怪,已經一個變量 有一個正方形。 你不平方變量。 這是該變量。 西格瑪的平方的均方差。 其實,讓我寫下來。 這等於方差。 這就是等於 — — 你把每個數據點--和 我們打電話給他們 x 子我。 你把每個數據點的找出它從有多遠 人口,你平方米,意思是,然後,你取 所有的那些的平均水平。 以便您采取平均,你它們求和起來。 你從我去等於 1。 所以從第一點,一直到第 n 個點。 然後,以平均,你它們求和起來,並與 然後你除以 n。 所以造成差異的原因是這些平方距離的平均值 每個點的平均值。 並讓我給你的直覺,它本質上是 說,平均而言,每個人大概很遠的地方是 中間的點。 這是想到方差的最佳方法。 現在如果我們處理 — — 這是 人口、 正確嗎? 我們說: 如果我們想要弄清楚的方差 在該國的男人的高地,它將很難 找出人口的方差。 你必須去,本質上,測量 每個人的高度。 2 億 5000 萬人。 如果不是只是一些人口或 完全不可能有一些或數據 隨機變數。 我們去到更晚些時候。 因此很多的時候你真的想要估計這種差異 通過采取一個樣本的方差。 相同的方式,你不能均值的人口, 但也許你想估計它通過獲取 樣本的意思。 我們了解到,在這第一次的影片中。 如果這是 — — 如果這就是整個人口。 這就是數以百萬計的數據點,或甚至數據點中 你永遠無法得到,因爲它是的未來 一個隨機變數。 這就是人口。 您可能只想看一個樣本估計的事情。 這其實是大多數的推斷 所有有關統計數字。 找出有關樣本的敘述統計信息 並使人口有關的推論。 讓我試試 100 人,如果它似乎對這種藥 統計學意義的結果,這種藥會 可能的工作作爲一個整體人口。 所以,這是它是什麽有關。 它是很重要的是要了解這一概念 而不是人口的樣本。 並能夠找到一個樣本的統計數字, 大多數情況下,可以描述人口或幫助我們 估計,他們稱之爲,人口的參數。 那麽是什麽意思的一個 — — 讓我重寫這些定義。 人口的意思是什麽? 我會做的紫色。 人口的紫色。 人口的平均值。 你只是把每個數據點中的人口,x 我。 你他們總結。 你開始的第一次的數據點與你去所有 點到第 n 個數據的方式。 你除以 n。 你都對它們進行求和,除以 n。 這就是中庸。 那麽你將它插入此公式。 你可以看到每個點從那中央有多遠 這意味著從的點。 你方差。 現在怎麽樣如果我們做爲一個樣本? 好吧,如果我們想要估計的人口的平均值 以某種方式計算意味著一個樣本,最好的事情我可以 --認爲,這些真的是種工程的公式。 這些都是人類說: 好吧最好的什麽 選取的樣本的方法? 我們能做的好全是樣本的真的拿我們的平均。 而這正是樣本平均值。 我們學到了第一個影片中,該符號 — — 公式是這幾乎完全相同。 只是表示法的不同。 而不是編寫畝,你寫過它的一條線的 x。 樣本平均值是平等的 — — 再一次,你把每個 現在在該示例中,不在整個人口中的數據點。 你總結他們從第一項,然後到 第 n 個,對吧? 他們說在此示例中有 n 數據點。 然後您將其劃分的數據點你有數。 不夠公平。 這真是同一公式。 我拿了人口、 平均的方式我說,好吧,如果我 只是有一個樣本,讓我只是把意思相同的方式。 這可能是平均的好估計 人口。 現在它變得有趣起來,當我們談論方差。 所以你自然的反應是確定,我有此示例。 如果我想爲什麽估計人口的方差 不要只是申請此同一公式基本上 樣品嗎? 這樣可能會說 — — 而這是實際樣本變異數。 他們使用公式 s 平方。 所以西格瑪是善良的 s 希臘字母等效於。 所以現在當我們正在處理樣品,我們 只是寫那裏的 s。 所以這是樣本變異數。 讓我寫下來。 樣本變異數。 這是 — — 所以我們只是可能會說,嗯,也許采取的好方法 樣本變異數是做相同的方式。 讓我們花的每個示例中間點的距離。 找出我們的樣本平均值從有多遠。 在這裡我們使用人口平均,但現在我們只使用 因爲這就是全部的意思是該示例可以告知我們。 我們不知道什麽是人口平均 不看整個人口。 采取的廣場。 這使得變得積極,它有其他屬性, 這以後我們就去。 然後把所有這些平方距離的平均值。 所以你把它從 — — 你它們求和起來。 還有 n 他們到一些向上,正確嗎? 小寫字母 n。 你除以小寫字母 n。 你說,這是一個很好的估計。 也不管這種差異是什麽,那可能是一個很好的估計 爲整個人口。 其實這是有些人常常指甚麽時候他們 談樣本變異數。 而有時它會實際上被稱爲這。 他們沒有把小小寫字母 n。 他們爲什麽這樣做的原因是因爲我們除以 n 和。 而你說,Sal 這裡的問題是什麽? 與問題 — — 和我會給你的直覺,因爲這 其實是用來讓我記住的東西。 我仍坦率地竭力與 在它後面的直覺。 嗯,我有種嚴格的直覺,但更多的 證明它對自己,這肯定是案件。 但是想想這樣。 如果有一串數字,而我就畫 在這裡號線。 如果我畫號線在這裡,所以讓我們說你知道- 並讓我們說在我人口的一串數字。 現在,讓我們說 — — 我只要隨機把一大堆 在我的人口中的數字。 與右邊的這些是比大 那些向左。 如果我是采取的其中一個樣本,也許我就帶 — — 該示例中,它是隨機的。 實際上,你想要一個隨機樣本。 你不想以任何方式被扭曲。 所以也許我采取這一、 這一、 這種, 和這個,對吧? 要是采取的這一數字的平均值,然後, 號碼,該號碼,該號碼。 它將是地方在中間。 它可能是某個地方那邊。 然後如果我想要找出樣本變異數使用 這一公式,我會說這個距離平方加這確定 距離平方加此距離平方加上, 距離的平方和平均他們全力以赴。 並就此號碼。 這也許會是一個不錯的近似 這整個人口的方差。 人口的平均大概去 --我不知道。 它可能是這麽漂亮。 如果我們采取的所有數據點,平均爲他們, 也許他們就像這裡的地方。 然後如果你弄明白超差,它也許會是 很接近的所有這些行,右平均嗎? 所有的樣本變異數的距離,對吧? 不夠公平。 所以你說,嘿 Sal。 這現在看起來還不錯。 但有一個小小的漁獲量。 如果 — — 是始終是相反的機率 挑選這些種相當均勻的數字,在我 示例中,如果我碰巧撿此編號,此編號, 與這一數字爲我 — — 讓我們說這一數字 作爲我的樣本嗎? 你的樣本平均值是無論你的樣本是什麽, 總是會在它,是吧嗎? 所以在這種情況下,您的樣本平均值可能就在這裡。 所有這些號碼,所以你可能會說好的這個數字不是 這一數字,這個數字並不太遠,距離太遠,然後 這個數字不太遠。 所以你樣本變異數,當你做這種方式,可能會 有點低轉。 所有這些數字,因爲他們是漂亮 — — 它們, 幾乎被定義,將會非常接近 對方的意思。 但在這種情況下,您的示例種不均衡, 人口的實際意思是這裡的地方。 這樣的示例中,如果你實際上有實際差異 已知的意思 — — 我知道這是所有有點令人困惑。 如果你真的知道中庸,你會 有說哦哇。 你會發現這些距離,將 已經多得多。 整點我想說的是,當你帶 樣品,有一些你樣本平均值是漂亮的機會 關閉到人口平均,正確嗎? 也許你的樣本平均值是在這裡和你的人口 意思是在這裡。 然後此公式將可能計算出挺好的 至少給了您的示例數據點和弄 造成差異的原因是什麽。 但有一個合理的機會,你們的樣品的意思是 — — 你 示例總是將會在您的數據樣本,右內嗎? 它永遠你們的數據樣本中心。 但它是完全有可能是在總體平均值 您的數據樣本的外面。 可能只是你只是碰巧撿那些 不要包含實際人口平均。 然後此樣本變異數計算這種方式將和 實際上低估了實際人口 方差,正確嗎? 因爲他們總是會再接近自己的意思 比起對總體平均值。 如果你理解,坦白地說,甚至像 10 % 這一點,你是一個非常先進的統計學生。 但我說這只是給你,一切希望,一些 直覺來實現這往往會低估。 此公式往往會低估實際 總體方差。 有一個公式,和這實際上證明更多 嚴格比我會做,這被認爲是 好,或者他們會調用它的偏見,估計 總體方差。 或不帶偏見的樣本變異數。 而有時它只是由表示再次平方的 s。 有時它由減 1 平方此 s n 表示。 我會告訴你爲什麽。 它是幾乎同樣的事。 你采取的每個數據點,搞得他們 是從樣本平均值。 你平方他們。 然後你采取的那些平均平方,除外 對於一個細微的差別。 I = 1 到 I = n。 而不是除以 n,則除以略 較小的數目。 你除以 n 減 1。 因此,當您劃分我減 1 而不是除以 n n,你要在這裡稍大一些。 原來這其實是 很多更準確的估計。 一天我要去至少寫到一個計算機程序 實驗證明它對我自己,這是 更好的總體方差估計值。 你會計算它同樣的方式。 你只是除以 n 減 1。 其他的方式來思考它 — — 事實上,沒有。 我失去了的時間。 我現在就會離開你。 然後在接下來的影片中,我們會做幾個 這樣你就不必太不知所措的計算 這些想法。 因爲我們的身體越來越有點抽象。 下一個影片在見到你。