这段视频在这里是动土仪式视频 多方面的原因。 一、 我要向您介绍的示例中,方差 这有趣它在其自己的权利。 我试图在 HD 中记录这段视频。 我希望你能看到它更大、 更清晰 比以往任何时候。 但我们将会看到如何,一切进展顺利。 这就是有点实验,所以和我一起承担。 所以,只是之前我们进入的一个样本,方差,但我 认为这是有教育意义,审查方差 人口。 我们可以比较一下他们的公式。 人口 — — 的方差是这希腊 西格玛的信。 小写西格玛的平方。 这意味着,方差。 我知道这很奇怪,已经一个变量 有一个正方形。 你不平方变量。 这是该变量。 西格玛的平方的均方差。 其实,让我写下来。 这等于方差。 这就是等于 — — 你把每个数据点--和 我们打电话给他们 x 子我。 你把每个数据点的找出它从有多远 人口,你平方米,意思是,然后,你取 所有的那些的平均水平。 以便您采取平均,你它们求和起来。 你从我去等于 1。 所以从第一点,一直到第 n 个点。 然后,以平均,你它们求和起来,并与 然后你除以 n。 所以造成差异的原因是这些平方距离的平均值 每个点的平均值。 并让我给你的直觉,它本质上是 说,平均而言,每个人大概很远的地方是 中间的点。 这是想到方差的最佳方法。 现在如果我们处理 — — 这是 人口、 正确吗? 我们说: 如果我们想要弄清楚的方差 在该国的男人的高地,它将很难 找出人口的方差。 你必须去,本质上,测量 每个人的高度。 2 亿 5000 万人。 如果不是只是一些人口或 完全不可能有一些或数据 随机变量。 我们去到更晚些时候。 因此很多的时候你真的想要估计这种差异 通过采取一个样本的方差。 相同的方式,你不能均值的人口, 但也许你想估计它通过获取 样本的意思。 我们了解到,在这第一次的视频中。 如果这是 — — 如果这就是整个人口。 这就是数以百万计的数据点,或甚至数据点中 你永远无法得到,因为它是的未来 一个随机变量。 这就是人口。 您可能只想看一个样本估计的事情。 这其实是大多数的推断 所有有关统计数字。 找出有关样本的描述性统计信息 并使人口有关的推论。 让我试试 100 人,如果它似乎对这种药 统计学意义的结果,这种药会 可能的工作作为一个整体人口。 所以,这是它是什么有关。 它是很重要的是要了解这一概念 而不是人口的样本。 并能够找到一个样本的统计数字, 大多数情况下,可以描述人口或帮助我们 估计,他们称之为,人口的参数。 那么是什么意思的一个 — — 让我重写这些定义。 人口的意思是什么? 我会做的紫色。 人口的紫色。 人口的平均值。 你只是把每个数据点中的人口,x 我。 你他们总结。 你开始的第一次的数据点与你去所有 点到第 n 个数据的方式。 你除以 n。 你都对它们进行求和,除以 n。 这就是中庸。 那么你将它插入此公式。 你可以看到每个点从那中央有多远 这意味着从的点。 你方差。 现在怎么样如果我们做为一个样本? 好吧,如果我们想要估计的人口的平均值 以某种方式计算意味着一个样本,最好的事情我可以 --认为,这些真的是种工程的公式。 这些都是人类说: 好吧最好的什么 选取的样本的方法? 我们能做的好全是样本的真的拿我们的平均。 而这正是样本平均值。 我们学到了第一个视频中,该符号 — — 公式是这几乎完全相同。 只是表示法的不同。 而不是编写亩,你写过它的一条线的 x。 样本平均值是平等的 — — 再一次,你把每个 现在在该示例中,不在整个人口中的数据点。 你总结他们从第一项,然后到 第 n 个,对吧? 他们说在此示例中有 n 数据点。 然后您将其划分的数据点你有数。 不够公平。 这真是同一公式。 我拿了人口、 平均的方式我说,好吧,如果我 只是有一个样本,让我只是把意思相同的方式。 这可能是平均的好估计 人口。 现在它变得有趣起来,当我们谈论方差。 所以你自然的反应是确定,我有此示例。 如果我想为什么估计人口的方差 不要只是申请此同一公式基本上 样品吗? 这样可能会说 — — 而这是实际样本方差。 他们使用公式 s 平方。 所以西格玛是善良的 s 希腊字母等效于。 所以现在当我们正在处理样品,我们 只是写那里的 s。 所以这是样本方差。 让我写下来。 样本方差。 这是 — — 所以我们只是可能会说,嗯,也许采取的好方法 样本方差是做相同的方式。 让我们花的每个示例中点的距离。 找出我们的样本平均值从有多远。 在这里我们使用人口平均,但现在我们只使用 因为这就是全部的意思是该示例可以告知我们。 我们不知道什么是人口平均 不看整个人口。 采取的广场。 这使得变得积极,它有其他属性, 这以后我们就去。 然后把所有这些平方距离的平均值。 所以你把它从 — — 你它们求和起来。 还有 n 他们到一些向上,正确吗? 小写字母 n。 你除以小写字母 n。 你说,这是一个很好的估计。 也不管这种差异是什么,那可能是一个很好的估计 为整个人口。 其实这是有些人常常指甚么时候他们 谈样本方差。 而有时它会实际上被称为这。 他们没有把小小写字母 n。 他们为什么这样做的原因是因为我们除以 n 和。 而你说,Sal 这里的问题是什么? 与问题 — — 和我会给你的直觉,因为这 其实是用来让我记住的东西。 我仍坦率地竭力与 在它后面的直觉。 嗯,我有种严格的直觉,但更多的 证明它对自己,这肯定是案件。 但是想想这样。 如果有一串数字,而我就画 在这里号线。 如果我画号线在这里,所以让我们说你知道- 并让我们说在我人口的一串数字。 现在,让我们说 — — 我只要随机把一大堆 在我的人口中的数字。 与右边的这些是比大 那些向左。 如果我是采取的其中一个样本,也许我就带 — — 该示例中,它是随机的。 实际上,你想要一个随机样本。 你不想以任何方式被扭曲。 所以也许我采取这一、 这一、 这种, 和这个,对吧? 要是采取的这一数字的平均值,然后, 号码,该号码,该号码。 它将是地方在中间。 它可能是某个地方那边。 然后如果我想要找出样本方差使用 这一公式,我会说这个距离平方加这确定 距离平方加此距离平方加上, 距离的平方和平均他们全力以赴。 并就此号码。 这也许会是一个不错的近似 这整个人口的方差。 人口的平均大概去 --我不知道。 它可能是这么漂亮。 如果我们采取的所有数据点,平均为他们, 也许他们就像这里的地方。 然后如果你弄明白超差,它也许会是 很接近的所有这些行,右平均吗? 所有的样本方差的距离,对吧? 不够公平。 所以你说,嘿 Sal。 这现在看起来还不错。 但有一个小小的渔获量。 如果 — — 是始终是相反的概率 挑选这些种相当均匀的数字,在我 示例中,如果我碰巧捡此编号,此编号, 与这一数字为我 — — 让我们说这一数字 作为我的样本吗? 你的样本平均值是无论你的样本是什么, 总是会在它,是吧吗? 所以在这种情况下,您的样本平均值可能就在这里。 所有这些号码,所以你可能会说好的这个数字不是 这一数字,这个数字并不太远,距离太远,然后 这个数字不太远。 所以你样本方差,当你做这种方式,可能会 有点低转。 所有这些数字,因为他们是漂亮 — — 它们, 几乎被定义,将会非常接近 对方的意思。 但在这种情况下,您的示例种不均衡, 人口的实际意思是这里的地方。 这样的示例中,如果你实际上有实际差异 已知的意思 — — 我知道这是所有有点令人困惑。 如果你真的知道中庸,你会 有说哦哇。 你会发现这些距离,将 已经多得多。 整点我想说的是,当你带 样品,有一些你样本平均值是漂亮的机会 关闭到人口平均,正确吗? 也许你的样本平均值是在这里和你的人口 意思是在这里。 然后此公式将可能计算出挺好的 至少给了您的示例数据点和弄 造成差异的原因是什么。 但有一个合理的机会,你们的样品的意思是 — — 你 示例总是将会在您的数据样本,右内吗? 它永远你们的数据样本中心。 但它是完全有可能是在总体平均值 您的数据样本的外面。 可能只是你只是碰巧捡那些 不要包含实际人口平均。 然后此样本方差计算这种方式将和 实际上低估了实际人口 方差,正确吗? 因为他们总是会再接近自己的意思 比起对总体平均值。 如果你理解,坦白地说,甚至像 10 % 这一点,你是一个非常先进的统计学生。 但我说这只是给你,一切希望,一些 直觉来实现这往往会低估。 此公式往往会低估实际 总体方差。 有一个公式,和这实际上证明更多 严格比我会做,这被认为是 好,或者他们会调用它的偏见,估计 总体方差。 或不带偏见的样本方差。 而有时它只是由表示再次平方的 s。 有时它由减 1 平方此 s n 表示。 我会告诉你为什么。 它是几乎同样的事。 你采取的每个数据点,搞得他们 是从样本平均值。 你平方他们。 然后你采取的那些平均平方,除外 对于一个细微的差别。 I = 1 到 I = n。 而不是除以 n,则除以略 较小的数目。 你除以 n 减 1。 因此,当您划分我减 1 而不是除以 n n,你要在这里稍大一些。 原来这其实是 很多更准确的估计。 一天我要去至少写到一个计算机程序 实验证明它对我自己,这是 更好的总体方差估计值。 你会计算它同样的方式。 你只是除以 n 减 1。 其他的方式来思考它 — — 事实上,没有。 我失去了的时间。 我现在就会离开你。 然后在接下来的视频中,我们会做几个 这样你就不必太不知所措的计算 这些想法。 因为我们的身体越来越有点抽象。 下一个视频在见到你。