< Return to Video

Statistics: Sample Variance

  • 0:01 - 0:03
    这段视频在这里是动土仪式视频
  • 0:03 - 0:05
    多方面的原因。
  • 0:05 - 0:10
    一、 我要向您介绍的示例中,方差
  • 0:10 - 0:12
    这有趣它在其自己的权利。
  • 0:12 - 0:15
    我试图在 HD 中记录这段视频。
  • 0:15 - 0:16
    我希望你能看到它更大、 更清晰
  • 0:16 - 0:17
    比以往任何时候。
  • 0:17 - 0:19
    但我们将会看到如何,一切进展顺利。
  • 0:19 - 0:22
    这就是有点实验,所以和我一起承担。
  • 0:22 - 0:25
    所以,只是之前我们进入的一个样本,方差,但我
  • 0:25 - 0:28
    认为这是有教育意义,审查方差
  • 0:28 - 0:29
    人口。
  • 0:29 - 0:32
    我们可以比较一下他们的公式。
  • 0:32 - 0:35
    人口 — — 的方差是这希腊
  • 0:35 - 0:36
    西格玛的信。
  • 0:36 - 0:37
    小写西格玛的平方。
  • 0:37 - 0:38
    这意味着,方差。
  • 0:38 - 0:41
    我知道这很奇怪,已经一个变量
  • 0:41 - 0:42
    有一个正方形。
  • 0:42 - 0:43
    你不平方变量。
  • 0:43 - 0:44
    这是该变量。
  • 0:44 - 0:46
    西格玛的平方的均方差。
  • 0:46 - 0:47
    其实,让我写下来。
  • 0:47 - 0:48
    这等于方差。
  • 0:52 - 0:55
    这就是等于 — — 你把每个数据点--和
  • 0:55 - 0:59
    我们打电话给他们 x 子我。
  • 0:59 - 1:02
    你把每个数据点的找出它从有多远
  • 1:02 - 1:09
    人口,你平方米,意思是,然后,你取
  • 1:09 - 1:11
    所有的那些的平均水平。
  • 1:11 - 1:13
    以便您采取平均,你它们求和起来。
  • 1:13 - 1:14
    你从我去等于 1。
  • 1:14 - 1:18
    所以从第一点,一直到第 n 个点。
  • 1:18 - 1:20
    然后,以平均,你它们求和起来,并与
  • 1:20 - 1:22
    然后你除以 n。
  • 1:22 - 1:26
    所以造成差异的原因是这些平方距离的平均值
  • 1:26 - 1:27
    每个点的平均值。
  • 1:27 - 1:30
    并让我给你的直觉,它本质上是
  • 1:30 - 1:33
    说,平均而言,每个人大概很远的地方是
  • 1:33 - 1:34
    中间的点。
  • 1:34 - 1:36
    这是想到方差的最佳方法。
  • 1:36 - 1:38
    现在如果我们处理 — — 这是
  • 1:38 - 1:39
    人口、 正确吗?
  • 1:39 - 1:42
    我们说: 如果我们想要弄清楚的方差
  • 1:42 - 1:45
    在该国的男人的高地,它将很难
  • 1:45 - 1:46
    找出人口的方差。
  • 1:46 - 1:49
    你必须去,本质上,测量
  • 1:49 - 1:50
    每个人的高度。
  • 1:50 - 1:51
    2 亿 5000 万人。
  • 1:51 - 1:55
    如果不是只是一些人口或
  • 1:55 - 1:57
    完全不可能有一些或数据
  • 1:57 - 1:58
    随机变量。
  • 1:58 - 1:59
    我们去到更晚些时候。
  • 1:59 - 2:03
    因此很多的时候你真的想要估计这种差异
  • 2:03 - 2:05
    通过采取一个样本的方差。
  • 2:05 - 2:07
    相同的方式,你不能均值的人口,
  • 2:07 - 2:10
    但也许你想估计它通过获取
  • 2:10 - 2:11
    样本的意思。
  • 2:11 - 2:14
    我们了解到,在这第一次的视频中。
  • 2:14 - 2:18
    如果这是 — — 如果这就是整个人口。
  • 2:18 - 2:20
    这就是数以百万计的数据点,或甚至数据点中
  • 2:20 - 2:22
    你永远无法得到,因为它是的未来
  • 2:22 - 2:23
    一个随机变量。
  • 2:23 - 2:24
    这就是人口。
  • 2:27 - 2:32
    您可能只想看一个样本估计的事情。
  • 2:32 - 2:35
    这其实是大多数的推断
  • 2:35 - 2:36
    所有有关统计数字。
  • 2:36 - 2:39
    找出有关样本的描述性统计信息
  • 2:39 - 2:41
    并使人口有关的推论。
  • 2:41 - 2:45
    让我试试 100 人,如果它似乎对这种药
  • 2:45 - 2:47
    统计学意义的结果,这种药会
  • 2:47 - 2:49
    可能的工作作为一个整体人口。
  • 2:49 - 2:50
    所以,这是它是什么有关。
  • 2:50 - 2:52
    它是很重要的是要了解这一概念
  • 2:52 - 2:54
    而不是人口的样本。
  • 2:54 - 2:58
    并能够找到一个样本的统计数字,
  • 2:58 - 3:00
    大多数情况下,可以描述人口或帮助我们
  • 3:00 - 3:04
    估计,他们称之为,人口的参数。
  • 3:04 - 3:07
    那么是什么意思的一个 — — 让我重写这些定义。
  • 3:07 - 3:09
    人口的意思是什么?
  • 3:09 - 3:10
    我会做的紫色。
  • 3:10 - 3:12
    人口的紫色。
  • 3:12 - 3:14
    人口的平均值。
  • 3:14 - 3:20
    你只是把每个数据点中的人口,x 我。
  • 3:20 - 3:22
    你他们总结。
  • 3:22 - 3:24
    你开始的第一次的数据点与你去所有
  • 3:24 - 3:26
    点到第 n 个数据的方式。
  • 3:26 - 3:27
    你除以 n。
  • 3:27 - 3:28
    你都对它们进行求和,除以 n。
  • 3:28 - 3:29
    这就是中庸。
  • 3:29 - 3:30
    那么你将它插入此公式。
  • 3:30 - 3:33
    你可以看到每个点从那中央有多远
  • 3:33 - 3:34
    这意味着从的点。
  • 3:34 - 3:36
    你方差。
  • 3:36 - 3:40
    现在怎么样如果我们做为一个样本?
  • 3:40 - 3:43
    好吧,如果我们想要估计的人口的平均值
  • 3:43 - 3:47
    以某种方式计算意味着一个样本,最好的事情我可以
  • 3:47 - 3:49
    --认为,这些真的是种工程的公式。
  • 3:49 - 3:51
    这些都是人类说: 好吧最好的什么
  • 3:51 - 3:52
    选取的样本的方法?
  • 3:52 - 3:55
    我们能做的好全是样本的真的拿我们的平均。
  • 3:55 - 3:57
    而这正是样本平均值。
  • 3:57 - 3:59
    我们学到了第一个视频中,该符号 — —
  • 3:59 - 4:00
    公式是这几乎完全相同。
  • 4:00 - 4:02
    只是表示法的不同。
  • 4:02 - 4:05
    而不是编写亩,你写过它的一条线的 x。
  • 4:05 - 4:09
    样本平均值是平等的 — — 再一次,你把每个
  • 4:09 - 4:12
    现在在该示例中,不在整个人口中的数据点。
  • 4:12 - 4:16
    你总结他们从第一项,然后到
  • 4:16 - 4:17
    第 n 个,对吧?
  • 4:17 - 4:21
    他们说在此示例中有 n 数据点。
  • 4:21 - 4:23
    然后您将其划分的数据点你有数。
  • 4:23 - 4:24
    不够公平。
  • 4:24 - 4:26
    这真是同一公式。
  • 4:26 - 4:28
    我拿了人口、 平均的方式我说,好吧,如果我
  • 4:28 - 4:30
    只是有一个样本,让我只是把意思相同的方式。
  • 4:30 - 4:33
    这可能是平均的好估计
  • 4:33 - 4:34
    人口。
  • 4:34 - 4:36
    现在它变得有趣起来,当我们谈论方差。
  • 4:36 - 4:39
    所以你自然的反应是确定,我有此示例。
  • 4:39 - 4:43
    如果我想为什么估计人口的方差
  • 4:43 - 4:45
    不要只是申请此同一公式基本上
  • 4:45 - 4:46
    样品吗?
  • 4:46 - 4:49
    这样可能会说 — — 而这是实际样本方差。
  • 4:49 - 4:55
    他们使用公式 s 平方。
  • 4:55 - 4:58
    所以西格玛是善良的 s 希腊字母等效于。
  • 4:58 - 5:00
    所以现在当我们正在处理样品,我们
  • 5:00 - 5:01
    只是写那里的 s。
  • 5:01 - 5:02
    所以这是样本方差。
  • 5:02 - 5:03
    让我写下来。
  • 5:03 - 5:04
    样本方差。
  • 5:12 - 5:16
    这是 — — 所以我们只是可能会说,嗯,也许采取的好方法
  • 5:16 - 5:17
    样本方差是做相同的方式。
  • 5:17 - 5:24
    让我们花的每个示例中点的距离。
  • 5:24 - 5:27
    找出我们的样本平均值从有多远。
  • 5:27 - 5:29
    在这里我们使用人口平均,但现在我们只使用
  • 5:29 - 5:31
    因为这就是全部的意思是该示例可以告知我们。
  • 5:31 - 5:33
    我们不知道什么是人口平均
  • 5:33 - 5:36
    不看整个人口。
  • 5:36 - 5:36
    采取的广场。
  • 5:36 - 5:38
    这使得变得积极,它有其他属性,
  • 5:38 - 5:40
    这以后我们就去。
  • 5:40 - 5:43
    然后把所有这些平方距离的平均值。
  • 5:43 - 5:45
    所以你把它从 — — 你它们求和起来。
  • 5:45 - 5:47
    还有 n 他们到一些向上,正确吗?
  • 5:47 - 5:48
    小写字母 n。
  • 5:48 - 5:52
    你除以小写字母 n。
  • 5:52 - 5:53
    你说,这是一个很好的估计。
  • 5:53 - 5:56
    也不管这种差异是什么,那可能是一个很好的估计
  • 5:56 - 5:57
    为整个人口。
  • 5:57 - 6:01
    其实这是有些人常常指甚么时候他们
  • 6:01 - 6:02
    谈样本方差。
  • 6:02 - 6:05
    而有时它会实际上被称为这。
  • 6:05 - 6:08
    他们没有把小小写字母 n。
  • 6:08 - 6:10
    他们为什么这样做的原因是因为我们除以 n 和。
  • 6:10 - 6:12
    而你说,Sal 这里的问题是什么?
  • 6:12 - 6:14
    与问题 — — 和我会给你的直觉,因为这
  • 6:14 - 6:16
    其实是用来让我记住的东西。
  • 6:16 - 6:19
    我仍坦率地竭力与
  • 6:19 - 6:22
    在它后面的直觉。
  • 6:22 - 6:25
    嗯,我有种严格的直觉,但更多的
  • 6:25 - 6:27
    证明它对自己,这肯定是案件。
  • 6:27 - 6:28
    但是想想这样。
  • 6:28 - 6:30
    如果有一串数字,而我就画
  • 6:30 - 6:33
    在这里号线。
  • 6:33 - 6:36
    如果我画号线在这里,所以让我们说你知道-
  • 6:36 - 6:39
    并让我们说在我人口的一串数字。
  • 6:39 - 6:42
    现在,让我们说 — — 我只要随机把一大堆
  • 6:42 - 6:44
    在我的人口中的数字。
  • 6:44 - 6:46
    与右边的这些是比大
  • 6:46 - 6:46
    那些向左。
  • 6:49 - 6:53
    如果我是采取的其中一个样本,也许我就带 — —
  • 6:53 - 6:55
    该示例中,它是随机的。
  • 6:55 - 6:56
    实际上,你想要一个随机样本。
  • 6:56 - 6:57
    你不想以任何方式被扭曲。
  • 6:57 - 7:03
    所以也许我采取这一、 这一、 这种,
  • 7:03 - 7:05
    和这个,对吧?
  • 7:05 - 7:07
    要是采取的这一数字的平均值,然后,
  • 7:07 - 7:08
    号码,该号码,该号码。
  • 7:08 - 7:09
    它将是地方在中间。
  • 7:09 - 7:11
    它可能是某个地方那边。
  • 7:11 - 7:13
    然后如果我想要找出样本方差使用
  • 7:13 - 7:17
    这一公式,我会说这个距离平方加这确定
  • 7:17 - 7:21
    距离平方加此距离平方加上,
  • 7:21 - 7:24
    距离的平方和平均他们全力以赴。
  • 7:24 - 7:25
    并就此号码。
  • 7:25 - 7:28
    这也许会是一个不错的近似
  • 7:28 - 7:30
    这整个人口的方差。
  • 7:30 - 7:32
    人口的平均大概去
  • 7:32 - 7:33
    --我不知道。
  • 7:33 - 7:35
    它可能是这么漂亮。
  • 7:35 - 7:37
    如果我们采取的所有数据点,平均为他们,
  • 7:37 - 7:39
    也许他们就像这里的地方。
  • 7:39 - 7:41
    然后如果你弄明白超差,它也许会是
  • 7:41 - 7:44
    很接近的所有这些行,右平均吗?
  • 7:44 - 7:47
    所有的样本方差的距离,对吧?
  • 7:47 - 7:47
    不够公平。
  • 7:47 - 7:48
    所以你说,嘿 Sal。
  • 7:48 - 7:50
    这现在看起来还不错。
  • 7:50 - 7:52
    但有一个小小的渔获量。
  • 7:52 - 7:55
    如果 — — 是始终是相反的概率
  • 7:55 - 7:57
    挑选这些种相当均匀的数字,在我
  • 7:57 - 8:01
    示例中,如果我碰巧捡此编号,此编号,
  • 8:01 - 8:04
    与这一数字为我 — — 让我们说这一数字
  • 8:04 - 8:05
    作为我的样本吗?
  • 8:05 - 8:08
    你的样本平均值是无论你的样本是什么,
  • 8:08 - 8:10
    总是会在它,是吧吗?
  • 8:10 - 8:13
    所以在这种情况下,您的样本平均值可能就在这里。
  • 8:13 - 8:15
    所有这些号码,所以你可能会说好的这个数字不是
  • 8:15 - 8:18
    这一数字,这个数字并不太远,距离太远,然后
  • 8:18 - 8:19
    这个数字不太远。
  • 8:19 - 8:22
    所以你样本方差,当你做这种方式,可能会
  • 8:22 - 8:24
    有点低转。
  • 8:24 - 8:27
    所有这些数字,因为他们是漂亮 — — 它们,
  • 8:27 - 8:29
    几乎被定义,将会非常接近
  • 8:29 - 8:30
    对方的意思。
  • 8:30 - 8:35
    但在这种情况下,您的示例种不均衡,
  • 8:35 - 8:38
    人口的实际意思是这里的地方。
  • 8:38 - 8:41
    这样的示例中,如果你实际上有实际差异
  • 8:41 - 8:44
    已知的意思 — — 我知道这是所有有点令人困惑。
  • 8:44 - 8:45
    如果你真的知道中庸,你会
  • 8:45 - 8:47
    有说哦哇。
  • 8:47 - 8:48
    你会发现这些距离,将
  • 8:48 - 8:51
    已经多得多。
  • 8:51 - 8:54
    整点我想说的是,当你带
  • 8:54 - 8:58
    样品,有一些你样本平均值是漂亮的机会
  • 8:58 - 9:00
    关闭到人口平均,正确吗?
  • 9:00 - 9:03
    也许你的样本平均值是在这里和你的人口
  • 9:03 - 9:03
    意思是在这里。
  • 9:03 - 9:06
    然后此公式将可能计算出挺好的
  • 9:06 - 9:08
    至少给了您的示例数据点和弄
  • 9:08 - 9:09
    造成差异的原因是什么。
  • 9:09 - 9:14
    但有一个合理的机会,你们的样品的意思是 — — 你
  • 9:14 - 9:17
    示例总是将会在您的数据样本,右内吗?
  • 9:17 - 9:19
    它永远你们的数据样本中心。
  • 9:19 - 9:21
    但它是完全有可能是在总体平均值
  • 9:21 - 9:23
    您的数据样本的外面。
  • 9:23 - 9:25
    可能只是你只是碰巧捡那些
  • 9:25 - 9:28
    不要包含实际人口平均。
  • 9:28 - 9:32
    然后此样本方差计算这种方式将和
  • 9:32 - 9:35
    实际上低估了实际人口
  • 9:35 - 9:36
    方差,正确吗?
  • 9:36 - 9:38
    因为他们总是会再接近自己的意思
  • 9:38 - 9:40
    比起对总体平均值。
  • 9:40 - 9:43
    如果你理解,坦白地说,甚至像 10 %
  • 9:43 - 9:46
    这一点,你是一个非常先进的统计学生。
  • 9:46 - 9:49
    但我说这只是给你,一切希望,一些
  • 9:49 - 9:54
    直觉来实现这往往会低估。
  • 9:54 - 9:57
    此公式往往会低估实际
  • 9:57 - 9:59
    总体方差。
  • 9:59 - 10:01
    有一个公式,和这实际上证明更多
  • 10:01 - 10:05
    严格比我会做,这被认为是
  • 10:05 - 10:08
    好,或者他们会调用它的偏见,估计
  • 10:08 - 10:09
    总体方差。
  • 10:09 - 10:11
    或不带偏见的样本方差。
  • 10:11 - 10:14
    而有时它只是由表示再次平方的 s。
  • 10:14 - 10:19
    有时它由减 1 平方此 s n 表示。
  • 10:19 - 10:21
    我会告诉你为什么。
  • 10:21 - 10:22
    它是几乎同样的事。
  • 10:22 - 10:25
    你采取的每个数据点,搞得他们
  • 10:25 - 10:28
    是从样本平均值。
  • 10:28 - 10:29
    你平方他们。
  • 10:29 - 10:32
    然后你采取的那些平均平方,除外
  • 10:32 - 10:33
    对于一个细微的差别。
  • 10:33 - 10:36
    I = 1 到 I = n。
  • 10:36 - 10:39
    而不是除以 n,则除以略
  • 10:39 - 10:42
    较小的数目。
  • 10:42 - 10:44
    你除以 n 减 1。
  • 10:44 - 10:47
    因此,当您划分我减 1 而不是除以 n
  • 10:47 - 10:50
    n,你要在这里稍大一些。
  • 10:50 - 10:51
    原来这其实是
  • 10:51 - 10:52
    很多更准确的估计。
  • 10:52 - 10:55
    一天我要去至少写到一个计算机程序
  • 10:55 - 10:57
    实验证明它对我自己,这是
  • 10:57 - 11:02
    更好的总体方差估计值。
  • 11:02 - 11:03
    你会计算它同样的方式。
  • 11:03 - 11:05
    你只是除以 n 减 1。
  • 11:05 - 11:07
    其他的方式来思考它 — — 事实上,没有。
  • 11:07 - 11:08
    我失去了的时间。
  • 11:08 - 11:10
    我现在就会离开你。
  • 11:10 - 11:11
    然后在接下来的视频中,我们会做几个
  • 11:11 - 11:13
    这样你就不必太不知所措的计算
  • 11:13 - 11:13
    这些想法。
  • 11:13 - 11:15
    因为我们的身体越来越有点抽象。
  • 11:15 - 11:17
    下一个视频在见到你。
Title:
Statistics: Sample Variance
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
11:18

Chinese (Simplified, China) subtitles

Incomplete

Revisions