Statistics: Sample Variance
-
0:01 - 0:03这段视频在这里是动土仪式视频
-
0:03 - 0:05多方面的原因。
-
0:05 - 0:10一、 我要向您介绍的示例中,方差
-
0:10 - 0:12这有趣它在其自己的权利。
-
0:12 - 0:15我试图在 HD 中记录这段视频。
-
0:15 - 0:16我希望你能看到它更大、 更清晰
-
0:16 - 0:17比以往任何时候。
-
0:17 - 0:19但我们将会看到如何,一切进展顺利。
-
0:19 - 0:22这就是有点实验,所以和我一起承担。
-
0:22 - 0:25所以,只是之前我们进入的一个样本,方差,但我
-
0:25 - 0:28认为这是有教育意义,审查方差
-
0:28 - 0:29人口。
-
0:29 - 0:32我们可以比较一下他们的公式。
-
0:32 - 0:35人口 — — 的方差是这希腊
-
0:35 - 0:36西格玛的信。
-
0:36 - 0:37小写西格玛的平方。
-
0:37 - 0:38这意味着,方差。
-
0:38 - 0:41我知道这很奇怪,已经一个变量
-
0:41 - 0:42有一个正方形。
-
0:42 - 0:43你不平方变量。
-
0:43 - 0:44这是该变量。
-
0:44 - 0:46西格玛的平方的均方差。
-
0:46 - 0:47其实,让我写下来。
-
0:47 - 0:48这等于方差。
-
0:52 - 0:55这就是等于 — — 你把每个数据点--和
-
0:55 - 0:59我们打电话给他们 x 子我。
-
0:59 - 1:02你把每个数据点的找出它从有多远
-
1:02 - 1:09人口,你平方米,意思是,然后,你取
-
1:09 - 1:11所有的那些的平均水平。
-
1:11 - 1:13以便您采取平均,你它们求和起来。
-
1:13 - 1:14你从我去等于 1。
-
1:14 - 1:18所以从第一点,一直到第 n 个点。
-
1:18 - 1:20然后,以平均,你它们求和起来,并与
-
1:20 - 1:22然后你除以 n。
-
1:22 - 1:26所以造成差异的原因是这些平方距离的平均值
-
1:26 - 1:27每个点的平均值。
-
1:27 - 1:30并让我给你的直觉,它本质上是
-
1:30 - 1:33说,平均而言,每个人大概很远的地方是
-
1:33 - 1:34中间的点。
-
1:34 - 1:36这是想到方差的最佳方法。
-
1:36 - 1:38现在如果我们处理 — — 这是
-
1:38 - 1:39人口、 正确吗?
-
1:39 - 1:42我们说: 如果我们想要弄清楚的方差
-
1:42 - 1:45在该国的男人的高地,它将很难
-
1:45 - 1:46找出人口的方差。
-
1:46 - 1:49你必须去,本质上,测量
-
1:49 - 1:50每个人的高度。
-
1:50 - 1:512 亿 5000 万人。
-
1:51 - 1:55如果不是只是一些人口或
-
1:55 - 1:57完全不可能有一些或数据
-
1:57 - 1:58随机变量。
-
1:58 - 1:59我们去到更晚些时候。
-
1:59 - 2:03因此很多的时候你真的想要估计这种差异
-
2:03 - 2:05通过采取一个样本的方差。
-
2:05 - 2:07相同的方式,你不能均值的人口,
-
2:07 - 2:10但也许你想估计它通过获取
-
2:10 - 2:11样本的意思。
-
2:11 - 2:14我们了解到,在这第一次的视频中。
-
2:14 - 2:18如果这是 — — 如果这就是整个人口。
-
2:18 - 2:20这就是数以百万计的数据点,或甚至数据点中
-
2:20 - 2:22你永远无法得到,因为它是的未来
-
2:22 - 2:23一个随机变量。
-
2:23 - 2:24这就是人口。
-
2:27 - 2:32您可能只想看一个样本估计的事情。
-
2:32 - 2:35这其实是大多数的推断
-
2:35 - 2:36所有有关统计数字。
-
2:36 - 2:39找出有关样本的描述性统计信息
-
2:39 - 2:41并使人口有关的推论。
-
2:41 - 2:45让我试试 100 人,如果它似乎对这种药
-
2:45 - 2:47统计学意义的结果,这种药会
-
2:47 - 2:49可能的工作作为一个整体人口。
-
2:49 - 2:50所以,这是它是什么有关。
-
2:50 - 2:52它是很重要的是要了解这一概念
-
2:52 - 2:54而不是人口的样本。
-
2:54 - 2:58并能够找到一个样本的统计数字,
-
2:58 - 3:00大多数情况下,可以描述人口或帮助我们
-
3:00 - 3:04估计,他们称之为,人口的参数。
-
3:04 - 3:07那么是什么意思的一个 — — 让我重写这些定义。
-
3:07 - 3:09人口的意思是什么?
-
3:09 - 3:10我会做的紫色。
-
3:10 - 3:12人口的紫色。
-
3:12 - 3:14人口的平均值。
-
3:14 - 3:20你只是把每个数据点中的人口,x 我。
-
3:20 - 3:22你他们总结。
-
3:22 - 3:24你开始的第一次的数据点与你去所有
-
3:24 - 3:26点到第 n 个数据的方式。
-
3:26 - 3:27你除以 n。
-
3:27 - 3:28你都对它们进行求和,除以 n。
-
3:28 - 3:29这就是中庸。
-
3:29 - 3:30那么你将它插入此公式。
-
3:30 - 3:33你可以看到每个点从那中央有多远
-
3:33 - 3:34这意味着从的点。
-
3:34 - 3:36你方差。
-
3:36 - 3:40现在怎么样如果我们做为一个样本?
-
3:40 - 3:43好吧,如果我们想要估计的人口的平均值
-
3:43 - 3:47以某种方式计算意味着一个样本,最好的事情我可以
-
3:47 - 3:49--认为,这些真的是种工程的公式。
-
3:49 - 3:51这些都是人类说: 好吧最好的什么
-
3:51 - 3:52选取的样本的方法?
-
3:52 - 3:55我们能做的好全是样本的真的拿我们的平均。
-
3:55 - 3:57而这正是样本平均值。
-
3:57 - 3:59我们学到了第一个视频中,该符号 — —
-
3:59 - 4:00公式是这几乎完全相同。
-
4:00 - 4:02只是表示法的不同。
-
4:02 - 4:05而不是编写亩,你写过它的一条线的 x。
-
4:05 - 4:09样本平均值是平等的 — — 再一次,你把每个
-
4:09 - 4:12现在在该示例中,不在整个人口中的数据点。
-
4:12 - 4:16你总结他们从第一项,然后到
-
4:16 - 4:17第 n 个,对吧?
-
4:17 - 4:21他们说在此示例中有 n 数据点。
-
4:21 - 4:23然后您将其划分的数据点你有数。
-
4:23 - 4:24不够公平。
-
4:24 - 4:26这真是同一公式。
-
4:26 - 4:28我拿了人口、 平均的方式我说,好吧,如果我
-
4:28 - 4:30只是有一个样本,让我只是把意思相同的方式。
-
4:30 - 4:33这可能是平均的好估计
-
4:33 - 4:34人口。
-
4:34 - 4:36现在它变得有趣起来,当我们谈论方差。
-
4:36 - 4:39所以你自然的反应是确定,我有此示例。
-
4:39 - 4:43如果我想为什么估计人口的方差
-
4:43 - 4:45不要只是申请此同一公式基本上
-
4:45 - 4:46样品吗?
-
4:46 - 4:49这样可能会说 — — 而这是实际样本方差。
-
4:49 - 4:55他们使用公式 s 平方。
-
4:55 - 4:58所以西格玛是善良的 s 希腊字母等效于。
-
4:58 - 5:00所以现在当我们正在处理样品,我们
-
5:00 - 5:01只是写那里的 s。
-
5:01 - 5:02所以这是样本方差。
-
5:02 - 5:03让我写下来。
-
5:03 - 5:04样本方差。
-
5:12 - 5:16这是 — — 所以我们只是可能会说,嗯,也许采取的好方法
-
5:16 - 5:17样本方差是做相同的方式。
-
5:17 - 5:24让我们花的每个示例中点的距离。
-
5:24 - 5:27找出我们的样本平均值从有多远。
-
5:27 - 5:29在这里我们使用人口平均,但现在我们只使用
-
5:29 - 5:31因为这就是全部的意思是该示例可以告知我们。
-
5:31 - 5:33我们不知道什么是人口平均
-
5:33 - 5:36不看整个人口。
-
5:36 - 5:36采取的广场。
-
5:36 - 5:38这使得变得积极,它有其他属性,
-
5:38 - 5:40这以后我们就去。
-
5:40 - 5:43然后把所有这些平方距离的平均值。
-
5:43 - 5:45所以你把它从 — — 你它们求和起来。
-
5:45 - 5:47还有 n 他们到一些向上,正确吗?
-
5:47 - 5:48小写字母 n。
-
5:48 - 5:52你除以小写字母 n。
-
5:52 - 5:53你说,这是一个很好的估计。
-
5:53 - 5:56也不管这种差异是什么,那可能是一个很好的估计
-
5:56 - 5:57为整个人口。
-
5:57 - 6:01其实这是有些人常常指甚么时候他们
-
6:01 - 6:02谈样本方差。
-
6:02 - 6:05而有时它会实际上被称为这。
-
6:05 - 6:08他们没有把小小写字母 n。
-
6:08 - 6:10他们为什么这样做的原因是因为我们除以 n 和。
-
6:10 - 6:12而你说,Sal 这里的问题是什么?
-
6:12 - 6:14与问题 — — 和我会给你的直觉,因为这
-
6:14 - 6:16其实是用来让我记住的东西。
-
6:16 - 6:19我仍坦率地竭力与
-
6:19 - 6:22在它后面的直觉。
-
6:22 - 6:25嗯,我有种严格的直觉,但更多的
-
6:25 - 6:27证明它对自己,这肯定是案件。
-
6:27 - 6:28但是想想这样。
-
6:28 - 6:30如果有一串数字,而我就画
-
6:30 - 6:33在这里号线。
-
6:33 - 6:36如果我画号线在这里,所以让我们说你知道-
-
6:36 - 6:39并让我们说在我人口的一串数字。
-
6:39 - 6:42现在,让我们说 — — 我只要随机把一大堆
-
6:42 - 6:44在我的人口中的数字。
-
6:44 - 6:46与右边的这些是比大
-
6:46 - 6:46那些向左。
-
6:49 - 6:53如果我是采取的其中一个样本,也许我就带 — —
-
6:53 - 6:55该示例中,它是随机的。
-
6:55 - 6:56实际上,你想要一个随机样本。
-
6:56 - 6:57你不想以任何方式被扭曲。
-
6:57 - 7:03所以也许我采取这一、 这一、 这种,
-
7:03 - 7:05和这个,对吧?
-
7:05 - 7:07要是采取的这一数字的平均值,然后,
-
7:07 - 7:08号码,该号码,该号码。
-
7:08 - 7:09它将是地方在中间。
-
7:09 - 7:11它可能是某个地方那边。
-
7:11 - 7:13然后如果我想要找出样本方差使用
-
7:13 - 7:17这一公式,我会说这个距离平方加这确定
-
7:17 - 7:21距离平方加此距离平方加上,
-
7:21 - 7:24距离的平方和平均他们全力以赴。
-
7:24 - 7:25并就此号码。
-
7:25 - 7:28这也许会是一个不错的近似
-
7:28 - 7:30这整个人口的方差。
-
7:30 - 7:32人口的平均大概去
-
7:32 - 7:33--我不知道。
-
7:33 - 7:35它可能是这么漂亮。
-
7:35 - 7:37如果我们采取的所有数据点,平均为他们,
-
7:37 - 7:39也许他们就像这里的地方。
-
7:39 - 7:41然后如果你弄明白超差,它也许会是
-
7:41 - 7:44很接近的所有这些行,右平均吗?
-
7:44 - 7:47所有的样本方差的距离,对吧?
-
7:47 - 7:47不够公平。
-
7:47 - 7:48所以你说,嘿 Sal。
-
7:48 - 7:50这现在看起来还不错。
-
7:50 - 7:52但有一个小小的渔获量。
-
7:52 - 7:55如果 — — 是始终是相反的概率
-
7:55 - 7:57挑选这些种相当均匀的数字,在我
-
7:57 - 8:01示例中,如果我碰巧捡此编号,此编号,
-
8:01 - 8:04与这一数字为我 — — 让我们说这一数字
-
8:04 - 8:05作为我的样本吗?
-
8:05 - 8:08你的样本平均值是无论你的样本是什么,
-
8:08 - 8:10总是会在它,是吧吗?
-
8:10 - 8:13所以在这种情况下,您的样本平均值可能就在这里。
-
8:13 - 8:15所有这些号码,所以你可能会说好的这个数字不是
-
8:15 - 8:18这一数字,这个数字并不太远,距离太远,然后
-
8:18 - 8:19这个数字不太远。
-
8:19 - 8:22所以你样本方差,当你做这种方式,可能会
-
8:22 - 8:24有点低转。
-
8:24 - 8:27所有这些数字,因为他们是漂亮 — — 它们,
-
8:27 - 8:29几乎被定义,将会非常接近
-
8:29 - 8:30对方的意思。
-
8:30 - 8:35但在这种情况下,您的示例种不均衡,
-
8:35 - 8:38人口的实际意思是这里的地方。
-
8:38 - 8:41这样的示例中,如果你实际上有实际差异
-
8:41 - 8:44已知的意思 — — 我知道这是所有有点令人困惑。
-
8:44 - 8:45如果你真的知道中庸,你会
-
8:45 - 8:47有说哦哇。
-
8:47 - 8:48你会发现这些距离,将
-
8:48 - 8:51已经多得多。
-
8:51 - 8:54整点我想说的是,当你带
-
8:54 - 8:58样品,有一些你样本平均值是漂亮的机会
-
8:58 - 9:00关闭到人口平均,正确吗?
-
9:00 - 9:03也许你的样本平均值是在这里和你的人口
-
9:03 - 9:03意思是在这里。
-
9:03 - 9:06然后此公式将可能计算出挺好的
-
9:06 - 9:08至少给了您的示例数据点和弄
-
9:08 - 9:09造成差异的原因是什么。
-
9:09 - 9:14但有一个合理的机会,你们的样品的意思是 — — 你
-
9:14 - 9:17示例总是将会在您的数据样本,右内吗?
-
9:17 - 9:19它永远你们的数据样本中心。
-
9:19 - 9:21但它是完全有可能是在总体平均值
-
9:21 - 9:23您的数据样本的外面。
-
9:23 - 9:25可能只是你只是碰巧捡那些
-
9:25 - 9:28不要包含实际人口平均。
-
9:28 - 9:32然后此样本方差计算这种方式将和
-
9:32 - 9:35实际上低估了实际人口
-
9:35 - 9:36方差,正确吗?
-
9:36 - 9:38因为他们总是会再接近自己的意思
-
9:38 - 9:40比起对总体平均值。
-
9:40 - 9:43如果你理解,坦白地说,甚至像 10 %
-
9:43 - 9:46这一点,你是一个非常先进的统计学生。
-
9:46 - 9:49但我说这只是给你,一切希望,一些
-
9:49 - 9:54直觉来实现这往往会低估。
-
9:54 - 9:57此公式往往会低估实际
-
9:57 - 9:59总体方差。
-
9:59 - 10:01有一个公式,和这实际上证明更多
-
10:01 - 10:05严格比我会做,这被认为是
-
10:05 - 10:08好,或者他们会调用它的偏见,估计
-
10:08 - 10:09总体方差。
-
10:09 - 10:11或不带偏见的样本方差。
-
10:11 - 10:14而有时它只是由表示再次平方的 s。
-
10:14 - 10:19有时它由减 1 平方此 s n 表示。
-
10:19 - 10:21我会告诉你为什么。
-
10:21 - 10:22它是几乎同样的事。
-
10:22 - 10:25你采取的每个数据点,搞得他们
-
10:25 - 10:28是从样本平均值。
-
10:28 - 10:29你平方他们。
-
10:29 - 10:32然后你采取的那些平均平方,除外
-
10:32 - 10:33对于一个细微的差别。
-
10:33 - 10:36I = 1 到 I = n。
-
10:36 - 10:39而不是除以 n,则除以略
-
10:39 - 10:42较小的数目。
-
10:42 - 10:44你除以 n 减 1。
-
10:44 - 10:47因此,当您划分我减 1 而不是除以 n
-
10:47 - 10:50n,你要在这里稍大一些。
-
10:50 - 10:51原来这其实是
-
10:51 - 10:52很多更准确的估计。
-
10:52 - 10:55一天我要去至少写到一个计算机程序
-
10:55 - 10:57实验证明它对我自己,这是
-
10:57 - 11:02更好的总体方差估计值。
-
11:02 - 11:03你会计算它同样的方式。
-
11:03 - 11:05你只是除以 n 减 1。
-
11:05 - 11:07其他的方式来思考它 — — 事实上,没有。
-
11:07 - 11:08我失去了的时间。
-
11:08 - 11:10我现在就会离开你。
-
11:10 - 11:11然后在接下来的视频中,我们会做几个
-
11:11 - 11:13这样你就不必太不知所措的计算
-
11:13 - 11:13这些想法。
-
11:13 - 11:15因为我们的身体越来越有点抽象。
-
11:15 - 11:17下一个视频在见到你。
- Title:
- Statistics: Sample Variance
- Description:
-
- Video Language:
- English
- Team:
Khan Academy
- Duration:
- 11:18
![]() |
Fran Ontanaya edited Chinese (Simplified, China) subtitles for Statistics: Sample Variance |