WEBVTT 00:00:01.425 --> 00:00:05.015 - [讲解员] 在掌握计量经济学的道路上 00:00:05.619 --> 00:00:08.813 小徒弟Kamal也取得了巨大的进步 00:00:08.813 --> 00:00:13.662 他充分发挥了自己的能力 战胜了他的敌人 00:00:14.223 --> 00:00:16.640 可惜今天,他情绪低落 00:00:16.640 --> 00:00:19.614 因为有一项挑战尚未解决: 00:00:19.614 --> 00:00:24.230 Kamal还无法解读 学术研究期刊的论文 00:00:24.230 --> 00:00:27.347 比如《美国经济评论》 00:00:27.347 --> 00:00:29.317 和《计量经济学》等期刊 00:00:29.317 --> 00:00:33.501 在他看来,这些似乎是用 晦涩难懂的外语写的 00:00:33.501 --> 00:00:35.478 - [Kamal] 怎么回事...? 00:00:36.711 --> 00:00:40.349 -[讲解员] 对于新手Kamal来说 它们是模糊不清的 00:00:40.349 --> 00:00:42.205 但可以通过学习来解析 00:00:42.467 --> 00:00:45.109 让我们一起来阅读,学习 00:00:48.311 --> 00:00:51.712 line:1 随机对照试验 00:00:52.657 --> 00:00:53.984 让我们深入研究 00:00:53.984 --> 00:00:58.278 发表在《教育经济学评论》上的 西点军校的研究 00:00:58.658 --> 00:01:01.688 此论文讲述了 对“经济学101”的学生 00:01:01.688 --> 00:01:05.859 是否使用电子设备进行了随机评估 00:01:06.485 --> 00:01:09.192 首先,快速回顾其研究设计 00:01:09.423 --> 00:01:10.523 - 好的 00:01:11.553 --> 00:01:15.770 - [Josh] 在西点军校- 一所专门培训美国陆军军官的学院 00:01:15.770 --> 00:01:17.199 计量学大师们 00:01:17.199 --> 00:01:19.854 设计了一项随机试验 以回答这个问题 00:01:20.582 --> 00:01:22.383 按照不同的规则 00:01:22.383 --> 00:01:26.974 这些大师随机分配学员 到经济学的不同班级 00:01:27.116 --> 00:01:28.962 与大多数美国大学不同 00:01:28.962 --> 00:01:32.155 西点军校本来的规定是 不许使用电子设备 00:01:32.482 --> 00:01:36.324 为了这个实验 一些学生获得了特许 00:01:36.324 --> 00:01:38.679 不在这种传统、无电子产品的班里: 00:01:38.679 --> 00:01:41.911 没有笔记本电脑,没有平板电脑 没有手机! 00:01:43.324 --> 00:01:45.743 line:1 这是对照组,或基准 00:01:46.372 --> 00:01:49.292 另一组被允许使用电子产品 00:01:49.292 --> 00:01:52.704 这就是实验组 受制于一个变化了的环境 00:01:53.313 --> 00:01:56.000 在此,实验组可以在课堂上 00:01:56.000 --> 00:01:58.527 无限制地使用笔记本电脑 或平板电脑 00:01:59.195 --> 00:02:01.972 每一个因果问题 都有一个明确的结果 00:02:01.972 --> 00:02:05.379 我们在研究之前就已定义 希望影响的变量 00:02:06.058 --> 00:02:08.375 在西点军校 使用电子产品的结果 00:02:08.375 --> 00:02:10.124 是看期末考试的分数 00:02:10.535 --> 00:02:13.810 该研究的目的是为回答以下问题: 00:02:13.810 --> 00:02:17.629 用考试分数来衡量 在课堂使用电子设备 00:02:17.629 --> 00:02:19.765 与学习的因果关系是什么? 00:02:20.852 --> 00:02:25.787 - 经济学期刊文章 通常以描述性统计表格开头 00:02:25.994 --> 00:02:28.694 列出研究样本的关键因素 00:02:28.694 --> 00:02:32.129 - 我的天啊,我记得这个表 太令人困惑了! 00:02:32.129 --> 00:02:37.224 - [讲解员] 第一列到第三列报告平均特征 00:02:37.224 --> 00:02:40.089 这样就能知道我们的研究对象 00:02:40.089 --> 00:02:43.178 让我们从第一列开始 00:02:43.178 --> 00:02:45.438 它描述了对照组的协变量 00:02:45.438 --> 00:02:48.675 协变量是在实验开始之前测量的 00:02:48.675 --> 00:02:52.091 对照组和实验组的特征 00:02:52.091 --> 00:02:57.128 例如,我们看到对照组的平均年龄 略高于20岁 00:02:57.514 --> 00:03:00.535 许多协变量都是虚拟变量 00:03:00.997 --> 00:03:05.803 虚拟变量只能有两个值 -- 0或1 00:03:06.087 --> 00:03:10.298 例如,学生性别是虚拟变量 00:03:10.298 --> 00:03:13.386 女性等于1,男性等于0 00:03:13.386 --> 00:03:16.686 该变量的平均值为女性比例 00:03:17.104 --> 00:03:20.651 我们还发现,对照组中 有13%是西班牙裔 00:03:20.651 --> 00:03:23.905 19%服过兵役 00:03:24.817 --> 00:03:26.635 表中的注释是关键 00:03:26.635 --> 00:03:29.218 请在阅览表时参考这些 00:03:29.218 --> 00:03:33.534 这些注释解释了 每列和每个面板中的内容 NOTE Paragraph 00:03:39.485 --> 00:03:41.858 例如,这些注释告诉我们 00:03:41.858 --> 00:03:45.175 标准偏差用括号注明 00:03:45.947 --> 00:03:49.598 标准差告诉我们数据的离散情况 00:03:50.448 --> 00:03:54.887 例如,0.52的标准差告诉我们 00:03:54.887 --> 00:03:59.397 大多数对照组的GPA 落在2.35 00:03:59.397 --> 00:04:03.454 也就是比2.87的平均GPA低0.52 00:04:03.454 --> 00:04:08.337 和3.39之间 也就是比2.87高0.52 00:04:09.337 --> 00:04:12.122 较低的标准偏差味着GPA 00:04:12.122 --> 00:04:14.706 更紧密地聚集在平均值周围 00:04:14.706 --> 00:04:17.543 -[Kamal] 是啊,但大多数变量 都没有标准偏差 00:04:17.543 --> 00:04:18.600 -没错 00:04:18.600 --> 00:04:22.497 大师们通常都会忽略 虚拟变量的标准偏差 00:04:22.497 --> 00:04:26.500 因为变量的平均值 决定了其标准偏差 00:04:27.542 --> 00:04:30.102 本研究将两个实验组 00:04:30.102 --> 00:04:32.078 与对照组进行比较 00:04:32.078 --> 00:04:35.886 第一组可以随便使用 笔记本电脑和平板电脑 00:04:35.886 --> 00:04:38.252 第二个实验组的限制性强些 00:04:38.252 --> 00:04:41.713 只允许将平板电脑 放在桌子上使用 00:04:42.152 --> 00:04:45.238 实验组看起来与对照组很接近 00:04:46.694 --> 00:04:51.443 这将带我们到该表的下一个特征 第四列到第六列 00:04:51.443 --> 00:04:54.558 使用统计测试来比较实验前 00:04:54.558 --> 00:04:57.591 实验组和对照组的特征 00:04:58.158 --> 00:05:01.991 在第四栏中,两个实验组被合并了 00:05:01.991 --> 00:05:04.998 可以看到实验组和对照组的 00:05:04.998 --> 00:05:09.690 女性比例差异仅为0.03 00:05:10.508 --> 00:05:13.740 这种差异在统计学上并不显著 00:05:14.290 --> 00:05:17.440 在样本选择过程中 00:05:17.440 --> 00:05:20.623 我们可以很容易地 将其归结为偶然结果 00:05:20.623 --> 00:05:22.133 - 那我们怎么知道? 00:05:22.133 --> 00:05:23.790 - [讲解员] 记得经验法则吗? 00:05:23.790 --> 00:05:29.903 绝对值超出标准误差两倍的统计估计 00:05:30.108 --> 00:05:33.997 line:1 通常在统计学上是有显著性的 00:05:35.132 --> 00:05:38.766 标准误差为0.03 00:05:38.766 --> 00:05:41.483 与女性比例差异相同 00:05:42.244 --> 00:05:46.132 因此,后者与前者的比率仅为1 00:05:46.132 --> 00:05:48.607 这当然小于2 00:05:48.607 --> 00:05:51.451 - [Kamal] 哦!所以 表中的实验/对照差异 00:05:51.451 --> 00:05:54.455 均不超过其标准误差的两倍 00:05:54.455 --> 00:05:55.997 -[讲解员] 正确 00:05:55.997 --> 00:05:59.081 随机划分的学生似乎成功地 00:05:59.081 --> 00:06:01.945 创建了确实具有可比性的群体 00:06:02.846 --> 00:06:05.008 因此,我们可以确信 00:06:05.008 --> 00:06:07.774 课堂成绩随后的任何差异 00:06:07.774 --> 00:06:11.073 都是实验干预的结果 00:06:11.073 --> 00:06:14.754 而不是先前存在的差异的反映 00:06:14.754 --> 00:06:17.454 做到了“其他条件不变”! 00:06:17.454 --> 00:06:19.883 - [Kamal] 酷,等等 00:06:19.883 --> 00:06:22.833 底部有星号的数字呢? 00:06:22.833 --> 00:06:25.589 这些差异是标准误差的两倍以上 00:06:25.589 --> 00:06:27.402 -[讲解员] 好眼力,Kamal! 00:06:27.402 --> 00:06:29.386 该表中有许多数字 00:06:29.386 --> 00:06:32.246 面板B中的也很重要 00:06:32.246 --> 00:06:35.715 它们测量实验组和对照组的学生 00:06:35.715 --> 00:06:39.139 在课堂上使用电脑的程度 00:06:39.754 --> 00:06:42.873 这组的实验是允许电脑的使用 00:06:43.278 --> 00:06:44.873 研究人员必须证明 00:06:44.873 --> 00:06:47.079 被允许使用电脑的学生 00:06:47.079 --> 00:06:49.448 利用了这个机会 00:06:50.072 --> 00:06:53.033 如果他们没有使用,那就没有实验了 00:06:53.867 --> 00:06:57.469 幸运的是,第一实验组中 00:06:57.469 --> 00:06:59.472 81%的人使用了电脑 00:06:59.472 --> 00:07:02.178 而对照组中没有人使用电脑 00:07:02.178 --> 00:07:05.216 第二个平板电脑实验组的许多人 00:07:05.216 --> 00:07:07.264 也使用了电脑 00:07:07.264 --> 00:07:09.879 电脑的使用方面差异很大 00:07:09.879 --> 00:07:11.798 而且具有统计显著性 00:07:12.081 --> 00:07:15.428 我们还可以看到每组的样本量 00:07:15.428 --> 00:07:18.098 line:1 - [Kamal] 星号是装饰吗? 00:07:18.098 --> 00:07:21.421 -[讲解员]有些学术论文用星号来表示 00:07:21.421 --> 00:07:23.983 在统计学上有显著性的差异 00:07:23.983 --> 00:07:26.925 这可以引起人们的注意 00:07:26.925 --> 00:07:31.621 这里,三个星号表示结果在统计上 00:07:31.621 --> 00:07:35.672 p值偏离零假设的概率小于1% 00:07:35.672 --> 00:07:39.436 换句话说,这个结果纯粹是偶然的 00:07:39.436 --> 00:07:42.171 概率不到1/100 00:07:43.181 --> 00:07:48.997 两个星号表示偶然发现的机率 为1/20或5% 00:07:48.997 --> 00:07:52.469 一个星号代表 10%我们看到的结果 00:07:52.469 --> 00:07:56.036 仅归因于偶然 00:07:56.473 --> 00:07:59.957 如今,星号被视为有点过时 00:07:59.957 --> 00:08:01.606 有些期刊把它们省略了 00:08:01.606 --> 00:08:03.894 -[Kamal]那最后两列呢? 00:08:03.894 --> 00:08:08.152 -[讲解员] 与将两个实验组 合并为一的第四列不同 00:08:08.174 --> 00:08:13.876 后两列分别查看每个实验组的 实验/对照差异 00:08:14.572 --> 00:08:17.931 这提供了更详细的平衡分析 00:08:18.295 --> 00:08:21.288 line:1 另外,就目前而言 你可以忽略此行 00:08:21.288 --> 00:08:24.205 它将用于另一项显著性 测试 00:08:24.755 --> 00:08:29.402 现在我们来看看这篇文章的精华: 表四 00:08:30.075 --> 00:08:32.993 此表报告电子设备的使用 00:08:32.993 --> 00:08:37.273 对学生学习成绩影响的回归估计 00:08:37.273 --> 00:08:40.258 -[Kamal] 为什么这项研究 报告回归估计? 00:08:40.258 --> 00:08:42.529 这就是我不明白的原因 00:08:42.529 --> 00:08:44.806 我以为 我们喜欢随机试验的一个原因是 00:08:44.806 --> 00:08:48.320 只需比较实验组和对照组 00:08:48.320 --> 00:08:50.479 就可以获得因果关系 00:08:50.479 --> 00:08:53.883 由于这些组是平衡的 没有必要使用回归 00:08:53.883 --> 00:08:55.492 -[讲解员] 说得好,Kamal 00:08:55.492 --> 00:08:58.612 实际上,出于两个原因 00:08:58.612 --> 00:09:01.013 报告回归估计是惯例 00:09:01.013 --> 00:09:04.448 首先,尽管有证据表明 二者之间存在平衡 00:09:04.448 --> 00:09:07.349 但如果过于谨慎 分析师可能会考虑到 00:09:07.349 --> 00:09:09.678 二者之间的偶然性差异 00:09:09.678 --> 00:09:13.622 其次,回归估计可能更为精确 00:09:13.622 --> 00:09:16.509 也就是说,与简单的实验对照比较相比 00:09:16.509 --> 00:09:18.893 它们具有更低的标准误差 00:09:20.129 --> 00:09:22.526 本研究中的因变量 00:09:22.526 --> 00:09:24.305 是我们感兴趣的结果 00:09:24.652 --> 00:09:26.192 既然眼前的问题是 00:09:26.192 --> 00:09:29.068 课堂电子设备如何影响学习 00:09:29.068 --> 00:09:32.845 一个适合的结果 就是经济学期末考试的分数 00:09:33.406 --> 00:09:37.650 每列报告不同回归模型的结果 00:09:37.650 --> 00:09:40.476 除了实验组之外 00:09:40.476 --> 00:09:44.453 模型还通过控制变量 或协变量进行区分 00:09:44.934 --> 00:09:47.755 没有协变量的估计 00:09:47.755 --> 00:09:50.677 是对实验组和对照组的简单比较 00:09:50.677 --> 00:09:53.169 -[Kamal] 我还以为他们忘了填写呢 00:09:53.169 --> 00:09:56.228 -[讲解员]第一列显示,电子设备的使用 00:09:56.228 --> 00:10:00.835 使期末考试分数减少0.28标准差 00:10:01.547 --> 00:10:02.940 在我们的上一课中 00:10:02.940 --> 00:10:07.237 Joshway大师解释说 我们使用标准差单位 00:10:07.237 --> 00:10:10.672 因为这些单位在不同的研究中很容易比较 00:10:11.352 --> 00:10:12.642 第二列报告了 00:10:12.642 --> 00:10:16.082 添加人口统计控制的模型的结果 00:10:16.082 --> 00:10:19.907 在这里,我们比较测试分数 但持有不变的因素 00:10:19.907 --> 00:10:21.435 如年龄和性别 00:10:21.886 --> 00:10:23.202 第三列报告了 00:10:23.202 --> 00:10:27.186 将GPA添加到协变量列表中的 模型的结果 00:10:27.603 --> 00:10:30.822 第四列增加了ACT分数 00:10:30.822 --> 00:10:33.503 分析师经常以这种方式报告结果 00:10:33.503 --> 00:10:36.992 首先是包含很少或没有协变量的模型 00:10:36.992 --> 00:10:39.667 然后逐列报告 00:10:39.667 --> 00:10:43.586 添加越来越多协变量的模型估计值 00:10:44.035 --> 00:10:46.802 逐列观察,你注意到了什么? 00:10:47.252 --> 00:10:49.919 -[Kamal] 使用电脑的相关系数 00:10:49.919 --> 00:10:51.635 总是一个相当大的负数 00:10:51.635 --> 00:10:53.002 - [讲解员] 没错! 00:10:53.002 --> 00:10:56.455 我们还可以看到,标准误差小到 00:10:56.455 --> 00:11:00.561 足以使这些负面结果具有统计显著性 00:11:00.561 --> 00:11:04.446 换句话说,这个实验的主要收获是 00:11:04.446 --> 00:11:08.381 使用电子设备影响了学生的学习 00:11:09.000 --> 00:11:12.283 - [Kamal] GPA和ACT的分数 也很显著 00:11:12.283 --> 00:11:13.750 原因何在? 00:11:13.750 --> 00:11:15.423 -[讲解员]观察的很好! 00:11:15.423 --> 00:11:16.866 这并不奇怪 00:11:16.866 --> 00:11:20.473 我们期望这些变量 能预测在大学里的表现 00:11:20.473 --> 00:11:22.190 -[Kamal] 哦,没错 00:11:22.190 --> 00:11:24.026 之前取得很好成绩的孩子 00:11:24.026 --> 00:11:26.317 更有可能在这门课程中 取得较好的成绩 00:11:26.317 --> 00:11:30.226 -[讲解员] 你还会注意到这表中的 许多其他信息 00:11:30.226 --> 00:11:34.515 表中的其余面板报告了电子设备的使用 00:11:34.515 --> 00:11:36.933 对期末考试组成部分的影响 00:11:36.933 --> 00:11:39.816 如选择题 00:11:39.816 --> 00:11:43.371 这些结果大多与电脑的使用 00:11:43.371 --> 00:11:45.360 对总体得分的影响一致 00:11:45.360 --> 00:11:47.740 -[Kamal] 那行不是英文的行呢? 00:11:47.740 --> 00:11:50.994 -[讲解员] 它们提供了其他统计信息 00:11:50.994 --> 00:11:54.247 r 平方是拟合优度的度量 00:11:54.714 --> 00:11:56.638 尽管有些读者可能想知道 00:11:56.638 --> 00:11:58.010 但这并不太重要 00:11:58.660 --> 00:12:02.950 其他行报告具有统计显著性的替代测试 00:12:02.950 --> 00:12:05.028 你目前也可以忽略 00:12:05.028 --> 00:12:07.934 -[Kamal] 哦,我的天 这些表没有那么难嘛! 00:12:07.934 --> 00:12:09.488 非常感谢您 00:12:09.488 --> 00:12:11.787 -[讲解员] 接下来是要讲的是回归 00:12:11.787 --> 00:12:13.179 再见! 00:12:15.974 --> 00:12:17.263 ♪ [音乐] ♪ 00:12:17.263 --> 00:12:20.575 你正在掌握计量经济学的路上 00:12:20.834 --> 00:12:23.003 为确保自己能够记住这个视频里的内容 00:12:23.003 --> 00:12:25.467 请回答一些快速的练习题 00:12:25.467 --> 00:12:29.003 或者,如果你已准备好 请点按以观看下一个视频 00:12:29.003 --> 00:12:31.728 你还可以查看MRU的网站 00:12:31.796 --> 00:12:34.758 那里有更多课程、教师资源等