WEBVTT 00:00:01.425 --> 00:00:05.015 - [讲解员] 在掌握计量经济学的道路上 00:00:05.619 --> 00:00:08.813 蚱蜢Kamal取得了巨大的进步 00:00:08.813 --> 00:00:13.662 他充分发挥了自己的能力 战胜了他的敌人 00:00:14.223 --> 00:00:16.640 可惜,如今他情绪低落 00:00:16.640 --> 00:00:19.614 因为有一项挑战尚未得到满足 00:00:19.614 --> 00:00:24.230 Kamal还无法解读 学术研究期刊的经典著作 00:00:24.230 --> 00:00:27.347 比如《美国经济评论》 00:00:27.347 --> 00:00:29.317 和《计量经济学》等期刊 00:00:29.317 --> 00:00:33.501 在他看来,这些似乎是用一种 晦涩难懂的外国语言写的 00:00:33.501 --> 00:00:35.478 - [Kamal] 怎么回事...? 00:00:36.711 --> 00:00:40.069 -[讲解员] 这些卷对于还是新手的Kamal 是不透明的 00:00:40.069 --> 00:00:42.205 但可以通过研究解析 00:00:42.467 --> 00:00:45.109 让我们一起学习阅读它们 00:00:45.928 --> 00:00:49.001 掌握计量经济学 阅读经济学论文 00:00:49.001 --> 00:00:51.712 随机试验 00:00:52.657 --> 00:00:53.984 让我们深入研究 00:00:53.984 --> 00:00:58.278 发表在《教育经济学评论》上 的西点军校的研究 00:00:58.658 --> 00:01:01.688 本文报告了一项经济学101教室的学生 00:01:01.688 --> 00:01:05.859 电子设备的使用的随机评估 00:01:06.485 --> 00:01:09.192 首先,快速回顾其研究设计 00:01:09.423 --> 00:01:10.523 - 好吧 00:01:11.553 --> 00:01:13.630 - [Josh] 在西点军校 00:01:13.630 --> 00:01:17.029 一所专门培训美国陆军军官的军事学院教学 的计量学硕士生 00:01:17.029 --> 00:01:19.854 设计了一项随机试验 以回答这个问题 00:01:20.582 --> 00:01:23.233 这些硕士生随机分配西点军校学员 00:01:23.233 --> 00:01:26.574 进入经济学班,按照不同的规则操作 00:01:27.116 --> 00:01:28.962 与大多数美国大学不同 00:01:28.962 --> 00:01:31.945 西点军校的默认规则是没有电子设备 00:01:32.482 --> 00:01:35.784 为了这个实验的目的 一些学生被分配到 00:01:35.784 --> 00:01:38.679 这样的传统、无电子产品的班里—— 00:01:38.679 --> 00:01:41.911 没有笔记本电脑,没有平板电脑和手机! 00:01:43.324 --> 00:01:45.743 这是对照组,或基线情况 00:01:46.372 --> 00:01:49.292 另一组被允许使用电子产品 00:01:49.292 --> 00:01:52.704 这就是实验组 受制于一个变化了的环境 00:01:53.313 --> 00:01:56.000 这情况下的实验是在课堂上 00:01:56.000 --> 00:01:58.107 无限制地使用笔记本电脑或平板电脑 00:01:59.195 --> 00:02:01.972 每一个因果问题都有一个明确的结果 —— 00:02:01.972 --> 00:02:05.379 我们在研究之前就已经定下的 希望影响的变量 00:02:06.058 --> 00:02:08.375 西点军校电子产品研究的结果 00:02:08.375 --> 00:02:10.124 是期末考试分数 00:02:10.535 --> 00:02:13.810 该研究的目的是为回答以下问题: 00:02:13.810 --> 00:02:17.629 以考试分数为衡量 课堂电子设备 00:02:17.629 --> 00:02:19.765 对学习的因果效应是什么? 00:02:20.852 --> 00:02:25.787 - 经济学期刊文章 通常以描述性统计表格开头 00:02:25.994 --> 00:02:28.694 列出研究样本的关键事实 00:02:28.694 --> 00:02:32.129 - 我的天啊,我记得这个表 -- 太令人困惑了! 00:02:32.129 --> 00:02:37.224 - [讲解员] 第一列到第三列报告平均特征 00:02:37.224 --> 00:02:40.089 这样就能知道我们的研究对象 00:02:40.089 --> 00:02:44.933 让我们从第一列开始 它描述了对照组的协变量 00:02:45.438 --> 00:02:51.461 协变量是在实验开始之前测量的 对照组和实验组的特征 00:02:52.091 --> 00:02:57.128 例如,我们看到对照组的平均年龄 略高于20岁 00:02:57.514 --> 00:02:59.855 许多协变量都是虚拟变量 00:03:00.997 --> 00:03:05.803 虚拟变量只能有两个值 -- 0或1 00:03:06.087 --> 00:03:10.298 例如,学生性别由虚拟变量捕获 00:03:10.298 --> 00:03:13.386 女性等于1,对男性等于0 00:03:13.386 --> 00:03:16.686 该变量的平均值为女性比例 00:03:17.104 --> 00:03:20.651 我们还发现,对照组中 有13%是西班牙裔 00:03:20.651 --> 00:03:23.905 19%有服过兵役 00:03:24.817 --> 00:03:26.635 表中的注释是关键 00:03:26.635 --> 00:03:29.218 请在阅览表时参考这些 00:03:29.218 --> 00:03:33.534 这些注释解释了每个列和面板中 显示的内容 00:03:34.977 --> 00:03:36.891 面板A NOTE Paragraph 00:03:37.015 --> 00:03:39.039 面板B 00:03:39.485 --> 00:03:41.858 例如,这些注释告诉我们 00:03:41.858 --> 00:03:45.175 标准偏差用括号代表 00:03:45.947 --> 00:03:49.598 标准差告诉我们数据有多分散 00:03:50.448 --> 00:03:54.887 例如,0.52的标准差告诉我们 00:03:54.887 --> 00:03:59.397 大多数对照组的GPA 落在2.35 00:03:59.397 --> 00:04:03.454 也就是比2.87的平均GPA低0.52 00:04:03.454 --> 00:04:08.337 和3.39之间 也就是比2.87高0.52 00:04:09.337 --> 00:04:12.122 较低的标准偏差味着GPA 00:04:12.122 --> 00:04:14.706 更紧密地聚集在平均值周围 00:04:14.706 --> 00:04:17.543 -[Kamal] 是啊,但是在大多数变量 都没有较低的标准偏差 00:04:17.543 --> 00:04:18.600 没错 00:04:18.600 --> 00:04:22.497 硕士生通常都会忽略用于实体模型的标准偏差 00:04:22.497 --> 00:04:26.500 因为此变量的平均值决定了其标准偏差 00:04:27.542 --> 00:04:30.102 本研究将两个实验组 00:04:30.102 --> 00:04:32.078 与对照组进行比较 00:04:32.078 --> 00:04:35.886 第一组被允许使用笔记本电脑和平板电脑 00:04:35.886 --> 00:04:38.252 第二个个实验组的限制性更强 00:04:38.252 --> 00:04:41.713 只允许将平板电脑放在桌子上 00:04:42.152 --> 00:04:45.238 实验组看起来很像对照组 00:04:46.694 --> 00:04:51.443 这将我们带到该表的下一个特征 第四列到第六列 00:04:51.443 --> 00:04:54.558 使用统计测试来比较实验前 00:04:54.558 --> 00:04:57.591 实验组和对照组的特征 00:04:58.158 --> 00:05:01.991 在第四栏中,两个实验组被合并了 00:05:01.991 --> 00:05:04.998 可以看到实验组和对照组的 00:05:04.998 --> 00:05:09.690 女性比例差异仅为0.03 00:05:10.508 --> 00:05:13.740 这种差异在统计学上并不显着—— 00:05:14.290 --> 00:05:17.440 在样本选择过程中 00:05:17.440 --> 00:05:20.623 我们可以很容易地将其归结为偶然结果 00:05:20.623 --> 00:05:22.133 - [Kamal] 那我们要怎么知道呢? 00:05:22.133 --> 00:05:23.790 - [讲解员] 记得经验法则吗? 00:05:23.790 --> 00:05:29.903 绝对值超出标准误差两倍的统计估计 00:05:30.108 --> 00:05:33.997 通常在统计学上是有显着性的 00:05:35.132 --> 00:05:38.766 标准误差为0.03 00:05:38.766 --> 00:05:41.483 与女性比例差异相同 00:05:42.244 --> 00:05:46.132 因此,后者与前者的比率仅为1 00:05:46.132 --> 00:05:48.607 这当然小于2 00:05:48.607 --> 00:05:51.191 - [Kamal] 哦!所以 表中的实验/对照差异 00:05:51.191 --> 00:05:54.455 均不超过其标准误差的两倍 00:05:54.455 --> 00:05:55.997 -[讲解员] 正确 00:05:55.997 --> 00:05:59.081 随机划分的学生似乎成功地 00:05:59.081 --> 00:06:01.945 创建了确实具有可比性的群体 00:06:02.846 --> 00:06:05.008 因此,我们可以确信 00:06:05.008 --> 00:06:07.774 课堂成绩随后的任何差异 00:06:07.774 --> 00:06:11.073 都是实验干预的结果 00:06:11.073 --> 00:06:14.754 而不是先前存在的差异的反映 00:06:14.754 --> 00:06:17.454 达到了Ceteris paribus! 00:06:17.454 --> 00:06:22.374 - [Kamal] 酷。等等 底部有星号的数字和呢? 00:06:22.833 --> 00:06:25.589 这些差异是标准误差的两倍以上 00:06:25.589 --> 00:06:27.402 -[讲解员] 好眼力,Kamal! 00:06:27.402 --> 00:06:29.386 该表中有许多数字 00:06:29.386 --> 00:06:32.246 面板B也很重要 00:06:32.246 --> 00:06:35.715 此面板测量实验组和对照组的学生 00:06:35.715 --> 00:06:39.139 在课堂上使用电脑的程度 00:06:39.754 --> 00:06:42.873 这组的实验是允许电脑的使用 00:06:43.278 --> 00:06:44.873 研究人员必须证明 00:06:44.873 --> 00:06:47.079 被允许使用电脑的学生 00:06:47.079 --> 00:06:49.448 利用了这个机会 00:06:50.072 --> 00:06:53.033 如果他们没有使用,那就没有实验了 00:06:53.867 --> 00:06:57.799 幸运的是,第一实验组中的81%人 00:06:57.799 --> 00:06:59.472 使用了电脑 00:06:59.472 --> 00:07:02.178 而对照组中没有人使用电脑 00:07:02.178 --> 00:07:05.216 第二个平板电脑实验组的许多人 00:07:05.216 --> 00:07:07.264 也使用了电脑 00:07:07.264 --> 00:07:09.879 电脑的使用方面差异很大 00:07:09.879 --> 00:07:11.798 而且具有统计显著性 00:07:12.081 --> 00:07:15.428 我们还可以看到每组的样本量 00:07:15.428 --> 00:07:18.098 - [Kamal] 星号就像装饰品吗? 00:07:18.098 --> 00:07:21.421 -[讲解员]有些学术论文用星号来表示 00:07:21.421 --> 00:07:23.983 在统计学上有显着性的差异 00:07:23.983 --> 00:07:26.925 这可以向看的人突出显示 00:07:26.925 --> 00:07:31.621 这里,三个星号表示结果在统计上 00:07:31.621 --> 00:07:34.942 不同于零,p值小于1% 00:07:35.672 --> 00:07:39.436 换句话说,这个结果纯粹是偶然的发现 00:07:39.436 --> 00:07:42.171 概率不到1/100 00:07:43.181 --> 00:07:48.997 两个星号表示偶然发现的机会的概率 为1/20或5% 00:07:48.997 --> 00:07:52.469 一个星号代表 10%我们看到的结果 00:07:52.469 --> 00:07:56.036 仅归因于偶然 00:07:56.473 --> 00:07:59.957 如今,星号被视为有点过时 00:07:59.957 --> 00:08:01.606 有些期刊把它们省略了 00:08:01.606 --> 00:08:03.894 -[Kamal]那最后两列呢? 00:08:03.894 --> 00:08:08.152 -[讲解员] 与将两个实验组 合并为一个实验组的第四列不同 00:08:08.174 --> 00:08:13.876 后两列分别查看每个实验组的实验/对照差异 00:08:14.572 --> 00:08:17.441 这提供了更详细的平衡分析 00:08:18.295 --> 00:08:21.288 另外,就目前而言 你可以忽略此行 00:08:21.288 --> 00:08:24.205 它将用于另一项显着性 测试 00:08:24.755 --> 00:08:29.062 现在我们来看看这篇文章的妙处 表四 00:08:30.075 --> 00:08:32.993 此表报告电子设备的使用 00:08:32.993 --> 00:08:37.273 对学生学习成效的影响的回归估计 00:08:37.273 --> 00:08:40.258 -[Kamal] 为什么这项研究 报告的回归估计? 00:08:40.258 --> 00:08:42.529 这就是我不明白的原因 00:08:42.529 --> 00:08:44.806 我以为我们喜欢随机试验的一个原因是 00:08:44.806 --> 00:08:47.260 我们用它们来获得因果效应 00:08:47.260 --> 00:08:50.479 只需比较实验组和对照组 00:08:50.479 --> 00:08:53.883 由于这些组是平衡的 没有必要使用回归 00:08:53.883 --> 00:08:55.492 -[讲解员] 说得好,Kamal 00:08:55.492 --> 00:08:59.272 实际上,出于两个原因 00:08:59.272 --> 00:09:01.013 报告回归估计是惯例 00:09:01.013 --> 00:09:04.448 首先,尽管有证据表明二者之间存在平衡 00:09:04.448 --> 00:09:07.349 但如果过于谨慎 分析师可能会考虑到 00:09:07.349 --> 00:09:09.678 二者之间的偶然性差异 00:09:09.678 --> 00:09:13.622 其次,回归估计可能更为精确—— 00:09:13.622 --> 00:09:16.509 也就是说,与简单的实验对照比较相比 00:09:16.509 --> 00:09:18.893 它们具有更低的标准误差 00:09:20.129 --> 00:09:22.526 本研究中的因变量 00:09:22.526 --> 00:09:24.305 是我们感兴趣的结果 00:09:24.652 --> 00:09:26.192 既然眼前的问题是 00:09:26.192 --> 00:09:29.068 课堂电子设备如何影响学习 00:09:29.068 --> 00:09:32.845 一个适合的结果就是经济学期末考试的分数 00:09:33.406 --> 00:09:37.650 每列报告不同回归模型的结果 00:09:37.650 --> 00:09:40.476 除了实验状态之外 00:09:40.476 --> 00:09:44.453 模型还通过它们包括的控制变量 或协变量进行区分 00:09:44.934 --> 00:09:48.425 没有协变量的估计 00:09:48.425 --> 00:09:50.677 是实验组和对照组的简单比较 00:09:50.677 --> 00:09:53.169 -[Kamal] 我以为他们只是忘了填写 00:09:53.169 --> 00:09:56.228 -[讲解员]第一列显示,电子设备的使用 00:09:56.228 --> 00:10:00.835 使期末考试分数减少0.28标准差 00:10:01.547 --> 00:10:02.940 在我们的上一课中 00:10:02.940 --> 00:10:07.237 Joshway大师解释说 我们使用标准差单位 00:10:07.237 --> 00:10:10.672 因为这些单位在不同的研究中很容易被比较 00:10:11.352 --> 00:10:12.642 第二列报告了 00:10:12.642 --> 00:10:16.082 添加人口统计控制的模型的结果 00:10:16.082 --> 00:10:19.907 在这里,我们比较测试分数 但持有不变的因素 00:10:19.907 --> 00:10:21.435 如年龄和性别 00:10:21.886 --> 00:10:23.202 第三列报告了 00:10:23.202 --> 00:10:27.186 将GPA添加到协变量列表中的模型的结果 00:10:27.603 --> 00:10:30.822 第四列增加了ACT分数 00:10:30.822 --> 00:10:33.503 分析师经常以这种方式报告结果 00:10:33.503 --> 00:10:36.992 首先是包含很少或没有协变量的模型 00:10:36.992 --> 00:10:39.667 然后逐列报告 00:10:39.667 --> 00:10:43.586 添加越来越多协变量的模型估计值 00:10:44.035 --> 00:10:46.802 逐列观察,你注意到了什么? 00:10:47.252 --> 00:10:49.919 -[Kamal] 使用电脑的系数 00:10:49.919 --> 00:10:51.635 总是一个相当大的负数 00:10:51.635 --> 00:10:53.002 - [讲解员] 没错! 00:10:53.002 --> 00:10:56.455 我们还可以看到,标准误差小到 00:10:56.455 --> 00:11:00.561 足以使这些负面结果具有统计显著性 00:11:00.561 --> 00:11:04.446 换句话说,这个实验的主要收获是 00:11:04.446 --> 00:11:08.381 教室里的电子设备影响了学生的学习 00:11:09.000 --> 00:11:12.283 - [Kamal] GPA和ACT的分数 也很重要 00:11:12.283 --> 00:11:13.750 原因何在? 00:11:13.750 --> 00:11:15.423 -[讲解员]很好的观察! 00:11:15.423 --> 00:11:16.866 这并不奇怪 00:11:16.866 --> 00:11:20.473 我们期望这些变量能预测在大学里的表现 00:11:20.473 --> 00:11:22.190 -[Kamal] 哦,没错 00:11:22.190 --> 00:11:24.026 之前取得更好成绩的孩子 00:11:24.026 --> 00:11:26.317 更有可能在这门课程中取得较好的成绩 00:11:26.317 --> 00:11:30.226 -[讲解员] 你还会注意到这表中的 许多其他信息 00:11:30.226 --> 00:11:34.515 表中的其余面板报告了电子设备的使用 00:11:34.515 --> 00:11:36.933 对期末考试组成部分的影响 00:11:36.933 --> 00:11:39.816 如选择题 00:11:39.816 --> 00:11:43.371 这些结果大多与电脑的使用 00:11:43.371 --> 00:11:45.360 对总体得分的影响一致 00:11:45.360 --> 00:11:47.740 -[Kamal] 那行不是英文的行呢? 00:11:47.740 --> 00:11:50.994 -[讲解员] 它们提供了其他统计信息 00:11:50.994 --> 00:11:54.247 r 平方是拟合优度的度量 00:11:54.714 --> 00:11:56.009 尽管有些读者可能想知道 00:11:56.009 --> 00:11:58.010 但这并不太重要 00:11:58.660 --> 00:12:02.950 其他行报告具有统计显著性的替代测试 00:12:02.950 --> 00:12:05.028 你目前可以忽略这些测试 00:12:05.028 --> 00:12:07.934 -[Kamal] 哦,我的天 这些表没有那么难嘛! 00:12:07.934 --> 00:12:09.488 非常感谢你 00:12:09.488 --> 00:12:11.787 -[讲解员] 接下来是要讲的是回归这个议题 00:12:11.787 --> 00:12:13.179 再见! 00:12:15.974 --> 00:12:17.263 ♪ [音乐] ♪ 00:12:17.263 --> 00:12:20.575 你正在掌握计量经济学的路上 00:12:20.834 --> 00:12:22.783 为确保自己能够记住这个视频里的内容 00:12:22.783 --> 00:12:25.467 请回答一些快速的练习题 00:12:25.467 --> 00:12:29.003 或者,如果你已准备好 请点按以观看下一个视频 00:12:29.003 --> 00:12:31.728 你还可以查看MRU的网站 00:12:31.796 --> 00:12:34.758 那里有更多课程、教师资源等