1 00:00:01,425 --> 00:00:05,015 - [讲解员] 在掌握计量经济学的道路上 2 00:00:05,619 --> 00:00:08,813 小徒弟Kamal也取得了巨大的进步 3 00:00:08,813 --> 00:00:13,662 他充分发挥了自己的能力 战胜了他的敌人 4 00:00:14,223 --> 00:00:16,640 可惜今天,他情绪低落 5 00:00:16,640 --> 00:00:19,614 因为有一项挑战尚未解决: 6 00:00:19,614 --> 00:00:24,230 Kamal还无法解读 学术研究期刊的论文 7 00:00:24,230 --> 00:00:27,347 比如《美国经济评论》 8 00:00:27,347 --> 00:00:29,317 和《计量经济学》等期刊 9 00:00:29,317 --> 00:00:33,501 在他看来,这些似乎是用 晦涩难懂的外语写的 10 00:00:33,501 --> 00:00:35,478 - [Kamal] 怎么回事...? 11 00:00:36,711 --> 00:00:40,349 -[讲解员] 对于新手Kamal来说 它们是模糊不清的 12 00:00:40,349 --> 00:00:42,205 但可以通过学习来解析 13 00:00:42,467 --> 00:00:45,109 让我们一起来阅读,学习 14 00:00:48,311 --> 00:00:51,712 随机对照试验 15 00:00:52,657 --> 00:00:53,984 让我们深入研究 16 00:00:53,984 --> 00:00:58,278 发表在《教育经济学评论》上的 西点军校的研究 17 00:00:58,658 --> 00:01:01,688 此论文讲述了 对“经济学101”的学生 18 00:01:01,688 --> 00:01:05,859 是否使用电子设备进行了随机评估 19 00:01:06,485 --> 00:01:09,192 首先,快速回顾其研究设计 20 00:01:09,423 --> 00:01:10,523 - 好的 21 00:01:11,553 --> 00:01:15,770 - [Josh] 在西点军校- 一所专门培训美国陆军军官的学院 22 00:01:15,770 --> 00:01:17,199 计量学大师们 23 00:01:17,199 --> 00:01:19,854 设计了一项随机试验 以回答这个问题 24 00:01:20,582 --> 00:01:22,383 按照不同的规则 25 00:01:22,383 --> 00:01:26,974 这些大师随机分配学员 到经济学的不同班级 26 00:01:27,116 --> 00:01:28,962 与大多数美国大学不同 27 00:01:28,962 --> 00:01:32,155 西点军校本来的规定是 不许使用电子设备 28 00:01:32,482 --> 00:01:36,324 为了这个实验 一些学生获得了特许 29 00:01:36,324 --> 00:01:38,679 不在这种传统、无电子产品的班里: 30 00:01:38,679 --> 00:01:41,911 没有笔记本电脑,没有平板电脑 没有手机! 31 00:01:43,324 --> 00:01:45,743 这是对照组,或基准 32 00:01:46,372 --> 00:01:49,292 另一组被允许使用电子产品 33 00:01:49,292 --> 00:01:52,704 这就是实验组 受制于一个变化了的环境 34 00:01:53,313 --> 00:01:56,000 在此,实验组可以在课堂上 35 00:01:56,000 --> 00:01:58,527 无限制地使用笔记本电脑 或平板电脑 36 00:01:59,195 --> 00:02:01,972 每一个因果问题 都有一个明确的结果 37 00:02:01,972 --> 00:02:05,379 我们在研究之前就已定义 希望影响的变量 38 00:02:06,058 --> 00:02:08,375 在西点军校 使用电子产品的结果 39 00:02:08,375 --> 00:02:10,124 是看期末考试的分数 40 00:02:10,535 --> 00:02:13,810 该研究的目的是为回答以下问题: 41 00:02:13,810 --> 00:02:17,629 用考试分数来衡量 在课堂使用电子设备 42 00:02:17,629 --> 00:02:19,765 与学习的因果关系是什么? 43 00:02:20,852 --> 00:02:25,787 - 经济学期刊文章 通常以描述性统计表格开头 44 00:02:25,994 --> 00:02:28,694 列出研究样本的关键因素 45 00:02:28,694 --> 00:02:32,129 - 我的天啊,我记得这个表 太令人困惑了! 46 00:02:32,129 --> 00:02:37,224 - [讲解员] 第一列到第三列报告平均特征 47 00:02:37,224 --> 00:02:40,089 这样就能知道我们的研究对象 48 00:02:40,089 --> 00:02:43,178 让我们从第一列开始 49 00:02:43,178 --> 00:02:45,438 它描述了对照组的协变量 50 00:02:45,438 --> 00:02:48,675 协变量是在实验开始之前测量的 51 00:02:48,675 --> 00:02:52,091 对照组和实验组的特征 52 00:02:52,091 --> 00:02:57,128 例如,我们看到对照组的平均年龄 略高于20岁 53 00:02:57,514 --> 00:03:00,535 许多协变量都是虚拟变量 54 00:03:00,997 --> 00:03:05,803 虚拟变量只能有两个值 -- 0或1 55 00:03:06,087 --> 00:03:10,298 例如,学生性别是虚拟变量 56 00:03:10,298 --> 00:03:13,386 女性等于1,男性等于0 57 00:03:13,386 --> 00:03:16,686 该变量的平均值为女性比例 58 00:03:17,104 --> 00:03:20,651 我们还发现,对照组中 有13%是西班牙裔 59 00:03:20,651 --> 00:03:23,905 19%服过兵役 60 00:03:24,817 --> 00:03:26,635 表中的注释是关键 61 00:03:26,635 --> 00:03:29,218 请在阅览表时参考这些 62 00:03:29,218 --> 00:03:33,534 这些注释解释了 每列和每个面板中的内容 63 00:03:39,485 --> 00:03:41,858 例如,这些注释告诉我们 64 00:03:41,858 --> 00:03:45,175 标准偏差用括号注明 65 00:03:45,947 --> 00:03:49,598 标准差告诉我们数据的离散情况 66 00:03:50,448 --> 00:03:54,887 例如,0.52的标准差告诉我们 67 00:03:54,887 --> 00:03:59,397 大多数对照组的GPA 落在2.35 68 00:03:59,397 --> 00:04:03,454 也就是比2.87的平均GPA低0.52 69 00:04:03,454 --> 00:04:08,337 和3.39之间 也就是比2.87高0.52 70 00:04:09,337 --> 00:04:12,122 较低的标准偏差味着GPA 71 00:04:12,122 --> 00:04:14,706 更紧密地聚集在平均值周围 72 00:04:14,706 --> 00:04:17,543 -[Kamal] 是啊,但大多数变量 都没有标准偏差 73 00:04:17,543 --> 00:04:18,600 -没错 74 00:04:18,600 --> 00:04:22,497 大师们通常都会忽略 虚拟变量的标准偏差 75 00:04:22,497 --> 00:04:26,500 因为变量的平均值 决定了其标准偏差 76 00:04:27,542 --> 00:04:30,102 本研究将两个实验组 77 00:04:30,102 --> 00:04:32,078 与对照组进行比较 78 00:04:32,078 --> 00:04:35,886 第一组可以随便使用 笔记本电脑和平板电脑 79 00:04:35,886 --> 00:04:38,252 第二个实验组的限制性强些 80 00:04:38,252 --> 00:04:41,713 只允许将平板电脑 放在桌子上使用 81 00:04:42,152 --> 00:04:45,238 实验组看起来与对照组很接近 82 00:04:46,694 --> 00:04:51,443 这将带我们到该表的下一个特征 第四列到第六列 83 00:04:51,443 --> 00:04:54,558 使用统计测试来比较实验前 84 00:04:54,558 --> 00:04:57,591 实验组和对照组的特征 85 00:04:58,158 --> 00:05:01,991 在第四栏中,两个实验组被合并了 86 00:05:01,991 --> 00:05:04,998 可以看到实验组和对照组的 87 00:05:04,998 --> 00:05:09,690 女性比例差异仅为0.03 88 00:05:10,508 --> 00:05:13,740 这种差异在统计学上并不显著 89 00:05:14,290 --> 00:05:17,440 在样本选择过程中 90 00:05:17,440 --> 00:05:20,623 我们可以很容易地 将其归结为偶然结果 91 00:05:20,623 --> 00:05:22,133 - 那我们怎么知道? 92 00:05:22,133 --> 00:05:23,790 - [讲解员] 记得经验法则吗? 93 00:05:23,790 --> 00:05:29,903 绝对值超出标准误差两倍的统计估计 94 00:05:30,108 --> 00:05:33,997 通常在统计学上是有显著性的 95 00:05:35,132 --> 00:05:38,766 标准误差为0.03 96 00:05:38,766 --> 00:05:41,483 与女性比例差异相同 97 00:05:42,244 --> 00:05:46,132 因此,后者与前者的比率仅为1 98 00:05:46,132 --> 00:05:48,607 这当然小于2 99 00:05:48,607 --> 00:05:51,451 - [Kamal] 哦!所以 表中的实验/对照差异 100 00:05:51,451 --> 00:05:54,455 均不超过其标准误差的两倍 101 00:05:54,455 --> 00:05:55,997 -[讲解员] 正确 102 00:05:55,997 --> 00:05:59,081 随机划分的学生似乎成功地 103 00:05:59,081 --> 00:06:01,945 创建了确实具有可比性的群体 104 00:06:02,846 --> 00:06:05,008 因此,我们可以确信 105 00:06:05,008 --> 00:06:07,774 课堂成绩随后的任何差异 106 00:06:07,774 --> 00:06:11,073 都是实验干预的结果 107 00:06:11,073 --> 00:06:14,754 而不是先前存在的差异的反映 108 00:06:14,754 --> 00:06:17,454 做到了“其他条件不变”! 109 00:06:17,454 --> 00:06:19,883 - [Kamal] 酷,等等 110 00:06:19,883 --> 00:06:22,833 底部有星号的数字呢? 111 00:06:22,833 --> 00:06:25,589 这些差异是标准误差的两倍以上 112 00:06:25,589 --> 00:06:27,402 -[讲解员] 好眼力,Kamal! 113 00:06:27,402 --> 00:06:29,386 该表中有许多数字 114 00:06:29,386 --> 00:06:32,246 面板B中的也很重要 115 00:06:32,246 --> 00:06:35,715 它们测量实验组和对照组的学生 116 00:06:35,715 --> 00:06:39,139 在课堂上使用电脑的程度 117 00:06:39,754 --> 00:06:42,873 这组的实验是允许电脑的使用 118 00:06:43,278 --> 00:06:44,873 研究人员必须证明 119 00:06:44,873 --> 00:06:47,079 被允许使用电脑的学生 120 00:06:47,079 --> 00:06:49,448 利用了这个机会 121 00:06:50,072 --> 00:06:53,033 如果他们没有使用,那就没有实验了 122 00:06:53,867 --> 00:06:57,469 幸运的是,第一实验组中 123 00:06:57,469 --> 00:06:59,472 81%的人使用了电脑 124 00:06:59,472 --> 00:07:02,178 而对照组中没有人使用电脑 125 00:07:02,178 --> 00:07:05,216 第二个平板电脑实验组的许多人 126 00:07:05,216 --> 00:07:07,264 也使用了电脑 127 00:07:07,264 --> 00:07:09,879 电脑的使用方面差异很大 128 00:07:09,879 --> 00:07:11,798 而且具有统计显著性 129 00:07:12,081 --> 00:07:15,428 我们还可以看到每组的样本量 130 00:07:15,428 --> 00:07:18,098 - [Kamal] 星号是装饰吗? 131 00:07:18,098 --> 00:07:21,421 -[讲解员]有些学术论文用星号来表示 132 00:07:21,421 --> 00:07:23,983 在统计学上有显著性的差异 133 00:07:23,983 --> 00:07:26,925 这可以引起人们的注意 134 00:07:26,925 --> 00:07:31,621 这里,三个星号表示结果在统计上 135 00:07:31,621 --> 00:07:35,672 p值偏离零假设的概率小于1% 136 00:07:35,672 --> 00:07:39,436 换句话说,这个结果纯粹是偶然的 137 00:07:39,436 --> 00:07:42,171 概率不到1/100 138 00:07:43,181 --> 00:07:48,997 两个星号表示偶然发现的机率 为1/20或5% 139 00:07:48,997 --> 00:07:52,469 一个星号代表 10%我们看到的结果 140 00:07:52,469 --> 00:07:56,036 仅归因于偶然 141 00:07:56,473 --> 00:07:59,957 如今,星号被视为有点过时 142 00:07:59,957 --> 00:08:01,606 有些期刊把它们省略了 143 00:08:01,606 --> 00:08:03,894 -[Kamal]那最后两列呢? 144 00:08:03,894 --> 00:08:08,152 -[讲解员] 与将两个实验组 合并为一的第四列不同 145 00:08:08,174 --> 00:08:13,876 后两列分别查看每个实验组的 实验/对照差异 146 00:08:14,572 --> 00:08:17,931 这提供了更详细的平衡分析 147 00:08:18,295 --> 00:08:21,288 另外,就目前而言 你可以忽略此行 148 00:08:21,288 --> 00:08:24,205 它将用于另一项显著性 测试 149 00:08:24,755 --> 00:08:29,402 现在我们来看看这篇文章的精华: 表四 150 00:08:30,075 --> 00:08:32,993 此表报告电子设备的使用 151 00:08:32,993 --> 00:08:37,273 对学生学习成绩影响的回归估计 152 00:08:37,273 --> 00:08:40,258 -[Kamal] 为什么这项研究 报告回归估计? 153 00:08:40,258 --> 00:08:42,529 这就是我不明白的原因 154 00:08:42,529 --> 00:08:44,806 我以为 我们喜欢随机试验的一个原因是 155 00:08:44,806 --> 00:08:48,320 只需比较实验组和对照组 156 00:08:48,320 --> 00:08:50,479 就可以获得因果关系 157 00:08:50,479 --> 00:08:53,883 由于这些组是平衡的 没有必要使用回归 158 00:08:53,883 --> 00:08:55,492 -[讲解员] 说得好,Kamal 159 00:08:55,492 --> 00:08:58,612 实际上,出于两个原因 160 00:08:58,612 --> 00:09:01,013 报告回归估计是惯例 161 00:09:01,013 --> 00:09:04,448 首先,尽管有证据表明 二者之间存在平衡 162 00:09:04,448 --> 00:09:07,349 但如果过于谨慎 分析师可能会考虑到 163 00:09:07,349 --> 00:09:09,678 二者之间的偶然性差异 164 00:09:09,678 --> 00:09:13,622 其次,回归估计可能更为精确 165 00:09:13,622 --> 00:09:16,509 也就是说,与简单的实验对照比较相比 166 00:09:16,509 --> 00:09:18,893 它们具有更低的标准误差 167 00:09:20,129 --> 00:09:22,526 本研究中的因变量 168 00:09:22,526 --> 00:09:24,305 是我们感兴趣的结果 169 00:09:24,652 --> 00:09:26,192 既然眼前的问题是 170 00:09:26,192 --> 00:09:29,068 课堂电子设备如何影响学习 171 00:09:29,068 --> 00:09:32,845 一个适合的结果 就是经济学期末考试的分数 172 00:09:33,406 --> 00:09:37,650 每列报告不同回归模型的结果 173 00:09:37,650 --> 00:09:40,476 除了实验组之外 174 00:09:40,476 --> 00:09:44,453 模型还通过控制变量 或协变量进行区分 175 00:09:44,934 --> 00:09:47,755 没有协变量的估计 176 00:09:47,755 --> 00:09:50,677 是对实验组和对照组的简单比较 177 00:09:50,677 --> 00:09:53,169 -[Kamal] 我还以为他们忘了填写呢 178 00:09:53,169 --> 00:09:56,228 -[讲解员]第一列显示,电子设备的使用 179 00:09:56,228 --> 00:10:00,835 使期末考试分数减少0.28标准差 180 00:10:01,547 --> 00:10:02,940 在我们的上一课中 181 00:10:02,940 --> 00:10:07,237 Joshway大师解释说 我们使用标准差单位 182 00:10:07,237 --> 00:10:10,672 因为这些单位在不同的研究中很容易比较 183 00:10:11,352 --> 00:10:12,642 第二列报告了 184 00:10:12,642 --> 00:10:16,082 添加人口统计控制的模型的结果 185 00:10:16,082 --> 00:10:19,907 在这里,我们比较测试分数 但持有不变的因素 186 00:10:19,907 --> 00:10:21,435 如年龄和性别 187 00:10:21,886 --> 00:10:23,202 第三列报告了 188 00:10:23,202 --> 00:10:27,186 将GPA添加到协变量列表中的 模型的结果 189 00:10:27,603 --> 00:10:30,822 第四列增加了ACT分数 190 00:10:30,822 --> 00:10:33,503 分析师经常以这种方式报告结果 191 00:10:33,503 --> 00:10:36,992 首先是包含很少或没有协变量的模型 192 00:10:36,992 --> 00:10:39,667 然后逐列报告 193 00:10:39,667 --> 00:10:43,586 添加越来越多协变量的模型估计值 194 00:10:44,035 --> 00:10:46,802 逐列观察,你注意到了什么? 195 00:10:47,252 --> 00:10:49,919 -[Kamal] 使用电脑的相关系数 196 00:10:49,919 --> 00:10:51,635 总是一个相当大的负数 197 00:10:51,635 --> 00:10:53,002 - [讲解员] 没错! 198 00:10:53,002 --> 00:10:56,455 我们还可以看到,标准误差小到 199 00:10:56,455 --> 00:11:00,561 足以使这些负面结果具有统计显著性 200 00:11:00,561 --> 00:11:04,446 换句话说,这个实验的主要收获是 201 00:11:04,446 --> 00:11:08,381 使用电子设备影响了学生的学习 202 00:11:09,000 --> 00:11:12,283 - [Kamal] GPA和ACT的分数 也很显著 203 00:11:12,283 --> 00:11:13,750 原因何在? 204 00:11:13,750 --> 00:11:15,423 -[讲解员]观察的很好! 205 00:11:15,423 --> 00:11:16,866 这并不奇怪 206 00:11:16,866 --> 00:11:20,473 我们期望这些变量 能预测在大学里的表现 207 00:11:20,473 --> 00:11:22,190 -[Kamal] 哦,没错 208 00:11:22,190 --> 00:11:24,026 之前取得很好成绩的孩子 209 00:11:24,026 --> 00:11:26,317 更有可能在这门课程中 取得较好的成绩 210 00:11:26,317 --> 00:11:30,226 -[讲解员] 你还会注意到这表中的 许多其他信息 211 00:11:30,226 --> 00:11:34,515 表中的其余面板报告了电子设备的使用 212 00:11:34,515 --> 00:11:36,933 对期末考试组成部分的影响 213 00:11:36,933 --> 00:11:39,816 如选择题 214 00:11:39,816 --> 00:11:43,371 这些结果大多与电脑的使用 215 00:11:43,371 --> 00:11:45,360 对总体得分的影响一致 216 00:11:45,360 --> 00:11:47,740 -[Kamal] 那行不是英文的行呢? 217 00:11:47,740 --> 00:11:50,994 -[讲解员] 它们提供了其他统计信息 218 00:11:50,994 --> 00:11:54,247 r 平方是拟合优度的度量 219 00:11:54,714 --> 00:11:56,638 尽管有些读者可能想知道 220 00:11:56,638 --> 00:11:58,010 但这并不太重要 221 00:11:58,660 --> 00:12:02,950 其他行报告具有统计显著性的替代测试 222 00:12:02,950 --> 00:12:05,028 你目前也可以忽略 223 00:12:05,028 --> 00:12:07,934 -[Kamal] 哦,我的天 这些表没有那么难嘛! 224 00:12:07,934 --> 00:12:09,488 非常感谢您 225 00:12:09,488 --> 00:12:11,787 -[讲解员] 接下来是要讲的是回归 226 00:12:11,787 --> 00:12:13,179 再见! 227 00:12:15,974 --> 00:12:17,263 ♪ [音乐] ♪ 228 00:12:17,263 --> 00:12:20,575 你正在掌握计量经济学的路上 229 00:12:20,834 --> 00:12:23,003 为确保自己能够记住这个视频里的内容 230 00:12:23,003 --> 00:12:25,467 请回答一些快速的练习题 231 00:12:25,467 --> 00:12:29,003 或者,如果你已准备好 请点按以观看下一个视频 232 00:12:29,003 --> 00:12:31,728 你还可以查看MRU的网站 233 00:12:31,796 --> 00:12:34,758 那里有更多课程、教师资源等