WEBVTT

00:00:01.425 --> 00:00:05.015
- [讲解员] 在掌握计量经济学的道路上

00:00:05.619 --> 00:00:08.813
蚱蜢Kamal取得了巨大的进步

00:00:08.813 --> 00:00:13.662
他充分发挥了自己的能力
战胜了他的敌人

00:00:14.223 --> 00:00:16.640
可惜，如今他情绪低落

00:00:16.640 --> 00:00:19.614
因为有一项挑战尚未得到满足

00:00:19.614 --> 00:00:24.230
Kamal还无法解读
学术研究期刊的经典著作

00:00:24.230 --> 00:00:27.347
比如《美国经济评论》

00:00:27.347 --> 00:00:29.317
和《计量经济学》等期刊

00:00:29.317 --> 00:00:33.501
在他看来，这些似乎是用一种
晦涩难懂的外国语言写的

00:00:33.501 --> 00:00:35.478
- [Kamal] 怎么回事...？

00:00:36.711 --> 00:00:40.069
-[讲解员] 这些卷对于还是新手的Kamal
是不透明的

00:00:40.069 --> 00:00:42.205
但可以通过研究解析

00:00:42.467 --> 00:00:45.109
让我们一起学习阅读它们

00:00:45.928 --> 00:00:49.001
掌握计量经济学
阅读经济学论文

00:00:49.001 --> 00:00:51.712
随机试验

00:00:52.657 --> 00:00:53.984
让我们深入研究

00:00:53.984 --> 00:00:58.278
发表在《教育经济学评论》上
的西点军校的研究

00:00:58.658 --> 00:01:01.688
本文报告了一项经济学101教室的学生

00:01:01.688 --> 00:01:05.859
电子设备的使用的随机评估

00:01:06.485 --> 00:01:09.192
首先，快速回顾其研究设计

00:01:09.423 --> 00:01:10.523
- 好吧

00:01:11.553 --> 00:01:13.630
- [Josh] 在西点军校

00:01:13.630 --> 00:01:17.029
一所专门培训美国陆军军官的军事学院教学
的计量学硕士生

00:01:17.029 --> 00:01:19.854
设计了一项随机试验
以回答这个问题

00:01:20.582 --> 00:01:23.233
这些硕士生随机分配西点军校学员

00:01:23.233 --> 00:01:26.574
进入经济学班，按照不同的规则操作

00:01:27.116 --> 00:01:28.962
与大多数美国大学不同

00:01:28.962 --> 00:01:31.945
西点军校的默认规则是没有电子设备

00:01:32.482 --> 00:01:35.784
为了这个实验的目的
一些学生被分配到

00:01:35.784 --> 00:01:38.679
这样的传统、无电子产品的班里——

00:01:38.679 --> 00:01:41.911
没有笔记本电脑，没有平板电脑和手机！

00:01:43.324 --> 00:01:45.743
这是对照组，或基线情况

00:01:46.372 --> 00:01:49.292
另一组被允许使用电子产品

00:01:49.292 --> 00:01:52.704
这就是实验组
受制于一个变化了的环境

00:01:53.313 --> 00:01:56.000
这情况下的实验是在课堂上

00:01:56.000 --> 00:01:58.107
无限制地使用笔记本电脑或平板电脑

00:01:59.195 --> 00:02:01.972
每一个因果问题都有一个明确的结果 ——

00:02:01.972 --> 00:02:05.379
我们在研究之前就已经定下的
希望影响的变量

00:02:06.058 --> 00:02:08.375
西点军校电子产品研究的结果

00:02:08.375 --> 00:02:10.124
是期末考试分数

00:02:10.535 --> 00:02:13.810
该研究的目的是为回答以下问题：

00:02:13.810 --> 00:02:17.629
以考试分数为衡量
课堂电子设备

00:02:17.629 --> 00:02:19.765
对学习的因果效应是什么？

00:02:20.852 --> 00:02:25.787
- 经济学期刊文章
通常以描述性统计表格开头

00:02:25.994 --> 00:02:28.694
列出研究样本的关键事实

00:02:28.694 --> 00:02:32.129
- 我的天啊，我记得这个表 --
太令人困惑了！

00:02:32.129 --> 00:02:37.224
- [讲解员] 第一列到第三列报告平均特征

00:02:37.224 --> 00:02:40.089
这样就能知道我们的研究对象

00:02:40.089 --> 00:02:44.933
让我们从第一列开始
它描述了对照组的协变量

00:02:45.438 --> 00:02:51.461
协变量是在实验开始之前测量的
对照组和实验组的特征

00:02:52.091 --> 00:02:57.128
例如，我们看到对照组的平均年龄
略高于20岁

00:02:57.514 --> 00:02:59.855
许多协变量都是虚拟变量

00:03:00.997 --> 00:03:05.803
虚拟变量只能有两个值 --
0或1

00:03:06.087 --> 00:03:10.298
例如，学生性别由虚拟变量捕获

00:03:10.298 --> 00:03:13.386
女性等于1，对男性等于0

00:03:13.386 --> 00:03:16.686
该变量的平均值为女性比例

00:03:17.104 --> 00:03:20.651
我们还发现，对照组中
有13%是西班牙裔

00:03:20.651 --> 00:03:23.905
19%有服过兵役

00:03:24.817 --> 00:03:26.635
表中的注释是关键

00:03:26.635 --> 00:03:29.218
请在阅览表时参考这些

00:03:29.218 --> 00:03:33.534
这些注释解释了每个列和面板中
显示的内容

00:03:34.977 --> 00:03:36.891
面板A

NOTE Paragraph

00:03:37.015 --> 00:03:39.039
面板B

00:03:39.485 --> 00:03:41.858
例如，这些注释告诉我们

00:03:41.858 --> 00:03:45.175
标准偏差用括号代表

00:03:45.947 --> 00:03:49.598
标准差告诉我们数据有多分散

00:03:50.448 --> 00:03:54.887
例如，0.52的标准差告诉我们

00:03:54.887 --> 00:03:59.397
大多数对照组的GPA
落在2.35

00:03:59.397 --> 00:04:03.454
也就是比2.87的平均GPA低0.52

00:04:03.454 --> 00:04:08.337
和3.39之间
也就是比2.87高0.52

00:04:09.337 --> 00:04:12.122
较低的标准偏差味着GPA

00:04:12.122 --> 00:04:14.706
更紧密地聚集在平均值周围

00:04:14.706 --> 00:04:17.543
-[Kamal] 是啊，但是在大多数变量
都没有较低的标准偏差

00:04:17.543 --> 00:04:18.600
没错

00:04:18.600 --> 00:04:22.497
硕士生通常都会忽略用于实体模型的标准偏差

00:04:22.497 --> 00:04:26.500
因为此变量的平均值决定了其标准偏差

00:04:27.542 --> 00:04:30.102
本研究将两个实验组

00:04:30.102 --> 00:04:32.078
与对照组进行比较

00:04:32.078 --> 00:04:35.886
第一组被允许使用笔记本电脑和平板电脑

00:04:35.886 --> 00:04:38.252
第二个个实验组的限制性更强

00:04:38.252 --> 00:04:41.713
只允许将平板电脑放在桌子上

00:04:42.152 --> 00:04:45.238
实验组看起来很像对照组

00:04:46.694 --> 00:04:51.443
这将我们带到该表的下一个特征
第四列到第六列

00:04:51.443 --> 00:04:54.558
使用统计测试来比较实验前

00:04:54.558 --> 00:04:57.591
实验组和对照组的特征

00:04:58.158 --> 00:05:01.991
在第四栏中，两个实验组被合并了

00:05:01.991 --> 00:05:04.998
可以看到实验组和对照组的

00:05:04.998 --> 00:05:09.690
女性比例差异仅为0.03

00:05:10.508 --> 00:05:13.740
这种差异在统计学上并不显着——

00:05:14.290 --> 00:05:17.440
在样本选择过程中

00:05:17.440 --> 00:05:20.623
我们可以很容易地将其归结为偶然结果

00:05:20.623 --> 00:05:22.133
- [Kamal] 那我们要怎么知道呢？

00:05:22.133 --> 00:05:23.790
- [讲解员] 记得经验法则吗？

00:05:23.790 --> 00:05:29.903
绝对值超出标准误差两倍的统计估计

00:05:30.108 --> 00:05:33.997
通常在统计学上是有显着性的

00:05:35.132 --> 00:05:38.766
标准误差为0.03

00:05:38.766 --> 00:05:41.483
与女性比例差异相同

00:05:42.244 --> 00:05:46.132
因此，后者与前者的比率仅为1

00:05:46.132 --> 00:05:48.607
这当然小于2

00:05:48.607 --> 00:05:51.191
- [Kamal] 哦！所以
表中的实验/对照差异

00:05:51.191 --> 00:05:54.455
均不超过其标准误差的两倍

00:05:54.455 --> 00:05:55.997
-[讲解员] 正确

00:05:55.997 --> 00:05:59.081
随机划分的学生似乎成功地

00:05:59.081 --> 00:06:01.945
创建了确实具有可比性的群体

00:06:02.846 --> 00:06:05.008
因此，我们可以确信

00:06:05.008 --> 00:06:07.774
课堂成绩随后的任何差异

00:06:07.774 --> 00:06:11.073
都是实验干预的结果

00:06:11.073 --> 00:06:14.754
而不是先前存在的差异的反映

00:06:14.754 --> 00:06:17.454
达到了Ceteris paribus！

00:06:17.454 --> 00:06:22.374
- [Kamal] 酷。等等
底部有星号的数字和呢？

00:06:22.833 --> 00:06:25.589
这些差异是标准误差的两倍以上

00:06:25.589 --> 00:06:27.402
-[讲解员] 好眼力，Kamal！

00:06:27.402 --> 00:06:29.386
该表中有许多数字

00:06:29.386 --> 00:06:32.246
面板B也很重要

00:06:32.246 --> 00:06:35.715
此面板测量实验组和对照组的学生

00:06:35.715 --> 00:06:39.139
在课堂上使用电脑的程度

00:06:39.754 --> 00:06:42.873
这组的实验是允许电脑的使用

00:06:43.278 --> 00:06:44.873
研究人员必须证明

00:06:44.873 --> 00:06:47.079
被允许使用电脑的学生

00:06:47.079 --> 00:06:49.448
利用了这个机会

00:06:50.072 --> 00:06:53.033
如果他们没有使用，那就没有实验了

00:06:53.867 --> 00:06:57.799
幸运的是，第一实验组中的81%人

00:06:57.799 --> 00:06:59.472
使用了电脑

00:06:59.472 --> 00:07:02.178
而对照组中没有人使用电脑

00:07:02.178 --> 00:07:05.216
第二个平板电脑实验组的许多人

00:07:05.216 --> 00:07:07.264
也使用了电脑

00:07:07.264 --> 00:07:09.879
电脑的使用方面差异很大

00:07:09.879 --> 00:07:11.798
而且具有统计显著性

00:07:12.081 --> 00:07:15.428
我们还可以看到每组的样本量

00:07:15.428 --> 00:07:18.098
- [Kamal] 星号就像装饰品吗？

00:07:18.098 --> 00:07:21.421
-[讲解员]有些学术论文用星号来表示

00:07:21.421 --> 00:07:23.983
在统计学上有显着性的差异

00:07:23.983 --> 00:07:26.925
这可以向看的人突出显示

00:07:26.925 --> 00:07:31.621
这里，三个星号表示结果在统计上

00:07:31.621 --> 00:07:34.942
不同于零，p值小于1%

00:07:35.672 --> 00:07:39.436
换句话说，这个结果纯粹是偶然的发现

00:07:39.436 --> 00:07:42.171
概率不到1/100

00:07:43.181 --> 00:07:48.997
两个星号表示偶然发现的机会的概率
为1/20或5%

00:07:48.997 --> 00:07:52.469
一个星号代表
10%我们看到的结果

00:07:52.469 --> 00:07:56.036
仅归因于偶然

00:07:56.473 --> 00:07:59.957
如今，星号被视为有点过时

00:07:59.957 --> 00:08:01.606
有些期刊把它们省略了

00:08:01.606 --> 00:08:03.894
-[Kamal]那最后两列呢？

00:08:03.894 --> 00:08:08.152
-[讲解员] 与将两个实验组
合并为一个实验组的第四列不同

00:08:08.174 --> 00:08:13.876
后两列分别查看每个实验组的实验/对照差异

00:08:14.572 --> 00:08:17.441
这提供了更详细的平衡分析

00:08:18.295 --> 00:08:21.288
另外，就目前而言
你可以忽略此行

00:08:21.288 --> 00:08:24.205
它将用于另一项显着性
测试

00:08:24.755 --> 00:08:29.062
现在我们来看看这篇文章的妙处
表四

00:08:30.075 --> 00:08:32.993
此表报告电子设备的使用

00:08:32.993 --> 00:08:37.273
对学生学习成效的影响的回归估计

00:08:37.273 --> 00:08:40.258
-[Kamal] 为什么这项研究
报告的回归估计？

00:08:40.258 --> 00:08:42.529
这就是我不明白的原因

00:08:42.529 --> 00:08:44.806
我以为我们喜欢随机试验的一个原因是

00:08:44.806 --> 00:08:47.260
我们用它们来获得因果效应

00:08:47.260 --> 00:08:50.479
只需比较实验组和对照组

00:08:50.479 --> 00:08:53.883
由于这些组是平衡的
没有必要使用回归

00:08:53.883 --> 00:08:55.492
-[讲解员] 说得好，Kamal

00:08:55.492 --> 00:08:59.272
实际上，出于两个原因

00:08:59.272 --> 00:09:01.013
报告回归估计是惯例

00:09:01.013 --> 00:09:04.448
首先，尽管有证据表明二者之间存在平衡

00:09:04.448 --> 00:09:07.349
但如果过于谨慎
分析师可能会考虑到

00:09:07.349 --> 00:09:09.678
二者之间的偶然性差异

00:09:09.678 --> 00:09:13.622
其次，回归估计可能更为精确——

00:09:13.622 --> 00:09:16.509
也就是说，与简单的实验对照比较相比

00:09:16.509 --> 00:09:18.893
它们具有更低的标准误差

00:09:20.129 --> 00:09:22.526
本研究中的因变量

00:09:22.526 --> 00:09:24.305
是我们感兴趣的结果

00:09:24.652 --> 00:09:26.192
既然眼前的问题是

00:09:26.192 --> 00:09:29.068
课堂电子设备如何影响学习

00:09:29.068 --> 00:09:32.845
一个适合的结果就是经济学期末考试的分数

00:09:33.406 --> 00:09:37.650
每列报告不同回归模型的结果

00:09:37.650 --> 00:09:40.476
除了实验状态之外

00:09:40.476 --> 00:09:44.453
模型还通过它们包括的控制变量
或协变量进行区分

00:09:44.934 --> 00:09:48.425
没有协变量的估计

00:09:48.425 --> 00:09:50.677
是实验组和对照组的简单比较

00:09:50.677 --> 00:09:53.169
-[Kamal] 我以为他们只是忘了填写

00:09:53.169 --> 00:09:56.228
-[讲解员]第一列显示，电子设备的使用

00:09:56.228 --> 00:10:00.835
使期末考试分数减少0.28标准差

00:10:01.547 --> 00:10:02.940
在我们的上一课中

00:10:02.940 --> 00:10:07.237
Joshway大师解释说
我们使用标准差单位

00:10:07.237 --> 00:10:10.672
因为这些单位在不同的研究中很容易被比较

00:10:11.352 --> 00:10:12.642
第二列报告了

00:10:12.642 --> 00:10:16.082
添加人口统计控制的模型的结果

00:10:16.082 --> 00:10:19.907
在这里，我们比较测试分数
但持有不变的因素

00:10:19.907 --> 00:10:21.435
如年龄和性别

00:10:21.886 --> 00:10:23.202
第三列报告了

00:10:23.202 --> 00:10:27.186
将GPA添加到协变量列表中的模型的结果

00:10:27.603 --> 00:10:30.822
第四列增加了ACT分数

00:10:30.822 --> 00:10:33.503
分析师经常以这种方式报告结果

00:10:33.503 --> 00:10:36.992
首先是包含很少或没有协变量的模型

00:10:36.992 --> 00:10:39.667
然后逐列报告

00:10:39.667 --> 00:10:43.586
添加越来越多协变量的模型估计值

00:10:44.035 --> 00:10:46.802
逐列观察，你注意到了什么？

00:10:47.252 --> 00:10:49.919
-[Kamal] 使用电脑的系数

00:10:49.919 --> 00:10:51.635
总是一个相当大的负数

00:10:51.635 --> 00:10:53.002
- [讲解员] 没错！

00:10:53.002 --> 00:10:56.455
我们还可以看到，标准误差小到

00:10:56.455 --> 00:11:00.561
足以使这些负面结果具有统计显著性

00:11:00.561 --> 00:11:04.446
换句话说，这个实验的主要收获是

00:11:04.446 --> 00:11:08.381
教室里的电子设备影响了学生的学习

00:11:09.000 --> 00:11:12.283
- [Kamal] GPA和ACT的分数
也很重要

00:11:12.283 --> 00:11:13.750
原因何在？

00:11:13.750 --> 00:11:15.423
-[讲解员]很好的观察！

00:11:15.423 --> 00:11:16.866
这并不奇怪

00:11:16.866 --> 00:11:20.473
我们期望这些变量能预测在大学里的表现

00:11:20.473 --> 00:11:22.190
-[Kamal] 哦，没错

00:11:22.190 --> 00:11:24.026
之前取得更好成绩的孩子

00:11:24.026 --> 00:11:26.317
更有可能在这门课程中取得较好的成绩

00:11:26.317 --> 00:11:30.226
-[讲解员] 你还会注意到这表中的
许多其他信息

00:11:30.226 --> 00:11:34.515
表中的其余面板报告了电子设备的使用

00:11:34.515 --> 00:11:36.933
对期末考试组成部分的影响

00:11:36.933 --> 00:11:39.816
如选择题

00:11:39.816 --> 00:11:43.371
这些结果大多与电脑的使用

00:11:43.371 --> 00:11:45.360
对总体得分的影响一致

00:11:45.360 --> 00:11:47.740
-[Kamal] 那行不是英文的行呢？

00:11:47.740 --> 00:11:50.994
-[讲解员] 它们提供了其他统计信息

00:11:50.994 --> 00:11:54.247
r 平方是拟合优度的度量

00:11:54.714 --> 00:11:56.009
尽管有些读者可能想知道

00:11:56.009 --> 00:11:58.010
但这并不太重要

00:11:58.660 --> 00:12:02.950
其他行报告具有统计显著性的替代测试

00:12:02.950 --> 00:12:05.028
你目前可以忽略这些测试

00:12:05.028 --> 00:12:07.934
-[Kamal] 哦，我的天
这些表没有那么难嘛！

00:12:07.934 --> 00:12:09.488
非常感谢你

00:12:09.488 --> 00:12:11.787
-[讲解员] 接下来是要讲的是回归这个议题

00:12:11.787 --> 00:12:13.179
再见！

00:12:15.974 --> 00:12:17.263
♪ [音乐] ♪

00:12:17.263 --> 00:12:20.575
你正在掌握计量经济学的路上

00:12:20.834 --> 00:12:22.783
为确保自己能够记住这个视频里的内容

00:12:22.783 --> 00:12:25.467
请回答一些快速的练习题

00:12:25.467 --> 00:12:29.003
或者，如果你已准备好
请点按以观看下一个视频

00:12:29.003 --> 00:12:31.728
你还可以查看MRU的网站

00:12:31.796 --> 00:12:34.758
那里有更多课程、教师资源等