0:00:00.239,0:00:05.110 - [讲解员] 从因到果之路[br]黑暗又凶险 0:00:05.572,0:00:08.974 但我们拥有[br]计量经济学的强大武器 0:00:09.941,0:00:14.824 请看,这就是威力最强的[br]随机分配之剑 0:00:14.824,0:00:18.108 它直逼因果问题的核心 0:00:22.971,0:00:27.737 我们先来看看我们手中[br]最强大也最昂贵的武器 -- 0:00:27.737,0:00:29.558 随机试验 0:00:29.558,0:00:30.828 - [学生] 太棒了 0:00:30.828,0:00:34.839 - 每种计量方法的使命[br]都始于因果问题 0:00:34.893,0:00:37.842 清晰的问题[br]才能带来清晰的答案 0:00:38.955,0:00:42.709 而随机试验能够提供[br]最清晰的答案 0:00:43.623,0:00:47.592 我们来看看[br]随机试验是如何 0:00:47.712,0:00:51.328 对因果问题给出[br]格外有说服力的答案的 0:00:52.012,0:00:55.528 - [Josh] 正如一把精心打磨的宝剑 0:00:55.528,0:00:57.805 随机试验直指因果问题的核心 0:00:57.805,0:01:00.912 它能用来创造[br]深具说服力的同类比较 0:01:01.092,0:01:03.921 但就像其他精心制造的武器一样 0:01:03.921,0:01:07.195 随机试验十分昂贵[br]运用起来耗时也很久 0:01:08.041,0:01:11.555 - 随机试验起源于医学研究 0:01:11.555,0:01:16.362 当时被称为随机化临床试验[br]简称 RCT 0:01:17.245,0:01:21.359 美国食品药品监督管理局规定 0:01:21.359,0:01:24.932 制药厂必须证明 0:01:24.932,0:01:26.331 新药和新疗法的安全性和有效性 0:01:26.981,0:01:30.025 他们的做法就是[br]开展一系列 RCT 0:01:30.440,0:01:35.275 所以我们说随机试验测量的是[br]“治疗”效果,或处理效应 0:01:35.936,0:01:38.269 说不定你就曾参与过 0:01:38.269,0:01:39.733 另外一种随机试验 -- 0:01:39.733,0:01:43.102 硅谷公司用来比较[br]不同营销策略的 0:01:43.102,0:01:45.699 A/B试验 0:01:45.699,0:01:50.480 例如,亚马逊会对搜索结果[br]进行随机化处理 0:01:50.480,0:01:51.624 从而不断进行随机试验 0:01:51.624,0:01:53.071 - [女声] 哦[br]- [男声] 有意思 0:01:53.071,0:01:56.553 - 随机试验在教育学研究中[br]也有着重要的作用 0:01:56.553,0:01:59.679 它们被用于解答一个 0:01:59.679,0:02:01.718 我这个当老师的[br]尤其关心的因果问题 0:02:01.718,0:02:04.519 课堂上应该允许 0:02:04.519,0:02:06.584 使用笔记本电脑等电子设备吗? 0:02:07.210,0:02:09.883 许多人认为这些电子设备[br]能够辅助课堂学习 0:02:09.883,0:02:13.833 但另一些人认为它们会让学生分心[br]我也这么想 0:02:14.216,0:02:15.433 谁说得对呢? 0:02:21.543,0:02:23.776 为了回答这个问题 0:02:23.776,0:02:26.760 西点军校(美国一所军官培训学校)的[br]计量大师们 0:02:26.760,0:02:30.734 设计了一个随机试验 0:02:30.734,0:02:33.209 这群大师把西点军校的学员 0:02:33.209,0:02:36.426 随机分配到遵循不同班规的[br]经济学班级里 0:02:37.207,0:02:39.183 和美国大部分高校不同的是 0:02:39.183,0:02:42.034 西点军校通常不允许[br]学生使用电子设备 0:02:42.735,0:02:45.501 为了进行这次试验[br]一部分学生 0:02:45.501,0:02:48.851 留在了这种传统的[br]不允许使用高科技的班级里 0:02:48.851,0:02:51.852 笔记本电脑,平板电脑和手机[br]统统不准用 0:02:53.325,0:02:55.909 这些学生构成了控制组[br]或者叫基线组 0:02:55.909,0:02:59.506 另一组学生被允许使用电子设备 0:02:59.506,0:03:02.762 他们是实验组[br]处在与对照组不同的环境中 0:03:03.179,0:03:05.962 这场试验中[br]实验组接受的“处理” 0:03:05.962,0:03:08.247 是笔记本和平板电脑[br]在课堂上的无限制使用 0:03:09.274,0:03:11.763 每个因果问题都有清晰的结果 -- 0:03:11.763,0:03:16.080 即事前定义的[br]我们希望影响的变量 0:03:16.080,0:03:18.546 在西点军校电子设备的研究中 0:03:18.546,0:03:20.328 结果变量是期末考试成绩 0:03:20.433,0:03:23.650 这项研究力图回答以下问题: 0:03:23.650,0:03:27.520 用考试成绩来衡量的话[br]课堂上使用电子设备 0:03:27.520,0:03:29.654 对学习造成的因果效应有多大? 0:03:30.236,0:03:33.154 - [讲解员] 西点军校的经济学学生 0:03:33.154,0:03:36.323 被随机分配到了实验组和控制组 0:03:36.323,0:03:39.987 随机试验为“其余条件不变”的比较[br]创造了条件 0:03:39.987,0:03:44.371 让我们得以通过组间比较[br]得出因果关系结论 0:03:44.682,0:03:49.017 随机试验之所以[br]能够揭示因果关系 0:03:49.017,0:03:52.677 是因为统计学里的一个性质[br]即“大数定理” 0:03:52.677,0:03:55.045 统计学家和数学家 0:03:55.045,0:03:57.478 发现关于自然世界的[br]重要且稳定的性质时 0:03:57.478,0:04:00.761 会把这种性质称为定理 0:04:01.628,0:04:04.529 大数定理告诉我们[br]当参与随机分配的组足够大 0:04:04.529,0:04:07.962 各组中的学生 0:04:07.962,0:04:10.012 各方面的平均水平[br]一定会很相近 0:04:10.626,0:04:14.162 这就意味着[br]随机分配到各组的学生 0:04:14.162,0:04:17.862 应该具有相似的家庭背景[br]学习动力和能力 0:04:18.748,0:04:22.444 至少在理论上[br]我们可以跟选择性偏差说再见了 0:04:22.862,0:04:26.044 实际上[br]参与随机分配的组 0:04:26.044,0:04:28.478 未必大到能让大数法则[br]发挥作用的程度 0:04:28.711,0:04:31.995 研究者们也有可能[br]在随机分配环节上犯错 0:04:32.312,0:04:35.245 在这样高技术含量的研究活动中 0:04:35.245,0:04:37.478 即便是经验丰富的大师[br]也要当心这种差错 0:04:37.989,0:04:39.774 因此我们进行平衡性检验 0:04:39.774,0:04:42.740 比较各组中学生的背景变量 0:04:42.740,0:04:45.006 确保它们确实相近 0:04:46.588,0:04:49.004 - [讲解员] 这是西点试验的[br]平衡检验结果 0:04:49.627,0:04:51.932 这个表格有两列 0:04:51.932,0:04:54.688 一列显示了控制组的数据 0:04:54.688,0:04:57.021 另一列是实验组的数据 0:04:57.825,0:05:01.759 各行显示的是几个[br]我们希望能平衡的变量 -- 0:05:01.759,0:05:06.255 性别,年龄,种族和高中绩点等 0:05:07.232,0:05:09.271 第一行告诉我们 0:05:09.271,0:05:11.687 每组学员中女性的占比 0:05:11.687,0:05:16.387 控制组为17%[br]实验组为20% 0:05:17.962,0:05:21.194 Kamal,你觉得绩点看起来平衡吗? 0:05:21.731,0:05:25.028 - [Kamal] 控制组的[br]平均绩点是2.87 0:05:25.028,0:05:29.381 实验组是2.82,相当接近 0:05:29.615,0:05:34.031 - [讲解员] 好在这两组各方面都很相近 0:05:34.031,0:05:35.566 - 样本需要大到什么程度 0:05:35.566,0:05:37.499 才能使大数定理发挥作用呢? 0:05:37.743,0:05:39.102 - [讲解员] 西点军校的研究中 0:05:39.102,0:05:42.680 每组包括250名学员 0:05:42.680,0:05:44.999 这个数字基本上[br]可以确定是足够大的了 0:05:44.999,0:05:47.809 并没有什么硬性规定[br]或者快速判定的法则 0:05:47.809,0:05:51.266 在另一个视频中[br]你会学到 0:05:51.266,0:05:54.633 如何用正式的统计检验[br]去证实组间平衡的假说 0:05:54.633,0:05:55.850 - [男声] 令人激动 0:06:00.220,0:06:01.987 - 这张表格中的核心问题 0:06:02.022,0:06:04.222 在于处理效应的估计结果 0:06:04.505,0:06:07.324 记住,这项研究中的处理 0:06:07.324,0:06:09.323 是在课堂上使用电子设备的许可 0:06:09.571,0:06:13.638 处理效应是控制组和对照组[br]平均值相比较的结果 0:06:15.103,0:06:17.746 允许课堂上使用电子设备的那组 0:06:17.746,0:06:21.756 期末考试的平均成绩 0:06:21.756,0:06:24.455 比控制组的高出了[br]0.28个标准差 0:06:26.026,0:06:27.982 这个效应有多大呢? 0:06:28.275,0:06:31.643 社会科学家以标准差为单位[br]衡量考试成绩 0:06:31.643,0:06:34.875 因为使用这种单位[br]便于进行跨研究比较 0:06:35.143,0:06:38.642 以往针对课堂学习的大量研究表明 0:06:38.642,0:06:40.760 0.28是一个相当大的数字 0:06:41.025,0:06:45.515 成绩下降0.28个标准差相当于 0:06:45.515,0:06:48.426 把一个成绩中游的学生[br]塞进班级的倒数前三分之一 0:06:49.338,0:06:51.524 我们能确定地说 0:06:51.524,0:06:52.893 这些大结果是有意义的吗? 0:06:52.893,0:06:55.709 毕竟我们比较的是 0:06:55.709,0:06:57.607 通过一次随机分配[br]得到的实验组和对照组 0:06:57.607,0:07:00.711 说不定重新随机分配[br]就会得到不同的结果 0:07:00.711,0:07:03.774 - 因此我们要对[br]因果效应估计量的抽样方差 0:07:03.774,0:07:05.974 进行量化 0:07:06.276,0:07:08.028 - 抽样方差是什么? 0:07:08.781,0:07:10.858 - [讲解员] 抽样方差告诉我们 0:07:10.858,0:07:15.554 某一具体的统计学结果[br]有多大可能性只是巧合 0:07:15.554,0:07:18.858 而不是反映了基本关系 0:07:19.725,0:07:23.282 抽样方差由一个数字表示 0:07:23.282,0:07:26.706 这个数字被称为[br]因果效应估计结果的标准误 0:07:26.706,0:07:29.338 - [学生嘟囔] 我没听懂[br]- 她在说什么呀...? 0:07:29.338,0:07:32.989 - 稍安勿躁,我们以后[br]会详细讲解这个重要概念 0:07:32.989,0:07:34.023 - [学生] 太好了 0:07:34.023,0:07:36.498 - 记住,标准误越小 0:07:36.498,0:07:38.747 结果就越确凿 0:07:38.963,0:07:42.180 另一方面[br]相比于我们想估计的效应 0:07:42.180,0:07:44.568 标准误如果较大 0:07:44.568,0:07:47.435 那如果我们再做一次试验 0:07:47.435,0:07:49.991 得到不同结果的可能性就很大 0:07:50.333,0:07:54.284 你可以把标准误看成 0:07:54.284,0:07:56.574 判断我们能否信赖[br]得出的结果的一种方式 0:07:56.574,0:07:57.631 - [学生] 好吧 0:07:57.631,0:08:01.147 - [讲解员] 在这项研究中[br]标准误是0.1 0:08:01.768,0:08:04.654 - 现阶段我们只需要记住[br]一条简单的经验法则 0:08:04.759,0:08:06.748 当处理效应的估计结果 0:08:06.753,0:08:08.586 大于其标准误的两倍时 0:08:08.586,0:08:12.103 这个非零结果只是偶然的可能性 0:08:12.103,0:08:13.975 非常低[br]大约只有二十分之一 0:08:14.855,0:08:18.290 因为这种可能性很低[br]我们把这种 0:08:18.290,0:08:21.052 是其标准误两倍及以上的估计量 0:08:21.052,0:08:23.352 称为是“统计显著”的 0:08:24.431,0:08:28.149 - Camilla 西点军校这项研究里 0:08:28.149,0:08:29.859 处理效应是否统计显著? 0:08:30.728,0:08:35.934 - 标注误为0.10[br]处理效应为0.28 0:08:35.934,0:08:40.359 0.28大于0.10的两倍[br]统计显著 0:08:40.445,0:08:41.613 - 回答正确 0:08:41.613,0:08:45.959 因此,在 Econ 101 的课堂上 0:08:45.959,0:08:50.093 使用电子设备导致的学习损失[br]不仅大,而且还统计显著 0:08:50.093,0:08:51.249 - [男声] 有趣 0:08:56.775,0:08:59.987 - 随机试验通常[br]能为因果关系问题 0:08:59.987,0:09:01.407 给出最有说服力的答案 0:09:01.407,0:09:04.462 工具箱里如果有这个武器[br]我们就使用 0:09:05.204,0:09:07.435 随机分配让我们能确保 0:09:07.435,0:09:09.567 其他条件的确是一致的 0:09:10.114,0:09:12.633 但随机试验有时很难组织 0:09:12.633,0:09:15.084 它们可能很昂贵又很耗时 0:09:15.084,0:09:18.000 甚至有时被认为是不道德的 0:09:18.404,0:09:21.420 因此大师们找到了[br]其他有说服力的做法 0:09:21.420,0:09:25.170 这些其他做法试图[br]效仿随机试验对因果关系的揭示 0:09:25.170,0:09:28.404 但又希望能不像专门的实验那样 0:09:28.404,0:09:31.370 费时,费力,费钱 0:09:31.461,0:09:34.794 这些替代工具常被用于 0:09:34.794,0:09:37.016 实际生活中[br]近似随机分配的场景下 0:09:39.016,0:09:42.556 - [讲解员] 你已踏上了[br]成为计量经济学大师的旅程 0:09:42.556,0:09:44.451 做几道练习题 0:09:44.451,0:09:47.387 来确保自己掌握了所学知识吧 0:09:47.387,0:09:50.870 如果你已经做好准备[br]请点击进入下一条视频 0:09:50.870,0:09:53.517 欢迎浏览 MRU 的网站 0:09:53.517,0:09:56.591 获取更多课程和教师资源等材料