Return to Video

Randomized Trials: The Ideal Weapon

  • 0:00 - 0:05
    - [讲解员] 从因到果之路
    黑暗又凶险
  • 0:06 - 0:09
    但我们拥有
    计量经济学的强大武器
  • 0:10 - 0:15
    请看,这就是威力最强的
    随机分配之剑
  • 0:15 - 0:19
    正直逼因果问题的核心
  • 0:23 - 0:28
    我们先来看看我们手中
    最强大也最昂贵的武器 --
  • 0:28 - 0:30
    随机试验
  • 0:30 - 0:31
    - [学生] 太棒了
  • 0:31 - 0:35
    - 每种计量方法
    都始于因果关系
  • 0:35 - 0:38
    清晰的问题
    才能带来清晰的答案
  • 0:39 - 0:43
    而随机试验能够提供
    最清晰的答案
  • 0:44 - 0:48
    我们来看看
    随机试验是如何
  • 0:48 - 0:51
    对因果问题给出
    格外有说服力的答案的
  • 0:52 - 0:54
    - [Josh] 正如一把精心打磨的宝剑
  • 0:54 - 0:58
    随机试验直指因果问题的核心
  • 0:58 - 1:01
    它能用来创造
    深具说服力的同类比较
  • 1:01 - 1:04
    但就像其他精心制造的武器一样
  • 1:04 - 1:07
    进行随机试验十分昂贵
    同时也很耗时
  • 1:08 - 1:12
    - 随机试验起源于医学研究
  • 1:12 - 1:17
    当时被称为随机临床试验
    简称 RCT
  • 1:17 - 1:20
    美国食品药品监督管理局规定
  • 1:20 - 1:22
    制药厂必须证明
  • 1:22 - 1:26
    新药和新疗法的安全性和有效性
  • 1:27 - 1:30
    他们的做法就是
    开展一系列 RCT
  • 1:30 - 1:35
    所以我们说随机试验测量的是
    “治疗”效果,或处理效应
  • 1:36 - 1:38
    说不定你就曾参与过
  • 1:38 - 1:40
    另外一种随机试验 --
  • 1:40 - 1:43
    硅谷公司用来比较
    不同营销策略的
  • 1:43 - 1:46
    A/B试验
  • 1:46 - 1:48
    例如,亚马逊的随机试验
  • 1:48 - 1:52
    被幕后的不断搜索结果所应用
  • 1:52 - 1:53
    - [女]哦
    - [男]有意思
  • 1:53 - 1:57
    - 随机试验在教育学研究中
    也起着重要的作用
  • 1:57 - 1:59
    它们被用于解答一个
  • 1:59 - 2:02
    我这个当老师的
    尤其关心的因果问题:
  • 2:02 - 2:04
    课堂上到底应不应该
  • 2:04 - 2:07
    允许使用笔记本电脑等电子设备?
  • 2:07 - 2:10
    许多人认为这些电子设备
    能够辅助课堂学习
  • 2:10 - 2:14
    但另一些人认为它们会让学生分心
    我也这么想
  • 2:14 - 2:16
    谁说得对呢?
  • 2:22 - 2:24
    为了回答这个问题
  • 2:24 - 2:27
    培训军官的西点军校中的
    计量大师们
  • 2:27 - 2:31
    设计了一个随机试验
  • 2:31 - 2:34
    这群大师把西点军校
    学习经济学的学员
  • 2:34 - 2:36
    随机分配到遵循不同班规的班级里
  • 2:37 - 2:39
    和美国大部分高校不同的是
  • 2:39 - 2:42
    西点军校通常不允许
    学生使用电子设备
  • 2:43 - 2:46
    为了进行这次试验
    一部分学生
  • 2:46 - 2:49
    留在了这种传统的
    不允许使用高科技的班级里
  • 2:49 - 2:52
    笔记本电脑,平板电脑和手机
    统统不准用
  • 2:53 - 2:56
    这些学生构成了控制组
    或者叫基线组
  • 2:56 - 3:00
    另一组学生被允许使用电子设备
  • 3:00 - 3:03
    他们是实验组
    处在与对照组不同的环境中
  • 3:03 - 3:06
    这场试验中
    实验组接受的“处理”
  • 3:06 - 3:09
    是在课堂上无限制使用
    笔记本和平板电脑
  • 3:09 - 3:12
    每个因果问题都有清晰的结果 --
  • 3:12 - 3:16
    即事前定义的
    我们希望影响的变量
  • 3:16 - 3:19
    在西点军校使用电子设备的研究中
  • 3:19 - 3:20
    结果变量是期末考试成绩
  • 3:20 - 3:24
    这项研究试图回答以下问题:
  • 3:24 - 3:28
    用考试成绩来衡量的话
    课堂上使用电子设备
  • 3:28 - 3:30
    对学习造成的因果效应有多大?
  • 3:30 - 3:32
    - [讲解员] 西点军校的经济学学生
  • 3:32 - 3:36
    被随机分配到了实验组和控制组
  • 3:36 - 3:40
    随机试验为“其余条件不变”的比较
    创造了条件
  • 3:40 - 3:44
    让我们得以通过组间比较
    得出因果关系结论
  • 3:45 - 3:49
    - 随机试验之所以
    能够揭示因果关系
  • 3:49 - 3:53
    是因为统计学里的一个性质
    即“大数定理”
  • 3:53 - 3:55
    统计学家和数学家
  • 3:55 - 3:59
    发现关于自然世界的
    重要且稳定的性质时
  • 3:59 - 4:01
    会把这种性质称为定理
  • 4:02 - 4:06
    大数定理告诉我们
    当参与随机分配的组足够大
  • 4:06 - 4:07
    各组中的学生
  • 4:07 - 4:10
    各方面的平均水平
    一定会很相近
  • 4:11 - 4:14
    这就意味着
    随机分配到各组的学生
  • 4:14 - 4:18
    应该具有相似的家庭背景
    学习动力和能力
  • 4:19 - 4:22
    至少在理论上
    我们可以跟选择性偏差说再见了
  • 4:23 - 4:26
    实际上
    参与随机分配的组
  • 4:26 - 4:28
    未必大到能让大数法则
    发挥作用的程度
  • 4:29 - 4:32
    研究者们也有可能
    在随机分配环节上犯错
  • 4:32 - 4:34
    在这种技巧性强的研究活动中
  • 4:34 - 4:37
    即便是经验丰富的大师
    也要当心出现差错
  • 4:38 - 4:40
    因此我们进行平衡性检验
  • 4:40 - 4:43
    比较各组中学生的背景变量
  • 4:43 - 4:45
    确保它们确实相近
  • 4:47 - 4:49
    - [讲解员] 这是西点试验的
    平衡检验结果
  • 4:50 - 4:52
    这个表格有两列
  • 4:52 - 4:55
    一列显示了控制组的数据
  • 4:55 - 4:57
    另一列是实验组的数据
  • 4:58 - 5:02
    各行显示的是几个
    我们希望能平衡的变量 --
  • 5:02 - 5:06
    性别,年龄,种族和高中绩点等
  • 5:07 - 5:09
    第一行告诉我们
  • 5:09 - 5:12
    每组学员中女性的占比
  • 5:12 - 5:16
    控制组为17%
    实验组为20%
  • 5:18 - 5:21
    Kamal,你觉得绩点看起来平衡吗?
  • 5:22 - 5:25
    - [Kamal] 控制组的
    平均绩点是2.87
  • 5:25 - 5:29
    实验组是2.82,相当接近
  • 5:30 - 5:34
    - [讲解员] 好在这两组各方面都很相近
  • 5:34 - 5:36
    - 样本需要大到什么程度
  • 5:36 - 5:37
    才能使大数定理发挥作用呢?
  • 5:38 - 5:40
    - [讲解员] 西点军校的研究中
  • 5:40 - 5:43
    每组有250名学员
  • 5:43 - 5:45
    这个数字基本上是足够大的了
  • 5:45 - 5:48
    并没有什么硬性规定
  • 5:48 - 5:51
    在另一个视频中
    你会学到
  • 5:51 - 5:55
    如何用正式的统计检验
    去证实组间平衡的假说
  • 5:55 - 5:56
    - [男声] 令人激动
  • 6:00 - 6:02
    - 这张表格中的核心问题
  • 6:02 - 6:04
    在于处理效应的估计结果
  • 6:05 - 6:07
    记住,这项研究中的“处理”
  • 6:07 - 6:09
    是允许在课堂上使用电子设备
  • 6:10 - 6:14
    处理效应是控制组和对照组
    平均值相比较的结果
  • 6:15 - 6:18
    允许课堂上使用电子设备的那组
  • 6:18 - 6:20
    期末考试的平均成绩
  • 6:20 - 6:24
    比控制组的低了
    0.28个标准差
  • 6:26 - 6:28
    这个效应有多大呢?
  • 6:28 - 6:32
    社会学家以标准差为单位
    衡量考试成绩
  • 6:32 - 6:35
    因为使用这种单位
    便于进行跨研究比较
  • 6:35 - 6:39
    以往针对课堂学习的大量研究表明
  • 6:39 - 6:41
    0.28是一个相当大的数字
  • 6:41 - 6:44
    成绩下降0.28个标准差相当于
  • 6:44 - 6:48
    把一个成绩中游的学生
    塞进班级的倒数三分之一
  • 6:49 - 6:51
    我们能确定
  • 6:51 - 6:53
    这些大结果是有意义的吗?
  • 6:53 - 6:56
    毕竟我们比较的是
  • 6:56 - 6:58
    通过一次随机分配
    得到的实验组和对照组的结果
  • 6:58 - 7:01
    说不定重新随机分配
    就会得到不同的结果
  • 7:01 - 7:04
    - 因此我们要对
    因果效应估计量的抽样方差
  • 7:04 - 7:06
    进行量化
  • 7:06 - 7:08
    - 抽样方差是什么?
  • 7:09 - 7:11
    - [讲解员] 抽样方差告诉我们
  • 7:11 - 7:16
    某一具体的统计学结果
    有多大可能只是巧合
  • 7:16 - 7:19
    而不是反映了基本关系
  • 7:20 - 7:23
    抽样方差由一个数字表示
  • 7:23 - 7:27
    这个数字被称为
    因果效应估计结果的标准误
  • 7:27 - 7:29
    - [学生] 我没听懂
    - 她在说什么呀...?
  • 7:29 - 7:33
    - 稍安勿躁,我们以后
    会详细讲解这个重要概念
  • 7:33 - 7:34
    - [学生] 太好了
  • 7:34 - 7:36
    - 记住,标准误越小
  • 7:36 - 7:39
    结果就越确凿
  • 7:39 - 7:42
    另一方面
    相比于我们想估计的效应
  • 7:42 - 7:45
    标准误如果较大
  • 7:45 - 7:48
    如果我们再做一次试验
  • 7:48 - 7:50
    得到不同结果的可能性就越大
  • 7:50 - 7:53
    你可以把标准误看成
  • 7:53 - 7:57
    判断我们能否信赖
    得出的结果的一种方式
  • 7:57 - 7:58
    - [学生] 好吧
  • 7:58 - 8:01
    - [讲解员] 在这项研究中
    标准误是0.1
  • 8:02 - 8:05
    - 现阶段我们只需要记住
    一条简单的经验法则
  • 8:05 - 8:07
    当处理效应的估计结果
  • 8:07 - 8:09
    大于其标准误的两倍时
  • 8:09 - 8:12
    这个非零结果
    只是偶然的可能性非常低
  • 8:12 - 8:15
    大约只有二十分之一
  • 8:15 - 8:18
    因为这种可能性很低
    我们把这种
  • 8:18 - 8:21
    是其标准误两倍及以上的估计量
  • 8:21 - 8:23
    称为是“统计显著”的
  • 8:24 - 8:28
    - Camilla,西点军校这项研究里
  • 8:28 - 8:30
    处理效应是否统计显著?
  • 8:31 - 8:36
    - 标注误为0.10
    处理效应为0.28
  • 8:36 - 8:40
    0.28大于0.10的两倍
    统计显著
  • 8:40 - 8:42
    - 回答正确
  • 8:42 - 8:46
    因此,在 Econ 101 的课堂上
  • 8:46 - 8:50
    使用电子设备对学习的负面影响
    不仅大,而且还统计显著
  • 8:50 - 8:51
    - [男声] 有趣
  • 8:57 - 9:00
    - 随机试验通常
    能为因果关系问题
  • 9:00 - 9:01
    给出最有说服力的答案
  • 9:01 - 9:04
    如果工具箱里有这个武器
    我们就用它
  • 9:05 - 9:07
    随机分配让我们能确保
  • 9:07 - 9:10
    其他条件的确是一致的
  • 9:10 - 9:13
    但随机试验有时很难组织
  • 9:13 - 9:15
    它们可能很昂贵又很耗时
  • 9:15 - 9:18
    甚至有时被认为是不道德的
  • 9:18 - 9:21
    因此大师们找到了
    其他有说服力的做法
  • 9:21 - 9:25
    这些其他做法试图
    效仿随机试验对因果关系的揭示
  • 9:25 - 9:28
    但又希望能不像专门设计的实验那样
  • 9:28 - 9:31
    费时,费力,费钱
  • 9:31 - 9:35
    这些替代工具常被用于
  • 9:35 - 9:37
    实际生活中
    近似随机分配的场景下
  • 9:39 - 9:43
    - [讲解员] 你已踏上了
    成为计量经济学大师的旅程
  • 9:43 - 9:44
    做几道练习题
  • 9:44 - 9:47
    来确保自己掌握了所学知识吧
  • 9:47 - 9:51
    如果你已经做好准备
    请点击进入下一条视频
  • 9:51 - 9:54
    欢迎浏览 MRU 的网站
  • 9:54 - 9:57
    获取更多课程和教师资源等材料
Title:
Randomized Trials: The Ideal Weapon
Description:

more » « less
Video Language:
English
Team:
Marginal Revolution University
Project:
Mastering Econometrics
Duration:
10:01

Chinese, Simplified subtitles

Revisions Compare revisions