[讲师] 因果推断之路既黑暗又危险
但是计量经济学是很厉害的武器
当自然界给你带来偶然的随机分配时
使用气势汹汹与灵活多變的
工具变量进行攻击
随机试验是完成
“其他条件不变”的比较
的最可靠途径
但我们经常无法使用
这个功能强大的工具
但是有时候,随机是偶然发生的
这时候我们转向工具变量
—简称IV
工具变量
今天的课堂是IV两节课的第一节
我们的第一节IV课
从学校的故事开始
特许学校属于公立学校
这些学校不受日常学区监督
与教师工会合同约束
特许学校能否提高成绩
是美国教育改革史上
最重要的问题之一
最受欢迎的特许学校的申请人数
远多于学位
因此抽奖运决定了
谁家孩子可获录取
在学生争夺机会时需要面对很多风险
正如获奖纪录片“等待超人”中
所描述的那样
等待结果时会产生很多情绪
别哭,你会让妈妈哭的
好吗?
特许学校真的能提供更好的教育吗?
评论家肯定会说"不是的"
他们会争辩说特许学校
能夠招募更好
更聪明或更主动的学生
因此未来结果的差异
反映了选择性偏差
等一下,这个似乎很容易
在抽奖活动中
我们会随机选择中奖者
因此只比较中奖者及未中奖者
很明显的
卡马尔,你的想法是好的
但是特许学校的抽签安排
不会强迫学生们进入
或离开特定的学校
特许学校的学位是随机分配的
有些孩子很幸运
有些孩子不是
如果我们只是想知道特许学校
所带来的影响
我们可以将其视为随机试验
但是,我们只对特许学校
就学的影响
感兴趣
而对录取不感兴趣
并非所有获录取的学生
都会接受学位
IV将被录取为特许学校学生的影响
转变为实际就读特许学校的影响
- 太酷了
- 哦,太好了
让我们看一个例子
这是一所执行知识就是力量专案
的特许学校,或简称为KIPP
这所KIPP特许学校位于林恩
这是一座位于麻省海边的
褪色工业城镇
这所学校的申请者多于学位
因此他们要抽签来挑选学生
从2005年到2008年
共有371名四年级以及五年级生
参加了KIPP林恩的抽签
当中253名学生KIPP获录取
118名学生未获录取
一年后,获录取者的数学分数
比未获录取者更高
我们并不是试图弄清楚
获录取后是否会提高
你的数学水平
我们想知道参加KIPP
是否会使你的数学成绩改进
在253位获录取者中
实际上只有199位到KIPP上学
其他学生选择了传统的公立学校
同样,在118名未被录取的学生中
事实上有一些最终参加了KIPP
他们后来也获录取
那么,实际上参加KIPP
对考试成绩有何影响呢?
为什么我们不能只衡量
他们的数学成绩?
这是很好的问题
你将他们与谁进行比较呢?
那些没有参加的学生
上学率是随机的吗?
- 不是啊
- 选择性偏差
- 对啊
- 什么?
KIPP的录取是随机的,因此我们
对“其他条件不变”的假设充满信心
但上学率不是随机的
选择接受录取通知
可能是与数学成绩有关的特征
例如,有奉献精神的父母
更有可能接受录取
无论上那间学校
他们的孩子的数学成绩
也有可能更好
对啊
IV将录取的影响
转化为KIPP上学率的影响
并就一些获录取者到其他学校上学
而一些未被录取者还是设法
参加了KIPP 而进行调整
本质上,IV需要进行不完全的随机化
并进行适当的调整
怎么样? IV描述了一种连锁反应
为什么学校的录取会影响成绩?
可能是因为这影响了
特许学校的上学率
而特许学校的上学率
提高了数学成绩
连锁反应的第一个环节
称之为“第一阶段”
是抽签对特许学校上学率的影响
第二阶段是在特许学校就学
以及结果变量之间的关联
在这情况下,数学分数
工具变量或简称为“工具”
是启动链式反应的变量
工具变量对结果的影响
称为简化式
这个链式反应可以用数学表示
我们乘以第一阶段
即录取者对上学率的影响
到第二阶段
上学率对分数的影响
我们得到简化式
获录取对分数的影响
简化式和第一阶段是可观察的
并且易于计算
但是,上学率对成绩的影响
并未能直接观察到
这是我们试图确定的因果关系
考虑到我们将在稍后进行讨论的
一些重要假设
我们可以通过将简化式
除以第一阶段
来找出KIPP上学率的影响
通过示例,这点将会更加清楚
让我们开始吧
有关衡量的简短笔记
我们使用标准差来衡量成绩
通常用希腊字母sigma (σ) 表示
一个σ是从大多数成绩分配的
最低15%
到中间位置的巨大变化
甚至¼或½ σ 的差异也很大
现在我们准备将一些数字
插入到前面介绍的方程式中
首先,获录取对数学成绩
有何影响呢?
KIPP申请人的数学成绩是
申请KIPP之前一年中
低于州平均值的标准差的三分之一
但是一年后,获录取者得分
达到了州平均水平
而未被录取者
仍然落后于平均分数-0.36σ
获录取者对分数的影响
是获录取者的分数
与未被录取者的分数之间的差异
获录取者的平均数学成绩
减去未被录取者的平均数学成绩
你的答案是0.36σ
接下来:获录取对上学率
有什么影响呢?
换句话说,如果你获录取
与未被录取相比
你参加KIPP的可能性有多大?
首先,有多少百分比的获录取者
参加KIPP?
用参加KIPP的获录取者的人数
除以获录取者的总数—78%
要找出参加KIPP
而未被录取者的百分比
我们将参加KIPP的
未被录取者的人数
除以未被录取者的总数—即4%
从78减去4,我们发现获录取
会使你参加KIPP的可能性
提高了74%
现在我们可以找到真正想要的数据—
用0.36除以0.74
以得到上学率对分数的影响
参加KIPP可使数学成绩
平均提高了0.48个标准差
这是一项了不起的成就
等于从成绩分布的底部三分之一
移到中间
哇,[听不见]
这些估算值适用于
选择参加KIPP抽签的学生
其注册状态因获录取而更改
这不一定是所有林恩学生的
随机样本
因此我们不能假设
我们会对其他类型的学生
看到相同的效果
- 嗯
但是这种对KIPP学生的
敏锐度的影响
可能很好地表明了
增加额外的特许学校学位的后果
- 很酷
- 明白
IV消除了选择性偏差
但是像所有其他工具一样
这个解决方案建立在
一系列不应被视为
理所当然的假设的基础上
首先,第一阶段必须是实质性的
就是工具变量,获录取或未被录取
都必须真正改变了我们感兴趣的变量
这里就是KIPP上学率
在这情况下,第一阶段
并不是真的存在疑问
获录取会使KIPP上学率的可能性更大
并非所有IV故事都是这样的
其次,工具变量
必须和随机分配的一样好
意味着获录取者和未被录取者
这是独立性假设
当然,KIPP的获录取者
实际上是随机分配的
尽管如此,我们仍应检查
两者的平衡
并确认获录取者及未被录取者
具有相似的家庭背景
相似的才能等
从本质上讲,我们正在检查
以确保KIPP录取的公平
获录取者没有可疑
最后,我们要求工具变量
仅会通过感兴趣的变量
来更改结果—
在这情况下,参加KIPP
这个假设称为“排斥限制”
仅当这三个假设都符合时
IV才有效
我不明白排斥限制
除了参加KIPP外
获录取还会如何影响数学成绩呢?
- 对啊
- 很好的问题
假设获录取者只是为了录取而兴奋
而这种幸福感促使他们
都会更努力学习及学习更多的数学
不管在哪间学校上学
这将违反“排斥限制”
因为获录取的动机是第二种渠道
获录取可能会影响考试成绩
虽然很难完全排除这个可能性
在KIPP研究中
没有其他渠道的证据
IV解决了诸如KIPP抽签之类的方案中的
选择性偏差问题
而是抽签是随机的
但其中一些选择退出
这种有意但不完整的随机分配
非常普遍
即使是随机临床试验也有这个功能
IV解决了抽奖或临床研究中
非随机占用的问题
但是抽奖并不是引人注目的
唯一工具变量
很多因果问题
可以通过自然发生
以及随机分配变量来解决
这里有一个因果问题:
在职业生涯早期生儿育女的女性
会否因此蒙受巨大收入损失吗?
毕竟,女性的收入低于男性
当然我们可以简单地
对养育较多或较少孩子的女性的收入
进行比较即可
但是,这样的比较充满了
选择性偏差
如果可以的话,我们可以
将婴儿随机
分配到不同的家庭
对啊,听起来不错
我们的下一个IV故事
—梦幻而不是幻想
将会描述一个适合家庭规模的
自然且神奇的工具变量
你正在掌握计量经济学
请回答一些练习问题
来确保记得这个视频的内容
或者,如果准备好了
请单击以观看下一个视频
你也可以访问MRU网站
以获取更多课程
教师资源等