1 00:00:00,299 --> 00:00:04,644 [讲师] 因果推断之路既黑暗又危险 2 00:00:05,139 --> 00:00:08,015 但是计量经济学使用的“武器”是很厉害的 3 00:00:08,480 --> 00:00:11,734 当自然界给你偶然、随机分配时 4 00:00:11,734 --> 00:00:16,273 使用厉害与灵活多变的 工具变量进行攻克 5 00:00:23,653 --> 00:00:26,362 随机试验是完成 “其他条件不变”比较的 6 00:00:26,362 --> 00:00:28,704 最可靠途径 7 00:00:28,704 --> 00:00:32,640 但我们经常无法使用 这个功能强大的工具 8 00:00:33,224 --> 00:00:36,940 但是有时候,随机是偶然发生的 9 00:00:36,940 --> 00:00:40,592 这时候我们转向工具变量 10 00:00:40,592 --> 00:00:41,938 —简称IV 11 00:00:41,938 --> 00:00:44,508 - 工具变量 12 00:00:44,508 --> 00:00:48,186 - 今天的课是IV两节课的第一节 13 00:00:48,958 --> 00:00:52,801 我们的第一节IV课 从学校的故事开始 14 00:00:54,348 --> 00:00:56,388 - [Josh]特许学校属于公立学校 15 00:00:56,388 --> 00:01:00,112 这些学校不受日常学区监督 与教师工会合同约束 16 00:01:00,895 --> 00:01:03,511 特许学校能否提高成绩 17 00:01:03,511 --> 00:01:05,161 是美国教育改革史上 18 00:01:05,161 --> 00:01:07,761 最重要的问题之一 19 00:01:08,145 --> 00:01:12,562 - 最受欢迎的特许学校的申请人数 远多于学生名额 20 00:01:12,562 --> 00:01:16,870 因此必须通过抽签来决定 谁家孩子可被录取 21 00:01:16,870 --> 00:01:20,695 学生争夺机会时,面对很多风险 22 00:01:20,695 --> 00:01:25,003 正如获奖纪录片“等待超人”中 23 00:01:25,003 --> 00:01:27,832 所描述的那样 24 00:01:27,832 --> 00:01:29,699 等待结果时,心潮起伏 25 00:01:30,258 --> 00:01:32,916 - 别哭,你会让妈妈哭的 好吗? 26 00:01:37,498 --> 00:01:40,618 - 特许学校真的能提供更好的教育吗? 27 00:01:40,948 --> 00:01:43,183 评论家肯定会说"不是的" 28 00:01:43,413 --> 00:01:46,586 他们会争辩说 特许学校能夠招募更好 29 00:01:46,586 --> 00:01:50,164 更聪明或更主动的学生 因此未来结果的差异 30 00:01:50,164 --> 00:01:52,061 反映了选择性偏差 31 00:01:52,595 --> 00:01:54,729 - 等一下,这个似乎很容易 32 00:01:55,139 --> 00:01:57,639 在抽签过程中 我们会随机选择中奖者 33 00:01:57,639 --> 00:02:00,083 因此只比较中奖者及未中奖者 - 很明显 34 00:02:00,083 --> 00:02:01,784 - 卡马尔,你的想法是好的 35 00:02:01,784 --> 00:02:04,375 但是特许学校的抽签安排 36 00:02:04,375 --> 00:02:07,560 不会强迫学生们进入 或离开特定的学校 37 00:02:07,749 --> 00:02:10,667 特许学校的名额是随机分配的 38 00:02:11,650 --> 00:02:13,449 有些孩子很幸运 39 00:02:13,449 --> 00:02:14,966 有些孩子很不幸 40 00:02:14,966 --> 00:02:17,235 如果我们只是想知道 41 00:02:17,235 --> 00:02:19,202 特许学校名额分配的影响 42 00:02:19,202 --> 00:02:22,417 我们可以将其视为随机试验 43 00:02:22,717 --> 00:02:25,534 但是,我们只对特许学校 就学的情况 44 00:02:25,534 --> 00:02:27,042 感兴趣 45 00:02:27,042 --> 00:02:28,283 而不是录取 46 00:02:28,568 --> 00:02:32,039 并非所有获录取的学生 都会接受它 47 00:02:32,039 --> 00:02:36,514 IV将被录取为特许学校学生的影响 48 00:02:36,514 --> 00:02:40,367 转变为实际就读后的影响 49 00:02:40,367 --> 00:02:42,344 - 太酷了 - 哦,太好了 50 00:02:45,925 --> 00:02:48,201 - 让我们看一个例子 51 00:02:48,201 --> 00:02:52,353 这是一所执行“知识就是力量”专案 的特许学校,或简称为KIPP 52 00:02:52,736 --> 00:02:54,937 这所KIPP特许学校位于林恩 53 00:02:54,937 --> 00:02:58,837 这是一座位于麻省海边的 颓废工业城镇 54 00:02:59,104 --> 00:03:01,886 这所学校的申请者多于学校名额 55 00:03:01,886 --> 00:03:05,620 因此他们要抽签来挑选学生 56 00:03:05,834 --> 00:03:11,854 从2005年到2008年 共有371名四年级以及五年级生 57 00:03:11,854 --> 00:03:15,350 参加了KIPP林恩的抽签 58 00:03:15,350 --> 00:03:18,805 当中253名学生KIPP获录取 59 00:03:18,805 --> 00:03:21,651 118名学生未获录取 60 00:03:21,967 --> 00:03:26,001 一年后,获录取者的数学分数 61 00:03:26,001 --> 00:03:27,852 比未获录取者高很多 62 00:03:27,852 --> 00:03:30,466 还记得吗 我们并不想了解 63 00:03:30,466 --> 00:03:33,803 获录取是否会提高 你的数学水平 64 00:03:34,070 --> 00:03:38,471 我们想知道的是 在KIPP是否使你的数学成绩改进 65 00:03:39,041 --> 00:03:45,750 在253位获录取者中 实际上只有199位到KIPP上学 66 00:03:46,139 --> 00:03:48,804 其他学生选择了传统的公立学校 67 00:03:49,563 --> 00:03:55,536 同样,在118名未被录取的学生中 事实上有一些最终参加了KIPP 68 00:03:55,536 --> 00:03:57,452 他们后来也获录取 69 00:03:57,452 --> 00:04:00,044 那么,实际上参加KIPP 70 00:04:00,044 --> 00:04:02,377 对考试成绩有何影响呢? 71 00:04:03,109 --> 00:04:05,426 - 我们为什么不能只衡量 他们的数学成绩? 72 00:04:05,894 --> 00:04:07,235 - 这个问得好 73 00:04:07,235 --> 00:04:09,302 你将他们与谁进行比较呢? 74 00:04:09,302 --> 00:04:11,111 - 那些没有参加的学生 75 00:04:11,111 --> 00:04:12,944 - 上学是随机的吗? 76 00:04:14,161 --> 00:04:16,177 - 不是啊 - 选择性偏差 77 00:04:16,177 --> 00:04:17,909 - 对啊 - 什么? 78 00:04:17,909 --> 00:04:23,046 KIPP的录取是随机的,因此我们 对“其他条件不变”的假设充满信心 79 00:04:23,236 --> 00:04:26,599 但上学率不是随机的 80 00:04:26,635 --> 00:04:30,626 选择接受录取 81 00:04:30,626 --> 00:04:32,984 可能是与数学成绩有关的 82 00:04:33,251 --> 00:04:36,157 例如,有奉献精神的父母 83 00:04:36,157 --> 00:04:38,957 更有可能接受录取 84 00:04:38,957 --> 00:04:41,006 无论上哪个学校 85 00:04:41,006 --> 00:04:44,090 他们的孩子的数学成绩 都可能更好 86 00:04:44,090 --> 00:04:45,114 - 对啊 87 00:04:45,114 --> 00:04:47,725 - IV将录取的影响 88 00:04:47,725 --> 00:04:50,567 转化为KIPP上学率的影响 89 00:04:50,573 --> 00:04:53,371 并就一些获录取者到其他学校上学 90 00:04:53,371 --> 00:04:56,573 而一些未被录取者还是设法 参加了KIPP 而进行调整 91 00:04:56,950 --> 00:05:00,517 本质上,IV需要进行不完全的随机化 92 00:05:00,517 --> 00:05:03,007 并进行适当的调整 93 00:05:03,684 --> 00:05:07,107 如何呢? IV描述了一种连锁反应 94 00:05:07,641 --> 00:05:10,343 为什么学校的录取会影响成绩? 95 00:05:10,343 --> 00:05:13,256 可能是因为这影响了 特许学校的上学率 96 00:05:13,256 --> 00:05:16,643 而特许学校的上学率 提高了数学成绩 97 00:05:16,643 --> 00:05:20,645 连锁反应的第一个环节 称之为“第一阶段” 98 00:05:20,645 --> 00:05:24,478 是抽签对特许学校上学率的影响 99 00:05:24,478 --> 00:05:28,452 第二阶段是在特许学校就学 100 00:05:28,452 --> 00:05:30,153 以及结果变量之间的关联 101 00:05:30,153 --> 00:05:32,471 在此例中是数学分数 102 00:05:32,732 --> 00:05:36,441 工具变量或简称为“工具” 103 00:05:36,441 --> 00:05:40,246 是启动连锁反应的变量 104 00:05:40,979 --> 00:05:43,993 工具变量对结果的影响 105 00:05:43,993 --> 00:05:46,631 称为简化式 106 00:05:48,143 --> 00:05:51,869 这个连锁反应可以用数学表示 107 00:05:51,869 --> 00:05:54,241 我们用第一阶段 108 00:05:54,241 --> 00:05:56,349 即录取者对上学率的影响 109 00:05:56,349 --> 00:05:57,960 乘以第二阶段: 110 00:05:57,960 --> 00:06:00,538 上学率对分数的影响 111 00:06:00,538 --> 00:06:02,713 就得到简化式 112 00:06:02,713 --> 00:06:05,680 获录取对分数的影响 113 00:06:06,780 --> 00:06:11,566 简化式和第一阶段是可观察的 并且易于计算 114 00:06:11,752 --> 00:06:14,876 但是,上学率对成绩的影响 115 00:06:14,876 --> 00:06:17,093 并不能直接观察到 116 00:06:17,093 --> 00:06:20,360 这是我们试图确定的因果关系 117 00:06:21,043 --> 00:06:23,827 考虑到我们将在稍后进行讨论的 一些重要假设 118 00:06:23,827 --> 00:06:25,977 我们可以通过将简化式 除以第一阶段 119 00:06:25,977 --> 00:06:29,265 来找出KIPP上学率的影响 120 00:06:29,265 --> 00:06:32,910 通过示例,这点将会更加清楚 121 00:06:32,910 --> 00:06:34,407 - 让我们开始吧 122 00:06:37,161 --> 00:06:38,728 - 回顾一下有关计量的内容 123 00:06:38,728 --> 00:06:41,745 我们使用标准差来衡量成绩 124 00:06:41,745 --> 00:06:44,728 通常用希腊字母σ表示 125 00:06:44,728 --> 00:06:48,862 一个σ是从成绩分布曲线的低位15%左右 126 00:06:48,862 --> 00:06:51,634 到中间的大多数 127 00:06:51,634 --> 00:06:55,412 即使是¼或½ σ 也是很大的差异 128 00:06:56,262 --> 00:06:58,389 - 现在我们准备将一些数字 129 00:06:58,389 --> 00:07:01,655 带入到前面提及的方程式中 130 00:07:01,655 --> 00:07:03,861 首先,获录取对数学成绩 131 00:07:03,861 --> 00:07:06,076 有何影响呢? 132 00:07:06,354 --> 00:07:09,401 KIPP申请人的数学成绩 133 00:07:09,401 --> 00:07:11,835 在申请KIPP的前一年 134 00:07:11,835 --> 00:07:14,386 低于州平均值标准差的三分之一 135 00:07:14,386 --> 00:07:18,320 但是一年后,获录取者得分 达到了州平均水平 136 00:07:18,320 --> 00:07:20,543 而未被录取者 137 00:07:20,543 --> 00:07:25,499 仍然落后,平均分数近-0.36σ 138 00:07:25,834 --> 00:07:29,619 获录取者对分数的影响 是获录取者的分数 139 00:07:29,619 --> 00:07:33,119 与未被录取者分数之间的差异 140 00:07:33,403 --> 00:07:35,784 获录取者的平均数学成绩 141 00:07:35,784 --> 00:07:38,269 减去未被录取者的平均数学成绩 142 00:07:38,269 --> 00:07:41,502 你的答案是0.36σ 143 00:07:41,908 --> 00:07:46,880 接下来:获录取对真正去上学 有什么影响? 144 00:07:46,880 --> 00:07:49,193 换句话说,如果你获录取 145 00:07:49,193 --> 00:07:51,247 与未被录取相比 146 00:07:51,247 --> 00:07:53,671 你参加KIPP的可能性有多大? 147 00:07:53,671 --> 00:07:57,798 首先,获录取后 参加KIPP的百分比是多少? 148 00:07:57,798 --> 00:08:00,774 用参加KIPP的获录取者的人数 149 00:08:00,774 --> 00:08:05,490 除以获录取者的总数--那是78% 150 00:08:05,810 --> 00:08:09,331 要找出参加KIPP 而未被录取者的百分比 151 00:08:09,331 --> 00:08:12,333 我们将参加KIPP的 未被录取者的人数 152 00:08:12,333 --> 00:08:16,865 除以未被录取者的总数—即4% 153 00:08:17,377 --> 00:08:21,597 从78减去4,我们发现获录取 154 00:08:21,597 --> 00:08:25,600 会使你参加KIPP的可能性 提高了74% 155 00:08:25,946 --> 00:08:29,312 现在我们可以找到真正想要的数据 156 00:08:29,312 --> 00:08:34,551 用0.36除以0.74 以得到上学率对分数的影响 157 00:08:34,789 --> 00:08:37,585 参加KIPP可使数学成绩 158 00:08:37,585 --> 00:08:41,606 平均提高了0.48个标准差 159 00:08:42,126 --> 00:08:44,503 这是一项了不起的成就 160 00:08:44,503 --> 00:08:47,380 等于从成绩分布的底部三分之一 161 00:08:47,380 --> 00:08:49,925 提到了中间 162 00:08:49,925 --> 00:08:51,085 - 哇 163 00:08:51,085 --> 00:08:53,027 - 这些估算值适用于 164 00:08:53,027 --> 00:08:54,781 选择参加KIPP抽签的学生 165 00:08:54,781 --> 00:08:57,762 其记录因获录取而更改 166 00:08:57,985 --> 00:09:00,617 这不一定是所有林恩学生的 167 00:09:00,617 --> 00:09:02,283 随机样本 168 00:09:02,536 --> 00:09:05,035 因此我们不能假设 我们会对其他类型的学生 169 00:09:05,035 --> 00:09:07,327 得到相同的效果 - 嗯 170 00:09:07,327 --> 00:09:10,218 但是这种对KIPP学生的 敏锐度的影响 171 00:09:10,218 --> 00:09:13,367 可能很好地表明了 172 00:09:13,367 --> 00:09:15,767 增加额外的特许学校名额的后果 173 00:09:15,767 --> 00:09:17,216 - 很酷 - 明白 174 00:09:19,628 --> 00:09:23,352 - IV消除了选择性偏差 但是像所有其他工具一样 175 00:09:23,352 --> 00:09:25,624 这个解决方案是建立在 一系列的假设上的 176 00:09:25,624 --> 00:09:27,825 不应被视为理所当然 177 00:09:28,098 --> 00:09:31,463 首先,第一阶段必须是实质性的 178 00:09:31,463 --> 00:09:35,565 就是工具变量,获录取或未被录取 179 00:09:35,565 --> 00:09:39,065 都必须真正改变了我们感兴趣的变量 180 00:09:39,065 --> 00:09:41,031 这里就是KIPP上学率 181 00:09:41,298 --> 00:09:44,594 在这钟情况下,第一阶段 并不真的存在疑问 182 00:09:44,594 --> 00:09:47,894 获录取会使KIPP上学率的可能性更大 183 00:09:48,386 --> 00:09:50,631 并非所有IV故事都是这样的 184 00:09:51,321 --> 00:09:53,698 其次,工具变量 185 00:09:53,698 --> 00:09:55,361 必须是随机分配的 186 00:09:55,361 --> 00:09:58,716 意味着获录取者和未被录取者 具有相同特性 187 00:09:58,893 --> 00:10:01,559 这是独立性假设 188 00:10:01,977 --> 00:10:05,716 当然,KIPP的获录取者 实际上是随机分配的 189 00:10:05,716 --> 00:10:09,656 尽管如此,我们仍应检查 两者的情况 190 00:10:09,656 --> 00:10:11,493 并确认获录取者及未被录取者 191 00:10:11,493 --> 00:10:13,590 具有相似的家庭背景 相似的才能等 192 00:10:13,590 --> 00:10:16,969 从本质上讲,我们正在检查 以确保KIPP录取的公平 193 00:10:16,969 --> 00:10:20,055 获录取者没有明显的优势 194 00:10:21,373 --> 00:10:24,373 最后,我们要求工具变量 195 00:10:24,373 --> 00:10:26,092 仅会通过感兴趣的变量 来更改结果— 196 00:10:26,092 --> 00:10:28,100 在此例中是参加KIPP 197 00:10:28,299 --> 00:10:31,367 这个假设称为“排斥限制” 198 00:10:32,951 --> 00:10:37,500 - 仅当这三个假设都符合时 IV才有效 199 00:10:38,033 --> 00:10:40,418 - 我不明白“排斥限制” 200 00:10:40,917 --> 00:10:43,239 上KIPP不能提高数学 201 00:10:43,239 --> 00:10:45,244 而是获录取提高数学成绩呢? 202 00:10:45,244 --> 00:10:47,230 - 对啊? - 很好的问题 203 00:10:47,230 --> 00:10:50,536 假设获录取者只是为了赢 204 00:10:50,536 --> 00:10:55,045 而这种幸福感促使他们 更努力学,学习更多的数学 205 00:10:55,045 --> 00:10:57,285 不管在哪个学校上学 206 00:10:57,285 --> 00:10:59,901 这将违反“排斥限制” 207 00:10:59,901 --> 00:11:03,787 因为获录取的动机是第二种渠道 208 00:11:03,787 --> 00:11:06,569 获录取可能会影响考试成绩 209 00:11:06,865 --> 00:11:09,546 虽然很难完全排除这个可能性 210 00:11:09,546 --> 00:11:11,950 在KIPP研究中 211 00:11:11,950 --> 00:11:14,108 没有其他渠道的证据 212 00:11:17,817 --> 00:11:23,040 - IV解决了诸如KIPP抽签之类的 选择性偏差问题 213 00:11:23,040 --> 00:11:25,051 而抽签是随机的 214 00:11:25,051 --> 00:11:27,083 但其中一些选择退出 215 00:11:28,451 --> 00:11:31,700 这种有意但不完整的随机分配 216 00:11:31,700 --> 00:11:33,367 非常普遍 217 00:11:33,367 --> 00:11:36,318 即使是随机临床试验也有这样的 218 00:11:37,134 --> 00:11:40,053 IV解决了抽奖或临床研究中 219 00:11:40,053 --> 00:11:42,534 非随机占用的问题 220 00:11:43,054 --> 00:11:46,725 但是抽奖并不是引人注目的 唯一工具变量 221 00:11:46,915 --> 00:11:49,124 很多因果问题 222 00:11:49,124 --> 00:11:50,948 可以通过自然发生来解决 223 00:11:50,948 --> 00:11:53,831 和随机分配变量一样好用 224 00:11:54,731 --> 00:11:56,915 这里有一个因果问题: 225 00:11:56,915 --> 00:11:59,450 在职业生涯早期,生儿育女的女性 226 00:11:59,450 --> 00:12:01,647 是否因此蒙受巨大收入损失? 227 00:12:02,648 --> 00:12:04,970 毕竟,女性的收入低于男性 228 00:12:05,573 --> 00:12:08,506 当然我们可以简单地 229 00:12:08,506 --> 00:12:11,381 对养育较多或较少孩子的女性的收入 进行比较即可 230 00:12:11,381 --> 00:12:14,190 但是,这样的比较充满了 选择性偏差 231 00:12:14,806 --> 00:12:17,401 如果可以的话,我们可以 将婴儿随机 232 00:12:17,401 --> 00:12:19,089 分配到不同的家庭 233 00:12:19,089 --> 00:12:22,131 对啊,听起来不错 234 00:12:22,470 --> 00:12:26,714 我们的下一个IV故事 —梦幻而不是幻想 235 00:12:26,714 --> 00:12:29,774 将会描述一个适合家庭的 236 00:12:29,774 --> 00:12:31,918 自然且神奇的工具变量 237 00:12:34,551 --> 00:12:38,202 你正在掌握计量经济学 238 00:12:38,202 --> 00:12:40,170 请回答一些练习问题 239 00:12:40,170 --> 00:12:42,636 来确保记得这个视频的内容 240 00:12:42,886 --> 00:12:46,336 或者,如果准备好了 请单击以观看下一个视频 241 00:12:46,529 --> 00:12:50,204 你也可以访问MRU网站 以获取更多课程 242 00:12:50,204 --> 00:12:52,027 及教师资源等