1 00:00:00,012 --> 00:00:01,054 ♪ [音乐] ♪ 2 00:00:03,620 --> 00:00:06,420 [讲解员] 欢迎观看《诺奖得主畅谈系列》 3 00:00:07,000 --> 00:00:10,043 在本集中,Josh Angrist 和Guido Imbens 4 00:00:10,043 --> 00:00:14,716 与Isaiah Andrews就机器学习 在应用计量经济学中的作用 5 00:00:14,717 --> 00:00:16,587 展开讨论和争辩 6 00:00:18,264 --> 00:00:21,223 - [Isaiah] 有很多议题 两位大致上都意见一致 7 00:00:21,224 --> 00:00:24,240 但我想换个两位有异议的话题 8 00:00:24,240 --> 00:00:26,883 我想听听您们对机器学习的看法 9 00:00:26,883 --> 00:00:29,900 还有就经济学而言 它在当前和未来所起的作用 10 00:00:30,072 --> 00:00:33,714 - [Guido] 我看过一些 专论之类的数据 11 00:00:33,716 --> 00:00:35,245 但并无相关出版文献 12 00:00:36,106 --> 00:00:39,312 我看到有人做了搜索算法之类的实验 13 00:00:39,668 --> 00:00:41,736 不过问题在于 14 00:00:42,829 --> 00:00:45,623 该实验是关于排序与改变排序的 15 00:00:45,837 --> 00:00:50,559 所以当中显然存在许多异质性 16 00:00:52,161 --> 00:00:56,031 比方说若要搜寻的是 17 00:00:57,831 --> 00:01:00,617 Britney Spears的照片 18 00:01:00,617 --> 00:01:05,500 那么,排序并不重要 因为你会自行判断结果 19 00:01:06,136 --> 00:01:09,717 排第一、第二,还是第三都无所谓 20 00:01:10,091 --> 00:01:12,951 但若找的是最好的计量经济学专业书籍 21 00:01:13,139 --> 00:01:18,196 结果排序是第一还是第十,差别就很大了 22 00:01:18,544 --> 00:01:20,923 因为这关系到点阅率 23 00:01:21,829 --> 00:01:23,417 所以… 24 00:01:23,417 --> 00:01:27,259 - [Josh] 为什么需要 机器学习来发现这点? 25 00:01:27,260 --> 00:01:29,195 似乎我自己来就行了 26 00:01:29,195 --> 00:01:30,435 - 总的来说… 27 00:01:30,435 --> 00:01:32,100 - 这有很多可能性 28 00:01:32,101 --> 00:01:37,257 - 因为设想到事物的诸多特性 29 00:01:37,681 --> 00:01:43,287 你会想了解造成异质性的驱力及其影响 30 00:01:43,323 --> 00:01:45,008 - 但你只是在预测 31 00:01:45,008 --> 00:01:47,665 某种意义上来说,这是在解决营销问题 32 00:01:47,666 --> 00:01:49,191 - 不,这有因果关系 33 00:01:49,274 --> 00:01:51,911 - 这是因果关系,但缺乏科学内涵 34 00:01:51,911 --> 00:01:53,271 不妨这样想 35 00:01:53,664 --> 00:01:57,307 - 不是的,在医疗界也有类似的例子 36 00:01:57,857 --> 00:01:59,498 如果做个实验 37 00:01:59,498 --> 00:02:03,705 你可能对治疗是否对 某些群体有效非常感兴趣 38 00:02:03,828 --> 00:02:07,887 这当中牵涉各种特性 因此需要系统性地搜寻… 39 00:02:07,888 --> 00:02:10,489 - 没错,但我怀疑的是这种观点: 40 00:02:10,489 --> 00:02:13,561 我应关注的某种因果关系 41 00:02:13,689 --> 00:02:17,259 可以通过一些有用的机器学习来发现 42 00:02:17,259 --> 00:02:20,045 我对学校进行了许多研究 43 00:02:20,046 --> 00:02:22,839 包括特许学校 44 00:02:22,839 --> 00:02:25,167 公共资助的私立学校 45 00:02:25,225 --> 00:02:29,399 校方实际上可视需要自由安排课程 46 00:02:29,529 --> 00:02:33,390 有些特许学校的教学成效卓著 47 00:02:33,789 --> 00:02:37,662 而在产生这类结果的数据集中包含许多共变量 48 00:02:37,663 --> 00:02:43,207 包括基线分数、家庭背景、家长教育程度 49 00:02:43,343 --> 00:02:45,800 学生性别和种族 50 00:02:45,930 --> 00:02:49,795 一旦我将其中这些变量整合后 51 00:02:49,795 --> 00:02:51,900 便会产生高维空间 52 00:02:52,243 --> 00:02:56,401 我对那种班级特征的处理效应很感兴趣 53 00:02:56,457 --> 00:03:02,046 比如是否对来自低收入家庭的孩子较有利 54 00:03:02,409 --> 00:03:06,042 我很难相信会有这种应用 55 00:03:06,042 --> 00:03:09,872 能解释非常高维的东西 56 00:03:09,872 --> 00:03:14,971 像我发现 非白人高收入家庭的儿童 57 00:03:14,971 --> 00:03:17,790 基线分数只落在第三个四分位数 58 00:03:18,166 --> 00:03:23,108 且只在三年级(小学)时进入这种学校 而非六年级(中学) 59 00:03:23,108 --> 00:03:25,715 那是高维分析的结果 60 00:03:25,716 --> 00:03:28,016 条件陈述也很复杂 61 00:03:28,223 --> 00:03:30,675 我认为在此使用应用有两大问题 62 00:03:30,676 --> 00:03:34,000 首先是分析难以执行 63 00:03:34,600 --> 00:03:36,412 也不明白这样做的理由 64 00:03:36,591 --> 00:03:41,139 我还知道有些替代模型 就有几乎同样的作用 65 00:03:41,671 --> 00:03:42,877 这就完全不同了 66 00:03:43,115 --> 00:03:48,636 因为机器学习 无法指出真正重要的预测因子 67 00:03:48,637 --> 00:03:51,020 只是告诉我这是不错的预测因子 68 00:03:51,486 --> 00:03:57,586 所以我认为就社会科学而言 情况有些不同 69 00:03:57,785 --> 00:04:00,983 - 我想你提到的 在社会科学应用中 70 00:04:01,513 --> 00:04:08,091 效果并没有很大的异质性 71 00:04:09,783 --> 00:04:13,410 - 若可人为填补模型缺陷,可能会有 72 00:04:13,411 --> 00:04:15,685 - 不是这样的! 73 00:04:15,739 --> 00:04:18,786 我想就多数干扰因子来讲 74 00:04:18,787 --> 00:04:22,765 你会期望对所有人来说 效果意涵是一样的 75 00:04:24,358 --> 00:04:26,913 或许当中存在些许强度差异 76 00:04:26,914 --> 00:04:31,596 不过许多教学上的论辩 认为这对大家都有好处 77 00:04:34,169 --> 00:04:37,385 并非只对某些人不利 对其他人就有益 78 00:04:37,471 --> 00:04:40,812 当然其中会有一小部分不好 79 00:04:40,869 --> 00:04:43,884 程度上会有落差 80 00:04:43,948 --> 00:04:46,955 但得有非常庞大的数据集才能发现 81 00:04:47,135 --> 00:04:51,415 我同意这类例子的分析难度不低 82 00:04:51,700 --> 00:04:56,457 但我想还有很多异质性更高的情境 83 00:04:57,250 --> 00:04:59,102 - 我不否认有那种可能 84 00:04:59,102 --> 00:05:04,918 但我认为你所举的例子 本质上是营销案例 85 00:05:06,315 --> 00:05:10,630 不,这是有其意涵的 86 00:05:10,631 --> 00:05:14,393 组织机构是否要顾虑… 87 00:05:15,469 --> 00:05:17,900 - 好吧,那我得读那篇论文了 88 00:05:18,336 --> 00:05:21,008 所以感觉上 89 00:05:21,467 --> 00:05:23,996 - 某些事我们仍有分歧 - 没错 90 00:05:23,996 --> 00:05:25,440 并非全然达成共识 91 00:05:25,440 --> 00:05:27,200 我也感觉到了 92 00:05:27,200 --> 00:05:30,833 - 我们这方面有不同看法 93 00:05:30,834 --> 00:05:32,915 是因为现在有了这些争论题材 94 00:05:33,040 --> 00:05:34,754 - 现在是不是比较“热”了? 95 00:05:35,820 --> 00:05:37,883 - 激烈起来好啊! 96 00:05:38,016 --> 00:05:39,691 Josh,听您的意思是 97 00:05:39,692 --> 00:05:45,236 并非全盘否定这类应用分析的可能性 98 00:05:45,237 --> 00:05:49,487 而是对当前应用持保留态度 99 00:05:49,917 --> 00:05:51,589 - 可以这样说 - 我是很有信心的 100 00:05:54,156 --> 00:05:55,189 - 就此而言 101 00:05:55,189 --> 00:05:57,661 我认为Josh说的有一定道理 102 00:05:57,987 --> 00:06:01,984 即使是机器学习预测模型用例 103 00:06:01,984 --> 00:06:06,952 真正大放异彩的地方 在于存在很多异质性 104 00:06:07,300 --> 00:06:10,411 - 你不太在意这其中的细节,对吧? 105 00:06:10,769 --> 00:06:11,836 - 是的 106 00:06:11,836 --> 00:06:15,000 - 并无涉及政策角度之类的 107 00:06:15,128 --> 00:06:20,089 - 机器学习更擅长辨识数字纪录之类的 108 00:06:20,090 --> 00:06:24,000 而非建构复杂的模型 109 00:06:24,400 --> 00:06:28,079 但是有很多社会科学,很多的经济应用 110 00:06:28,222 --> 00:06:31,905 事实上,我们很了解所属变数间的关联 111 00:06:31,906 --> 00:06:34,700 这些关联有很多是单调的 112 00:06:37,126 --> 00:06:39,376 教育会提升收入 113 00:06:39,697 --> 00:06:41,950 不分人口特性 114 00:06:41,950 --> 00:06:44,930 任何教育程度都一样 115 00:06:44,930 --> 00:06:46,076 直到获得博士学位 116 00:06:46,077 --> 00:06:47,956 研究生教育也一样 117 00:06:49,227 --> 00:06:55,605 合理的范围内还不至于大幅下滑 118 00:06:56,044 --> 00:06:59,692 许多情况下 这类机器学习的方法表现亮眼 119 00:07:00,100 --> 00:07:04,900 这些关联中包含许多非单调性的多模性 120 00:07:05,300 --> 00:07:08,456 就这些关联性来说 机器学习是很有用的工具 121 00:07:08,921 --> 00:07:11,787 不过我仍坚信 122 00:07:12,472 --> 00:07:17,608 经济学家能从这些方法中获益良多 123 00:07:17,609 --> 00:07:21,700 对未来前景影响巨大 124 00:07:21,889 --> 00:07:22,979 ♪ [音乐] ♪ 125 00:07:23,382 --> 00:07:25,912 - 机器学习在这方面 似乎还有很多有趣的话题 126 00:07:25,912 --> 00:07:30,908 所以可否请Guido就当前既有的应用 127 00:07:30,908 --> 00:07:32,598 再举些例子? 128 00:07:32,628 --> 00:07:34,150 其中一个例子就是 129 00:07:34,673 --> 00:07:39,565 我们目前在舍弃平均因果关系 转向寻求个别化的估计 130 00:07:41,492 --> 00:07:43,426 来预测因果关系 131 00:07:43,427 --> 00:07:47,569 这方面机器算法非常有用 132 00:07:47,932 --> 00:07:51,503 以往的传统途径是内核方法 133 00:07:51,504 --> 00:07:53,936 理论上成效不错 134 00:07:53,944 --> 00:07:57,301 不过认真说来,有人说这已是极致了 135 00:07:57,548 --> 00:07:59,779 不过此法的实际表现不甚理想 136 00:08:00,900 --> 00:08:03,439 Stefan Wager 和 Susan Athey 137 00:08:03,439 --> 00:08:07,526 两位学者持续耕耘的 随机与因果森林这类推断法 138 00:08:07,526 --> 00:08:09,429 应用非常广泛 139 00:08:09,548 --> 00:08:16,142 这些方法在这类情境中 推断基于共变项的因果效应 140 00:08:16,142 --> 00:08:19,151 效果其实很不错 141 00:08:20,604 --> 00:08:23,818 我想这些推断方法才刚起步 142 00:08:23,819 --> 00:08:25,700 但很多情况下 143 00:08:27,351 --> 00:08:31,600 这些演算法在搜索广泛空间时 144 00:08:31,721 --> 00:08:37,021 以及找出适合的函数方面帮助很大 145 00:08:37,267 --> 00:08:40,948 其运作方式是我们无法事先备妥的 146 00:08:41,500 --> 00:08:43,015 - 就因果推论而言 147 00:08:43,016 --> 00:08:47,295 我没有机器学习 对我感兴趣的因果效应提供洞见的例子 148 00:08:47,767 --> 00:08:51,209 我倒是有些很可能产生误导的例子 149 00:08:51,210 --> 00:08:54,022 我和 Brigham Frandsen 合作过一些相关研究 150 00:08:54,022 --> 00:08:59,897 例如,在需要界定共变量的工具变量问题中 151 00:09:00,187 --> 00:09:03,456 使用随机森林来建立共变量效应模型 152 00:09:04,288 --> 00:09:08,200 对此,你不会对其功能形式有特别强烈的感受 153 00:09:08,201 --> 00:09:12,915 因此或许需作决策曲线分析 并对弹性曲线拟合分析持开放的态度 154 00:09:12,916 --> 00:09:16,757 这会引导你进入一种 模型中包含许多非线性的情况 155 00:09:17,312 --> 00:09:19,933 这对工具变量来说很危险 156 00:09:19,933 --> 00:09:22,893 因为任何所排除的非线性 157 00:09:23,226 --> 00:09:25,839 都有可能导致因果效应的谬误 158 00:09:25,839 --> 00:09:29,292 我和Brigham已就这点提出有力证明 159 00:09:29,292 --> 00:09:35,159 所用的例子是我和Bill Evans 合作的论文中所用的两项分析工具 160 00:09:35,160 --> 00:09:38,754 其中若将两阶段最小二乘法 161 00:09:38,755 --> 00:09:42,366 换成某种随机森林分析法 162 00:09:42,900 --> 00:09:46,807 便会得出精密估算过的虚假推估 163 00:09:48,962 --> 00:09:51,942 我认为这是一大警讯 164 00:09:51,943 --> 00:09:54,665 考量我使用简单分析工具 165 00:09:54,666 --> 00:09:58,975 就自身研究的案例中 所得到的这些验证 166 00:09:59,268 --> 00:10:01,433 让我对此有所怀疑 167 00:10:02,862 --> 00:10:06,276 非线性和工具变量并不是很契合 168 00:10:06,331 --> 00:10:09,981 - 不是的,这听起来好像更复杂了 169 00:10:10,052 --> 00:10:12,372 - 我们谈的是工具变量... - 是的 170 00:10:12,536 --> 00:10:14,091 ...所以才设法厘清 171 00:10:15,907 --> 00:10:17,289 有道理 172 00:10:17,289 --> 00:10:18,410 ♪ [音乐] ♪ 173 00:10:18,410 --> 00:10:22,132 - 作为Econometrica的编辑 我收到很多相关领域的论文 174 00:10:22,640 --> 00:10:26,823 不过其动机并不明确 175 00:10:27,578 --> 00:10:29,523 事实上是无目的的 176 00:10:29,759 --> 00:10:34,919 这些投稿并非传统的 半参数基础论文 177 00:10:35,315 --> 00:10:37,045 这是一大问题 178 00:10:38,496 --> 00:10:42,337 相关的一个问题是计量经济学有种惯例 179 00:10:42,656 --> 00:10:47,474 那就是非常专注于 形式变量渐近后的趋近结果 180 00:10:48,800 --> 00:10:53,311 很多论文是作者提出一种方法后 181 00:10:53,312 --> 00:10:59,420 然后以一种非常标准化的方式 建构出渐近的特性 182 00:11:00,896 --> 00:11:02,078 - 那样不好吗? 183 00:11:02,815 --> 00:11:09,040 - 我想这多少会排挤掉许多框架外的研究 184 00:11:09,040 --> 00:11:13,585 毕竟机器学习的相关文献 很多是比较偏向演算法的 185 00:11:13,808 --> 00:11:18,433 是基于演算法而得出预测 186 00:11:18,744 --> 00:11:23,458 结果证明这种方式的成效 优于非参数内核回归 187 00:11:23,650 --> 00:11:24,682 长期以来 188 00:11:24,683 --> 00:11:28,643 计量经济学都在处理非参数 大家用的都是内核回归 189 00:11:29,037 --> 00:11:31,202 这很适合用来证明定理 190 00:11:31,210 --> 00:11:34,684 可藉此得出置信区间 一致性和渐近正态性 191 00:11:34,684 --> 00:11:37,190 一切都很棒,但却不太实用 192 00:11:37,260 --> 00:11:40,760 机器学习的研究方式却好很多 193 00:11:40,844 --> 00:11:42,867 但又不会有这样的问题… 194 00:11:42,867 --> 00:11:46,671 - 理论薄弱 不是我对机器学习不满的地方 195 00:11:47,141 --> 00:11:52,394 - 不,我的意思是机器学习更擅于预测 196 00:11:52,394 --> 00:11:54,830 - 机器学习是更好的曲线拟合工具 197 00:11:54,864 --> 00:11:57,704 - 但机器学习使得那些 198 00:11:57,705 --> 00:12:00,458 因为没有遵循常规 199 00:12:00,458 --> 00:12:06,279 本来无法被计量经济学期刊 轻易接受的论文发布 200 00:12:06,857 --> 00:12:12,344 当Breiman研究回归树的时候 也是不太正统 201 00:12:12,920 --> 00:12:18,400 我想他投计量经济学期刊时 也必定遇到了不少困难 202 00:12:19,967 --> 00:12:23,656 我认为我们画地自限 203 00:12:24,663 --> 00:12:27,830 因此难有突破 204 00:12:27,924 --> 00:12:31,154 毕竟很多机器学习的方法实际上很实用 205 00:12:31,163 --> 00:12:34,000 我认为总的来说 206 00:12:34,908 --> 00:12:40,168 计算机科学家在相关研究文献上 贡献了大量的这类演算法 207 00:12:40,582 --> 00:12:43,887 也提出诸多很实用的演算法 208 00:12:43,887 --> 00:12:48,964 而这也会影响我们进行实证研究的方式 209 00:12:49,749 --> 00:12:52,066 不过我们对此尚未完全内化 210 00:12:52,068 --> 00:12:57,748 因为我们仍相当专注于 获得点估计和标准误差 211 00:12:58,485 --> 00:13:00,214 还有P值 212 00:13:00,270 --> 00:13:06,183 某种程度上,我们得摆脱局限 以善用机器学习的能力 213 00:13:06,491 --> 00:13:10,702 以及相关文献的有益贡献 214 00:13:11,396 --> 00:13:13,548 - 我一方面颇能理解您的观点 215 00:13:13,548 --> 00:13:16,850 也就是传统的计量经济学框架 216 00:13:16,850 --> 00:13:23,612 是在类似趋近的设定下 提出一种方法来证明极限定理 217 00:13:24,237 --> 00:13:27,057 因此论文出版有所局限 218 00:13:27,273 --> 00:13:28,710 且在某种意义上 219 00:13:28,711 --> 00:13:33,211 藉由放宽对论文学理论述的想像 220 00:13:33,485 --> 00:13:38,299 机器学习的研究文献 就很多问题都有很实用的见解 221 00:13:38,300 --> 00:13:41,085 而且目前对计量经济学也有重大影响 222 00:13:41,434 --> 00:13:47,548 有个我很感兴趣的问题 您如何定位理论… 223 00:13:48,611 --> 00:13:51,255 您是否认为理论部分毫无价值可言? 224 00:13:51,600 --> 00:13:56,748 因为见到机器学习工具的产出时 我常有个疑问 225 00:13:56,772 --> 00:14:01,653 您所提到的几种方式 实际上都已开推论结果 226 00:14:02,535 --> 00:14:05,559 我想知道的是 不确定性量化之类的方法 227 00:14:05,560 --> 00:14:08,000 我有自身的验证 228 00:14:08,000 --> 00:14:10,888 我有既定的观点 并观察到对应结果 229 00:14:10,889 --> 00:14:12,301 那要怎样就此更新呢? 230 00:14:12,302 --> 00:14:13,643 而在某种意义上 231 00:14:13,643 --> 00:14:17,145 若身处常态分布的世界 我也清楚怎样处理 232 00:14:17,146 --> 00:14:18,305 但此处却不然 233 00:14:18,305 --> 00:14:20,859 因此我想知道您对此有何看法 234 00:14:20,860 --> 00:14:26,426 - 我不认为这些结果并无特别之处 235 00:14:26,427 --> 00:14:30,161 但这类结果通常很难达成 236 00:14:30,162 --> 00:14:32,162 我们可能无法办到 237 00:14:32,489 --> 00:14:34,942 可能得分阶段来做 238 00:14:34,943 --> 00:14:36,505 得有人率先提出 239 00:14:36,506 --> 00:14:42,230 我有个特定功能的有趣演算法 240 00:14:42,231 --> 00:14:44,699 且以特定标准而言 241 00:14:45,479 --> 00:14:49,804 这种演算法在这组数据集的功效良好 242 00:14:50,896 --> 00:14:52,602 所以我们应该提出来 243 00:14:52,602 --> 00:14:59,463 未来也许有人会有办法 在特定条件下以此进行推论 244 00:14:59,463 --> 00:15:03,800 然后发现达成条件不是很实际 那就再研究 245 00:15:03,903 --> 00:15:10,535 我觉得我们过去始终认为 所投入的类型必须有所限制时 246 00:15:10,536 --> 00:15:13,185 这是在自我设限 247 00:15:13,185 --> 00:15:14,502 就某种意义而言 248 00:15:15,700 --> 00:15:21,716 这又回到Josh和我 对局部平均处理效应的看法 249 00:15:21,909 --> 00:15:25,174 以前人们并非这样看待这个问题的 250 00:15:25,899 --> 00:15:29,089 某种层面而言,有人会说 251 00:15:29,500 --> 00:15:33,845 这类工作的必要处理 就是先厘清需要估计的对象 252 00:15:34,132 --> 00:15:37,499 然后尽力估计 253 00:15:38,026 --> 00:15:44,158 但是你们这些人却倒行逆施 254 00:15:44,300 --> 00:15:46,546 你可能会说,“你看看,我有个估计器 255 00:15:47,203 --> 00:15:50,641 我要看看它所估计的内容是什么?” 256 00:15:50,642 --> 00:15:55,141 然后我猜你可能会说 “这有啥特别的”之类的回应 257 00:15:55,142 --> 00:15:58,451 并且说这样做不合理 258 00:15:58,948 --> 00:16:03,003 我认为我们看待问题的方式 259 00:16:03,487 --> 00:16:06,830 应该更灵活一点 260 00:16:06,831 --> 00:16:11,172 因为过去未曾尝试 我们已错失一些机会 261 00:16:11,300 --> 00:16:12,351 ♪ [音乐] ♪ 262 00:16:12,914 --> 00:16:14,752 - Isaiah 你听到我们的观点了 263 00:16:14,753 --> 00:16:18,267 也了解我们有一些意见分歧 264 00:16:18,268 --> 00:16:20,400 为何不为我们评评理呢? 265 00:16:22,500 --> 00:16:24,999 - 哦,您问的小问题好棒喔 266 00:16:26,484 --> 00:16:32,966 我想一方面,我很认同 Guido提到的一些观点 267 00:16:35,911 --> 00:16:40,156 有一点就机器学习来说似乎是比较清楚的 268 00:16:40,165 --> 00:16:45,016 就某种我们有兴趣投入的非参数预测问题 269 00:16:45,017 --> 00:16:49,625 无论是有条件的期望或条件概率 270 00:16:49,920 --> 00:16:53,545 过去这得用内核回归 271 00:16:53,546 --> 00:16:57,314 或运行序列回归之类的分析 272 00:16:57,672 --> 00:17:00,442 目前为止 我们似乎明白了一件事 273 00:17:00,443 --> 00:17:02,958 在广泛的应用层面上 274 00:17:03,102 --> 00:17:07,457 像是估计有条件的平均函数 条件概率 275 00:17:07,458 --> 00:17:09,811 或其他各种非参数对象 276 00:17:09,811 --> 00:17:12,000 机器学习的方法 277 00:17:12,001 --> 00:17:15,879 似乎比计量经济学和统计学 惯用的非参数分析法 278 00:17:15,880 --> 00:17:17,292 表现得更好 279 00:17:17,299 --> 00:17:19,107 尤其是在高维空间观察数据 280 00:17:19,500 --> 00:17:22,976 - 你是在说倾向得分之类的? 281 00:17:22,977 --> 00:17:25,063 - 正是 - 滋扰函数 282 00:17:25,063 --> 00:17:27,215 - 对,倾向得分之类的 283 00:17:27,839 --> 00:17:30,577 甚至是直接相关的对象 284 00:17:30,578 --> 00:17:35,100 像是条件平均处理效应 这种区别两种条件期望函数者 285 00:17:35,100 --> 00:17:36,507 这类的可能 286 00:17:36,508 --> 00:17:38,095 当然,即便如此 287 00:17:38,873 --> 00:17:45,817 有关如何解读的理论推论 和这类项目的大规模样本陈述 288 00:17:45,818 --> 00:17:47,270 相对而言较不成熟 289 00:17:47,271 --> 00:17:50,100 这还得看机器学习所用的估计器而定 290 00:17:50,100 --> 00:17:53,165 但比较难的是 291 00:17:53,166 --> 00:17:57,957 机器学习的某些分析方法 就特定目的而言似乎更好用 292 00:17:57,958 --> 00:18:03,259 但我们得谨慎带入,并慎重解读结果 293 00:18:03,543 --> 00:18:07,667 但这无疑是当今热门,也不乏相关研究 294 00:18:07,668 --> 00:18:12,800 因此我完全可以预期 未来会有更多相关进展 295 00:18:12,913 --> 00:18:16,693 因此机器学习有个需要警惕的问题是-- 296 00:18:16,694 --> 00:18:22,139 这一方面是危机 而有时是降低应用价值的问题 297 00:18:22,139 --> 00:18:26,618 那便是当人们着手一项自身跃跃欲试 298 00:18:26,619 --> 00:18:28,676 而非问题导向的方法时 299 00:18:28,889 --> 00:18:35,219 与其就自身感兴趣的对象及参数来切入 300 00:18:35,490 --> 00:18:39,500 让我想一下要如何分辨特定事物 301 00:18:39,500 --> 00:18:41,894 如何在庞大的数据中将其涵盖 302 00:18:41,895 --> 00:18:47,065 “噢,这是有条件的期望函数 我来插入对应的机器学习的估计器” 303 00:18:47,065 --> 00:18:48,705 这样做似乎是很合理的 304 00:18:48,904 --> 00:18:53,084 反观若根据价格来回归数量 305 00:18:53,594 --> 00:18:55,773 然后辩称是采用机器学习的方法 306 00:18:56,217 --> 00:18:58,766 或许我很满意这解决了内生性问题 307 00:18:58,791 --> 00:19:01,200 对此我们通常会顾虑,但也可能不会 308 00:19:01,491 --> 00:19:06,291 但同样的,这让厘清问题的方法更明确了 309 00:19:06,500 --> 00:19:09,779 也就是先决定研究兴趣,再思索一下… 310 00:19:09,779 --> 00:19:11,623 - 就是带入经济学… 311 00:19:11,624 --> 00:19:12,741 - 没错 312 00:19:12,741 --> 00:19:14,566 - 并考量异质性 313 00:19:14,567 --> 00:19:20,186 并就部分因子来善用机器学习的方法 314 00:19:20,293 --> 00:19:21,387 - 正是如此 315 00:19:21,388 --> 00:19:25,801 所以引发兴趣的问题向来都是一样的 316 00:19:25,801 --> 00:19:28,483 但现在我们有一些更好的估计方法 317 00:19:28,864 --> 00:19:32,704 而难以预测之处 318 00:19:32,704 --> 00:19:37,196 就是机器学习的文献资料相当庞杂 319 00:19:37,452 --> 00:19:42,723 而我提到的带入方式毕竟有限 320 00:19:42,928 --> 00:19:45,476 因而衍生许多其他有趣的问题 321 00:19:45,477 --> 00:19:49,300 例如这类交互的未来发展 及能从中汲取的其他经验 322 00:19:49,300 --> 00:19:54,347 这些我相信仍有许多颇具前景的开发空间 323 00:19:54,414 --> 00:19:56,400 但我没有确切答案 324 00:19:56,935 --> 00:20:00,158 - 我完全同意 325 00:20:00,388 --> 00:20:03,539 这很令人期待 326 00:20:03,539 --> 00:20:06,162 我认为这方面只需再稍加把劲 327 00:20:06,600 --> 00:20:08,883 所以这点Isaiah跟我看法一致 328 00:20:10,174 --> 00:20:11,633 - 我没这么说喔 329 00:20:12,926 --> 00:20:14,419 ♪ [音乐] ♪ 330 00:20:14,419 --> 00:20:16,833 若你想观看更多 《诺奖得主畅谈系列》的节目 331 00:20:16,833 --> 00:20:18,012 请点击此处 332 00:20:18,019 --> 00:20:20,312 或你若想多学一点计量经济学 333 00:20:20,467 --> 00:20:23,067 那就看看Josh的 《计量经济学》系列视频 334 00:20:23,600 --> 00:20:26,569 若想多加了解 Guido、Josh和Isaiah 335 00:20:26,687 --> 00:20:28,550 请参考视频描述中的链接 336 00:20:28,796 --> 00:20:30,298 ♪ [音乐] ♪