WEBVTT 00:00:00.012 --> 00:00:01.054 ♪ [音乐] ♪ 00:00:03.620 --> 00:00:06.420 [讲解员] 欢迎观看《诺奖得主畅谈系列》 00:00:07.000 --> 00:00:10.043 在本集中,Josh Angrist 和Guido Imbens 00:00:10.043 --> 00:00:14.716 与Isaiah Andrews就机器学习 在应用计量经济学中的作用 00:00:14.717 --> 00:00:16.587 展开讨论和争辩 00:00:18.264 --> 00:00:21.223 - [Isaiah] 有很多议题 两位大致上都意见一致 00:00:21.224 --> 00:00:24.240 但我想换个两位有异议的话题 00:00:24.240 --> 00:00:26.883 我想听听您们对机器学习的看法 00:00:26.883 --> 00:00:29.900 还有就经济学而言 它在当前和未来所起的作用 00:00:30.072 --> 00:00:33.714 - [Guido] 我看过一些 专论之类的数据 00:00:33.716 --> 00:00:35.245 但并无相关出版文献 00:00:36.106 --> 00:00:39.312 我看到有人做了搜索算法之类的实验 00:00:39.668 --> 00:00:41.736 不过问题在于 00:00:42.829 --> 00:00:45.623 该实验是关于排序与改变排序的 00:00:45.837 --> 00:00:50.559 所以当中显然存在许多异质性 00:00:52.161 --> 00:00:56.031 比方说若要搜寻的是 00:00:57.831 --> 00:01:00.617 Britney Spears的照片 00:01:00.617 --> 00:01:05.500 那么,排序并不重要 因为你会自行判断结果 00:01:06.136 --> 00:01:09.717 排第一、第二,还是第三都无所谓 00:01:10.091 --> 00:01:12.951 但若找的是最好的计量经济学专业书籍 00:01:13.139 --> 00:01:18.196 结果排序是第一还是第十,差别就很大了 00:01:18.544 --> 00:01:20.923 因为这关系到点阅率 00:01:21.829 --> 00:01:23.417 所以… 00:01:23.417 --> 00:01:27.259 - [Josh] 为什么需要 机器学习来发现这点? 00:01:27.260 --> 00:01:29.195 似乎我自己来就行了 00:01:29.195 --> 00:01:30.435 - 总的来说… 00:01:30.435 --> 00:01:32.100 - 这有很多可能性 00:01:32.101 --> 00:01:37.257 - 因为设想到事物的诸多特性 00:01:37.681 --> 00:01:43.287 你会想了解造成异质性的驱力及其影响 00:01:43.323 --> 00:01:45.008 - 但你只是在预测 00:01:45.008 --> 00:01:47.665 某种意义上来说,这是在解决营销问题 00:01:47.666 --> 00:01:49.191 - 不,这有因果关系 00:01:49.274 --> 00:01:51.911 - 这是因果关系,但缺乏科学内涵 00:01:51.911 --> 00:01:53.271 不妨这样想 00:01:53.664 --> 00:01:57.307 - 不是的,在医疗界也有类似的例子 00:01:57.857 --> 00:01:59.498 如果做个实验 00:01:59.498 --> 00:02:03.705 你可能对治疗是否对 某些群体有效非常感兴趣 00:02:03.828 --> 00:02:07.887 这当中牵涉各种特性 因此需要系统性地搜寻… 00:02:07.888 --> 00:02:10.489 - 没错,但我怀疑的是这种观点: 00:02:10.489 --> 00:02:13.561 我应关注的某种因果关系 00:02:13.689 --> 00:02:17.259 可以通过一些有用的机器学习来发现 00:02:17.259 --> 00:02:20.045 我对学校进行了许多研究 00:02:20.046 --> 00:02:22.839 包括特许学校 00:02:22.839 --> 00:02:25.167 公共资助的私立学校 00:02:25.225 --> 00:02:29.399 校方实际上可视需要自由安排课程 00:02:29.529 --> 00:02:33.390 有些特许学校的教学成效卓著 00:02:33.789 --> 00:02:37.662 而在产生这类结果的数据集中包含许多共变量 00:02:37.663 --> 00:02:43.207 包括基线分数、家庭背景、家长教育程度 00:02:43.343 --> 00:02:45.800 学生性别和种族 00:02:45.930 --> 00:02:49.795 一旦我将其中这些变量整合后 00:02:49.795 --> 00:02:51.900 便会产生高维空间 00:02:52.243 --> 00:02:56.401 我对那种班级特征的处理效应很感兴趣 00:02:56.457 --> 00:03:02.046 比如是否对来自低收入家庭的孩子较有利 00:03:02.409 --> 00:03:06.042 我很难相信会有这种应用 00:03:06.042 --> 00:03:09.872 能解释非常高维的东西 00:03:09.872 --> 00:03:14.971 像我发现 非白人高收入家庭的儿童 00:03:14.971 --> 00:03:17.790 基线分数只落在第三个四分位数 00:03:18.166 --> 00:03:23.108 且只在三年级(小学)时进入这种学校 而非六年级(中学) 00:03:23.108 --> 00:03:25.715 那是高维分析的结果 00:03:25.716 --> 00:03:28.016 条件陈述也很复杂 00:03:28.223 --> 00:03:30.675 我认为在此使用应用有两大问题 00:03:30.676 --> 00:03:34.000 首先是分析难以执行 00:03:34.600 --> 00:03:36.412 也不明白这样做的理由 00:03:36.591 --> 00:03:41.139 我还知道有些替代模型 就有几乎同样的作用 00:03:41.671 --> 00:03:42.877 这就完全不同了 00:03:43.115 --> 00:03:48.636 因为机器学习 无法指出真正重要的预测因子 00:03:48.637 --> 00:03:51.020 只是告诉我这是不错的预测因子 00:03:51.486 --> 00:03:57.586 所以我认为就社会科学而言 情况有些不同 00:03:57.785 --> 00:04:00.983 - 我想你提到的 在社会科学应用中 00:04:01.513 --> 00:04:08.091 效果并没有很大的异质性 00:04:09.783 --> 00:04:13.410 - 若可人为填补模型缺陷,可能会有 00:04:13.411 --> 00:04:15.685 - 不是这样的! 00:04:15.739 --> 00:04:18.786 我想就多数干扰因子来讲 00:04:18.787 --> 00:04:22.765 你会期望对所有人来说 效果意涵是一样的 00:04:24.358 --> 00:04:26.913 或许当中存在些许强度差异 00:04:26.914 --> 00:04:31.596 不过许多教学上的论辩 认为这对大家都有好处 00:04:34.169 --> 00:04:37.385 并非只对某些人不利 对其他人就有益 00:04:37.471 --> 00:04:40.812 当然其中会有一小部分不好 00:04:40.869 --> 00:04:43.884 程度上会有落差 00:04:43.948 --> 00:04:46.955 但得有非常庞大的数据集才能发现 00:04:47.135 --> 00:04:51.415 我同意这类例子的分析难度不低 00:04:51.700 --> 00:04:56.457 但我想还有很多异质性更高的情境 00:04:57.250 --> 00:04:59.102 - 我不否认有那种可能 00:04:59.102 --> 00:05:04.918 但我认为你所举的例子 本质上是营销案例 00:05:06.315 --> 00:05:10.630 不,这是有其意涵的 00:05:10.631 --> 00:05:14.393 组织机构是否要顾虑… 00:05:15.469 --> 00:05:17.900 - 好吧,那我得读那篇论文了 00:05:18.336 --> 00:05:21.008 所以感觉上 00:05:21.467 --> 00:05:23.996 - 某些事我们仍有分歧 - 没错 00:05:23.996 --> 00:05:25.440 并非全然达成共识 00:05:25.440 --> 00:05:27.200 我也感觉到了 00:05:27.200 --> 00:05:30.833 - 我们这方面有不同看法 00:05:30.834 --> 00:05:32.915 是因为现在有了这些争论题材 00:05:33.040 --> 00:05:34.754 - 现在是不是比较“热”了? 00:05:35.820 --> 00:05:37.883 - 激烈起来好啊! 00:05:38.016 --> 00:05:39.691 Josh,听您的意思是 00:05:39.692 --> 00:05:45.236 并非全盘否定这类应用分析的可能性 00:05:45.237 --> 00:05:49.487 而是对当前应用持保留态度 00:05:49.917 --> 00:05:51.589 - 可以这样说 - 我是很有信心的 00:05:54.156 --> 00:05:55.189 - 就此而言 00:05:55.189 --> 00:05:57.661 我认为Josh说的有一定道理 00:05:57.987 --> 00:06:01.984 即使是机器学习预测模型用例 00:06:01.984 --> 00:06:06.952 真正大放异彩的地方 在于存在很多异质性 00:06:07.300 --> 00:06:10.411 - 你不太在意这其中的细节,对吧? 00:06:10.769 --> 00:06:11.836 - 是的 00:06:11.836 --> 00:06:15.000 - 并无涉及政策角度之类的 00:06:15.128 --> 00:06:20.089 - 机器学习更擅长辨识数字纪录之类的 00:06:20.090 --> 00:06:24.000 而非建构复杂的模型 00:06:24.400 --> 00:06:28.079 但是有很多社会科学,很多的经济应用 00:06:28.222 --> 00:06:31.905 事实上,我们很了解所属变数间的关联 00:06:31.906 --> 00:06:34.700 这些关联有很多是单调的 00:06:37.126 --> 00:06:39.376 教育会提升收入 00:06:39.697 --> 00:06:41.950 不分是人口特性 00:06:41.950 --> 00:06:44.930 任何教育程度都一样 00:06:44.930 --> 00:06:46.076 直到获得博士学位 00:06:46.077 --> 00:06:47.956 研究所教育也一样吗? 00:06:47.956 --> 00:06:49.227 [笑声] 00:06:49.227 --> 00:06:55.605 合理的范围内还不至于大幅下滑 00:06:56.044 --> 00:06:59.692 许多情况下,这类机器学习的方法表现亮眼 00:07:00.100 --> 00:07:04.900 这些关联中包含许多非单调性的多模性 00:07:05.300 --> 00:07:08.456 就这些关联性来说,机器学习是很有力的工具 00:07:08.921 --> 00:07:11.787 不过我仍坚信 00:07:12.472 --> 00:07:17.608 经济学家能从这些方法中获益良多 00:07:17.609 --> 00:07:21.700 对未来前景影响甚钜 00:07:21.889 --> 00:07:22.979 ♪ [音乐] ♪ 00:07:23.382 --> 00:07:25.912 - [Isaiah] 机器学习在这方面 似乎还有很多有趣的议题 00:07:25.912 --> 00:07:30.908 所以可否请Guido就当前既有的应用 00:07:30.908 --> 00:07:32.598 再举些例子? 00:07:32.628 --> 00:07:34.150 其中一个例子就是 00:07:34.673 --> 00:07:39.565 我们目前舍弃一般的因果关系 转向寻求个别化的估计 00:07:41.492 --> 00:07:43.426 来预测因果关系 00:07:43.427 --> 00:07:47.569 这方面机器学习的演算非常有用 00:07:47.932 --> 00:07:51.503 以往的传统途径是内核方法 00:07:51.504 --> 00:07:53.936 理论上成效不错 00:07:53.944 --> 00:07:57.301 不过认真说来,有人说这已是极致了 00:07:57.548 --> 00:07:59.579 不过此法的实务表现不甚理想 00:08:00.900 --> 00:08:02.971 Stefan Wager 和 Susan Athey 00:08:02.979 --> 00:08:06.644 两位学者持续耕耘的 随机与因果森林这类推断法 00:08:06.916 --> 00:08:09.429 应用非常广泛 00:08:09.548 --> 00:08:15.562 这些方法在这类情境中 推断基于共变项的因果效应 00:08:15.563 --> 00:08:19.151 效果其实很不错 00:08:20.604 --> 00:08:23.818 我想这些推断方法才刚起步 00:08:23.819 --> 00:08:25.700 但很多情况下 00:08:27.351 --> 00:08:31.600 这些演算法在搜索广泛空间时 00:08:31.721 --> 00:08:37.021 以及找出适合的函数方面帮助很大 00:08:37.267 --> 00:08:40.948 其运作方式是我们无法事先备妥的 00:08:41.500 --> 00:08:43.015 就因果推论而言 00:08:43.016 --> 00:08:47.295 我并不清楚机器学习的洞见 是否有吸引我关注的例子 00:08:47.767 --> 00:08:51.209 我知道一些很可能会误导的例子 00:08:51.210 --> 00:08:53.781 因此我和 Brigham Frandsen 合作过一些相关研究 00:08:54.022 --> 00:08:59.897 例如,在需要界定共变量的工具变量问题中 00:09:00.187 --> 00:09:03.456 使用随机森林来建立共变量效应模型 00:09:04.288 --> 00:09:08.200 对此,你不会对其功能形式有特别强烈的感受 00:09:08.201 --> 00:09:12.915 因此或许需作决策曲线分析 并对弹性曲线拟合分析持开放的态度 00:09:12.916 --> 00:09:16.757 这会引导你进入一种 模型中包含许多非线性的情况 00:09:17.312 --> 00:09:19.933 这对工具变量来说很危险 00:09:19.933 --> 00:09:22.893 因为任何所排除的非线性 00:09:23.226 --> 00:09:25.839 都有可能导致因果效应的谬误 00:09:25.839 --> 00:09:29.292 我想我和Brigham已就这点提出有力证明 00:09:29.292 --> 00:09:35.159 所用的例子是我和Bill Evans 合着的论文中所用的两项分析工具 00:09:35.160 --> 00:09:38.754 其中若将两阶段最小二乘法 00:09:38.755 --> 00:09:42.366 换成某种随机森林分析法 00:09:42.900 --> 00:09:46.807 便会得出精密估算过的虚假推估 00:09:48.962 --> 00:09:51.942 我认为这是一大警讯 00:09:51.943 --> 00:09:54.665 考量我使用简单分析工具 00:09:54.666 --> 00:09:58.975 就自身研究兴趣的案例中 所得到的这些验证过的见解 00:09:59.268 --> 00:10:01.093 让我对此有所怀疑 00:10:02.862 --> 00:10:06.276 非线性和工具变量并不是很契合 00:10:06.331 --> 00:10:09.981 - 不是的,这听起来好像变成更复杂的层面 00:10:10.052 --> 00:10:11.802 - 我们谈的是工具变量... - 是的 00:10:12.536 --> 00:10:14.091 ...所以才设法厘清 00:10:14.395 --> 00:10:15.899 [笑声] 00:10:15.907 --> 00:10:17.289 有道理 00:10:17.289 --> 00:10:18.410 ♪ [音乐] ♪ 00:10:18.410 --> 00:10:22.132 - [Guido] 身为Econometrica的编辑 我收到很多相关领域的论文 00:10:22.640 --> 00:10:26.823 不过其动机并不明确 00:10:27.578 --> 00:10:29.523 事实上是无从得知 00:10:29.759 --> 00:10:34.919 这些投稿论文并非传统的 半母数估计的那种论文 00:10:35.315 --> 00:10:37.045 这是一大问题 00:10:38.496 --> 00:10:42.337 相关的一个问题是计量经济学有种惯例 00:10:42.656 --> 00:10:47.474 那就是非常专注于 形式变量渐近后的趋近结果 00:10:48.800 --> 00:10:53.311 很多论文是作者提出一种方法后 00:10:53.312 --> 00:10:59.420 然后以一种非常标准化的方式建构出渐近的特性 00:11:00.896 --> 00:11:02.078 - 那样不好吗? 00:11:02.815 --> 00:11:09.040 我想这多少会排挤掉许多框架外的研究 00:11:09.040 --> 00:11:13.585 毕竟机器学习的相关文献 很多是比较偏向演算法的 00:11:13.808 --> 00:11:18.433 是基于演算法而得出预测 00:11:18.744 --> 00:11:23.458 结果证明这种方式的成效 优于非参数内核回归 00:11:23.650 --> 00:11:24.682 长期以来 00:11:24.683 --> 00:11:28.643 计量经济学都在处理非参数 大家用的都是内核回归 00:11:29.037 --> 00:11:31.202 这很适合用来证明定理 00:11:31.210 --> 00:11:34.684 可藉此得出置信区间、一致性和渐近正态性 00:11:34.684 --> 00:11:36.920 一切都很棒,但却不太实用 00:11:37.260 --> 00:11:40.760 机器学习的研究方式却好很多 00:11:40.844 --> 00:11:42.557 但又不会有这样的问题… 00:11:42.557 --> 00:11:45.871 我不认为因为机器学习,所以理论是薄弱的 00:11:45.871 --> 00:11:47.141 [笑声] 00:11:47.141 --> 00:11:52.394 不,我的意思是机器学习更擅于预测 00:11:52.394 --> 00:11:54.500 - 机器学习是更好的曲线拟合工具 00:11:54.864 --> 00:11:57.704 但机器学习的研究分析方式 00:11:57.705 --> 00:12:00.458 因为并非证明事物的形式 00:12:01.486 --> 00:12:06.279 一开始无法为计量经济学期刊所轻易接受 00:12:06.857 --> 00:12:11.174 Breiman研发回归树的时候也是不符正统 00:12:12.920 --> 00:12:18.400 我想他当时投稿计量经济学期刊 也必定遇到不少困难 00:12:19.967 --> 00:12:23.656 我认为我们画地自限 00:12:24.663 --> 00:12:27.830 因此难有突破 00:12:27.924 --> 00:12:31.154 毕竟很多机器学习的方法实际上很实用 00:12:31.163 --> 00:12:34.000 我认为总的来说 00:12:34.908 --> 00:12:40.168 计算机科学家在相关研究文献上 贡献了大量的这类演算法 00:12:40.582 --> 00:12:43.887 也提出诸多很实用的演算法 00:12:43.887 --> 00:12:48.964 而这也会影响我们进行实证研究的方式 00:12:49.749 --> 00:12:52.066 不过我们对此尚未完全内化 00:12:52.068 --> 00:12:57.748 因为我们仍相当专注于 获得点估计和标准误差 00:12:58.485 --> 00:13:00.214 还有P值 00:13:00.270 --> 00:13:06.183 某种程度上,我们得摆脱局限 以善用机器学习的能力 00:13:06.491 --> 00:13:10.702 以及相关文献的有益贡献 00:13:11.396 --> 00:13:13.548 - 我一方面颇能理解你的观点 00:13:13.548 --> 00:13:16.850 也就是传统的计量经济学框架 00:13:16.850 --> 00:13:23.612 是在类似趋近的设定下 提出一种方法来证明极限定理 00:13:24.237 --> 00:13:27.057 因此论文出版有所局限 00:13:27.273 --> 00:13:28.710 且在某种意义上 00:13:28.711 --> 00:13:33.211 藉由放宽对论文学理论述的想像 00:13:33.485 --> 00:13:38.299 机器学习的研究文献 就很多问题都有很实用的见解 00:13:38.300 --> 00:13:41.085 而且目前对计量经济学也有重大影响 00:13:41.434 --> 00:13:47.548 有个我很感兴趣的问题是你如何定位理论… 00:13:48.611 --> 00:13:51.255 你是否认为理论部分毫无价值可言? 00:13:51.600 --> 00:13:56.748 因为见到机器学习工具的产出时,我常有个疑问 00:13:56.772 --> 00:14:01.653 你所提到的几种方式 实际上都已开发出推论结果 00:14:02.535 --> 00:14:05.559 我想知道的是不确定性量化之类的方法 00:14:05.560 --> 00:14:08.000 我有自身的先验 00:14:08.000 --> 00:14:10.888 我有既定的观点,并观察到对应结果 00:14:10.889 --> 00:14:12.301 那要怎样就此更新呢? 00:14:12.302 --> 00:14:13.333 而在某种意义上 00:14:13.334 --> 00:14:17.145 若身处常态分布的世界,我也清楚怎样处理 00:14:17.146 --> 00:14:18.305 但此处却不然 00:14:18.305 --> 00:14:20.859 因此我想知道你对此有何看法 00:14:20.860 --> 00:14:26.426 - 我不认为这些结果并无特别之处 00:14:26.427 --> 00:14:30.161 但这类结果通常很难达成 00:14:30.162 --> 00:14:32.162 我们可能无法办到 00:14:32.489 --> 00:14:34.942 可能得分阶段来做 00:14:34.943 --> 00:14:36.505 得有人率先提出 00:14:36.506 --> 00:14:42.230 “看,我有个特定功能的有趣演算法 00:14:42.231 --> 00:14:44.699 且以特定标准而言 00:14:45.479 --> 00:14:49.804 这种演算法在这组数据集的功效良好 00:14:50.896 --> 00:14:52.602 所以我们应该提出来 00:14:52.602 --> 00:14:59.463 未来也许有人会有办法 在特定条件下以此进行推论 00:14:59.463 --> 00:15:03.800 然后发现达成条件不是很实际,那就再研究 00:15:03.903 --> 00:15:10.535 我觉得当我们过去始终认为 所投入的类型必须有所限制时 00:15:10.536 --> 00:15:13.185 这是在自我设限 00:15:13.185 --> 00:15:14.502 就某种意义而言 00:15:15.700 --> 00:15:21.716 这又回到Josh和我 对局部平均处理效应的看法 00:15:21.909 --> 00:15:25.174 以前人们并非这样看待这个问题的 00:15:25.899 --> 00:15:29.089 某种层面而言,有人会说 00:15:29.500 --> 00:15:33.845 这类工作的必要处理 就是先厘清需要估计的对象 00:15:34.132 --> 00:15:37.499 然后尽力估计 00:15:38.026 --> 00:15:44.158 但是你们这些人却倒行逆施 00:15:44.300 --> 00:15:46.546 你可能会说,“你看看,我有个估计器 00:15:47.203 --> 00:15:50.641 我要看看它所估计的内容是什么?” 00:15:50.642 --> 00:15:55.141 然后我猜你可能会说 “这有啥特别的”之类的回应 00:15:55.142 --> 00:15:58.451 并且说这样做不合理 00:15:58.948 --> 00:16:03.003 我认为我们看待问题的方式 00:16:03.487 --> 00:16:06.830 应该更灵活一点 00:16:06.831 --> 00:16:11.172 因为过去未曾尝试,我们已错失一些机会 00:16:11.300 --> 00:16:12.351 ♪ [音乐] ♪ 00:16:12.914 --> 00:16:14.752 - [Josh] Isaiah 你听到我们的观点了 00:16:14.753 --> 00:16:18.267 也了解我们有一些意见分歧 00:16:18.268 --> 00:16:20.400 为何不为我们评评理呢? 00:16:20.950 --> 00:16:22.394 [笑声] 00:16:22.500 --> 00:16:24.999 - 哦,你问的小问题好棒喔 00:16:25.062 --> 00:16:26.275 [笑声] 00:16:26.484 --> 00:16:32.966 我想一方面是我很认同 Guido提到的一些观点 00:16:34.100 --> 00:16:35.710 [笑声] 00:16:35.911 --> 00:16:40.156 有一点就机器学习来说似乎是比较清楚的 00:16:40.165 --> 00:16:45.016 就某种我们有兴趣投入的非参数预测问题来说 00:16:45.017 --> 00:16:49.625 无论是有条件的期望或条件概率 00:16:49.920 --> 00:16:53.545 过去这得跑内核回归 00:16:53.546 --> 00:16:57.314 得运行序列回归之类的分析 00:16:57.672 --> 00:17:00.442 所以目前为止,我们似乎明白了一件事 00:17:00.443 --> 00:17:02.958 在广泛的应用层面上 00:17:03.102 --> 00:17:07.457 像是估计有条件的平均函数、条件概率 00:17:07.458 --> 00:17:09.811 或其他各种非参数对象 00:17:09.811 --> 00:17:12.000 机器学习的方法 00:17:12.001 --> 00:17:15.879 似乎比计量经济学和统计学 惯用的非参数分析法 00:17:15.880 --> 00:17:17.292 表现得更好 00:17:17.299 --> 00:17:19.107 尤其是在高维空间观察数据 00:17:19.500 --> 00:17:22.976 你是在说倾向得分之类的? 00:17:22.977 --> 00:17:25.063 - 正是 - 滋扰函数 00:17:25.063 --> 00:17:27.215 - 对,倾向得分之类的 00:17:27.839 --> 00:17:30.577 甚至是直接相关的对象 00:17:30.578 --> 00:17:35.100 像是条件平均处理效应 这种区别两种条件期望函数者 00:17:35.100 --> 00:17:36.507 这类的可能 00:17:36.508 --> 00:17:38.095 当然,即便如此 00:17:38.873 --> 00:17:45.817 有关如何解读的理论推论 和这类项目的大规模样本陈述 00:17:45.818 --> 00:17:47.270 相对而言较不成熟 00:17:47.271 --> 00:17:50.100 这还得看机器学习所用的估计器而定 00:17:50.100 --> 00:17:53.165 所以吊诡的是 00:17:53.166 --> 00:17:57.957 机器学习的某些分析方法 就特定目的而言似乎更好用 00:17:57.958 --> 00:18:03.259 但我们得谨慎带入,并慎重解读结果的陈述 00:18:03.543 --> 00:18:07.667 但这无疑是当今显学,也不乏相关研究 00:18:07.668 --> 00:18:12.800 因此我全然可以预期 未来会有更多相关进展 00:18:12.913 --> 00:18:16.693 因此机器学习有个需要警惕的问题是-- 00:18:16.694 --> 00:18:22.139 这一方面是危机 而有时是减损应用价值的问题 00:18:22.139 --> 00:18:26.618 那便是当人们着手一项自身跃跃欲试 00:18:26.619 --> 00:18:28.676 ˊ而非问题导向的方法时 00:18:28.889 --> 00:18:35.219 与其就自身感兴趣的对象及参数来切入 00:18:35.490 --> 00:18:39.500 让我想一下要如何分辨特定事物 00:18:39.500 --> 00:18:41.894 如何在庞大的数据中将其涵盖 00:18:41.895 --> 00:18:47.065 “噢,这是有条件的期望函数 我来插入对应的机器学习的估计器” 00:18:47.065 --> 00:18:48.705 这样做似乎是很合理的 00:18:48.904 --> 00:18:53.084 反观若根据价格来回归数量 00:18:53.594 --> 00:18:55.773 然后辩称是采用机器学习的方法 00:18:56.217 --> 00:18:58.766 或许我很满意这解决了内生性问题 00:18:58.791 --> 00:19:01.200 对此我们通常会顾虑,但也可能不会 00:19:01.491 --> 00:19:06.291 但同样的,这让厘清问题的方法更明确了 00:19:06.500 --> 00:19:09.779 也就是先决定研究兴趣,再思索一下… 00:19:09.779 --> 00:19:11.623 - 就是带入经济学… 00:19:11.624 --> 00:19:12.741 - 没错 00:19:12.741 --> 00:19:14.566 - 并考量异质性 00:19:14.567 --> 00:19:20.186 并就部分因子来善用机器学习的方法 00:19:20.293 --> 00:19:21.387 - 正是如此 00:19:21.388 --> 00:19:25.801 所以引发兴趣的问题向来都是一样的 00:19:25.801 --> 00:19:28.483 但现在我们有一些更好的估计方法 00:19:28.864 --> 00:19:32.704 而难以预测之处 00:19:32.704 --> 00:19:37.196 就是机器学习的文献资料相当庞杂 00:19:37.452 --> 00:19:42.723 而我提到的带入方式毕竟有限 00:19:42.928 --> 00:19:45.476 因而衍生许多其他有趣的问题 00:19:45.477 --> 00:19:49.300 例如这类交互的未来发展 及能从中汲取的其他经验 00:19:49.300 --> 00:19:54.347 这些我相信仍有许多颇具前景的开发空间 00:19:54.414 --> 00:19:56.400 但我没有确切答案 00:19:56.935 --> 00:20:00.158 我完全同意 00:20:00.388 --> 00:20:03.539 这很令人期待 00:20:03.601 --> 00:20:06.162 我认为这方面只需再稍加把劲 00:20:06.600 --> 00:20:08.353 所以这点Isaiah跟我看法一致 00:20:08.720 --> 00:20:10.044 [笑声] 00:20:10.174 --> 00:20:11.633 - 我没这么说喔 00:20:12.926 --> 00:20:14.419 ♪ [音乐] ♪ 00:20:14.419 --> 00:20:16.833 若你想观看更多《诺贝尔对话》的节目 00:20:16.833 --> 00:20:18.012 点击此处 00:20:18.019 --> 00:20:20.312 或你若想多学一点计量经济学 00:20:20.467 --> 00:20:23.067 那就看看Josh的 《精通剂量经济学》系列视频 00:20:23.600 --> 00:20:26.569 若想多加认识 Guido、Josh和Isaiah 00:20:26.687 --> 00:20:28.550 请参考视频描述中的链接 00:20:28.796 --> 00:20:30.298 ♪ [音乐] ♪