♪ [音乐] ♪

[讲解员] 欢迎观看《诺奖得主畅谈系列》

在本集中，Josh Angrist
和Guido Imbens

与Isaiah Andrews就机器学习
在应用计量经济学中的作用

展开讨论和争辩

- [Isaiah] 有很多议题
两位大致上都意见一致

但我想换个两位有异议的话题

我想听听您们对机器学习的看法

还有就经济学而言
它在当前和未来所起的作用

- [Guido] 我看过一些
专论之类的数据

但并无相关出版文献

我看到有人做了搜索算法之类的实验

不过问题在于

该实验是关于排序与改变排序的

所以当中显然存在许多异质性

比方说若要搜寻的是

Britney Spears的照片

那么，排序并不重要
因为你会自行判断结果

排第一、第二，还是第三都无所谓

但若找的是最好的计量经济学专业书籍

结果排序是第一还是第十，差别就很大了

因为这关系到点阅率

所以…

- [Josh] 为什么需要
机器学习来发现这点？

似乎我自己来就行了

- 总的来说…

- 这有很多可能性

- 因为设想到事物的诸多特性

你会想了解造成异质性的驱力及其影响

- 但你只是在预测

某种意义上来说，这是在解决营销问题

- 不，这有因果关系

- 这是因果关系，但缺乏科学内涵

不妨这样想

- 不是的，在医疗界也有类似的例子

如果做个实验

你可能对治疗是否对
某些群体有效非常感兴趣

这当中牵涉各种特性
因此需要系统性地搜寻…

- 没错，但我怀疑的是这种观点：

我应关注的某种因果关系

可以通过一些有用的机器学习来发现

我对学校进行了许多研究

包括公办特许学校

公共资助的私立学校

校方实际上可视需要自由安排课程

有些特许学校的教学成效卓著

而在产生这类结果的数据集中包含许多共变量

包括基线分数、家庭背景、家长教育程度

学生性别和种族

一旦我将其中的数个项目整合后

便会产生高维空间

我对那种班级特征的处理效应很感兴趣

比如是否对出身低收入家庭者较有利

但令我较难信服的应用是

非常高维的这类资料

我发现例如高收入家庭的非白人儿童

但基线分数落在第三个四分位数

且只在公立学校念到三年级而非六年级

因此衍生高维分析

条件陈述也很复杂

我认为刚才那种排序有两大问题

首先是分析难以执行

也不明白这样做的理由

我还知道有些替代模型就有几乎同样的作用

这就完全不同了

对吧？因为机器学习
无法指出真正重要的预测因子

只能找出不错的预测因子

所以我认为就社会科学而言，情况有些不同

- [Guido] 我想你提到的
社会科学应用

是处理效应中异质性显着的例子

- [Josh] 若可填补模型空间可能会有

- 不是这样的！

我想就多数那些干扰因子来讲

你会期望对所有人来说，效果意涵是一样的

或许当中存在些许强度差异

不过许多教育上的论辩
认为这对大家都有好处

并非只对某些人不好，对其他人就有益

当然其中会有一小部分不好

程度上会有落差

但得有非常庞大的数据集才能发现

我同意这类例子的分析难度不低

但我想还有很多异质性更高的情境

- 我不否认有那种可能

我认为你所举的例子，本质上是营销案例

不，这是有其意涵的，那就是组织机构

亦即实际上是否得顾虑…

- 好吧，那我得读那篇论文了

所以感觉上

- 某部份我们仍有意见分歧
- 没错

并非全然达成共识

我也感觉到了

- 这方面我们实际上有不同看法
是因为现在才有这些争论题材

[笑声]

现在是不是比较热闹了？

热络起来好啊

Josh，听来你的意思是

你并非全盘否认这类分析可能有的应用价值

而是对当前应用抱持保留的态度

- 可以这样说
- 我是很有信心的

[笑声]

- 就此而言

我认为Josh说的有道理

即使是机器学习大放异彩的预测模型用例

还是存在许多异质性

你不太在意这其中的细节对吧？

- [Guido] 是的

并无牵涉政策角度之类的

机器学习更擅长辨识数字纪录之类的

而非建构复杂的模型

但是有很多社会科学，很多的经济应用

事实上，我们很了解所属变数间的关联

这些关联有很多是单调（monotone）的

教育会提升收入

不分是人口特性

任何教育程度都一样

直到获得博士学位

研究所教育也一样吗？

[笑声]

合理的范围内还不至于大幅下滑

许多情况下，这类机器学习的方法表现亮眼

这些关联中包含许多非单调性的多模性

就这些关联性来说，机器学习是很有力的工具

不过我仍坚信

经济学家能从这些方法中获益良多

对未来前景影响甚钜

♪ [音乐] ♪

- [Isaiah] 机器学习在这方面
似乎还有很多有趣的议题

所以可否请Guido就当前既有的应用

再举些例子？

其中一个例子就是

我们目前舍弃一般的因果关系
转向寻求个别化的估计

来预测因果关系

这方面机器学习的演算非常有用

以往的传统途径是内核方法

理论上成效不错

不过认真说来，有人说这已是极致了

不过此法的实务表现不甚理想

Stefan Wager
和 Susan Athey

两位学者持续耕耘的
随机与因果森林这类推断法

应用非常广泛

这些方法在这类情境中
推断基于共变项的因果效应

效果其实很不错

我想这些推断方法才刚起步

但很多情况下

这些演算法在搜索广泛空间时

以及找出适合的函数方面帮助很大

其运作方式是我们无法事先备妥的

就因果推论而言

我并不清楚机器学习的洞见
是否有吸引我关注的例子

我知道一些很可能会误导的例子

因此我和 Brigham Frandsen
合作过一些相关研究

例如，在需要界定共变量的工具变量问题中

使用随机森林来建立共变量效应模型

对此，你不会对其功能形式有特别强烈的感受

因此或许需作决策曲线分析
并对弹性曲线拟合分析持开放的态度

这会引导你进入一种
模型中包含许多非线性的情况

这对工具变量来说很危险

因为任何所排除的非线性

都有可能导致因果效应的谬误

我想我和Brigham已就这点提出有力证明

所用的例子是我和Bill Evans
合着的论文中所用的两项分析工具

其中若将两阶段最小二乘法

换成某种随机森林分析法

便会得出精密估算过的虚假推估

我认为这是一大警讯

考量我使用简单分析工具

就自身研究兴趣的案例中
所得到的这些验证过的见解

让我对此有所怀疑

非线性和工具变量并不是很契合

- 不是的，这听起来好像变成更复杂的层面

- 我们谈的是工具变量...
- 是的

...所以才设法厘清

[笑声]

有道理

♪ [音乐] ♪

- [Guido] 身为<i>Econometrica</i>的编辑
我收到很多相关领域的论文

不过其动机并不明确

事实上是无从得知

这些投稿论文并非传统的
半母数估计的那种论文

这是一大问题

相关的一个问题是计量经济学有种惯例

那就是非常专注于
形式变量渐近后的趋近结果

很多论文是作者提出一种方法后

然后以一种非常标准化的方式建构出渐近的特性

- 那样不好吗？

我想这多少会排挤掉许多框架外的研究

毕竟机器学习的相关文献
很多是比较偏向演算法的

是基于演算法而得出预测

结果证明这种方式的成效
优于非参数内核回归

长期以来

计量经济学都在处理非参数
大家用的都是内核回归

这很适合用来证明定理

可藉此得出置信区间、一致性和渐近正态性

一切都很棒，但却不太实用

机器学习的研究方式却好很多

但又不会有这样的问题…

我不认为因为机器学习，所以理论是薄弱的

[笑声]

不，我的意思是机器学习更擅于预测

- 机器学习是更好的曲线拟合工具

但机器学习的研究分析方式

因为并非证明事物的形式

一开始无法为计量经济学期刊所轻易接受

Breiman研发回归树的时候也是不符正统

我想他当时投稿计量经济学期刊
也必定遇到不少困难

我认为我们画地自限

因此难有突破

毕竟很多机器学习的方法实际上很实用

我认为总的来说

计算机科学家在相关研究文献上
贡献了大量的这类演算法

也提出诸多很实用的演算法

而这也会影响我们进行实证研究的方式

不过我们对此尚未完全内化

因为我们仍相当专注于
获得点估计和标准误差

还有P值

某种程度上，我们得摆脱局限
以善用机器学习的能力

以及相关文献的有益贡献

- 我一方面颇能理解你的观点

也就是传统的计量经济学框架

是在类似趋近的设定下
提出一种方法来证明极限定理

因此论文出版有所局限

且在某种意义上

藉由放宽对论文学理论述的想像

机器学习的研究文献
就很多问题都有很实用的见解

而且目前对计量经济学也有重大影响

有个我很感兴趣的问题是你如何定位理论…

你是否认为理论部分毫无价值可言？

因为见到机器学习工具的产出时，我常有个疑问

你所提到的几种方式
实际上都已开发出推论结果

我想知道的是不确定性量化之类的方法

我有自身的先验

我有既定的观点，并观察到对应结果

那要怎样就此更新呢？

而在某种意义上

若身处常态分布的世界，我也清楚怎样处理

但此处却不然

因此我想知道你对此有何看法

- 我不认为这些结果并无特别之处

但这类结果通常很难达成

我们可能无法办到

可能得分阶段来做

得有人率先提出

“看，我有个特定功能的有趣演算法

且以特定标准而言

这种演算法在这组数据集的功效良好

所以我们应该提出来

未来也许有人会有办法
在特定条件下以此进行推论

然后发现达成条件不是很实际，那就再研究

我觉得当我们过去始终认为
所投入的类型必须有所限制时

这是在自我设限

就某种意义而言

这又回到Josh和我
对局部平均处理效应的看法

以前人们并非这样看待这个问题的

某种层面而言，有人会说

这类工作的必要处理
就是先厘清需要估计的对象

然后尽力估计

但是你们这些人却倒行逆施

你可能会说，“你看看，我有个估计器

我要看看它所估计的内容是什么？”

然后我猜你可能会说
“这有啥特别的”之类的回应

并且说这样做不合理

我认为我们看待问题的方式

应该更灵活一点

因为过去未曾尝试，我们已错失一些机会

♪ [音乐] ♪

- [Josh] Isaiah
你听到我们的观点了

也了解我们有一些意见分歧

为何不为我们评评理呢？

[笑声]

- 哦，你问的小问题好棒喔

[笑声]

我想一方面是我很认同
Guido提到的一些观点

[笑声]

有一点就机器学习来说似乎是比较清楚的

就某种我们有兴趣投入的非参数预测问题来说

无论是有条件的期望或条件概率

过去这得跑内核回归

得运行序列回归之类的分析

所以目前为止，我们似乎明白了一件事

在广泛的应用层面上

像是估计有条件的平均函数、条件概率

或其他各种非参数对象

机器学习的方法

似乎比计量经济学和统计学
惯用的非参数分析法

表现得更好

尤其是在高维空间观察数据

你是在说倾向得分之类的？

- 正是
- 滋扰函数

- 对，倾向得分之类的

甚至是直接相关的对象

像是条件平均处理效应
这种区别两种条件期望函数者

这类的可能

当然，即便如此

有关如何解读的理论推论
和这类项目的大规模样本陈述

相对而言较不成熟

这还得看机器学习所用的估计器而定

所以吊诡的是

机器学习的某些分析方法
就特定目的而言似乎更好用

但我们得谨慎带入，并慎重解读结果的陈述

但这无疑是当今显学，也不乏相关研究

因此我全然可以预期
未来会有更多相关进展

因此机器学习有个需要警惕的问题是--

这一方面是危机
而有时是减损应用价值的问题

那便是当人们着手一项自身跃跃欲试

ˊ而非问题导向的方法时

与其就自身感兴趣的对象及参数来切入

让我想一下要如何分辨特定事物

如何在庞大的数据中将其涵盖

“噢，这是有条件的期望函数
我来插入对应的机器学习的估计器”

这样做似乎是很合理的

反观若根据价格来回归数量

然后辩称是采用机器学习的方法

或许我很满意这解决了内生性问题

对此我们通常会顾虑，但也可能不会

但同样的，这让厘清问题的方法更明确了

也就是先决定研究兴趣，再思索一下…

- 就是带入经济学…

- 没错

- 并考量异质性

并就部分因子来善用机器学习的方法

- 正是如此

所以引发兴趣的问题向来都是一样的

但现在我们有一些更好的估计方法

而难以预测之处

就是机器学习的文献资料相当庞杂

而我提到的带入方式毕竟有限

因而衍生许多其他有趣的问题

例如这类交互的未来发展
及能从中汲取的其他经验

这些我相信仍有许多颇具前景的开发空间

但我没有确切答案

我完全同意

这很令人期待

我认为这方面只需再稍加把劲

所以这点Isaiah跟我看法一致

[笑声]

- 我没这么说喔

♪ [音乐] ♪

若你想观看更多《诺贝尔对话》的节目

点击此处

或你若想多学一点计量经济学

那就看看Josh的
《精通剂量经济学》系列视频

若想多加认识
Guido、Josh和Isaiah

请参考视频描述中的链接

♪ [音乐] ♪