How Will Machine Learning Impact Economics?
-
0:00 - 0:01♪ [音乐] ♪
-
0:04 - 0:06[讲解员] 欢迎观看《诺贝尔对话》
-
0:07 - 0:10本集中,Josh Angrist
和Guido Imbens -
0:10 - 0:15与Isaiah Andrews就机器学习
在应用计量经济学中的角色 -
0:15 - 0:17展开讨论和争辩
-
0:18 - 0:21- [Isaiah] 有很多议题
两位大致上都同意 -
0:21 - 0:24但我想换个或许两位各有看法的话题
-
0:24 - 0:27我想听听你们对机器学习的看法
-
0:27 - 0:30还有就经济学而言
这方面在当前和未来的进展 -
0:30 - 0:34- [Guido] 我看过一些
专论之类的数据 -
0:34 - 0:35但并无相关出版文献
-
0:36 - 0:39我看到有人做了搜索演算法之类的实验
-
0:40 - 0:41不过问题在于
-
0:43 - 0:46该实验是关于排序与改变排序的
-
0:46 - 0:51所以当中显然存在许多异质性
-
0:52 - 0:56比方说若要搜寻的是
-
0:58 - 1:01小甜甜布兰妮的照片
(Britney Spears) -
1:01 - 1:06那结果排序不重要
因为还要自行判断是否吻合 -
1:06 - 1:10是排第一、第二,还是第三都无所谓
-
1:10 - 1:12但若要找的是最好的计量经济学专书
-
1:13 - 1:18结果排序是第一还是第十,差别就很大
-
1:19 - 1:21因为这关系到点阅率
-
1:22 - 1:23有监于此…
-
1:23 - 1:27- [Josh] 为什么需要
机器学习来发现这点? -
1:27 - 1:29这似乎我自己来就行了
-
1:29 - 1:30- [Guido] 所以总的来说…
-
1:30 - 1:32- [Josh] 这有很多可能性
-
1:32 - 1:37- 因为设想到事物的诸多特性
-
1:38 - 1:43你会想了解造成异质性的驱力及其影响
-
1:43 - 1:45- 但你只是在预测
-
1:45 - 1:48某种意义上来说,这是在解决营销问题
-
1:48 - 1:49- 不,这有因果关系
-
1:49 - 1:52- 这是因果关系,但缺乏科学内涵
-
1:52 - 1:53不妨这样想
-
1:54 - 1:57- 不是的,在医疗界也有类似的例子
-
1:58 - 2:02你若对部分族群接受特定疗法的功效感兴趣
-
2:02 - 2:04因此进行研究实验
-
2:04 - 2:08这当中牵涉各种特性
因此需要系统性地搜寻… -
2:08 - 2:14- 没错,但我有疑虑是个体因果关系的假设
-
2:14 - 2:17以及机器学习的洞察实用性
-
2:17 - 2:20考量到我丰富的执教经验
-
2:20 - 2:24包括一所公费资助的特许私校
-
2:25 - 2:29校方实际上可视需要自由安排课程
-
2:30 - 2:33有些特许学校的教学成效卓著
-
2:34 - 2:38而在产生这类结果的数据集中包含许多共变量
-
2:38 - 2:43包括基线分数、家庭背景、家长教育程度
-
2:43 - 2:46学生性别和种族
-
2:46 - 2:50一旦我将其中的数个项目整合后
-
2:50 - 2:52便会产生高维空间
-
2:52 - 2:56我对那种班级特征的处理效应很感兴趣
-
2:56 - 3:02比如是否对出身低收入家庭者较有利
-
3:02 - 3:06但令我较难信服的应用是
-
3:07 - 3:10非常高维的这类资料
-
3:10 - 3:15我发现例如高收入家庭的非白人儿童
-
3:15 - 3:18但基线分数落在第三个四分位数
-
3:18 - 3:23且只在公立学校念到三年级而非六年级
-
3:23 - 3:26因此衍生高维分析
-
3:26 - 3:28条件陈述也很复杂
-
3:28 - 3:31我认为刚才那种排序有两大问题
-
3:31 - 3:34首先是分析难以执行
-
3:35 - 3:36也不明白这样做的理由
-
3:37 - 3:41我还知道有些替代模型就有几乎同样的作用
-
3:42 - 3:43这就完全不同了
-
3:43 - 3:49对吧?因为机器学习
无法指出真正重要的预测因子 -
3:49 - 3:51只能找出不错的预测因子
-
3:51 - 3:58所以我认为就社会科学而言,情况有些不同
-
3:58 - 4:01- [Guido] 我想你提到的
社会科学应用 -
4:02 - 4:08是处理效应中异质性显著的例子
-
4:10 - 4:13- [Josh] 若可填补模型空间可能会有
-
4:13 - 4:16- 不是这样的!
-
4:16 - 4:19我想就多数那些干扰因子来讲
-
4:19 - 4:23你会期望对所有人来说,效果意涵是一样的
-
4:24 - 4:27或许当中存在些许强度差异
-
4:27 - 4:32不过许多教育上的论辩
认为这对大家都有好处 -
4:34 - 4:37并非只对某些人不好,对其他人就有益
-
4:37 - 4:41当然其中会有一小部分不好
-
4:41 - 4:44程度上会有落差
-
4:44 - 4:47但得有非常庞大的数据集才能发现
-
4:47 - 4:51我同意这类例子的分析难度不低
-
4:52 - 4:56但我想还有很多异质性更高的情境
-
4:57 - 4:59- 我不否认有那种可能
-
4:59 - 5:05我认为你所举的例子,本质上是营销案例
-
5:06 - 5:11不,这是有其意涵的,那就是组织机构
-
5:11 - 5:14亦即实际上是否得顾虑…
-
5:15 - 5:18- 好吧,那我得读那篇论文了
-
5:18 - 5:21所以感觉上
-
5:21 - 5:24- 某部份我们仍有意见分歧
- 没错 -
5:24 - 5:25并非全然达成共识
-
5:25 - 5:27我也感觉到了
-
5:27 - 5:31- 这方面我们实际上有不同看法
是因为现在才有这些争论题材 -
5:31 - 5:32[笑声]
-
5:33 - 5:35现在是不是比较热闹了?
-
5:36 - 5:38热络起来好啊
-
5:38 - 5:40Josh,听来你的意思是
-
5:40 - 5:45你并非全盘否认这类分析可能有的应用价值
-
5:45 - 5:49而是对当前应用抱持保留的态度
-
5:50 - 5:52- 可以这样说
- 我是很有信心的 -
5:52 - 5:54[笑声]
-
5:54 - 5:55- 就此而言
-
5:55 - 5:57我认为Josh说的有道理
-
5:58 - 6:05即使是机器学习大放异彩的预测模型用例
-
6:05 - 6:07还是存在许多异质性
-
6:07 - 6:10你不太在意这其中的细节对吧?
-
6:11 - 6:12- [Guido] 是的
-
6:12 - 6:15并无牵涉政策角度之类的
-
6:15 - 6:20机器学习更擅长辨识数字纪录之类的
-
6:20 - 6:24而非建构复杂的模型
-
6:24 - 6:28但是有很多社会科学,很多的经济应用
-
6:28 - 6:32事实上,我们很了解所属变数间的关联
-
6:32 - 6:35这些关联有很多是单调(monotone)的
-
6:37 - 6:39教育会提升收入
-
6:40 - 6:42不分是人口特性
-
6:42 - 6:45任何教育程度都一样
-
6:45 - 6:46直到获得博士学位
-
6:46 - 6:48研究所教育也一样吗?
-
6:48 - 6:49[笑声]
-
6:49 - 6:56合理的范围内还不至于大幅下滑
-
6:56 - 7:00许多情况下,这类机器学习的方法表现亮眼
-
7:00 - 7:05这些关联中包含许多非单调性的多模性
-
7:05 - 7:08就这些关联性来说,机器学习是很有力的工具
-
7:09 - 7:12不过我仍坚信
-
7:12 - 7:18经济学家能从这些方法中获益良多
-
7:18 - 7:22对未来前景影响甚钜
-
7:22 - 7:23♪ [音乐] ♪
-
7:23 - 7:26- [Isaiah] 机器学习在这方面
似乎还有很多有趣的议题 -
7:26 - 7:31所以可否请Guido就当前既有的应用
-
7:31 - 7:33再举些例子?
-
7:33 - 7:34其中一个例子就是
-
7:35 - 7:40我们目前舍弃一般的因果关系
转向寻求个别化的估计 -
7:41 - 7:43来预测因果关系
-
7:43 - 7:48这方面机器学习的演算非常有用
-
7:48 - 7:52以往的传统途径是内核方法
-
7:52 - 7:54理论上成效不错
-
7:54 - 7:57不过认真说来,有人说这已是极致了
-
7:58 - 8:00不过此法的实务表现不甚理想
-
8:01 - 8:03Stefan Wager
和 Susan Athey -
8:03 - 8:07两位学者持续耕耘的
随机与因果森林这类推断法 -
8:07 - 8:09应用非常广泛
-
8:10 - 8:16这些方法在这类情境中
推断基于共变项的因果效应 -
8:16 - 8:19效果其实很不错
-
8:21 - 8:24我想这些推断方法才刚起步
-
8:24 - 8:26但很多情况下
-
8:27 - 8:32这些演算法在搜索广泛空间时
-
8:32 - 8:37以及找出适合的函数方面帮助很大
-
8:37 - 8:41其运作方式是我们无法事先备妥的
-
8:42 - 8:43就因果推论而言
-
8:43 - 8:47我并不清楚机器学习的洞见
是否有吸引我关注的例子 -
8:48 - 8:51我知道一些很可能会误导的例子
-
8:51 - 8:54因此我和 Brigham Frandsen
合作过一些相关研究 -
8:54 - 9:00例如,在需要界定共变量的工具变量问题中
-
9:00 - 9:03使用随机森林来建立共变量效应模型
-
9:04 - 9:08对此,你不会对其功能形式有特别强烈的感受
-
9:08 - 9:13因此或许需作决策曲线分析
并对弹性曲线拟合分析持开放的态度 -
9:13 - 9:17这会引导你进入一种
模型中包含许多非线性的情况 -
9:17 - 9:20这对工具变量来说很危险
-
9:20 - 9:23因为任何所排除的非线性
-
9:23 - 9:26都有可能导致因果效应的谬误
-
9:26 - 9:29我想我和Brigham已就这点提出有力证明
-
9:29 - 9:35所用的例子是我和Bill Evans
合着的论文中所用的两项分析工具 -
9:35 - 9:39其中若将两阶段最小二乘法
-
9:39 - 9:42换成某种随机森林分析法
-
9:43 - 9:47便会得出精密估算过的虚假推估
-
9:49 - 9:52我认为这是一大警讯
-
9:52 - 9:55考量我使用简单分析工具
-
9:55 - 9:59就自身研究兴趣的案例中
所得到的这些验证过的见解 -
9:59 - 10:01让我对此有所怀疑
-
10:03 - 10:06非线性和工具变量并不是很契合
-
10:06 - 10:10- 不是的,这听起来好像变成更复杂的层面
-
10:10 - 10:12- 我们谈的是工具变量...
- 是的 -
10:13 - 10:14...所以才设法厘清
-
10:14 - 10:16[笑声]
-
10:16 - 10:17有道理
-
10:17 - 10:18♪ [音乐] ♪
-
10:18 - 10:22- [Guido] 身为Econometrica的编辑
我收到很多相关领域的论文 -
10:23 - 10:27不过其动机并不明确
-
10:28 - 10:30事实上是无从得知
-
10:30 - 10:35这些投稿论文并非传统的
半母数估计的那种论文 -
10:35 - 10:37这是一大问题
-
10:38 - 10:42相关的一个问题是计量经济学有种惯例
-
10:43 - 10:47那就是非常专注于
形式变量渐近后的趋近结果 -
10:49 - 10:53很多论文是作者提出一种方法后
-
10:53 - 10:59然后以一种非常标准化的方式建构出渐近的特性
-
11:01 - 11:02- 那样不好吗?
-
11:03 - 11:09我想这多少会排挤掉许多框架外的研究
-
11:09 - 11:14毕竟机器学习的相关文献
很多是比较偏向演算法的 -
11:14 - 11:18是基于演算法而得出预测
-
11:19 - 11:23结果证明这种方式的成效
优于非参数内核回归 -
11:24 - 11:25长期以来
-
11:25 - 11:29计量经济学都在处理非参数
大家用的都是内核回归 -
11:29 - 11:31这很适合用来证明定理
-
11:31 - 11:35可藉此得出置信区间、一致性和渐近正态性
-
11:35 - 11:37一切都很棒,但却不太实用
-
11:37 - 11:41机器学习的研究方式却好很多
-
11:41 - 11:43但又不会有这样的问题…
-
11:43 - 11:46我不认为因为机器学习,所以理论是薄弱的
-
11:46 - 11:47[笑声]
-
11:47 - 11:52不,我的意思是机器学习更擅于预测
-
11:52 - 11:54- 机器学习是更好的曲线拟合工具
-
11:55 - 11:58但机器学习的研究分析方式
-
11:58 - 12:00因为并非证明事物的形式
-
12:01 - 12:06一开始无法为计量经济学期刊所轻易接受
-
12:07 - 12:11Breiman研发回归树的时候也是不符正统
-
12:13 - 12:18我想他当时投稿计量经济学期刊
也必定遇到不少困难 -
12:20 - 12:24我认为我们画地自限
-
12:25 - 12:28因此难有突破
-
12:28 - 12:31毕竟很多机器学习的方法实际上很实用
-
12:31 - 12:34我认为总的来说
-
12:35 - 12:40计算机科学家在相关研究文献上
贡献了大量的这类演算法 -
12:41 - 12:44也提出诸多很实用的演算法
-
12:44 - 12:49而这也会影响我们进行实证研究的方式
-
12:50 - 12:52不过我们对此尚未完全内化
-
12:52 - 12:58因为我们仍相当专注于
获得点估计和标准误差 -
12:58 - 13:00还有P值
-
13:00 - 13:06某种程度上,我们得摆脱局限
以善用机器学习的能力 -
13:06 - 13:11以及相关文献的有益贡献
-
13:11 - 13:14- 我一方面颇能理解你的观点
-
13:14 - 13:17也就是传统的计量经济学框架
-
13:17 - 13:24是在类似趋近的设定下
提出一种方法来证明极限定理 -
13:24 - 13:27因此论文出版有所局限
-
13:27 - 13:29且在某种意义上
-
13:29 - 13:33藉由放宽对论文学理论述的想像
-
13:33 - 13:38机器学习的研究文献
就很多问题都有很实用的见解 -
13:38 - 13:41而且目前对计量经济学也有重大影响
-
13:41 - 13:48有个我很感兴趣的问题是你如何定位理论…
-
13:49 - 13:51你是否认为理论部分毫无价值可言?
-
13:52 - 13:57因为见到机器学习工具的产出时,我常有个疑问
-
13:57 - 14:02你所提到的几种方式
实际上都已开发出推论结果 -
14:03 - 14:06我想知道的是不确定性量化之类的方法
-
14:06 - 14:08我有自身的先验
-
14:08 - 14:11我有既定的观点,并观察到对应结果
-
14:11 - 14:12那要怎样就此更新呢?
-
14:12 - 14:13而在某种意义上
-
14:13 - 14:17若身处常态分布的世界,我也清楚怎样处理
-
14:17 - 14:18但此处却不然
-
14:18 - 14:21因此我想知道你对此有何看法
-
14:21 - 14:26- 我不认为这些结果并无特别之处
-
14:26 - 14:30但这类结果通常很难达成
-
14:30 - 14:32我们可能无法办到
-
14:32 - 14:35可能得分阶段来做
-
14:35 - 14:37得有人率先提出
-
14:37 - 14:42“看,我有个特定功能的有趣演算法
-
14:42 - 14:45且以特定标准而言
-
14:45 - 14:50这种演算法在这组数据集的功效良好
-
14:51 - 14:53所以我们应该提出来
-
14:53 - 14:59未来也许有人会有办法
在特定条件下以此进行推论 -
14:59 - 15:04然后发现达成条件不是很实际,那就再研究
-
15:04 - 15:11我觉得当我们过去始终认为
所投入的类型必须有所限制时 -
15:11 - 15:13这是在自我设限
-
15:13 - 15:15就某种意义而言
-
15:16 - 15:22这又回到Josh和我
对局部平均处理效应的看法 -
15:22 - 15:25以前人们并非这样看待这个问题的
-
15:26 - 15:29某种层面而言,有人会说
-
15:30 - 15:34这类工作的必要处理
就是先厘清需要估计的对象 -
15:34 - 15:37然后尽力估计
-
15:38 - 15:44但是你们这些人却倒行逆施
-
15:44 - 15:47你可能会说,“你看看,我有个估计器
-
15:47 - 15:51我要看看它所估计的内容是什么?”
-
15:51 - 15:55然后我猜你可能会说
“这有啥特别的”之类的回应 -
15:55 - 15:58并且说这样做不合理
-
15:59 - 16:03我认为我们看待问题的方式
-
16:03 - 16:07应该更灵活一点
-
16:07 - 16:11因为过去未曾尝试,我们已错失一些机会
-
16:11 - 16:12♪ [音乐] ♪
-
16:13 - 16:15- [Josh] Isaiah
你听到我们的观点了 -
16:15 - 16:18也了解我们有一些意见分歧
-
16:18 - 16:20为何不为我们评评理呢?
-
16:21 - 16:22[笑声]
-
16:22 - 16:25- 哦,你问的小问题好棒喔
-
16:25 - 16:26[笑声]
-
16:26 - 16:33我想一方面是我很认同
Guido提到的一些观点 -
16:34 - 16:36[笑声]
-
16:36 - 16:40有一点就机器学习来说似乎是比较清楚的
-
16:40 - 16:45就某种我们有兴趣投入的非参数预测问题来说
-
16:45 - 16:50无论是有条件的期望或条件概率
-
16:50 - 16:54过去这得跑内核回归
-
16:54 - 16:57得运行序列回归之类的分析
-
16:58 - 17:00所以目前为止,我们似乎明白了一件事
-
17:00 - 17:03在广泛的应用层面上
-
17:03 - 17:07像是估计有条件的平均函数、条件概率
-
17:07 - 17:10或其他各种非参数对象
-
17:10 - 17:12机器学习的方法
-
17:12 - 17:16似乎比计量经济学和统计学
惯用的非参数分析法 -
17:16 - 17:17表现得更好
-
17:17 - 17:19尤其是在高维空间观察数据
-
17:20 - 17:23你是在说倾向得分之类的?
-
17:23 - 17:25- 正是
- 滋扰函数 -
17:25 - 17:27- 对,倾向得分之类的
-
17:28 - 17:31甚至是直接相关的对象
-
17:31 - 17:35像是条件平均处理效应
这种区别两种条件期望函数者 -
17:35 - 17:37这类的可能
-
17:37 - 17:38当然,即便如此
-
17:39 - 17:46有关如何解读的理论推论
和这类项目的大规模样本陈述 -
17:46 - 17:47相对而言较不成熟
-
17:47 - 17:50这还得看机器学习所用的估计器而定
-
17:50 - 17:53所以吊诡的是
-
17:53 - 17:58机器学习的某些分析方法
就特定目的而言似乎更好用 -
17:58 - 18:03但我们得谨慎带入,并慎重解读结果的陈述
-
18:04 - 18:08但这无疑是当今显学,也不乏相关研究
-
18:08 - 18:13因此我全然可以预期
未来会有更多相关进展 -
18:13 - 18:17因此机器学习有个需要警惕的问题是--
-
18:17 - 18:22这一方面是危机
而有时是减损应用价值的问题 -
18:22 - 18:27那便是当人们着手一项自身跃跃欲试
-
18:27 - 18:29ˊ而非问题导向的方法时
-
18:29 - 18:35与其就自身感兴趣的对象及参数来切入
-
18:35 - 18:40让我想一下要如何分辨特定事物
-
18:40 - 18:42如何在庞大的数据中将其涵盖
-
18:42 - 18:47“噢,这是有条件的期望函数
我来插入对应的机器学习的估计器” -
18:47 - 18:49这样做似乎是很合理的
-
18:49 - 18:53反观若根据价格来回归数量
-
18:54 - 18:56然后辩称是采用机器学习的方法
-
18:56 - 18:59或许我很满意这解决了内生性问题
-
18:59 - 19:01对此我们通常会顾虑,但也可能不会
-
19:01 - 19:06但同样的,这让厘清问题的方法更明确了
-
19:06 - 19:10也就是先决定研究兴趣,再思索一下…
-
19:10 - 19:12- 就是带入经济学…
-
19:12 - 19:13- 没错
-
19:13 - 19:15- 并考量异质性
-
19:15 - 19:20并就部分因子来善用机器学习的方法
-
19:20 - 19:21- 正是如此
-
19:21 - 19:26所以引发兴趣的问题向来都是一样的
-
19:26 - 19:28但现在我们有一些更好的估计方法
-
19:29 - 19:33而难以预测之处
-
19:33 - 19:37就是机器学习的文献资料相当庞杂
-
19:37 - 19:43而我提到的带入方式毕竟有限
-
19:43 - 19:45因而衍生许多其他有趣的问题
-
19:45 - 19:49例如这类交互的未来发展
及能从中汲取的其他经验 -
19:49 - 19:54这些我相信仍有许多颇具前景的开发空间
-
19:54 - 19:56但我没有确切答案
-
19:57 - 20:00我完全同意
-
20:00 - 20:04这很令人期待
-
20:04 - 20:06我认为这方面只需再稍加把劲
-
20:07 - 20:08所以这点Isaiah跟我看法一致
-
20:09 - 20:10[笑声]
-
20:10 - 20:12- 我没这么说喔
-
20:13 - 20:14♪ [音乐] ♪
-
20:14 - 20:17若你想观看更多《诺贝尔对话》的节目
-
20:17 - 20:18点击此处
-
20:18 - 20:20或你若想多学一点计量经济学
-
20:20 - 20:23那就看看Josh的
《精通剂量经济学》系列视频 -
20:24 - 20:27若想多加认识
Guido、Josh和Isaiah -
20:27 - 20:29请参考视频描述中的链接
-
20:29 - 20:30♪ [音乐] ♪
- Title:
- How Will Machine Learning Impact Economics?
- ASR Confidence:
- 0.83
- Description:
-
- Video Language:
- English
- Team:
- Marginal Revolution University
- Duration:
- 20:33
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | ||
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | ||
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | ||
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | ||
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | ||
Samson Zhong edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | ||
Samson Zhong edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | ||
Samson Zhong edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? |