How Will Machine Learning Impact Economics?
-
0:00 - 0:01♪ [音乐] ♪
-
0:04 - 0:06[讲解员] 欢迎观看《诺奖得主畅谈系列》
-
0:07 - 0:10在本集中,Josh Angrist
和Guido Imbens -
0:10 - 0:15与Isaiah Andrews就机器学习
在应用计量经济学中的作用 -
0:15 - 0:17展开讨论和争辩
-
0:18 - 0:21- [Isaiah] 有很多议题
两位大致上都意见一致 -
0:21 - 0:24但我想换个两位有异议的话题
-
0:24 - 0:27我想听听您们对机器学习的看法
-
0:27 - 0:30还有就经济学而言
它在当前和未来所起的作用 -
0:30 - 0:34- [Guido] 我看过一些
专论之类的数据 -
0:34 - 0:35但并无相关出版文献
-
0:36 - 0:39我看到有人做了搜索算法之类的实验
-
0:40 - 0:42不过问题在于
-
0:43 - 0:46该实验是关于排序与改变排序的
-
0:46 - 0:51所以当中显然存在许多异质性
-
0:52 - 0:56比方说若要搜寻的是
-
0:58 - 1:01Britney Spears的照片
-
1:01 - 1:06那么,排序并不重要
因为你会自行判断结果 -
1:06 - 1:10排第一、第二,还是第三都无所谓
-
1:10 - 1:13但若找的是最好的计量经济学专业书籍
-
1:13 - 1:18结果排序是第一还是第十,差别就很大了
-
1:19 - 1:21因为这关系到点阅率
-
1:22 - 1:23所以…
-
1:23 - 1:27- [Josh] 为什么需要
机器学习来发现这点? -
1:27 - 1:29似乎我自己来就行了
-
1:29 - 1:30- 总的来说…
-
1:30 - 1:32- 这有很多可能性
-
1:32 - 1:37- 因为设想到事物的诸多特性
-
1:38 - 1:43你会想了解造成异质性的驱力及其影响
-
1:43 - 1:45- 但你只是在预测
-
1:45 - 1:48某种意义上来说,这是在解决营销问题
-
1:48 - 1:49- 不,这有因果关系
-
1:49 - 1:52- 这是因果关系,但缺乏科学内涵
-
1:52 - 1:53不妨这样想
-
1:54 - 1:57- 不是的,在医疗界也有类似的例子
-
1:58 - 1:59如果做个实验
-
1:59 - 2:04你可能对治疗是否对
某些群体有效非常感兴趣 -
2:04 - 2:08这当中牵涉各种特性
因此需要系统性地搜寻… -
2:08 - 2:10- 没错,但我怀疑的是这种观点:
-
2:10 - 2:14我应关注的某种因果关系
-
2:14 - 2:17可以通过一些有用的机器学习来发现
-
2:17 - 2:20我对学校进行了许多研究
-
2:20 - 2:23包括特许学校
-
2:23 - 2:25公共资助的私立学校
-
2:25 - 2:29校方实际上可视需要自由安排课程
-
2:30 - 2:33有些特许学校的教学成效卓著
-
2:34 - 2:38而在产生这类结果的数据集中包含许多共变量
-
2:38 - 2:43包括基线分数、家庭背景、家长教育程度
-
2:43 - 2:46学生性别和种族
-
2:46 - 2:50一旦我将其中这些变量整合后
-
2:50 - 2:52便会产生高维空间
-
2:52 - 2:56我对那种班级特征的处理效应很感兴趣
-
2:56 - 3:02比如是否对来自低收入家庭的孩子较有利
-
3:02 - 3:06我很难相信会有这种应用
-
3:06 - 3:10能解释非常高维的东西
-
3:10 - 3:15像我发现
非白人高收入家庭的儿童 -
3:15 - 3:18基线分数只落在第三个四分位数
-
3:18 - 3:23且只在三年级(小学)时进入这种学校
而非六年级(中学) -
3:23 - 3:26那是高维分析的结果
-
3:26 - 3:28条件陈述也很复杂
-
3:28 - 3:31我认为在此使用应用有两大问题
-
3:31 - 3:34首先是分析难以执行
-
3:35 - 3:36也不明白这样做的理由
-
3:37 - 3:41我还知道有些替代模型
就有几乎同样的作用 -
3:42 - 3:43这就完全不同了
-
3:43 - 3:49因为机器学习
无法指出真正重要的预测因子 -
3:49 - 3:51只是告诉我这是不错的预测因子
-
3:51 - 3:58所以我认为就社会科学而言
情况有些不同 -
3:58 - 4:01- 我想你提到的
在社会科学应用中 -
4:02 - 4:08效果并没有很大的异质性
-
4:10 - 4:13- 若可人为填补模型缺陷,可能会有
-
4:13 - 4:16- 不是这样的!
-
4:16 - 4:19我想就多数干扰因子来讲
-
4:19 - 4:23你会期望对所有人来说
效果意涵是一样的 -
4:24 - 4:27或许当中存在些许强度差异
-
4:27 - 4:32不过许多教学上的论辩
认为这对大家都有好处 -
4:34 - 4:37并非只对某些人不利
对其他人就有益 -
4:37 - 4:41当然其中会有一小部分不好
-
4:41 - 4:44程度上会有落差
-
4:44 - 4:47但得有非常庞大的数据集才能发现
-
4:47 - 4:51我同意这类例子的分析难度不低
-
4:52 - 4:56但我想还有很多异质性更高的情境
-
4:57 - 4:59- 我不否认有那种可能
-
4:59 - 5:05但我认为你所举的例子
本质上是营销案例 -
5:06 - 5:11不,这是有其意涵的
-
5:11 - 5:14组织机构是否要顾虑…
-
5:15 - 5:18- 好吧,那我得读那篇论文了
-
5:18 - 5:21所以感觉上
-
5:21 - 5:24- 某些事我们仍有分歧
- 没错 -
5:24 - 5:25并非全然达成共识
-
5:25 - 5:27我也感觉到了
-
5:27 - 5:31- 我们这方面有不同看法
-
5:31 - 5:33是因为现在有了这些争论题材
-
5:33 - 5:35- 现在是不是比较“热”了?
-
5:36 - 5:38- 激烈起来好啊!
-
5:38 - 5:40Josh,听您的意思是
-
5:40 - 5:45并非全盘否定这类应用分析的可能性
-
5:45 - 5:49而是对当前应用持保留态度
-
5:50 - 5:52- 可以这样说
- 我是很有信心的 -
5:54 - 5:55- 就此而言
-
5:55 - 5:58我认为Josh说的有一定道理
-
5:58 - 6:02即使是机器学习预测模型用例
-
6:02 - 6:07真正大放异彩的地方
在于存在很多异质性 -
6:07 - 6:10- 你不太在意这其中的细节,对吧?
-
6:11 - 6:12- 是的
-
6:12 - 6:15- 并无涉及政策角度之类的
-
6:15 - 6:20- 机器学习更擅长辨识数字纪录之类的
-
6:20 - 6:24而非建构复杂的模型
-
6:24 - 6:28但是有很多社会科学,很多的经济应用
-
6:28 - 6:32事实上,我们很了解所属变数间的关联
-
6:32 - 6:35这些关联有很多是单调的
-
6:37 - 6:39教育会提升收入
-
6:40 - 6:42不分人口特性
-
6:42 - 6:45任何教育程度都一样
-
6:45 - 6:46直到获得博士学位
-
6:46 - 6:48研究生教育也一样
-
6:49 - 6:56合理的范围内还不至于大幅下滑
-
6:56 - 7:00许多情况下
这类机器学习的方法表现亮眼 -
7:00 - 7:05这些关联中包含许多非单调性的多模性
-
7:05 - 7:08就这些关联性来说
机器学习是很有用的工具 -
7:09 - 7:12不过我仍坚信
-
7:12 - 7:18经济学家能从这些方法中获益良多
-
7:18 - 7:22对未来前景影响巨大
-
7:22 - 7:23♪ [音乐] ♪
-
7:23 - 7:26- 机器学习在这方面
似乎还有很多有趣的话题 -
7:26 - 7:31所以可否请Guido就当前既有的应用
-
7:31 - 7:33再举些例子?
-
7:33 - 7:34其中一个例子就是
-
7:35 - 7:40我们目前在舍弃平均因果关系
转向寻求个别化的估计 -
7:41 - 7:43来预测因果关系
-
7:43 - 7:48这方面机器算法非常有用
-
7:48 - 7:52以往的传统途径是内核方法
-
7:52 - 7:54理论上成效不错
-
7:54 - 7:57不过认真说来,有人说这已是极致了
-
7:58 - 8:00不过此法的实际表现不甚理想
-
8:01 - 8:03Stefan Wager
和 Susan Athey -
8:03 - 8:08两位学者持续耕耘的
随机与因果森林这类推断法 -
8:08 - 8:09应用非常广泛
-
8:10 - 8:16这些方法在这类情境中
推断基于共变项的因果效应 -
8:16 - 8:19效果其实很不错
-
8:21 - 8:24我想这些推断方法才刚起步
-
8:24 - 8:26但很多情况下
-
8:27 - 8:32这些演算法在搜索广泛空间时
-
8:32 - 8:37以及找出适合的函数方面帮助很大
-
8:37 - 8:41其运作方式是我们无法事先备妥的
-
8:42 - 8:43- 就因果推论而言
-
8:43 - 8:47我没有机器学习
对我感兴趣的因果效应提供洞见的例子 -
8:48 - 8:51我倒是有些很可能产生误导的例子
-
8:51 - 8:54我和 Brigham Frandsen
合作过一些相关研究 -
8:54 - 9:00例如,在需要界定共变量的工具变量问题中
-
9:00 - 9:03使用随机森林来建立共变量效应模型
-
9:04 - 9:08对此,你不会对其功能形式有特别强烈的感受
-
9:08 - 9:13因此或许需作决策曲线分析
并对弹性曲线拟合分析持开放的态度 -
9:13 - 9:17这会引导你进入一种
模型中包含许多非线性的情况 -
9:17 - 9:20这对工具变量来说很危险
-
9:20 - 9:23因为任何所排除的非线性
-
9:23 - 9:26都有可能导致因果效应的谬误
-
9:26 - 9:29我和Brigham已就这点提出有力证明
-
9:29 - 9:35所用的例子是我和Bill Evans
合作的论文中所用的两项分析工具 -
9:35 - 9:39其中若将两阶段最小二乘法
-
9:39 - 9:42换成某种随机森林分析法
-
9:43 - 9:47便会得出精密估算过的虚假推估
-
9:49 - 9:52我认为这是一大警讯
-
9:52 - 9:55考量我使用简单分析工具
-
9:55 - 9:59就自身研究的案例中
所得到的这些验证 -
9:59 - 10:01让我对此有所怀疑
-
10:03 - 10:06非线性和工具变量并不是很契合
-
10:06 - 10:10- 不是的,这听起来好像更复杂了
-
10:10 - 10:12- 我们谈的是工具变量...
- 是的 -
10:13 - 10:14...所以才设法厘清
-
10:16 - 10:17有道理
-
10:17 - 10:18♪ [音乐] ♪
-
10:18 - 10:22- 作为Econometrica的编辑
我收到很多相关领域的论文 -
10:23 - 10:27不过其动机并不明确
-
10:28 - 10:30事实上是无目的的
-
10:30 - 10:35这些投稿并非传统的
半参数基础论文 -
10:35 - 10:37这是一大问题
-
10:38 - 10:42相关的一个问题是计量经济学有种惯例
-
10:43 - 10:47那就是非常专注于
形式变量渐近后的趋近结果 -
10:49 - 10:53很多论文是作者提出一种方法后
-
10:53 - 10:59然后以一种非常标准化的方式
建构出渐近的特性 -
11:01 - 11:02- 那样不好吗?
-
11:03 - 11:09- 我想这多少会排挤掉许多框架外的研究
-
11:09 - 11:14毕竟机器学习的相关文献
很多是比较偏向演算法的 -
11:14 - 11:18是基于演算法而得出预测
-
11:19 - 11:23结果证明这种方式的成效
优于非参数内核回归 -
11:24 - 11:25长期以来
-
11:25 - 11:29计量经济学都在处理非参数
大家用的都是内核回归 -
11:29 - 11:31这很适合用来证明定理
-
11:31 - 11:35可藉此得出置信区间
一致性和渐近正态性 -
11:35 - 11:37一切都很棒,但却不太实用
-
11:37 - 11:41机器学习的研究方式却好很多
-
11:41 - 11:43但又不会有这样的问题…
-
11:43 - 11:47- 理论薄弱
不是我对机器学习不满的地方 -
11:47 - 11:52- 不,我的意思是机器学习更擅于预测
-
11:52 - 11:55- 机器学习是更好的曲线拟合工具
-
11:55 - 11:58- 但机器学习使得那些
-
11:58 - 12:00因为没有遵循常规
-
12:00 - 12:06本来无法被计量经济学期刊
轻易接受的论文发布 -
12:07 - 12:12当Breiman研究回归树的时候
也是不太正统 -
12:13 - 12:18我想他投计量经济学期刊时
也必定遇到了不少困难 -
12:20 - 12:24我认为我们画地自限
-
12:25 - 12:28因此难有突破
-
12:28 - 12:31毕竟很多机器学习的方法实际上很实用
-
12:31 - 12:34我认为总的来说
-
12:35 - 12:40计算机科学家在相关研究文献上
贡献了大量的这类演算法 -
12:41 - 12:44也提出诸多很实用的演算法
-
12:44 - 12:49而这也会影响我们进行实证研究的方式
-
12:50 - 12:52不过我们对此尚未完全内化
-
12:52 - 12:58因为我们仍相当专注于
获得点估计和标准误差 -
12:58 - 13:00还有P值
-
13:00 - 13:06某种程度上,我们得摆脱局限
以善用机器学习的能力 -
13:06 - 13:11以及相关文献的有益贡献
-
13:11 - 13:14- 我一方面颇能理解您的观点
-
13:14 - 13:17也就是传统的计量经济学框架
-
13:17 - 13:24是在类似趋近的设定下
提出一种方法来证明极限定理 -
13:24 - 13:27因此论文出版有所局限
-
13:27 - 13:29且在某种意义上
-
13:29 - 13:33藉由放宽对论文学理论述的想像
-
13:33 - 13:38机器学习的研究文献
就很多问题都有很实用的见解 -
13:38 - 13:41而且目前对计量经济学也有重大影响
-
13:41 - 13:48有个我很感兴趣的问题
您如何定位理论… -
13:49 - 13:51您是否认为理论部分毫无价值可言?
-
13:52 - 13:57因为见到机器学习工具的产出时
我常有个疑问 -
13:57 - 14:02您所提到的几种方式
实际上都已开推论结果 -
14:03 - 14:06我想知道的是
不确定性量化之类的方法 -
14:06 - 14:08我有自身的验证
-
14:08 - 14:11我有既定的观点
并观察到对应结果 -
14:11 - 14:12那要怎样就此更新呢?
-
14:12 - 14:14而在某种意义上
-
14:14 - 14:17若身处常态分布的世界
我也清楚怎样处理 -
14:17 - 14:18但此处却不然
-
14:18 - 14:21因此我想知道您对此有何看法
-
14:21 - 14:26- 我不认为这些结果并无特别之处
-
14:26 - 14:30但这类结果通常很难达成
-
14:30 - 14:32我们可能无法办到
-
14:32 - 14:35可能得分阶段来做
-
14:35 - 14:37得有人率先提出
-
14:37 - 14:42我有个特定功能的有趣演算法
-
14:42 - 14:45且以特定标准而言
-
14:45 - 14:50这种演算法在这组数据集的功效良好
-
14:51 - 14:53所以我们应该提出来
-
14:53 - 14:59未来也许有人会有办法
在特定条件下以此进行推论 -
14:59 - 15:04然后发现达成条件不是很实际
那就再研究 -
15:04 - 15:11我觉得我们过去始终认为
所投入的类型必须有所限制时 -
15:11 - 15:13这是在自我设限
-
15:13 - 15:15就某种意义而言
-
15:16 - 15:22这又回到Josh和我
对局部平均处理效应的看法 -
15:22 - 15:25以前人们并非这样看待这个问题的
-
15:26 - 15:29某种层面而言,有人会说
-
15:30 - 15:34这类工作的必要处理
就是先厘清需要估计的对象 -
15:34 - 15:37然后尽力估计
-
15:38 - 15:44但是你们这些人却倒行逆施
-
15:44 - 15:47你可能会说,“你看看,我有个估计器
-
15:47 - 15:51我要看看它所估计的内容是什么?”
-
15:51 - 15:55然后我猜你可能会说
“这有啥特别的”之类的回应 -
15:55 - 15:58并且说这样做不合理
-
15:59 - 16:03我认为我们看待问题的方式
-
16:03 - 16:07应该更灵活一点
-
16:07 - 16:11因为过去未曾尝试
我们已错失一些机会 -
16:11 - 16:12♪ [音乐] ♪
-
16:13 - 16:15- Isaiah
你听到我们的观点了 -
16:15 - 16:18也了解我们有一些意见分歧
-
16:18 - 16:20为何不为我们评评理呢?
-
16:22 - 16:25- 哦,您问的小问题好棒喔
-
16:26 - 16:33我想一方面,我很认同
Guido提到的一些观点 -
16:36 - 16:40有一点就机器学习来说似乎是比较清楚的
-
16:40 - 16:45就某种我们有兴趣投入的非参数预测问题
-
16:45 - 16:50无论是有条件的期望或条件概率
-
16:50 - 16:54过去这得用内核回归
-
16:54 - 16:57或运行序列回归之类的分析
-
16:58 - 17:00目前为止
我们似乎明白了一件事 -
17:00 - 17:03在广泛的应用层面上
-
17:03 - 17:07像是估计有条件的平均函数
条件概率 -
17:07 - 17:10或其他各种非参数对象
-
17:10 - 17:12机器学习的方法
-
17:12 - 17:16似乎比计量经济学和统计学
惯用的非参数分析法 -
17:16 - 17:17表现得更好
-
17:17 - 17:19尤其是在高维空间观察数据
-
17:20 - 17:23- 你是在说倾向得分之类的?
-
17:23 - 17:25- 正是
- 滋扰函数 -
17:25 - 17:27- 对,倾向得分之类的
-
17:28 - 17:31甚至是直接相关的对象
-
17:31 - 17:35像是条件平均处理效应
这种区别两种条件期望函数者 -
17:35 - 17:37这类的可能
-
17:37 - 17:38当然,即便如此
-
17:39 - 17:46有关如何解读的理论推论
和这类项目的大规模样本陈述 -
17:46 - 17:47相对而言较不成熟
-
17:47 - 17:50这还得看机器学习所用的估计器而定
-
17:50 - 17:53但比较难的是
-
17:53 - 17:58机器学习的某些分析方法
就特定目的而言似乎更好用 -
17:58 - 18:03但我们得谨慎带入,并慎重解读结果
-
18:04 - 18:08但这无疑是当今热门,也不乏相关研究
-
18:08 - 18:13因此我完全可以预期
未来会有更多相关进展 -
18:13 - 18:17因此机器学习有个需要警惕的问题是--
-
18:17 - 18:22这一方面是危机
而有时是降低应用价值的问题 -
18:22 - 18:27那便是当人们着手一项自身跃跃欲试
-
18:27 - 18:29而非问题导向的方法时
-
18:29 - 18:35与其就自身感兴趣的对象及参数来切入
-
18:35 - 18:40让我想一下要如何分辨特定事物
-
18:40 - 18:42如何在庞大的数据中将其涵盖
-
18:42 - 18:47“噢,这是有条件的期望函数
我来插入对应的机器学习的估计器” -
18:47 - 18:49这样做似乎是很合理的
-
18:49 - 18:53反观若根据价格来回归数量
-
18:54 - 18:56然后辩称是采用机器学习的方法
-
18:56 - 18:59或许我很满意这解决了内生性问题
-
18:59 - 19:01对此我们通常会顾虑,但也可能不会
-
19:01 - 19:06但同样的,这让厘清问题的方法更明确了
-
19:06 - 19:10也就是先决定研究兴趣,再思索一下…
-
19:10 - 19:12- 就是带入经济学…
-
19:12 - 19:13- 没错
-
19:13 - 19:15- 并考量异质性
-
19:15 - 19:20并就部分因子来善用机器学习的方法
-
19:20 - 19:21- 正是如此
-
19:21 - 19:26所以引发兴趣的问题向来都是一样的
-
19:26 - 19:28但现在我们有一些更好的估计方法
-
19:29 - 19:33而难以预测之处
-
19:33 - 19:37就是机器学习的文献资料相当庞杂
-
19:37 - 19:43而我提到的带入方式毕竟有限
-
19:43 - 19:45因而衍生许多其他有趣的问题
-
19:45 - 19:49例如这类交互的未来发展
及能从中汲取的其他经验 -
19:49 - 19:54这些我相信仍有许多颇具前景的开发空间
-
19:54 - 19:56但我没有确切答案
-
19:57 - 20:00- 我完全同意
-
20:00 - 20:04这很令人期待
-
20:04 - 20:06我认为这方面只需再稍加把劲
-
20:07 - 20:09所以这点Isaiah跟我看法一致
-
20:10 - 20:12- 我没这么说喔
-
20:13 - 20:14♪ [音乐] ♪
-
20:14 - 20:17若你想观看更多
《诺奖得主畅谈系列》的节目 -
20:17 - 20:18请点击此处
-
20:18 - 20:20或你若想多学一点计量经济学
-
20:20 - 20:23那就看看Josh的
《计量经济学》系列视频 -
20:24 - 20:27若想多加了解
Guido、Josh和Isaiah -
20:27 - 20:29请参考视频描述中的链接
-
20:29 - 20:30♪ [音乐] ♪
- Title:
- How Will Machine Learning Impact Economics?
- ASR Confidence:
- 0.83
- Description:
-
- Video Language:
- English
- Team:
- Marginal Revolution University
- Duration:
- 20:33
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 23, 2022, 10:15 AM | |
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 23, 2022, 5:57 AM | |
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 21, 2022, 9:14 AM | |
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 21, 2022, 8:54 AM | |
Jing Peng edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 20, 2022, 6:52 AM | |
Samson Zhong edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 19, 2022, 7:39 PM | |
Samson Zhong edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 19, 2022, 7:39 PM | |
Samson Zhong edited Chinese, Simplified subtitles for How Will Machine Learning Impact Economics? | May 19, 2022, 11:30 AM |