Return to Video

How Will Machine Learning Impact Economics?

  • 0:00 - 0:01
    ♪ [音乐] ♪
  • 0:04 - 0:06
    [讲解员] 欢迎观看《诺贝尔对话》
  • 0:07 - 0:10
    本集中,Josh Angrist
    和Guido Imbens
  • 0:10 - 0:15
    与Isaiah Andrews就机器学习
    在应用计量经济学中的角色
  • 0:15 - 0:17
    展开讨论和争辩
  • 0:18 - 0:21
    - [Isaiah] 有很多议题
    两位大致上都同意
  • 0:21 - 0:24
    但我想换个或许两位各有看法的话题
  • 0:24 - 0:27
    我想听听你们对机器学习的看法
  • 0:27 - 0:30
    还有就经济学而言
    这方面在当前和未来的进展
  • 0:30 - 0:34
    - [Guido] 我看过一些
    专利之类的数据
  • 0:34 - 0:35
    但并无相关出版文献
  • 0:36 - 0:39
    我看到有人做了搜索演算法的实验
  • 0:40 - 0:41
    不过问题在于
  • 0:43 - 0:46
    该实验是关于排序与改变排序的
  • 0:46 - 0:51
    所以当中显然存在许多异质性
  • 0:52 - 0:56
    比方说若要搜寻的是
  • 0:58 - 1:01
    小甜甜布兰妮的照片
    (Britney Spears)
  • 1:01 - 1:06
    那结果排序不重要
    因为还要自行判断吻合的目标
  • 1:06 - 1:10
    是排第一、第二,还是第三都无所谓
  • 1:10 - 1:12
    但若要找的是最好的计量经济学专书
  • 1:13 - 1:18
    结果排序是第一还是第十,差别就很大
  • 1:19 - 1:21
    因为这关系到点阅率
  • 1:22 - 1:23
    有监于此…
  • 1:23 - 1:27
    - [Josh] 为什么需要
    机器学习来发现这点?
  • 1:27 - 1:29
    这似乎我自己来就行了
  • 1:29 - 1:30
    - [Guido] 所以总的来说…
  • 1:30 - 1:32
    - [Josh] 这有很多可能性
  • 1:32 - 1:37
    - 因为设想到事物的诸多特性
  • 1:38 - 1:43
    你会想了解造成异质性的驱力及其影响
  • 1:43 - 1:45
    - 但你只是在预测
  • 1:45 - 1:48
    某种意义上来说,这是在解决营销问题
  • 1:48 - 1:49
    - 不,这有因果关系
  • 1:49 - 1:52
    - 这是因果关系,但缺乏科学内涵
  • 1:52 - 1:53
    不妨这样想
  • 1:54 - 1:57
    - 不是的,在医疗界也有类似的例子
  • 1:58 - 2:02
    你若对部分族群接受特定疗法的功效感兴趣
  • 2:02 - 2:04
    因此进行研究实验
  • 2:04 - 2:08
    这当中牵涉各种特性
    因此需要系统性地搜寻…
  • 2:08 - 2:14
    - 没错,但我有疑虑是个体因果关系的假设
  • 2:14 - 2:17
    以及机器学习的洞察实用性
  • 2:17 - 2:20
    考量到我丰富的执教经验
  • 2:20 - 2:24
    包括一所公费资助的特许私校
  • 2:25 - 2:29
    校方实际上可视需要自由安排课程
  • 2:30 - 2:33
    有些特许学校的教学成效卓著
  • 2:34 - 2:38
    而在产生这类结果的数据集中包含许多共变量
  • 2:38 - 2:43
    包括基线分数、家庭背景、家长教育程度
  • 2:43 - 2:46
    学生性别和种族
  • 2:46 - 2:50
    一旦我将其中的数个项目整合后
  • 2:50 - 2:52
    便会产生高维空间
  • 2:52 - 2:56
    我对那种疗效研究的对应班级特征绝对有兴趣
  • 2:56 - 3:02
    比如是否对出身低收入家庭者较有利
  • 3:02 - 3:06
    但令我较难信服的应用是
  • 3:07 - 3:10
    非常高维的这类资料
  • 3:10 - 3:15
    我发现例如高收入家庭的非白人儿童
  • 3:15 - 3:18
    但基线分数落在第三个四分位数
  • 3:18 - 3:23
    且只在公立学校念到三年级而非六年级
  • 3:23 - 3:26
    因此衍生高维分析
  • 3:26 - 3:28
    条件陈述也很复杂
  • 3:28 - 3:31
    我认为刚才那种排序有两大问题
  • 3:31 - 3:34
    首先是分析难以执行
  • 3:35 - 3:36
    也不明白这样做的理由
  • 3:37 - 3:41
    我还知道有些替代模型就有几乎同样的作用
  • 3:42 - 3:43
    这就完全不同了
  • 3:43 - 3:49
    对吧?因为机器学习
    无法指出真正重要的预测因子
  • 3:49 - 3:51
    只能找出不错的预测因子
  • 3:51 - 3:58
    所以我认为就社会科学而言,情况有些不同
  • 3:58 - 4:01
    - [Guido] 我想你提到的
    社会科学应用
  • 4:02 - 4:08
    是效果异质性显著的例子
  • 4:10 - 4:13
    - [Josh] 若可填补模型空间可能会有
  • 4:13 - 4:16
    - 不是这样的!
  • 4:16 - 4:19
    我想就多数那些干扰因子来讲
  • 4:19 - 4:23
    你会期望对所有人来说,效果意涵是一样的
  • 4:24 - 4:27
    或许当中存在些许强度差异
  • 4:27 - 4:32
    不过许多教育上的论辩
    认为这对大家都有好处
  • 4:34 - 4:37
    并非只对某些人不好,对其他人就有益
  • 4:37 - 4:41
    当然其中会有一小部分不好
  • 4:41 - 4:44
    程度上会有落差
  • 4:44 - 4:47
    但得有非常庞大的数据集才能发现
  • 4:47 - 4:51
    我同意这类例子的分析难度不低
  • 4:52 - 4:56
    但我想还有很多异质性更高的情境
  • 4:57 - 4:59
    - 我不否认有那种可能
  • 4:59 - 5:05
    我认为你所举的例子,本质上是营销案例
  • 5:06 - 5:11
    不,这就组织机构是有其意涵的
  • 5:11 - 5:14
    亦即实际上是否得顾虑…
  • 5:15 - 5:18
    - 好吧,那我得读那篇论文了
  • 5:18 - 5:21
    所以感觉上
  • 5:21 - 5:24
    - 某部份我们仍有意见分歧
    - 没错
  • 5:24 - 5:25
    并非全然达成共识
  • 5:25 - 5:27
    我也感觉到了
  • 5:27 - 5:31
    - 这方面我们实际上有不同看法
    是因为并非切身相关
  • 5:31 - 5:32
    [笑声]
  • 5:33 - 5:35
    现在气氛好一点了
  • 5:36 - 5:38
    热络起来好啊
  • 5:38 - 5:40
    Josh,听来你的意思是
  • 5:40 - 5:45
    你并非全盘否认这类分析可能有的应用价值
  • 5:45 - 5:49
    而是对当前应用抱持保留的态度
  • 5:50 - 5:52
    - 这说得通
    - 我是很有信心的
  • 5:52 - 5:54
    [笑声]
  • 5:54 - 5:55
    - 就此而言
  • 5:55 - 5:57
    我认为Josh说的有道理
  • 5:58 - 6:05
    即使是机器学习大放异彩的预测模型用例
  • 6:05 - 6:07
    还是存在许多异质性
  • 6:07 - 6:10
    你不太在意这其中的细节对吧?
  • 6:11 - 6:12
    - [Guido] 是的
  • 6:12 - 6:15
    并无牵涉政策角度之类的
  • 6:15 - 6:20
    机器学习更擅长辨识数字纪录之类的
  • 6:20 - 6:24
    而非建构复杂的模型
  • 6:24 - 6:28
    但是有很多社会科学,很多的经济应用
  • 6:28 - 6:32
    事实上,我们很了解所属变数间的关联
  • 6:32 - 6:35
    这些关联有很多是单调(monotone)的
  • 6:37 - 6:39
    教育会提升收入
  • 6:40 - 6:42
    不分是人口特性
  • 6:42 - 6:45
    任何教育程度都一样
  • 6:45 - 6:46
    直到获得博士学位
  • 6:46 - 6:48
    研究所教育也一样吗?
  • 6:48 - 6:49
    [笑声]
  • 6:49 - 6:56
    合理的范围内还不至于大幅下滑
  • 6:56 - 7:00
    许多情况下,这类机器学习的方法表现亮眼
  • 7:00 - 7:05
    这些关联中包含许多非单调性的多模性
  • 7:05 - 7:08
    就这些关联性来说,机器学习是很有力的工具
  • 7:09 - 7:12
    不过我仍坚信
  • 7:12 - 7:18
    经济学家能从这些方法中获益良多
  • 7:18 - 7:22
    对未来前景影响甚钜
  • 7:22 - 7:23
    ♪ [音乐] ♪
  • 7:23 - 7:26
    - [Isaiah] 机器学习在这方面
    似乎还有很多有趣的议题
  • 7:26 - 7:31
    所以可否请Guido就当前既有的应用
  • 7:31 - 7:33
    再举些例子?
  • 7:33 - 7:34
    其中一个例子就是
  • 7:35 - 7:40
    我们目前舍弃一般的因果关系
    转向寻求个别化的估计
  • 7:41 - 7:43
    来预测因果关系
  • 7:43 - 7:48
    这方面机器学习的演算非常有用
  • 7:48 - 7:52
    以往的传统途径是内核方法
  • 7:52 - 7:54
    理论上成效不错
  • 7:54 - 7:57
    不过有些人辩解道这已经是最好的了
  • 7:58 - 8:00
    不过此法的实务表现不甚理想
  • 8:01 - 8:03
    Stefan Wager
    和 Susan Athey
  • 8:03 - 8:07
    两位学者持续耕耘的
    随机与因果森林这类推断法
  • 8:07 - 8:09
    应用非常广泛
  • 8:10 - 8:16
    这些方法在这类情境中
    推断基于共变项的因果效应
  • 8:16 - 8:19
    效果其实很不错
  • 8:21 - 8:24
    我想这些推断方法才刚起步
  • 8:24 - 8:26
    但很多情况下
  • 8:27 - 8:32
    这些演算法在搜索广泛空间时
  • 8:32 - 8:37
    以及找出适合的函数方面帮助很大
  • 8:37 - 8:41
    其运作方式是我们无法事先备妥的
  • 8:42 - 8:43
    就因果推论而言
  • 8:43 - 8:47
    我并不清楚机器学习的洞见
    是否有吸引我关注的例子
  • 8:48 - 8:51
    我知道一些很可能会误导的例子
  • 8:51 - 8:54
    因此我和 Brigham Frandsen
    合作过一些相关研究
  • 8:54 - 9:00
    例如,在需要界定共变量的工具变量问题中
  • 9:00 - 9:03
    使用随机森林来建立共变量效应模型
  • 9:04 - 9:08
    对此,你不会对其功能形式有特别强烈的感受
  • 9:08 - 9:13
    因此或许需作决策曲线分析
    并对弹性曲线拟合分析持开放的态度
  • 9:13 - 9:17
    这会引导你进入一种
    模型中包含许多非线性的情况
  • 9:17 - 9:20
    这对工具变量来说很危险
  • 9:20 - 9:23
    因为任何所排除的非线性
  • 9:23 - 9:26
    都有可能导致因果效应的谬误
  • 9:26 - 9:29
    我想我和Brigham已就这点提出有力证明
  • 9:29 - 9:35
    所用的例子是我和Bill Evans
    合着的论文中所用的两项分析工具
  • 9:35 - 9:39
    其中若将两阶段最小二乘法
  • 9:39 - 9:42
    换成某种随机森林分析法
  • 9:43 - 9:47
    便会得出精算过的虚假推估
  • 9:49 - 9:52
    我认为这是一大警讯
  • 9:52 - 9:55
    考量我使用简单分析工具
  • 9:55 - 9:59
    就自身研究兴趣的案例中
    所得到的这些验证过的见解
  • 9:59 - 10:01
    让我对此有所怀疑
  • 10:03 - 10:06
    非线性和工具变量并不是很契合
Title:
How Will Machine Learning Impact Economics?
ASR Confidence:
0.83
Description:

more » « less
Video Language:
English
Team:
Marginal Revolution University
Duration:
20:33

Chinese, Simplified subtitles

Revisions Compare revisions