[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.01,0:00:01.05,Default,,0000,0000,0000,,♪ [音乐] ♪ Dialogue: 0,0:00:03.62,0:00:05.70,Default,,0000,0000,0000,,[讲解员] 欢迎观看《诺贝尔对话》 Dialogue: 0,0:00:07.00,0:00:10.04,Default,,0000,0000,0000,,本集中,Josh Angrist\N和Guido Imbens Dialogue: 0,0:00:10.04,0:00:14.72,Default,,0000,0000,0000,,与Isaiah Andrews就机器学习\N在应用计量经济学中的角色 Dialogue: 0,0:00:14.72,0:00:16.59,Default,,0000,0000,0000,,展开讨论和争辩 Dialogue: 0,0:00:18.26,0:00:21.22,Default,,0000,0000,0000,,- [Isaiah] 有很多议题\N两位大致上都同意 Dialogue: 0,0:00:21.22,0:00:24.24,Default,,0000,0000,0000,,但我想换个或许两位各有看法的话题 Dialogue: 0,0:00:24.24,0:00:26.88,Default,,0000,0000,0000,,我想听听你们对机器学习的看法 Dialogue: 0,0:00:26.88,0:00:29.90,Default,,0000,0000,0000,,还有就经济学而言\N这方面在当前和未来的进展 Dialogue: 0,0:00:30.07,0:00:33.72,Default,,0000,0000,0000,,- [Guido] 我看过一些\N专利之类的数据 Dialogue: 0,0:00:33.72,0:00:34.98,Default,,0000,0000,0000,,但并无相关出版文献 Dialogue: 0,0:00:36.11,0:00:39.31,Default,,0000,0000,0000,,我看到有人做了搜索演算法的实验 Dialogue: 0,0:00:39.67,0:00:41.18,Default,,0000,0000,0000,,不过问题在于 Dialogue: 0,0:00:42.83,0:00:45.62,Default,,0000,0000,0000,,该实验是关于排序与改变排序的 Dialogue: 0,0:00:45.84,0:00:50.56,Default,,0000,0000,0000,,所以当中显然存在许多异质性 Dialogue: 0,0:00:52.16,0:00:56.03,Default,,0000,0000,0000,,比方说若要搜寻的是 Dialogue: 0,0:00:57.83,0:01:00.62,Default,,0000,0000,0000,,小甜甜布兰妮的照片\N(Britney Spears) Dialogue: 0,0:01:00.62,0:01:05.50,Default,,0000,0000,0000,,那结果排序不重要\N因为还要自行判断吻合的目标 Dialogue: 0,0:01:06.14,0:01:09.72,Default,,0000,0000,0000,,是排第一、第二,还是第三都无所谓 Dialogue: 0,0:01:10.09,0:01:12.49,Default,,0000,0000,0000,,但若要找的是最好的计量经济学专书 Dialogue: 0,0:01:13.14,0:01:18.20,Default,,0000,0000,0000,,结果排序是第一还是第十,差别就很大 Dialogue: 0,0:01:18.54,0:01:20.92,Default,,0000,0000,0000,,因为这关系到点阅率 Dialogue: 0,0:01:21.83,0:01:23.42,Default,,0000,0000,0000,,有监于此… Dialogue: 0,0:01:23.42,0:01:27.26,Default,,0000,0000,0000,,- [Josh] 为什么需要\N机器学习来发现这点? Dialogue: 0,0:01:27.26,0:01:29.20,Default,,0000,0000,0000,,这似乎我自己来就行了 Dialogue: 0,0:01:29.20,0:01:30.44,Default,,0000,0000,0000,,- [Guido] 所以总的来说… Dialogue: 0,0:01:30.44,0:01:32.10,Default,,0000,0000,0000,,- [Josh] 这有很多可能性 Dialogue: 0,0:01:32.10,0:01:37.26,Default,,0000,0000,0000,,- 因为设想到事物的诸多特性 Dialogue: 0,0:01:37.68,0:01:43.29,Default,,0000,0000,0000,,你会想了解造成异质性的驱力及其影响 Dialogue: 0,0:01:43.32,0:01:45.01,Default,,0000,0000,0000,,- 但你只是在预测 Dialogue: 0,0:01:45.01,0:01:47.66,Default,,0000,0000,0000,,某种意义上来说,这是在解决营销问题 Dialogue: 0,0:01:47.67,0:01:49.19,Default,,0000,0000,0000,,- 不,这有因果关系 Dialogue: 0,0:01:49.27,0:01:51.91,Default,,0000,0000,0000,,- 这是因果关系,但缺乏科学内涵 Dialogue: 0,0:01:51.91,0:01:53.14,Default,,0000,0000,0000,,不妨这样想 Dialogue: 0,0:01:53.66,0:01:57.31,Default,,0000,0000,0000,,- 不是的,在医疗界也有类似的例子 Dialogue: 0,0:01:57.86,0:02:01.94,Default,,0000,0000,0000,,你若对部分族群接受特定疗法的功效感兴趣 Dialogue: 0,0:02:01.95,0:02:03.70,Default,,0000,0000,0000,,因此进行研究实验 Dialogue: 0,0:02:03.83,0:02:07.89,Default,,0000,0000,0000,,这当中牵涉各种特性\N因此需要系统性地搜寻… Dialogue: 0,0:02:07.89,0:02:13.73,Default,,0000,0000,0000,,- 没错,但我有疑虑是个体因果关系的假设 Dialogue: 0,0:02:13.100,0:02:17.02,Default,,0000,0000,0000,,以及机器学习的洞察实用性 Dialogue: 0,0:02:17.26,0:02:20.04,Default,,0000,0000,0000,,考量到我丰富的执教经验 Dialogue: 0,0:02:20.05,0:02:24.11,Default,,0000,0000,0000,,包括一所公费资助的特许私校 Dialogue: 0,0:02:25.22,0:02:29.40,Default,,0000,0000,0000,,校方实际上可视需要自由安排课程 Dialogue: 0,0:02:29.53,0:02:33.39,Default,,0000,0000,0000,,有些特许学校的教学成效卓著 Dialogue: 0,0:02:33.79,0:02:37.66,Default,,0000,0000,0000,,而在产生这类结果的数据集中包含许多共变量 Dialogue: 0,0:02:37.66,0:02:43.21,Default,,0000,0000,0000,,包括基线分数、家庭背景、家长教育程度 Dialogue: 0,0:02:43.34,0:02:45.80,Default,,0000,0000,0000,,学生性别和种族 Dialogue: 0,0:02:45.93,0:02:49.80,Default,,0000,0000,0000,,一旦我将其中的数个项目整合后 Dialogue: 0,0:02:49.80,0:02:51.90,Default,,0000,0000,0000,,便会产生高维空间 Dialogue: 0,0:02:52.24,0:02:56.40,Default,,0000,0000,0000,,我对那种疗效研究的对应班级特征绝对有兴趣 Dialogue: 0,0:02:56.46,0:03:02.05,Default,,0000,0000,0000,,比如是否对出身低收入家庭者较有利 Dialogue: 0,0:03:02.41,0:03:06.04,Default,,0000,0000,0000,,但令我较难信服的应用是 Dialogue: 0,0:03:07.27,0:03:09.87,Default,,0000,0000,0000,,非常高维的这类资料 Dialogue: 0,0:03:09.87,0:03:14.97,Default,,0000,0000,0000,,我发现例如高收入家庭的非白人儿童 Dialogue: 0,0:03:14.97,0:03:17.80,Default,,0000,0000,0000,,但基线分数落在第三个四分位数 Dialogue: 0,0:03:18.17,0:03:22.93,Default,,0000,0000,0000,,且只在公立学校念到三年级而非六年级 Dialogue: 0,0:03:22.93,0:03:25.72,Default,,0000,0000,0000,,因此衍生高维分析 Dialogue: 0,0:03:25.72,0:03:28.02,Default,,0000,0000,0000,,条件陈述也很复杂 Dialogue: 0,0:03:28.22,0:03:30.68,Default,,0000,0000,0000,,我认为刚才那种排序有两大问题 Dialogue: 0,0:03:30.68,0:03:34.00,Default,,0000,0000,0000,,首先是分析难以执行 Dialogue: 0,0:03:34.60,0:03:36.41,Default,,0000,0000,0000,,也不明白这样做的理由 Dialogue: 0,0:03:36.59,0:03:41.14,Default,,0000,0000,0000,,我还知道有些替代模型就有几乎同样的作用 Dialogue: 0,0:03:41.67,0:03:42.88,Default,,0000,0000,0000,,这就完全不同了 Dialogue: 0,0:03:43.12,0:03:48.64,Default,,0000,0000,0000,,对吧?因为机器学习\N无法指出真正重要的预测因子 Dialogue: 0,0:03:48.64,0:03:51.02,Default,,0000,0000,0000,,只能找出不错的预测因子 Dialogue: 0,0:03:51.49,0:03:57.59,Default,,0000,0000,0000,,所以我认为就社会科学而言,情况有些不同 Dialogue: 0,0:03:57.78,0:04:00.98,Default,,0000,0000,0000,,- [Guido] 我想你提到的\N社会科学应用 Dialogue: 0,0:04:01.52,0:04:08.10,Default,,0000,0000,0000,,是效果异质性显著的例子 Dialogue: 0,0:04:09.78,0:04:13.41,Default,,0000,0000,0000,,- [Josh] 若可填补模型空间可能会有 Dialogue: 0,0:04:13.41,0:04:15.68,Default,,0000,0000,0000,,- 不是这样的! Dialogue: 0,0:04:15.74,0:04:18.79,Default,,0000,0000,0000,,我想就多数那些干扰因子来讲 Dialogue: 0,0:04:18.79,0:04:22.76,Default,,0000,0000,0000,,你会期望对所有人来说,效果意涵是一样的 Dialogue: 0,0:04:24.36,0:04:26.91,Default,,0000,0000,0000,,或许当中存在些许强度差异 Dialogue: 0,0:04:26.91,0:04:31.60,Default,,0000,0000,0000,,不过许多教育上的论辩\N认为这对大家都有好处 Dialogue: 0,0:04:34.17,0:04:37.38,Default,,0000,0000,0000,,并非只对某些人不好,对其他人就有益 Dialogue: 0,0:04:37.47,0:04:40.81,Default,,0000,0000,0000,,当然其中会有一小部分不好 Dialogue: 0,0:04:40.87,0:04:43.88,Default,,0000,0000,0000,,程度上会有落差 Dialogue: 0,0:04:43.95,0:04:46.96,Default,,0000,0000,0000,,但得有非常庞大的数据集才能发现 Dialogue: 0,0:04:47.14,0:04:51.42,Default,,0000,0000,0000,,我同意这类例子的分析难度不低 Dialogue: 0,0:04:51.70,0:04:56.46,Default,,0000,0000,0000,,但我想还有很多异质性更高的情境 Dialogue: 0,0:04:57.25,0:04:59.10,Default,,0000,0000,0000,,- 我不否认有那种可能 Dialogue: 0,0:04:59.10,0:05:04.92,Default,,0000,0000,0000,,我认为你所举的例子,本质上是营销案例 Dialogue: 0,0:05:06.32,0:05:10.63,Default,,0000,0000,0000,,不,这就组织机构是有其意涵的 Dialogue: 0,0:05:10.63,0:05:14.39,Default,,0000,0000,0000,,亦即实际上是否得顾虑… Dialogue: 0,0:05:15.47,0:05:17.90,Default,,0000,0000,0000,,- 好吧,那我得读那篇论文了 Dialogue: 0,0:05:18.34,0:05:21.01,Default,,0000,0000,0000,,所以感觉上 Dialogue: 0,0:05:21.47,0:05:23.100,Default,,0000,0000,0000,,- 某部份我们仍有意见分歧\N- 没错 Dialogue: 0,0:05:23.100,0:05:25.44,Default,,0000,0000,0000,,并非全然达成共识 Dialogue: 0,0:05:25.44,0:05:27.20,Default,,0000,0000,0000,,我也感觉到了 Dialogue: 0,0:05:27.20,0:05:30.83,Default,,0000,0000,0000,,- 这方面我们实际上有不同看法\N是因为并非切身相关 Dialogue: 0,0:05:30.83,0:05:32.33,Default,,0000,0000,0000,,[笑声] Dialogue: 0,0:05:33.05,0:05:34.76,Default,,0000,0000,0000,,现在气氛好一点了 Dialogue: 0,0:05:35.82,0:05:37.88,Default,,0000,0000,0000,,热络起来好啊 Dialogue: 0,0:05:38.02,0:05:39.69,Default,,0000,0000,0000,,Josh,听来你的意思是 Dialogue: 0,0:05:39.69,0:05:45.24,Default,,0000,0000,0000,,你并非全盘否认这类分析可能有的应用价值 Dialogue: 0,0:05:45.24,0:05:49.49,Default,,0000,0000,0000,,而是对当前应用抱持保留的态度 Dialogue: 0,0:05:49.92,0:05:51.59,Default,,0000,0000,0000,,- 这说得通\N- 我是很有信心的 Dialogue: 0,0:05:51.98,0:05:53.66,Default,,0000,0000,0000,,[笑声] Dialogue: 0,0:05:54.16,0:05:55.19,Default,,0000,0000,0000,,- 就此而言 Dialogue: 0,0:05:55.19,0:05:56.75,Default,,0000,0000,0000,,我认为Josh说的有道理 Dialogue: 0,0:05:57.99,0:06:04.97,Default,,0000,0000,0000,,即使是机器学习大放异彩的预测模型用例 Dialogue: 0,0:06:04.99,0:06:06.95,Default,,0000,0000,0000,,还是存在许多异质性 Dialogue: 0,0:06:07.30,0:06:10.41,Default,,0000,0000,0000,,你不太在意这其中的细节对吧? Dialogue: 0,0:06:10.77,0:06:11.84,Default,,0000,0000,0000,,- [Guido] 是的 Dialogue: 0,0:06:11.84,0:06:15.00,Default,,0000,0000,0000,,并无牵涉政策角度之类的 Dialogue: 0,0:06:15.13,0:06:20.09,Default,,0000,0000,0000,,机器学习更擅长辨识数字纪录之类的 Dialogue: 0,0:06:20.09,0:06:24.00,Default,,0000,0000,0000,,而非建构复杂的模型 Dialogue: 0,0:06:24.40,0:06:28.08,Default,,0000,0000,0000,,但是有很多社会科学,很多的经济应用 Dialogue: 0,0:06:28.22,0:06:31.90,Default,,0000,0000,0000,,事实上,我们很了解所属变数间的关联 Dialogue: 0,0:06:31.91,0:06:34.70,Default,,0000,0000,0000,,这些关联有很多是单调(monotone)的 Dialogue: 0,0:06:37.13,0:06:39.38,Default,,0000,0000,0000,,教育会提升收入 Dialogue: 0,0:06:39.70,0:06:41.95,Default,,0000,0000,0000,,不分是人口特性 Dialogue: 0,0:06:41.95,0:06:44.93,Default,,0000,0000,0000,,任何教育程度都一样 Dialogue: 0,0:06:44.93,0:06:46.08,Default,,0000,0000,0000,,直到获得博士学位 Dialogue: 0,0:06:46.08,0:06:47.96,Default,,0000,0000,0000,,研究所教育也一样吗? Dialogue: 0,0:06:47.96,0:06:49.23,Default,,0000,0000,0000,,[笑声] Dialogue: 0,0:06:49.23,0:06:55.60,Default,,0000,0000,0000,,合理的范围内还不至于大幅下滑 Dialogue: 0,0:06:56.04,0:06:59.69,Default,,0000,0000,0000,,许多情况下,这类机器学习的方法表现亮眼 Dialogue: 0,0:07:00.10,0:07:04.90,Default,,0000,0000,0000,,这些关联中包含许多非单调性的多模性 Dialogue: 0,0:07:05.30,0:07:08.46,Default,,0000,0000,0000,,这些数据是很有力的