0:00:00.000,0:00:03.138
♪ (música) ♪

0:00:03.394,0:00:05.633
- [Narradora] Bienvenidos[br]a Nobel Conversations.

0:00:06.992,0:00:10.093
En este episodio,[br]Josh Angrist y Guido Imbens

0:00:10.093,0:00:13.366
están reunidos con Isaiah Andrews[br]para discutir y discrepar

0:00:13.366,0:00:15.221
sobre el papel[br]del aprendizaje automático

0:00:15.221,0:00:16.816
en la econometría aplicada.

0:00:17.894,0:00:19.896
- [Isaiah] Bien. Por supuesto[br]que hay muchos temas

0:00:19.896,0:00:21.465
en los que ustedes[br]están muy de acuerdo,

0:00:21.465,0:00:22.595
pero me gustaría pasar a uno

0:00:22.595,0:00:24.365
sobre el que tal vez[br]opinen algo distinto.

0:00:24.365,0:00:26.103
Me gustaría escuchar[br]algunas de sus opiniones

0:00:26.103,0:00:27.319
sobre el aprendizaje automático

0:00:27.319,0:00:30.257
y el papel que desempeña[br]y desempeñará en la economía.

0:00:30.257,0:00:31.858
- [Guido] He consultado[br]algunos datos,

0:00:31.858,0:00:33.349
como los datos privados.

0:00:33.349,0:00:35.306
Vemos que no hay[br]ningún documento publicado allí.

0:00:35.975,0:00:39.426
Se hizo un experimento[br]sobre algún algoritmo de búsqueda

0:00:39.426,0:00:41.081
y la cuestión era...

0:00:42.581,0:00:45.492
se trataba de clasificar cosas[br]y cambiar la clasificación.

0:00:45.990,0:00:47.163
Y estaba más o menos claro

0:00:47.163,0:00:50.271
que iba a haber[br]mucha heterogeneidad.

0:00:51.117,0:00:55.864
Si buscas, digamos,

0:00:58.122,0:01:00.640
una foto de Britney Spears,

0:01:00.640,0:01:02.505
realmente no importa[br]dónde la clasifiques

0:01:02.505,0:01:05.214
porque vas a encontrar[br]lo que estás buscando,

0:01:05.736,0:01:07.058
ya sea que la clasifiques

0:01:07.058,0:01:09.744
en primera, segunda[br]o tercera posición.

0:01:10.027,0:01:12.346
Pero si estás buscando[br]el mejor libro de econometría,

0:01:12.346,0:01:16.510
ya sea que pongas tu libro[br]en el primer lugar o en el décimo,

0:01:16.510,0:01:18.140
eso va a suponer[br]una gran diferencia

0:01:18.140,0:01:19.835
en la frecuencia

0:01:19.835,0:01:21.286
con la que la gente[br]hará clic en él.

0:01:22.089,0:01:23.312
Así que ahí--

0:01:23.312,0:01:24.326
[Josh] ¿Por qué necesito

0:01:24.326,0:01:27.314
el aprendizaje automático[br]para descubrir eso?

0:01:27.314,0:01:29.463
Porque parece que puedo descubrirlo[br]de forma sencilla.

0:01:29.463,0:01:30.517
- [Guido] En general--

0:01:30.517,0:01:32.233
- [Josh] Había[br]un montón de posibles--

0:01:32.233,0:01:34.233
- [Guido]...quieres pensar[br]que los artículos

0:01:34.233,0:01:37.092
tienen montón de características,

0:01:37.092,0:01:38.940
que quieres entender

0:01:38.940,0:01:43.650
lo que impulsa la heterogeneidad[br]en el efecto de--

0:01:43.669,0:01:44.876
- Pero solo estás prediciendo.

0:01:44.876,0:01:46.057
En cierto sentido,

0:01:46.057,0:01:47.793
estás resolviendo[br]un problema de marketing.

0:01:47.793,0:01:49.210
- No, es un efecto causal,

0:01:49.210,0:01:51.738
- Es causal, pero no tiene[br]contenido científico.

0:01:51.738,0:01:52.809
Piensa en--

0:01:53.669,0:01:57.243
- No, pero hay cosas similares[br]en el ámbito médico.

0:01:57.693,0:01:59.312
Si haces un experimento,

0:01:59.312,0:02:02.492
puedes estar muy interesado[br]en si el tratamiento funciona

0:02:02.492,0:02:03.821
para algunos grupos o no.

0:02:03.821,0:02:05.946
Y tienes un montón[br]de características individuales,

0:02:05.946,0:02:08.109
y quieres buscar sistemáticamente--

0:02:08.109,0:02:09.883
- Sí. Tengo mis dudas sobre esa...

0:02:09.883,0:02:12.588
esa especie de idea de que hay[br]un efecto causal personal

0:02:12.588,0:02:13.902
que me debería importar

0:02:13.902,0:02:15.164
y que el aprendizaje automático

0:02:15.164,0:02:17.103
puede descubrirlo[br]de alguna manera que sea útil.

0:02:17.517,0:02:18.678
Así que piensa en--

0:02:18.678,0:02:20.182
he trabajado mucho en las escuelas,

0:02:20.182,0:02:22.358
yendo a, digamos,[br]una escuela chárter,

0:02:22.358,0:02:24.498
una escuela privada[br]financiada con fondos públicos,

0:02:24.780,0:02:27.392
efectivamente,[br]que es libre de estructurar

0:02:27.392,0:02:29.587
su propio plan de estudios[br]en función del contexto.

0:02:29.587,0:02:30.938
Algunos tipos de escuelas chárter

0:02:30.938,0:02:33.379
consiguen[br]un rendimiento espectacular

0:02:33.379,0:02:36.321
y en el conjunto de datos[br]que produce ese resultado,

0:02:36.321,0:02:37.968
tengo un montón de covariables.

0:02:37.968,0:02:39.584
Tengo[br]las puntuaciones de referencia

0:02:39.584,0:02:41.321
y los antecedentes familiares,

0:02:41.321,0:02:45.524
la educación de los padres,[br]el sexo del niño, la raza del niño.

0:02:46.060,0:02:49.758
Y, bueno, en cuanto reúno[br]media docena de ellas,

0:02:49.758,0:02:51.751
tengo un espacio[br]de muy alta dimensión.

0:02:52.391,0:02:55.394
Sin duda, me interesan[br]las características del curso

0:02:55.394,0:02:56.803
de ese efecto del tratamiento,

0:02:56.803,0:02:58.688
como por ejemplo, si es mejor[br]para las personas

0:02:58.688,0:03:02.054
que provienen de familias[br]con menores ingresos.

0:03:02.377,0:03:05.656
Me cuesta creer[br]que haya una aplicación

0:03:05.656,0:03:09.970
para la versión[br]de muy alta dimensión,

0:03:09.970,0:03:12.499
en la que descubrí[br]que para los niños no blancos

0:03:12.499,0:03:15.028
que tienen[br]ingresos familiares altos

0:03:15.028,0:03:17.747
pero puntuaciones de referencia[br]en el tercer cuartil

0:03:17.747,0:03:20.535
y que solo fueron[br]a la escuela pública

0:03:20.535,0:03:23.128
en el tercer grado[br]pero no en el sexto.

0:03:23.128,0:03:25.681
Así que eso es lo que produce[br]ese análisis de alta dimensión.

0:03:25.681,0:03:27.938
Es una declaración condicional[br]muy elaborada.

0:03:27.938,0:03:30.702
Hay dos cosas que están mal,[br]en mi opinión.

0:03:30.702,0:03:32.418
En primer lugar, no lo veo como--

0:03:32.418,0:03:34.492
no puedo imaginar[br]por qué es algo procesable.

0:03:34.492,0:03:36.518
No sé por qué[br]querrías actuar sobre ello.

0:03:36.518,0:03:39.381
Y también sé que hay[br]algún modelo alternativo

0:03:39.381,0:03:42.856
que encaja casi igual de bien,[br]que lo invierte todo.

0:03:42.978,0:03:44.591
Porque el aprendizaje automático

0:03:44.591,0:03:48.473
no me dice que este es realmente[br]el predictor que importa,

0:03:48.473,0:03:50.779
solo me dice[br]que este es un buen predictor.

0:03:51.396,0:03:54.875
Así que creo,[br]que hay algo diferente

0:03:54.875,0:03:57.688
en el contexto[br]de las ciencias sociales.

0:03:57.688,0:04:00.270
- [Guido] Creo que las aplicaciones[br]de las ciencias sociales

0:04:00.270,0:04:03.922
de las que hablas[br]son aquellas en las que, creo,

0:04:03.922,0:04:07.923
no hay una gran cantidad[br]de heterogeneidad en los efectos.

0:04:09.760,0:04:13.610
- [Josh] Bueno, podría haberla[br]si me permites llenar ese espacio.

0:04:13.610,0:04:15.648
- No... ni siquiera entonces.

0:04:15.648,0:04:18.506
Creo que para muchas[br]de esas intervenciones,

0:04:18.506,0:04:22.840
se espera que el efecto[br]sea del mismo signo para todos.

0:04:23.055,0:04:27.320
Puede haber pequeñas diferencias[br]en la magnitud, pero no es...

0:04:27.576,0:04:29.968
Porque muchas de estas[br]diferencias educativas

0:04:29.968,0:04:31.612
son buenas para todos.

0:04:31.612,0:04:35.932
No es que sean malas[br]para algunas personas

0:04:35.932,0:04:37.408
y buenas para otras

0:04:37.408,0:04:39.797
y en algunos pequeños casos[br]pueden ser malas.

0:04:40.189,0:04:43.633
Pero puede haber[br]algo de variación en la magnitud,

0:04:43.633,0:04:44.808
pero se necesitarían

0:04:44.808,0:04:47.019
conjuntos de datos[br]muy muy grandes para encontrarlos.

0:04:47.019,0:04:48.985
Estoy de acuerdo en que,[br]en esos casos,

0:04:48.985,0:04:51.393
probablemente no serían[br]muy procesables de todos modos.

0:04:51.881,0:04:54.075
Pero creo que hay[br]muchos otros escenarios

0:04:54.075,0:04:56.483
donde hay mucha más heterogeneidad.

0:04:56.736,0:04:59.164
- Bueno, estoy abierto[br]a esa posibilidad

0:04:59.164,0:05:00.977
y creo que el ejemplo que has dado

0:05:00.977,0:05:04.857
es esencialmente[br]un ejemplo de marketing.

0:05:05.938,0:05:09.714
- No, esos tienen[br]implicaciones para ello

0:05:09.714,0:05:11.596
y esa es la organización,

0:05:11.596,0:05:15.358
si tienes que preocuparte por la--

0:05:15.358,0:05:17.857
- Bueno, necesito[br]ver ese documento.

0:05:18.289,0:05:21.490
- Así que, la sensación[br]que tengo es que...

0:05:21.490,0:05:23.371
- Todavía no estamos de acuerdo[br]en algo.

0:05:23.371,0:05:25.735
- Sí.[br]- No hemos coincidido en todo.

0:05:25.735,0:05:27.393
- Tengo esa sensación.[br][risas]

0:05:27.393,0:05:29.047
- En realidad,[br]hemos discrepado en esto

0:05:29.047,0:05:30.729
porque no estaba para discutir.

0:05:30.729,0:05:33.144
[risas]

0:05:33.144,0:05:35.060
- ¿Se está poniendo[br]algo caluroso aquí?

0:05:35.720,0:05:37.854
- Caluroso.[br]Es bueno que esté caluroso.

0:05:37.854,0:05:39.501
La sensación que tengo es, Josh,

0:05:39.501,0:05:41.951
que no estás diciendo[br]que estás seguro

0:05:41.951,0:05:44.159
de que no hay manera[br]de que haya una aplicación

0:05:44.159,0:05:45.667
en la que estas cosas sean útiles.

0:05:45.667,0:05:47.169
Estás diciendo[br]que no estás convencido

0:05:47.169,0:05:49.444
con las aplicaciones existentes[br]hasta la fecha.

0:05:49.907,0:05:51.665
- Me parece bien.[br]- Estoy muy seguro.

0:05:51.858,0:05:54.179
[risas]

0:05:54.179,0:05:55.270
- En este caso.

0:05:55.270,0:05:56.541
- Creo que Josh tiene razón

0:05:56.541,0:06:00.101
en que incluso[br]en los casos de predicción,

0:06:00.101,0:06:03.757
donde muchos de los métodos[br]de aprendizaje automática

0:06:03.757,0:06:06.517
realmente se destacan es donde hay[br]un montón de heterogeneidad.

0:06:06.785,0:06:10.400
- No te importan mucho[br]los detalles, ¿verdad?

0:06:10.400,0:06:11.480
- [Guido] Sí.

0:06:11.480,0:06:14.752
- No tiene un ángulo normativo[br]o algo así.

0:06:14.752,0:06:17.535
- El reconocimiento[br]de dígitos escritos a mano

0:06:17.535,0:06:18.569
y demás...

0:06:18.721,0:06:23.861
lo hace mucho mejor[br]que construir un modelo complicado.

0:06:24.201,0:06:26.925
Pero muchas[br]de las ciencias sociales,

0:06:26.925,0:06:28.454
muchas[br]de las aplicaciones económicas,

0:06:28.454,0:06:29.610
en realidad sabemos mucho

0:06:29.610,0:06:32.067
sobre la relación[br]entre sus variables.

0:06:32.067,0:06:34.572
Muchas de las relaciones[br]son estrictamente monótonas.

0:06:35.399,0:06:39.266
La educación va a aumentar[br]los ingresos de la gente,

0:06:39.266,0:06:41.916
sin importar[br]las características demográficas,

0:06:41.916,0:06:44.763
sin importar[br]el nivel de educación que se tenga.

0:06:44.763,0:06:46.325
- Hasta que lleguen a un doctorado.

0:06:46.325,0:06:48.126
- ¿Eso se aplica[br]a la escuela de posgrado?

0:06:48.126,0:06:49.218
[risas]

0:06:49.218,0:06:50.593
- En un rango razonable.

0:06:50.593,0:06:55.472
No va a bajar mucho.

0:06:55.472,0:06:58.178
En muchos de los entornos[br]en los que se destacan

0:06:58.178,0:07:00.209
estos métodos[br]de aprendizaje automático,

0:07:00.209,0:07:02.081
hay mucha falta de monotonicidad,

0:07:02.081,0:07:04.598
una especie de multimodalidad[br]en estas relaciones

0:07:04.598,0:07:08.475
y van a ser muy poderosos.

0:07:08.701,0:07:11.426
Pero sigo sosteniendo lo mismo.

0:07:11.426,0:07:17.530
Estos métodos tienen mucho[br]para ofrecerles a los economistas

0:07:17.530,0:07:21.465
y serán una gran parte del futuro.

0:07:21.629,0:07:23.183
APLICACIONES[br]DEL APRENDIZAJE AUTOMÁTICO

0:07:23.183,0:07:24.814
Parece que hay[br]algo interesante por decir

0:07:24.814,0:07:26.139
sobre el aprendizaje automático.

0:07:26.139,0:07:27.412
Así que, Guido, me preguntaba

0:07:27.412,0:07:29.416
¿podría dar tal vez[br]algunos de los ejemplos

0:07:29.416,0:07:30.694
que está pensando

0:07:30.694,0:07:32.507
con las aplicaciones[br]que salen en el momento?

0:07:32.507,0:07:35.779
- Un área[br]es donde en lugar de buscar

0:07:35.779,0:07:37.235
efectos causales promedio

0:07:37.235,0:07:39.684
estamos buscando[br]estimaciones individualizadas,

0:07:39.684,0:07:43.212
predicciones de efectos causales,

0:07:43.212,0:07:45.856
y allí, los algoritmos[br]de aprendizaje automático

0:07:45.856,0:07:47.384
han sido muy eficaces.

0:07:47.958,0:07:49.892
Hasta ahora,[br]hemos hecho estas cosas

0:07:49.892,0:07:51.458
utilizando métodos de kernel,

0:07:51.458,0:07:53.846
y teóricamente, funcionan muy bien,

0:07:53.846,0:07:56.226
y hay quienes comentan[br]que, formalmente,

0:07:56.226,0:07:57.575
no se puede hacer nada mejor.

0:07:57.575,0:07:59.422
Pero en la práctica,[br]no funcionan muy bien.

0:07:59.643,0:08:03.057
Las cosas aleatorias[br]de tipo bosque causal

0:08:03.057,0:08:05.833
en las que Stefan Wager[br]y Susan Athey

0:08:05.833,0:08:09.310
han estado trabajando[br]se utilizan muy ampliamente.

0:08:09.537,0:08:11.895
Han sido muy eficaces[br]en estos entornos

0:08:11.895,0:08:14.998
para obtener efectos causales

0:08:14.998,0:08:19.118
que varían según las covariables.

0:08:19.118,0:08:23.665
Creo que esto es solo el comienzo[br]de estos métodos.

0:08:23.665,0:08:25.605
Pero en muchos casos,

0:08:27.201,0:08:29.572
estos algoritmos son muy eficaces,

0:08:29.572,0:08:31.481
como en la búsqueda[br]en grandes espacios

0:08:31.481,0:08:36.908
y encontrar las funciones[br]que se ajustan muy bien

0:08:36.908,0:08:40.444
en formas que realmente[br]no podíamos hacer antes.

0:08:41.511,0:08:42.866
- No conozco ningún ejemplo

0:08:42.866,0:08:45.379
en el que el aprendizaje automático[br]haya generado conocimientos

0:08:45.379,0:08:47.260
sobre un efecto causal[br]que me interese.

0:08:47.619,0:08:49.133
Y sí conozco ejemplos

0:08:49.133,0:08:51.106
en los que es potencialmente[br]muy engañoso.

0:08:51.485,0:08:53.487
He trabajado con Brigham Frandsen

0:08:53.487,0:08:55.916
utilizando, por ejemplo,[br]bosques aleatorios

0:08:55.916,0:08:57.943
para modelar[br]los efectos de las covariables

0:08:57.943,0:08:59.775
en un problema[br]de variables instrumentales

0:08:59.775,0:09:03.328
en el que hay que condicionar[br]las covariables.

0:09:03.710,0:09:06.456
Y no tienes[br]un sentimiento muy fuerte

0:09:06.456,0:09:08.066
sobre la forma funcional para eso,

0:09:08.066,0:09:09.845
así que tal vez[br]se debería curvar...

0:09:09.845,0:09:12.814
estar abierto[br]a un ajuste flexible de la curva.

0:09:12.977,0:09:14.484
Y eso te lleva a un camino

0:09:14.484,0:09:16.617
donde hay un montón[br]de no linealidades en el modelo,

0:09:16.617,0:09:20.063
y eso es muy peligroso con el IV

0:09:20.063,0:09:22.698
porque cualquier tipo[br]de no linealidad excluida

0:09:22.698,0:09:25.785
genera potencialmente[br]un efecto causal espurio

0:09:25.785,0:09:29.104
y Brigham y yo lo mostramos,[br]creo que muy convincentemente,

0:09:29.104,0:09:31.734
en el caso de dos instrumentos

0:09:31.734,0:09:34.963
que vienen de un trabajo mío[br]con Bill Evans,

0:09:34.963,0:09:37.295
donde si se reemplaza...

0:09:37.295,0:09:40.896
un estimador tradicional[br]de mínimos cuadrados en dos etapas

0:09:40.896,0:09:42.676
con algún tipo de bosque aleatorio,

0:09:42.676,0:09:46.745
se obtienen estimaciones[br]sin sentido muy precisas.

0:09:47.336,0:09:51.056
Creo que eso[br]es una gran advertencia.

0:09:51.348,0:09:53.381
A la vista de esos resultados,

0:09:53.381,0:09:55.332
en un ejemplo que me interese

0:09:55.332,0:09:57.009
en el que los instrumentos[br]sean muy simples

0:09:57.009,0:10:01.149
y crea que son válidos,[br]sería escéptico al respecto.

0:10:02.280,0:10:06.668
La no linealidad y el IV[br]no se mezclan muy cómodamente.

0:10:06.668,0:10:09.191
- No, parece que eso[br]ya es más complicado...

0:10:09.191,0:10:11.653
- Bueno, es IV--[br]- Sí.

0:10:11.653,0:10:15.456
- ...pero luego trabajamos en eso.[br][risas]

0:10:15.456,0:10:16.862
- Está bien.

0:10:16.862,0:10:18.645
OPORTUNIDADES[br]PARA PUBLICAR EN REVISTAS

0:10:18.645,0:10:20.047
- [Guido] Como editor[br]de Econometrica,

0:10:20.047,0:10:22.235
muchos de estos trabajos[br]llegan a mi escritorio,

0:10:22.235,0:10:26.659
pero la motivación no es clara

0:10:27.461,0:10:29.706
y, de hecho, realmente no existe.

0:10:29.883,0:10:34.875
No son... artículos fundacionales[br]de tipo semiparamétrico.

0:10:35.515,0:10:37.079
Así que, ese es un gran problema.

0:10:37.947,0:10:40.934
Un problema relacionado[br]es que, en econometría,

0:10:40.934,0:10:43.436
tenemos la tradición[br]de estar muy centrados

0:10:43.436,0:10:46.448
en estos resultados[br]asintóticos formales.

0:10:46.757,0:10:50.073
Tenemos muchos artículos

0:10:50.073,0:10:53.244
en los que la gente[br]propone un método

0:10:53.244,0:10:55.379
y luego establece[br]las propiedades asintóticas

0:10:55.379,0:10:59.260
de una manera muy estandarizada.

0:11:00.696,0:11:01.954
- ¿Es eso malo?

0:11:02.202,0:11:06.186
- Bueno,[br]creo que ha cerrado la puerta

0:11:06.186,0:11:07.834
a muchos trabajos que no encajan

0:11:07.834,0:11:11.328
en la literatura[br]del aprendizaje automático,

0:11:11.328,0:11:13.247
muchas cosas son más algorítmicas.

0:11:13.927,0:11:18.714
La gente tenía algoritmos[br]para hacer predicciones

0:11:18.714,0:11:22.049
que resultaron funcionar[br]mucho mejor que, por ejemplo,

0:11:22.049,0:11:23.629
la regresión kernel no paramétrica.

0:11:23.865,0:11:25.128
Durante mucho tiempo,

0:11:25.128,0:11:26.920
en econometría[br]hicimos toda la no paramétrica

0:11:26.920,0:11:28.753
y usamos la regresión kernel.

0:11:29.178,0:11:30.969
Y eso fue genial[br]para probar teoremas.

0:11:30.969,0:11:32.637
Podías obtener[br]intervalos de confianza,

0:11:32.637,0:11:34.567
consistencia,[br]normalidad asintótica

0:11:34.567,0:11:36.875
y todo iba genial,[br]pero no era muy útil.

0:11:37.101,0:11:39.326
Y las cosas que hicieron[br]en el aprendizaje automático

0:11:39.326,0:11:40.805
son mucho, mucho mejores.

0:11:41.054,0:11:42.766
Pero no tenían el problema...

0:11:42.766,0:11:44.961
- Ese no es mi problema[br]con el aprendizaje automático,

0:11:44.961,0:11:46.983
que la teoría sea débil.[br][risas]

0:11:47.073,0:11:50.721
- No, pero estoy diciendo[br]que en cuanto a la predicción,

0:11:50.768,0:11:52.359
lo hace mucho mejor.

0:11:52.570,0:11:54.590
- Sí, es una mejor herramienta[br]de ajuste de curvas.

0:11:54.590,0:11:58.655
- Pero lo hizo de una manera[br]que no habría hecho

0:11:58.655,0:12:02.399
que esos trabajos fueran[br]inicialmente fáciles de introducir

0:12:02.399,0:12:04.291
en las revistas de econometría,

0:12:04.291,0:12:06.715
porque no estaba probando[br]el tipo de cosas...

0:12:06.990,0:12:09.842
Cuando Breiman[br]hacía sus árboles de regresión...

0:12:09.842,0:12:11.235
simplemente no encajaban.

0:12:11.477,0:12:15.815
Creo que le habría sido muy difícil[br]publicar estas cosas

0:12:15.815,0:12:18.183
en las revistas de econometría.

0:12:20.124,0:12:23.426
Creo que nos hemos limitado[br]demasiado

0:12:23.457,0:12:27.467
y nos hemos cerrado

0:12:27.615,0:12:29.816
a muchos de estos métodos[br]de aprendizaje automático

0:12:29.816,0:12:31.117
que son realmente muy útiles.

0:12:31.292,0:12:33.625
Es decir, creo, en general,

0:12:33.625,0:12:36.614
que la literatura,[br]los científicos de la computación,

0:12:36.614,0:12:40.038
han presentado una gran cantidad[br]de estos algoritmos

0:12:40.370,0:12:42.635
han propuesto[br]una gran cantidad de algoritmos

0:12:42.635,0:12:44.465
que realmente son muy útiles

0:12:44.465,0:12:48.792
y que están afectando la forma[br]en que haremos el trabajo empírico.

0:12:49.194,0:12:52.014
Pero no lo hemos interiorizado[br]del todo

0:12:52.014,0:12:54.050
porque todavía[br]estamos muy centrados

0:12:54.050,0:12:56.276
en obtener estimaciones puntuales

0:12:56.276,0:12:59.967
y obtener errores estándar[br]y obtener valores P

0:12:59.967,0:13:02.796
de una manera[br]que necesitamos superar

0:13:02.796,0:13:08.257
para aprovechar plenamente[br]la fuerza, los beneficios

0:13:08.257,0:13:10.564
de la literatura[br]de aprendizaje automático.

0:13:11.374,0:13:14.184
- Por un lado, creo que entiendo[br]tu punto de vista

0:13:14.184,0:13:16.738
de que el marco tradicional[br]de la econometría

0:13:16.738,0:13:19.734
de proponer un método,[br]demostrar un teorema límite

0:13:19.734,0:13:23.403
bajo alguna historia asintótica,[br]y otra, y otra y otra...

0:13:23.659,0:13:26.969
...y luego publicar el documento[br]es restrictivo,

0:13:26.969,0:13:28.805
y que, en cierto sentido,

0:13:28.805,0:13:30.301
al pensar más ampliamente

0:13:30.301,0:13:31.862
sobre cómo podría ser[br]un documento de métodos,

0:13:31.862,0:13:33.578
podemos escribir, en cierto sentido,

0:13:33.578,0:13:35.129
desde luego que la literatura[br]de aprendizaje automático

0:13:35.129,0:13:36.220
ha encontrado[br]un montón de cosas

0:13:36.220,0:13:38.269
que parecen funcionar bastante[br]bien para una serie de problemas

0:13:38.269,0:13:41.053
y ahora están influyendo[br]sustancialmente en la economía.

0:13:41.391,0:13:43.339
Supongo que una pregunta[br]que me interesa

0:13:43.339,0:13:46.278
es cómo piensas en el papel de...

0:13:46.792,0:13:50.990
¿Crees que no hay valor[br]en la parte de la teoría?

0:13:50.990,0:13:52.174
Porque supongo

0:13:52.174,0:13:54.118
que una pregunta[br]que a menudo me hago

0:13:54.118,0:13:55.729
al ver el resultado

0:13:55.729,0:13:57.273
de una herramienta[br]de aprendizaje automático--

0:13:57.273,0:13:59.397
y en realidad, varios de los métodos[br]de los que hablaste

0:13:59.397,0:14:01.759
tienen resultados inferenciales[br]desarrollados para ellos--

0:14:01.759,0:14:03.918
algo que siempre me pregunto,

0:14:03.918,0:14:05.642
una especie de cuantificación[br]de la incertidumbre

0:14:05.642,0:14:06.735
y simplemente...

0:14:06.735,0:14:07.801
Tengo mi...

0:14:07.801,0:14:09.743
vengo al mundo[br]con mi punto de vista,

0:14:09.743,0:14:11.072
veo el resultado de esta cosa.

0:14:11.072,0:14:12.633
¿Cómo debo actualizar[br]en función de eso?

0:14:12.633,0:14:14.341
Y en cierto sentido,[br]si estoy en un mundo

0:14:14.341,0:14:16.025
donde las cosas[br]se distribuyen normalmente,

0:14:16.025,0:14:17.191
sé cómo hacerlo.

0:14:17.191,0:14:18.350
Aquí no.

0:14:18.350,0:14:21.016
Así que me interesa escuchar[br]lo que piensas al respecto.

9:59:59.000,9:59:59.000
- No veo esto como si fuera decir

9:59:59.000,9:59:59.000
que estos resultados[br]no son interesantes,

9:59:59.000,9:59:59.000
pero habrá un montón de casos

9:59:59.000,9:59:59.000
en los que va a ser[br]increíblemente difícil

9:59:59.000,9:59:59.000
obtener esos resultados

9:59:59.000,9:59:59.000
y puede que no seamos capaces[br]de llegar allí

9:59:59.000,9:59:59.000
y puede que tengamos que hacerlo[br]en etapas donde primero alguien dice

9:59:59.000,9:59:59.000
"Oye, tengo este algoritmo interesante[br]para hacer algo",

9:59:59.000,9:59:59.000
y funciona bien por algún criterio[br]en este conjunto de datos en particular,

9:59:59.000,9:59:59.000
y debemos ponerlo ahí.

9:59:59.000,9:59:59.000
Y tal vez alguien descubra una forma

9:59:59.000,9:59:59.000
en la que más tarde[br]se pueda seguir haciendo inferencia

9:59:59.000,9:59:59.000
bajo algunas condiciones,

9:59:59.000,9:59:59.000
y tal vez no sean condiciones[br]particularmente realistas.

9:59:59.000,9:59:59.000
Entonces, podemos ir más allá.

9:59:59.000,9:59:59.000
Pero creo que hemos estado restringiendo demasiado las cosas donde dijimos:

9:59:59.000,9:59:59.000
"Este es el tipo de cosas que tenemos que hacer".

9:59:59.000,9:59:59.000
Y en cierto sentido, eso se remonta[br]a la forma en que Josh y yo

9:59:59.000,9:59:59.000
pensamos en las cosas[br]para el efecto del tratamiento promedio local.

9:59:59.000,9:59:59.000
Esa no era la forma[br]en que la gente pensaba

9:59:59.000,9:59:59.000
en estos problemas anteriormente.

9:59:59.000,9:59:59.000
Había una sensación

9:59:59.000,9:59:59.000
de que algunas personas[br]decían que la forma de hacer estas cosas

9:59:59.000,9:59:59.000
es decir primero lo que te interesa estimar y luego hacer lo mejor que puedas en la estimación.

9:59:59.000,9:59:59.000
Y lo que ustedes hacen[br]es hacerlo al revés.

9:59:59.000,9:59:59.000
Ustedes dicen: "Aquí tengo[br]un estimador

9:59:59.000,9:59:59.000
y ahora voy a averiguar[br]lo que está estimando".

9:59:59.000,9:59:59.000
Y supongo que vas a decir[br]por qué crees que es interesante

9:59:59.000,9:59:59.000
o tal vez por qué no es interesante[br]y eso no está bien.

9:59:59.000,9:59:59.000
No está permitido[br]hacerlo de esa manera.

9:59:59.000,9:59:59.000
Y creo que deberíamos ser[br]un poco más flexibles

9:59:59.000,9:59:59.000
a la hora de pensar[br]en cómo ver los problemas

9:59:59.000,9:59:59.000
porque creo que nos hemos perdido[br]algunas cosas por no hacer eso.

9:59:59.000,9:59:59.000
♪ (música) ♪

9:59:59.000,9:59:59.000
- [Josh] Así que has escuchado[br]nuestros puntos de vista, Isaiah,

9:59:59.000,9:59:59.000
y has visto que no estamos de acuerdo en algunos puntos.

9:59:59.000,9:59:59.000
¿Por qué no nos arbitras[br]esta disputa? [risas]

9:59:59.000,9:59:59.000
- Oh, es tan amable de tu parte el hacerme una pequeña pregunta. [risas]

9:59:59.000,9:59:59.000
Así que supongo que, por un lado,

9:59:59.000,9:59:59.000
estoy muy de acuerdo con algo[br]que Guido dijo antes de... [risas]

9:59:59.000,9:59:59.000
Así que una cosa[br]en la que el asunto del aprendizaje automático

9:59:59.000,9:59:59.000
parece relativamente claro

9:59:59.000,9:59:59.000
es en los entornos[br]donde nos interesa

9:59:59.000,9:59:59.000
alguna versión de un problema[br]de predicción no paramétrica.

9:59:59.000,9:59:59.000
Así que estoy interesado[br]en la estimación de una expectativa condicional o probabilidad condicional,

9:59:59.000,9:59:59.000
y en el pasado,[br]tal vez habría utilizado un kernel...

9:59:59.000,9:59:59.000
Habría utilizado[br]una regresión kernel

9:59:59.000,9:59:59.000
o habría utilizado una regresión[br]en serie, o algo por el estilo.

9:59:59.000,9:59:59.000
Parece que, en este momento,

9:59:59.000,9:59:59.000
tenemos una idea bastante clara

9:59:59.000,9:59:59.000
de que,[br]en una amplia gama de aplicaciones,

9:59:59.000,9:59:59.000
los métodos de aprendizaje automático

9:59:59.000,9:59:59.000
parecen funcionar mejor

9:59:59.000,9:59:59.000
para estimar las funciones[br]de media condicional,

9:59:59.000,9:59:59.000
o las probabilidades condicionales,

9:59:59.000,9:59:59.000
o varios otros objetos no paramétricos

9:59:59.000,9:59:59.000
que los métodos no paramétricos[br]más tradicionales

9:59:59.000,9:59:59.000
que se estudiaron[br]en econometría y estadística,

9:59:59.000,9:59:59.000
especialmente en entornos

9:59:59.000,9:59:59.000
de alta dimensión.

9:59:59.000,9:59:59.000
- ¿Así que, estás pensando[br]en la puntuación de propensión

9:59:59.000,9:59:59.000
o algo así?

9:59:59.000,9:59:59.000
- Sí, exactamente.[br]- Funciones de molestia.

9:59:59.000,9:59:59.000
- Sí, cosas[br]como las puntuaciones de propensión.

9:59:59.000,9:59:59.000
Incluso objetos[br]de interés más directo,

9:59:59.000,9:59:59.000
como los efectos de tratamiento promedio condicional,

9:59:59.000,9:59:59.000
que son la diferencia de dos funciones[br]de expectativa condicional,

9:59:59.000,9:59:59.000
potencialmente cosas así.

9:59:59.000,9:59:59.000
Por supuesto, incluso allí,[br]la teoría...

9:59:59.000,9:59:59.000
para la inferencia de la teoría[br]de cómo interpretar,

9:59:59.000,9:59:59.000
cómo hacer declaraciones[br]de muestras grandes

9:59:59.000,9:59:59.000
sobre algunas de estas cosas[br]están menos desarrolladas

9:59:59.000,9:59:59.000
dependiendo del estimador[br]de aprendizaje automático utilizado.

9:59:59.000,9:59:59.000
Y así, creo que algo[br]que es complicado

9:59:59.000,9:59:59.000
es que podemos tener[br]estos métodos,

9:59:59.000,9:59:59.000
que funcionan mucho...

9:59:59.000,9:59:59.000
que parecen funcionar mucho mejor[br]para algunos fines,

9:59:59.000,9:59:59.000
pero que tenemos que ser[br]un poco cuidadosos

9:59:59.000,9:59:59.000
en cómo los incorporamos

9:59:59.000,9:59:59.000
o cómo interpretamos[br]las declaraciones resultantes.

9:59:59.000,9:59:59.000
Pero, por supuesto,[br]esa es un área muy, muy activa

9:59:59.000,9:59:59.000
ahora mismo donde la gente[br]está haciendo toneladas de gran trabajo.

9:59:59.000,9:59:59.000
Así que espero ver[br]mucho más en el futuro.

9:59:59.000,9:59:59.000
Un problema[br]con el aprendizaje automático

9:59:59.000,9:59:59.000
que siempre parece un peligro es...

9:59:59.000,9:59:59.000
o que a veces es un peligro

9:59:59.000,9:59:59.000
y que a veces ha llevado

9:59:59.000,9:59:59.000
a aplicaciones[br]que han tenido menos sentido

9:59:59.000,9:59:59.000
es cuando la gente empieza[br]con un método que les entusiasma mucho en lugar de una pregunta.

9:59:59.000,9:59:59.000
Así que empezar con una pregunta

9:59:59.000,9:59:59.000
donde aquí está el objeto[br]que me interesa,

9:59:59.000,9:59:59.000
aquí está el parámetro de interés--

9:59:59.000,9:59:59.000
déjame pensar[br]en cómo identificaría esa cosa,

9:59:59.000,9:59:59.000
cómo recuperaría esa cosa[br]si tuviera una tonelada de datos.

9:59:59.000,9:59:59.000
Oh, aquí hay una función[br]de expectativa condicional,

9:59:59.000,9:59:59.000
permítanme conectar[br]un estimador de aprendizaje automático para eso--

9:59:59.000,9:59:59.000
eso parece muy muy sensato.

9:59:59.000,9:59:59.000
Mientras que, ya sabes,[br]si hago una regresión de la cantidad sobre el precio

9:59:59.000,9:59:59.000
y digo que he utilizado[br]un método de aprendizaje automático,

9:59:59.000,9:59:59.000
tal vez estoy satisfecho[br]de que eso resuelva

9:59:59.000,9:59:59.000
el problema de endogeneidad[br]que normalmente nos preocupa allí--

9:59:59.000,9:59:59.000
tal vez no lo estoy.

9:59:59.000,9:59:59.000
Pero, de nuevo,[br]es algo en lo que la forma de abordarlo

9:59:59.000,9:59:59.000
parece relativamente clara.

9:59:59.000,9:59:59.000
Es encontrar tu objeto de interés[br]y pensar en...

9:59:59.000,9:59:59.000
- Solo trae la economía.[br]- Exactamente.

9:59:59.000,9:59:59.000
- Y pensar en la heterogeneidad,[br]pero aprovechar

9:59:59.000,9:59:59.000
el poder de los métodos[br]de aprendizaje automático

9:59:59.000,9:59:59.000
para algunos de los componentes.

9:59:59.000,9:59:59.000
- Precisamente.

9:59:59.000,9:59:59.000
Exactamente.

9:59:59.000,9:59:59.000
Así que la cuestión de interés[br]es la misma que siempre ha sido,

9:59:59.000,9:59:59.000
pero ahora tenemos mejores métodos[br]para estimar algunas piezas de esto.

9:59:59.000,9:59:59.000
El lugar que parece[br]más difícil de pronosticar

9:59:59.000,9:59:59.000
es, obviamente, hay una gran cantidad en la literatura de aprendizaje automático

9:59:59.000,9:59:59.000
y las formas limitadas de enchufar[br]que he referido hasta ahora son una pieza limitada de eso.

9:59:59.000,9:59:59.000
Así que creo[br]que hay todo tipo de otras preguntas interesantes sobre dónde... dónde va esta interacción?

9:59:59.000,9:59:59.000
¿Qué más podemos aprender?

9:59:59.000,9:59:59.000
Y eso es algo[br]en lo que creo que hay una tonelada en marcha, que parece muy prometedor, y no tengo ni idea de cuál es la respuesta.

9:59:59.000,9:59:59.000
- No, estoy totalmente de acuerdo con eso,

9:59:59.000,9:59:59.000
pero eso lo hace muy emocionante.

9:59:59.000,9:59:59.000
Y creo que solo hay un poco de trabajo por hacer allí.

9:59:59.000,9:59:59.000
Muy bien. Así que Isaiah está de acuerdo conmigo allí. [risas]

9:59:59.000,9:59:59.000
- Yo no he dicho que por sí mismo. ♪ [música] ♪

9:59:59.000,9:59:59.000
- [Narradora] Si desea ver más[br]de Nobel Conversations,

9:59:59.000,9:59:59.000
haga clic aquí.

9:59:59.000,9:59:59.000
O si quieres aprender más[br]sobre econometría,

9:59:59.000,9:59:59.000
echa un vistazo[br]a la serie Mastering Econometrics de Josh.

9:59:59.000,9:59:59.000
Si quiere saber más[br]sobre Guido, Josh e Isaiah,

9:59:59.000,9:59:59.000
consulte los enlaces[br]en la descripción.