< Return to Video

¿Cómo impactará el aprendizaje automático en la economía?

  • 0:00 - 0:03
    ♪ (música) ♪
  • 0:03 - 0:06
    - [Narradora] Bienvenidos
    a Nobel Conversations.
  • 0:07 - 0:10
    En este episodio,
    Josh Angrist y Guido Imbens
  • 0:10 - 0:13
    se reúnen con Isaiah Andrews
    para discutir y discrepar
  • 0:13 - 0:15
    sobre el papel
    del aprendizaje automático
  • 0:15 - 0:17
    en la econometría aplicada.
  • 0:18 - 0:20
    - [Isaiah] Bien. Por supuesto
    que hay muchos temas
  • 0:20 - 0:21
    en los que ustedes
    están muy de acuerdo,
  • 0:21 - 0:23
    pero me gustaría pasar a uno
  • 0:23 - 0:24
    sobre el que tal vez
    opinen algo distinto.
  • 0:24 - 0:26
    Me gustaría escuchar
    algunas de sus opiniones
  • 0:26 - 0:27
    sobre el aprendizaje automático
  • 0:27 - 0:30
    y el papel que desempeña
    y desempeñará en la economía.
  • 0:30 - 0:32
    - [Guido] He consultado
    algunos datos,
  • 0:32 - 0:33
    como los datos privados.
  • 0:33 - 0:35
    Vemos que no hay
    ningún documento publicado allí.
  • 0:36 - 0:39
    Se hizo un experimento
    sobre algún algoritmo de búsqueda
  • 0:39 - 0:41
    y la cuestión era...
  • 0:43 - 0:45
    se trataba de clasificar cosas
    y cambiar la clasificación.
  • 0:46 - 0:47
    Y estaba más o menos claro
  • 0:47 - 0:50
    que iba a haber
    mucha heterogeneidad.
  • 0:51 - 0:56
    Si buscas, digamos,
  • 0:58 - 1:01
    una foto de Britney Spears,
  • 1:01 - 1:03
    realmente no importa
    dónde la clasifiques
  • 1:03 - 1:05
    porque vas a encontrar
    lo que estás buscando,
  • 1:06 - 1:07
    ya sea que la clasifiques
  • 1:07 - 1:10
    en primera, segunda
    o tercera posición.
  • 1:10 - 1:12
    Pero si estás buscando
    el mejor libro de econometría,
  • 1:12 - 1:17
    si pones tu libro en primer lugar
    o en el décimo,
  • 1:17 - 1:18
    eso va a suponer
    una gran diferencia
  • 1:18 - 1:20
    en la frecuencia
  • 1:20 - 1:21
    con la que la gente
    hará clic en él.
  • 1:22 - 1:23
    Así que ahí--
  • 1:23 - 1:24
    [Josh] ¿Por qué necesito
  • 1:24 - 1:27
    el aprendizaje automático
    para descubrir eso?
  • 1:27 - 1:29
    Porque parece que puedo descubrirlo
    de forma sencilla.
  • 1:29 - 1:31
    - [Guido] En general--
  • 1:31 - 1:32
    - [Josh] Había
    un montón de posibles--
  • 1:32 - 1:34
    - [Guido]...quieres pensar
    que los artículos
  • 1:34 - 1:37
    tienen montón de características,
  • 1:37 - 1:39
    que quieres entender
  • 1:39 - 1:44
    lo que impulsa la heterogeneidad
    en el efecto de--
  • 1:44 - 1:45
    - Pero solo estás prediciendo.
  • 1:45 - 1:46
    En cierto sentido,
  • 1:46 - 1:48
    estás resolviendo
    un problema de marketing.
  • 1:48 - 1:49
    - No, es un efecto causal,
  • 1:49 - 1:52
    - Es causal, pero no tiene
    contenido científico.
  • 1:52 - 1:53
    Piensa en--
  • 1:54 - 1:57
    - No, pero hay cosas similares
    en el ámbito médico.
  • 1:58 - 1:59
    Si haces un experimento,
  • 1:59 - 2:02
    puedes estar muy interesado
    en si el tratamiento funciona
  • 2:02 - 2:04
    para algunos grupos o no.
  • 2:04 - 2:06
    Y tienes un montón
    de características individuales,
  • 2:06 - 2:08
    y quieres buscar sistemáticamente--
  • 2:08 - 2:10
    - Sí. Tengo mis dudas sobre esa...
  • 2:10 - 2:13
    esa especie de idea de que hay
    un efecto causal personal
  • 2:13 - 2:14
    que me debería importar
  • 2:14 - 2:15
    y que el aprendizaje automático
  • 2:15 - 2:17
    puede descubrirlo
    de alguna manera que sea útil.
  • 2:18 - 2:19
    Así que piensa en--
  • 2:19 - 2:20
    he trabajado mucho en las escuelas,
  • 2:20 - 2:22
    yendo a, digamos,
    una escuela chárter,
  • 2:22 - 2:24
    una escuela privada
    financiada con fondos públicos,
  • 2:25 - 2:27
    efectivamente,
    que es libre de estructurar
  • 2:27 - 2:30
    su propio plan de estudios
    en función del contexto.
  • 2:30 - 2:31
    Algunos tipos de escuelas chárter
  • 2:31 - 2:33
    consiguen
    un rendimiento espectacular
  • 2:33 - 2:36
    y en el conjunto de datos
    que produce ese resultado,
  • 2:36 - 2:38
    tengo un montón de covariables.
  • 2:38 - 2:40
    Tengo
    las puntuaciones de referencia
  • 2:40 - 2:41
    y los antecedentes familiares,
  • 2:41 - 2:46
    la educación de los padres,
    el sexo del niño, la raza del niño.
  • 2:46 - 2:50
    Y, bueno, en cuanto reúno
    media docena de ellas,
  • 2:50 - 2:52
    tengo un espacio
    de muy alta dimensión.
  • 2:52 - 2:55
    Sin duda, me interesan
    las características del curso
  • 2:55 - 2:57
    de ese efecto del tratamiento,
  • 2:57 - 2:59
    como por ejemplo, si es mejor
    para las personas
  • 2:59 - 3:02
    que provienen de familias
    con menores ingresos.
  • 3:02 - 3:06
    Me cuesta creer
    que haya una aplicación
  • 3:06 - 3:10
    para la versión
    de muy alta dimensión,
  • 3:10 - 3:12
    en la que descubrí
    que para los niños no blancos
  • 3:12 - 3:15
    que tienen
    ingresos familiares altos
  • 3:15 - 3:18
    pero puntuaciones de referencia
    en el tercer cuartil
  • 3:18 - 3:21
    y que solo fueron
    a la escuela pública
  • 3:21 - 3:23
    en el tercer grado
    pero no en el sexto.
  • 3:23 - 3:26
    Así que eso es lo que produce
    ese análisis de alta dimensión.
  • 3:26 - 3:28
    Es una declaración condicional
    muy elaborada.
  • 3:28 - 3:31
    Hay dos cosas que están mal,
    en mi opinión.
  • 3:31 - 3:32
    En primer lugar, no lo veo como--
  • 3:32 - 3:34
    no puedo imaginar
    por qué es algo procesable.
  • 3:34 - 3:37
    No sé por qué
    querrías actuar sobre ello.
  • 3:37 - 3:39
    Y también sé que hay
    algún modelo alternativo
  • 3:39 - 3:43
    que encaja casi igual de bien,
    que lo invierte todo.
  • 3:43 - 3:45
    Porque el aprendizaje automático
  • 3:45 - 3:48
    no me dice que este es realmente
    el predictor que importa,
  • 3:48 - 3:51
    solo me dice
    que este es un buen predictor.
  • 3:51 - 3:55
    Así que creo,
    que hay algo diferente
  • 3:55 - 3:58
    en el contexto
    de las ciencias sociales.
  • 3:58 - 4:00
    - [Guido] Creo que las aplicaciones
    de las ciencias sociales
  • 4:00 - 4:04
    de las que hablas
    son aquellas en las que, creo,
  • 4:04 - 4:08
    no hay una gran cantidad
    de heterogeneidad en los efectos.
  • 4:10 - 4:14
    - [Josh] Bueno, podría haberla
    si me permites llenar ese espacio.
  • 4:14 - 4:16
    - No... ni siquiera entonces.
  • 4:16 - 4:19
    Creo que para muchas
    de esas intervenciones,
  • 4:19 - 4:23
    se espera que el efecto
    sea del mismo signo para todos.
  • 4:23 - 4:27
    Puede haber pequeñas diferencias
    en la magnitud, pero no es...
  • 4:28 - 4:30
    Porque muchas de estas
    diferencias educativas
  • 4:30 - 4:32
    son buenas para todos.
  • 4:32 - 4:36
    No es que sean malas
    para algunas personas
  • 4:36 - 4:37
    y buenas para otras
  • 4:37 - 4:40
    y en algunos pequeños casos
    pueden ser malas.
  • 4:40 - 4:44
    Pero puede haber
    algo de variación en la magnitud,
  • 4:44 - 4:45
    pero se necesitarían
  • 4:45 - 4:47
    conjuntos de datos
    muy muy grandes para encontrarlos.
  • 4:47 - 4:49
    Estoy de acuerdo en que,
    en esos casos,
  • 4:49 - 4:51
    probablemente no serían
    muy procesables de todos modos.
  • 4:52 - 4:54
    Pero creo que hay
    muchos otros escenarios
  • 4:54 - 4:56
    donde hay mucha más heterogeneidad.
  • 4:57 - 4:59
    - Bueno, estoy abierto
    a esa posibilidad
  • 4:59 - 5:01
    y creo que el ejemplo que has dado
  • 5:01 - 5:05
    es esencialmente
    un ejemplo de marketing.
  • 5:06 - 5:10
    - No, esos tienen
    implicaciones para ello
  • 5:10 - 5:12
    y esa es la organización,
  • 5:12 - 5:15
    si tienes que preocuparte por la--
  • 5:15 - 5:18
    - Bueno, necesito
    ver ese documento.
  • 5:18 - 5:21
    - Así que, la sensación
    que tengo es que...
  • 5:21 - 5:23
    - Todavía no estamos de acuerdo
    en algo.
  • 5:23 - 5:26
    - Sí.
    - No hemos coincidido en todo.
  • 5:26 - 5:27
    - Tengo esa sensación.
    [risas]
  • 5:27 - 5:29
    - En realidad,
    hemos discrepado en esto
  • 5:29 - 5:31
    porque no estaba para discutir.
  • 5:31 - 5:33
    [risas]
  • 5:33 - 5:35
    - ¿Se está poniendo
    algo caluroso aquí?
  • 5:36 - 5:38
    - Caluroso.
    Es bueno que esté caluroso.
  • 5:38 - 5:40
    La sensación que tengo es, Josh,
  • 5:40 - 5:42
    que no estás diciendo
    que estás seguro
  • 5:42 - 5:44
    de que no hay manera
    de que haya una aplicación
  • 5:44 - 5:46
    en la que estas cosas sean útiles.
  • 5:46 - 5:47
    Estás diciendo
    que no estás convencido
  • 5:47 - 5:49
    con las aplicaciones existentes
    hasta la fecha.
  • 5:50 - 5:52
    - Me parece bien.
    - Estoy muy seguro.
  • 5:52 - 5:54
    [risas]
  • 5:54 - 5:55
    - En este caso.
  • 5:55 - 5:57
    - Creo que Josh tiene razón
  • 5:57 - 6:00
    en que incluso
    en los casos de predicción,
  • 6:00 - 6:04
    donde muchos de los métodos
    de aprendizaje automática
  • 6:04 - 6:07
    realmente se destacan es donde hay
    un montón de heterogeneidad.
  • 6:07 - 6:10
    - No te importan mucho
    los detalles, ¿verdad?
  • 6:10 - 6:11
    - [Guido] Sí.
  • 6:11 - 6:15
    - No tiene un ángulo normativo
    o algo así.
  • 6:15 - 6:18
    - El reconocimiento
    de dígitos escritos a mano
  • 6:18 - 6:19
    y demás...
  • 6:19 - 6:24
    lo hace mucho mejor
    que construir un modelo complicado.
  • 6:24 - 6:27
    Pero muchas
    de las ciencias sociales,
  • 6:27 - 6:28
    muchas
    de las aplicaciones económicas,
  • 6:28 - 6:30
    en realidad sabemos mucho
  • 6:30 - 6:32
    sobre la relación
    entre sus variables.
  • 6:32 - 6:35
    Muchas de las relaciones
    son estrictamente monótonas.
  • 6:35 - 6:39
    La educación va a aumentar
    los ingresos de la gente,
  • 6:39 - 6:42
    sin importar
    las características demográficas,
  • 6:42 - 6:45
    sin importar
    el nivel de educación que se tenga.
  • 6:45 - 6:46
    - Hasta que lleguen a un doctorado.
  • 6:46 - 6:48
    - ¿Eso se aplica
    a la escuela de posgrado?
  • 6:48 - 6:49
    [risas]
  • 6:49 - 6:51
    - En un rango razonable.
  • 6:51 - 6:55
    No va a bajar mucho.
  • 6:55 - 6:58
    En muchos de los entornos
    en los que se destacan
  • 6:58 - 7:00
    estos métodos
    de aprendizaje automático,
  • 7:00 - 7:02
    hay mucha falta de monotonicidad,
  • 7:02 - 7:05
    una especie de multimodalidad
    en estas relaciones
  • 7:05 - 7:08
    y van a ser muy poderosos.
  • 7:09 - 7:11
    Pero sigo sosteniendo lo mismo.
  • 7:11 - 7:18
    Estos métodos tienen mucho
    para ofrecerles a los economistas
  • 7:18 - 7:21
    y serán una gran parte del futuro.
  • 7:22 - 7:23
    APLICACIONES
    DEL APRENDIZAJE AUTOMÁTICO
  • 7:23 - 7:25
    Parece que hay
    algo interesante por decir
  • 7:25 - 7:26
    sobre el aprendizaje automático.
  • 7:26 - 7:27
    Así que, Guido, me preguntaba
  • 7:27 - 7:29
    ¿podría dar tal vez
    algunos de los ejemplos
  • 7:29 - 7:31
    que está pensando
  • 7:31 - 7:33
    con las aplicaciones
    que salen en el momento?
  • 7:33 - 7:36
    - Un área
    es donde en lugar de buscar
  • 7:36 - 7:37
    efectos causales promedio
  • 7:37 - 7:40
    estamos buscando
    estimaciones individualizadas,
  • 7:40 - 7:43
    predicciones de efectos causales,
  • 7:43 - 7:46
    y allí, los algoritmos
    de aprendizaje automático
  • 7:46 - 7:47
    han sido muy eficaces.
  • 7:48 - 7:50
    Hasta ahora,
    hemos hecho estas cosas
  • 7:50 - 7:51
    utilizando métodos de kernel,
  • 7:51 - 7:54
    y teóricamente, funcionan muy bien,
  • 7:54 - 7:56
    y hay quienes comentan
    que, formalmente,
  • 7:56 - 7:58
    no se puede hacer nada mejor.
  • 7:58 - 7:59
    Pero en la práctica,
    no funcionan muy bien.
  • 8:00 - 8:03
    Las cosas aleatorias
    de tipo bosque causal
  • 8:03 - 8:06
    en las que Stefan Wager
    y Susan Athey
  • 8:06 - 8:09
    han estado trabajando
    se utilizan muy ampliamente.
  • 8:10 - 8:12
    Han sido muy eficaces
    en estos entornos
  • 8:12 - 8:15
    para obtener efectos causales
  • 8:15 - 8:19
    que varían según las covariables.
  • 8:19 - 8:24
    Creo que esto es solo el comienzo
    de estos métodos.
  • 8:24 - 8:26
    Pero en muchos casos,
  • 8:27 - 8:30
    estos algoritmos son muy eficaces,
  • 8:30 - 8:31
    como en la búsqueda
    en grandes espacios
  • 8:31 - 8:37
    y encontrar las funciones
    que se ajustan muy bien
  • 8:37 - 8:40
    en formas que realmente
    no podíamos hacer antes.
  • 8:42 - 8:43
    - No conozco ningún ejemplo
  • 8:43 - 8:45
    en el que el aprendizaje automático
    haya generado conocimientos
  • 8:45 - 8:47
    sobre un efecto causal
    que me interese.
  • 8:48 - 8:49
    Y sí conozco ejemplos
  • 8:49 - 8:51
    en los que es potencialmente
    muy engañoso.
  • 8:51 - 8:53
    He trabajado con Brigham Frandsen
  • 8:53 - 8:56
    utilizando, por ejemplo,
    bosques aleatorios
  • 8:56 - 8:58
    para modelar
    los efectos de las covariables
  • 8:58 - 9:00
    en un problema
    de variables instrumentales
  • 9:00 - 9:03
    en el que hay que condicionar
    las covariables.
  • 9:04 - 9:06
    Y no tienes
    un sentimiento muy fuerte
  • 9:06 - 9:08
    sobre la forma funcional para eso,
  • 9:08 - 9:10
    así que tal vez
    se debería curvar...
  • 9:10 - 9:13
    estar abierto
    a un ajuste flexible de la curva.
  • 9:13 - 9:14
    Y eso te lleva a un camino
  • 9:14 - 9:17
    donde hay un montón
    de no linealidades en el modelo,
  • 9:17 - 9:20
    y eso es muy peligroso con el IV
  • 9:20 - 9:23
    porque cualquier tipo
    de no linealidad excluida
  • 9:23 - 9:26
    genera potencialmente
    un efecto causal espurio
  • 9:26 - 9:29
    y Brigham y yo lo mostramos,
    creo que muy convincentemente,
  • 9:29 - 9:32
    en el caso de dos instrumentos
  • 9:32 - 9:35
    que vienen de un trabajo mío
    con Bill Evans,
  • 9:35 - 9:37
    donde si se reemplaza...
  • 9:37 - 9:41
    un estimador tradicional
    de mínimos cuadrados en dos etapas
  • 9:41 - 9:43
    con algún tipo de bosque aleatorio,
  • 9:43 - 9:47
    se obtienen estimaciones
    sin sentido muy precisas.
  • 9:47 - 9:51
    Creo que eso
    es una gran advertencia.
  • 9:51 - 9:53
    A la vista de esos resultados,
  • 9:53 - 9:55
    en un ejemplo que me interese
  • 9:55 - 9:57
    en el que los instrumentos
    sean muy simples
  • 9:57 - 10:01
    y crea que son válidos,
    sería escéptico al respecto.
  • 10:02 - 10:07
    La no linealidad y el IV
    no se mezclan muy cómodamente.
  • 10:07 - 10:09
    - No, parece que eso
    ya es más complicado...
  • 10:09 - 10:12
    - Bueno, es IV--
    - Sí.
  • 10:12 - 10:15
    - ...pero luego trabajamos en eso.
    [risas]
  • 10:15 - 10:17
    - Está bien.
  • 10:17 - 10:19
    OPORTUNIDADES
    PARA PUBLICAR EN REVISTAS
  • 10:19 - 10:20
    - [Guido] Como editor
    de Econometrica,
  • 10:20 - 10:22
    muchos de estos trabajos
    llegan a mi escritorio,
  • 10:22 - 10:27
    pero la motivación no es clara
  • 10:27 - 10:30
    y, de hecho, realmente no existe.
  • 10:30 - 10:35
    No son... artículos fundacionales
    de tipo semiparamétrico.
  • 10:36 - 10:37
    Así que, ese es un gran problema.
  • 10:38 - 10:41
    Un problema relacionado
    es que, en econometría,
  • 10:41 - 10:43
    tenemos la tradición
    de estar muy centrados
  • 10:43 - 10:46
    en estos resultados
    asintóticos formales.
  • 10:47 - 10:50
    Tenemos muchos artículos
  • 10:50 - 10:53
    en los que la gente
    propone un método
  • 10:53 - 10:55
    y luego establece
    las propiedades asintóticas
  • 10:55 - 10:59
    de una manera muy estandarizada.
  • 11:01 - 11:02
    - ¿Es eso malo?
  • 11:02 - 11:06
    - Bueno,
    creo que ha cerrado la puerta
  • 11:06 - 11:08
    a muchos trabajos que no encajan
  • 11:08 - 11:11
    en la literatura
    del aprendizaje automático,
  • 11:11 - 11:13
    muchas cosas son más algorítmicas.
  • 11:14 - 11:19
    La gente tenía algoritmos
    para hacer predicciones
  • 11:19 - 11:22
    que resultaron funcionar
    mucho mejor que, por ejemplo,
  • 11:22 - 11:24
    la regresión kernel no paramétrica.
  • 11:24 - 11:25
    Durante mucho tiempo,
  • 11:25 - 11:27
    en econometría
    hicimos toda la no paramétrica
  • 11:27 - 11:29
    y usamos la regresión kernel.
  • 11:29 - 11:31
    Y eso fue genial
    para probar teoremas.
  • 11:31 - 11:33
    Podías obtener
    intervalos de confianza,
  • 11:33 - 11:35
    consistencia,
    normalidad asintótica
  • 11:35 - 11:37
    y todo iba genial,
    pero no era muy útil.
  • 11:37 - 11:39
    Y las cosas que hicieron
    en el aprendizaje automático
  • 11:39 - 11:41
    son mucho, mucho mejores.
  • 11:41 - 11:43
    Pero no tenían el problema...
  • 11:43 - 11:45
    - Ese no es mi problema
    con el aprendizaje automático,
  • 11:45 - 11:47
    que la teoría sea débil.
    [risas]
  • 11:47 - 11:51
    - No, pero estoy diciendo
    que en cuanto a la predicción,
  • 11:51 - 11:52
    lo hace mucho mejor.
  • 11:53 - 11:55
    - Sí, es una mejor herramienta
    de ajuste de curvas.
  • 11:55 - 11:59
    - Pero lo hizo de una manera
    que no habría hecho
  • 11:59 - 12:02
    que esos trabajos fueran
    inicialmente fáciles de introducir
  • 12:02 - 12:04
    en las revistas de econometría,
  • 12:04 - 12:07
    porque no estaba probando
    el tipo de cosas...
  • 12:07 - 12:10
    Cuando Breiman
    hacía sus árboles de regresión...
  • 12:10 - 12:11
    simplemente no encajaban.
  • 12:11 - 12:16
    Creo que le habría sido muy difícil
    publicar estas cosas
  • 12:16 - 12:18
    en las revistas de econometría.
  • 12:20 - 12:23
    Creo que nos hemos limitado
    demasiado
  • 12:23 - 12:27
    y nos hemos cerrado
  • 12:28 - 12:30
    a muchos de estos métodos
    de aprendizaje automático
  • 12:30 - 12:31
    que son realmente muy útiles.
  • 12:31 - 12:34
    Es decir, creo, en general,
  • 12:34 - 12:37
    que la literatura,
    los científicos de la computación,
  • 12:37 - 12:40
    han presentado una gran cantidad
    de estos algoritmos
  • 12:40 - 12:43
    han propuesto
    una gran cantidad de algoritmos
  • 12:43 - 12:44
    que realmente son muy útiles
  • 12:44 - 12:49
    y que están afectando la forma
    en que haremos el trabajo empírico.
  • 12:49 - 12:52
    Pero no lo hemos interiorizado
    del todo
  • 12:52 - 12:54
    porque todavía
    estamos muy centrados
  • 12:54 - 12:56
    en obtener estimaciones puntuales
  • 12:56 - 13:00
    y obtener errores estándar
    y obtener valores P
  • 13:00 - 13:03
    de una manera
    que necesitamos superar
  • 13:03 - 13:08
    para aprovechar plenamente
    la fuerza, los beneficios
  • 13:08 - 13:11
    de la literatura
    de aprendizaje automático.
Title:
¿Cómo impactará el aprendizaje automático en la economía?
ASR Confidence:
0.83
Description:

more » « less
Video Language:
English
Team:
Marginal Revolution University
Duration:
20:33

Spanish (Latin America) subtitles

Revisions Compare revisions