♪ (música) ♪ - [Narradora] Bienvenidos a Nobel Conversations. En este episodio, Josh Angrist y Guido Imbens están con Isaiah Andrews para discutir y discrepar sobre el papel del aprendizaje automático en la econometría aplicada. - [Isaiah] Entonces, por supuesto que hay muchos temas en los que ustedes están muy de acuerdo, pero me gustaría pasar a uno en el que tal vez tengan algunas discrepancias. Me gustaría escuchar algunas de sus opiniones sobre el aprendizaje automático y el papel que está desempeñando y va a desempeñar en la economía. - [Guido] He consultado algunos datos como el propietario----------------------. Vemos que no hay ningún documento publicado allí. Se hizo un experimento sobre algún algoritmo de búsqueda y la cuestión era... se trataba de clasificar cosas y cambiar la clasificación. Y estaba más o menos claro que iba a haber mucha heterogeneidad. Si buscas, digamos, una foto de Britney Spears -- realmente no importa dónde la clasifiques----------------------------------- porque vas a encontrar lo que estás buscando, ya sea que la pongas en la primera, segunda o tercera posición del ranking. Pero si estás buscando el mejor libro de econometría, si pones tu libro en primer lugar o en el décimo, eso va a suponer una gran diferencia en la frecuencia con la que la gente va a hacer clic en él. Así que ahí... [Josh] ¿Por qué necesito el aprendizaje automático para descubrir eso? Parece que --porque puedo descubrirlo simplemente.----------------------- - [Guido] En general -- - [Josh] Había un montón de posibles... - Quieres pensar en que hay un montón de características de los artículos, que quieres entender lo que impulsa la heterogeneidad en el efecto de -- - Pero solo estás prediciendo. En cierto sentido, estás resolviendo un problema de marketing. - No, es un efecto causal, - Es causal, pero no tiene contenido científico. Piensa en... - No, pero hay cosas similares en el ámbito médico. Si haces un experimento, puedes estar muy interesado en si el tratamiento funciona para algunos grupos o no. Y tienes un montón de características individuales, y quieres buscar sistemáticamente... - Sí. Soy escéptico sobre esa... esa especie de idea de que hay un efecto causal personal que me debería importar y que el aprendizaje automático puede descubrirlo de alguna manera que sea útil. Así que piensa en -- he hecho un montón de trabajo en las escuelas, ir a, digamos, una escuela charter,------------------------------------------------- una escuela privada financiada con fondos públicos, efectivamente, que es libre de estructurar su propio plan de estudios para el contexto allí. Algunos tipos de escuelas chárter generan espectaculares ganancias de rendimiento y en el conjunto de datos que produce ese resultado, tengo un montón de covariables. Así que tengo las puntuaciones de referencia y tengo los antecedentes familiares, la educación de los padres, el sexo del niño, la raza del niño. Y, bueno, en cuanto reúno media docena de ellas, tengo un espacio de muy alta dimensión. Definitivamente me interesan las características del curso de ese efecto del tratamiento, como por ejemplo si es mejor para las personas que provienen de familias con menores ingresos. Me cuesta creer que haya una aplicación para la versión de muy alta dimensión de eso, en la que descubrí que para los niños no blancos que tienen ingresos familiares altos pero puntuaciones de referencia en el tercer cuartil y que solo fueron a la escuela pública en el tercer grado pero no en el sexto. Así que eso es lo que produce ese análisis de alta dimensión. Es una declaración condicional muy elaborada. Hay dos cosas que están mal, en mi opinión. En primer lugar, no lo veo como... no puedo imaginar por qué es procesable. No sé por qué querrías actuar sobre ello. Y también sé que hay algún modelo alternativo que encaja casi igual, que lo invierte todo. Porque el aprendizaje automático no me dice que este es realmente el predictor que importa -- sólo me dice que este es un buen predictor.