< Return to Video

¿Qué hemos aprendido de 5 millones de libros?

  • 0:00 - 0:02
    Erez Lieberman Aiden: Todo el mundo sabe
  • 0:02 - 0:05
    que una imagen vale más que mil palabras.
  • 0:07 - 0:09
    Pero en Harvard
  • 0:09 - 0:12
    nos preguntábamos si realmente es verdad.
  • 0:12 - 0:14
    (Risas)
  • 0:14 - 0:18
    Así que reunimos a un equipo de expertos
  • 0:18 - 0:20
    de Harvard, del MIT
  • 0:20 - 0:23
    de "The American Heritage Dictionary", de la Enciclopedia Británica
  • 0:23 - 0:25
    e incluso de nuestros patrocinadores:
  • 0:25 - 0:28
    Google.
  • 0:28 - 0:30
    Y meditamos sobre esto
  • 0:30 - 0:32
    durante unos 4 años
  • 0:32 - 0:37
    hasta llegar a una conclusión sorprendente.
  • 0:37 - 0:40
    Damas y caballeros: una imagen no vale más que mil palabras.
  • 0:40 - 0:42
    De hecho, hallamos que algunas imágenes
  • 0:42 - 0:47
    valen 500.000 millones de palabras.
  • 0:47 - 0:49
    Jean-Baptiste Michel: ¿Cómo llegamos a esta conclusión?
  • 0:49 - 0:51
    Erez y yo estábamos pensando formas
  • 0:51 - 0:53
    de ver el panorama general de la cultura humana
  • 0:53 - 0:56
    y de la historia humana: su cambio en el tiempo.
  • 0:56 - 0:58
    Se han escrito muchos libros en los últimos años.
  • 0:58 - 1:00
    Así que estábamos pensando que la mejor forma de aprender de ellos
  • 1:00 - 1:02
    es leyendo estos millones de libros.
  • 1:02 - 1:05
    Por supuesto, si existe una escala de lo impresionante,
  • 1:05 - 1:08
    ese tiene que estar posicionado muy, muy arriba.
  • 1:08 - 1:10
    Pero el problema es que hay un eje X
  • 1:10 - 1:12
    que es el eje de lo práctico.
  • 1:12 - 1:14
    Este está muy, muy abajo.
  • 1:14 - 1:17
    (Aplausos)
  • 1:17 - 1:20
    Ahora bien, la gente suele usar un enfoque alternativo:
  • 1:20 - 1:22
    tener pocas fuentes y leerlas con mucho cuidado.
  • 1:22 - 1:24
    Esto es muy práctico pero no tan impresionante.
  • 1:24 - 1:27
    Lo que realmente queremos
  • 1:27 - 1:30
    es llegar a lo impresionante y práctico.
  • 1:30 - 1:33
    Y resulta que había una empresa del otro lado del río llamada Google
  • 1:33 - 1:35
    que hace unos años había comenzado un proyecto de digitalización
  • 1:35 - 1:37
    que podría permitir este enfoque.
  • 1:37 - 1:39
    Ellos han digitalizado millones de libros.
  • 1:39 - 1:42
    Eso significa que uno podría usar métodos computacionales
  • 1:42 - 1:44
    para leer todos los libros con el clic de un botón.
  • 1:44 - 1:47
    Eso es muy práctico y sumamente impresionante.
  • 1:48 - 1:50
    ELA: Ahora les voy a contar un poco de dónde vienen los libros.
  • 1:50 - 1:53
    Desde la noche de los tiempos existen autores.
  • 1:53 - 1:56
    Estos autores se han esforzado por escribir libros.
  • 1:56 - 1:58
    Y eso se volvió considerablemente más fácil
  • 1:58 - 2:00
    con el desarrollo de la imprenta hace algunos siglos.
  • 2:00 - 2:03
    Desde entonces, los autores han tenido
  • 2:03 - 2:05
    129 millones de ocasiones
  • 2:05 - 2:07
    para publicar libros.
  • 2:07 - 2:09
    Y si esos libros no se perdieron en la historia
  • 2:09 - 2:11
    entonces están en alguna biblioteca
  • 2:11 - 2:14
    y muchos de esos libros han sido recuperados de las bibliotecas
  • 2:14 - 2:16
    y digitalizados por Google
  • 2:16 - 2:18
    que ha escaneado 15 millones de libros hasta la fecha.
  • 2:18 - 2:21
    Pero cuando Google digitaliza un libro lo pone en un formato muy bueno.
  • 2:21 - 2:23
    Ahora tenemos los datos y tenemos metadatos.
  • 2:23 - 2:26
    Tenemos información sobre cosas como el lugar de publicación
  • 2:26 - 2:28
    el autor, fecha de publicación.
  • 2:28 - 2:31
    Y recorremos todos esos registros,
  • 2:31 - 2:35
    excluyendo todo lo que no tenga la más alta calidad.
  • 2:35 - 2:37
    Lo que nos queda
  • 2:37 - 2:40
    es una colección de 5 millones de libros
  • 2:40 - 2:43
    500.000 millones de palabras,
  • 2:43 - 2:45
    una cadena de caracteres mil veces más larga
  • 2:45 - 2:48
    que el genoma humano;
  • 2:48 - 2:50
    un texto que, de escribirlo,
  • 2:50 - 2:52
    se extendería desde aquí hasta la luna ida y vuelta
  • 2:52 - 2:54
    10 veces más...
  • 2:54 - 2:58
    un verdadero fragmento de nuestro genoma cultural.
  • 2:58 - 3:00
    Por supuesto lo que hicimos
  • 3:00 - 3:03
    frente a tal extravagante hipérbole...
  • 3:03 - 3:05
    (Risas)
  • 3:05 - 3:08
    fue hacer lo que cualquier investigador que se respete
  • 3:08 - 3:11
    habría hecho.
  • 3:11 - 3:13
    Tomamos una página de XKDC,
  • 3:13 - 3:15
    y dijimos: "Háganse a un lado.
  • 3:15 - 3:17
    Vamos a intentar con la ciencia".
  • 3:17 - 3:19
    (Risas)
  • 3:19 - 3:21
    JM: Ahora, por supuesto, estábamos pensando:
  • 3:21 - 3:23
    primero pongamos los datos allí
  • 3:23 - 3:25
    para que la gente haga ciencia con eso.
  • 3:25 - 3:27
    Ahora estamos pensando: ¿qué datos podemos liberar?
  • 3:27 - 3:29
    Por supuesto, uno quiere tomar los libros
  • 3:29 - 3:31
    y liberar el texto completo de estos 5 millones de libros.
  • 3:31 - 3:33
    Pero Google, y Jon Orwant en particular,
  • 3:33 - 3:35
    nos explicaron una pequeña ecuación:
  • 3:35 - 3:38
    5 millones de autores
  • 3:38 - 3:41
    y 5 millones de demandantes, genera demandas masivas.
  • 3:41 - 3:43
    Por eso aunque sea muy, muy impresionante
  • 3:43 - 3:46
    de nuevo, es completamente impráctico.
  • 3:46 - 3:48
    (Risas)
  • 3:48 - 3:50
    Pero, de nuevo, cedimos
  • 3:50 - 3:53
    y adoptamos un enfoque muy práctico, un poco menos impresionante.
  • 3:53 - 3:55
    Dijimos: bueno, en vez de liberar todo el texto
  • 3:55 - 3:57
    vamos a liberar estadísticas sobre los libros.
  • 3:57 - 3:59
    Tomemos, por ejemplo, "un destello de felicidad".
  • 3:59 - 4:01
    Tiene 4 palabras; lo denominamos cuatro-grama.
  • 4:01 - 4:03
    Les vamos a contar cuántas veces aparece un cuatro-grama particular
  • 4:03 - 4:05
    en libros en 1801, 1802, 1803,
  • 4:05 - 4:07
    en cada año hasta 2008.
  • 4:07 - 4:09
    Eso nos da series temporales
  • 4:09 - 4:11
    de la frecuencia con que esta oración particular se usó en el tiempo.
  • 4:11 - 4:14
    Hacemos eso para todas las palabras y frases que aparecen en esos libros
  • 4:14 - 4:17
    y eso nos da una gran tabla de 2.000 millones de líneas
  • 4:17 - 4:19
    que nos cuentan formas en las que fue cambiando la cultura.
  • 4:19 - 4:21
    ELA: Esos dos millones de líneas
  • 4:21 - 4:23
    se denominan 2 millones de n-gramas.
  • 4:23 - 4:25
    ¿Qué nos dicen?
  • 4:25 - 4:27
    Los n-gramas individuales miden las tendencias culturales.
  • 4:27 - 4:29
    Les daré un ejemplo.
  • 4:29 - 4:31
    Supongamos que soy muy próspero
  • 4:31 - 4:33
    y mañana quiero contarles lo bien que me fue.
  • 4:33 - 4:36
    Podría decir: "Ayer prosperé".
  • 4:36 - 4:39
    En inglés, prosperé ¿es 'throve' o 'thrived'?
  • 4:39 - 4:42
    ¿Cuál debería usar?
  • 4:42 - 4:44
    ¿Cómo saberlo?
  • 4:44 - 4:46
    Desde hace unos 6 meses
  • 4:46 - 4:48
    la vanguardia en este campo
  • 4:48 - 4:50
    dice que, por ejemplo,
  • 4:50 - 4:52
    uno tiene que ir a ese psicólogo de pelo fabuloso
  • 4:52 - 4:54
    y decirle:
  • 4:54 - 4:57
    "Steve, eres experto en verbos irregulares.
  • 4:57 - 4:59
    ¿Qué debería hacer?"
  • 4:59 - 5:01
    Y él dirá: "Bueno la mayoría de la gente dice 'thrive'
  • 5:01 - 5:04
    pero alguna gente dice 'throve'".
  • 5:04 - 5:06
    Y también sabían, más o menos,
  • 5:06 - 5:09
    que si retrocedieran en el tiempo 200 años
  • 5:09 - 5:12
    y le preguntaran a este estadista de pelo fabuloso,
  • 5:12 - 5:15
    (Risas)
  • 5:15 - 5:17
    "Tom, ¿cómo debería decir?"
  • 5:17 - 5:19
    Diría: "Bueno, en mis tiempos era 'throve'
  • 5:19 - 5:22
    pero había 'thrived'".
  • 5:22 - 5:24
    Por eso ahora voy a mostrar los datos en crudo.
  • 5:24 - 5:28
    Dos filas de esta tabla de 2.000 millones de entradas.
  • 5:28 - 5:30
    Lo que están viendo es la frecuencia año por año
  • 5:30 - 5:33
    de 'thrived' y 'throve' en el tiempo.
  • 5:34 - 5:36
    Estas son sólo 2
  • 5:36 - 5:39
    de 2.000 millones de filas.
  • 5:39 - 5:41
    Así que el set de datos entero
  • 5:41 - 5:44
    es mil millones de veces más impresionante que esta diapositiva.
  • 5:44 - 5:46
    (Risas)
  • 5:46 - 5:50
    (Aplausos)
  • 5:50 - 5:52
    JM: Ahora bien, hay muchas otras imágenes que valen 500.000 millones de palabras.
  • 5:52 - 5:54
    Por ejemplo, ésta.
  • 5:54 - 5:56
    Si uno toma el caso de la gripe,
  • 5:56 - 5:58
    verá picos en el tiempo en el que se sabía
  • 5:58 - 6:01
    de la muerte por grandes epidemias de gripe en todo el mundo.
  • 6:01 - 6:04
    ELA: Si todavía no están convencidos,
  • 6:04 - 6:06
    los niveles del mar están subiendo,
  • 6:06 - 6:09
    y también el CO2 en la atmósfera y la temperatura del planeta.
  • 6:09 - 6:12
    JM: Puede ser que también deseen echar un vistazo a estos n-gramas,
  • 6:12 - 6:15
    para decirle a Nietzsche que Dios no está muerto,
  • 6:15 - 6:18
    aunque, estamos de acuerdo, necesitaría un mejor publicista.
  • 6:18 - 6:20
    (Risas)
  • 6:20 - 6:23
    ELA: Con este tipo de cosas se puede llegar a conceptos bastante abstractos.
  • 6:23 - 6:25
    Por ejemplo, tenemos la historia
  • 6:25 - 6:27
    del año 1950.
  • 6:27 - 6:29
    En general para la gran mayoría de la historia
  • 6:29 - 6:31
    a nadie le importa un comino 1950.
  • 6:31 - 6:33
    En 1700, en 1800, en 1900,
  • 6:33 - 6:36
    a nadie le importa.
  • 6:37 - 6:39
    Entre los años 30 y 40
  • 6:39 - 6:41
    a nadie le importa.
  • 6:41 - 6:43
    De repente, a mediados de los 40,
  • 6:43 - 6:45
    empezó a desatarse un rumor.
  • 6:45 - 6:47
    La gente se dio cuenta que venía 1950
  • 6:47 - 6:49
    y quizá era algo genial.
  • 6:49 - 6:52
    (Risas)
  • 6:52 - 6:55
    Pero nada cautivó el interés de la gente en 1950
  • 6:55 - 6:58
    tanto como el año 1950.
  • 6:58 - 7:01
    (Risas)
  • 7:01 - 7:03
    La gente iba por ahí obsesionada.
  • 7:03 - 7:05
    No podía parar de pensar
  • 7:05 - 7:08
    en todo lo que hicieron en 1950
  • 7:08 - 7:11
    todas las cosas que planeaban hacer en 1950
  • 7:11 - 7:16
    todos los sueños que querían cumplir en 1950.
  • 7:16 - 7:18
    De hecho, 1950 fue tan fascinante
  • 7:18 - 7:20
    que en los años sucesivos
  • 7:20 - 7:23
    la gente siguió hablando de las cosas sorprendentes que sucedieron
  • 7:23 - 7:25
    en el 51, 52, 53.
  • 7:25 - 7:27
    Finalmente, en 1954,
  • 7:27 - 7:29
    alguien despertó y se dio cuenta
  • 7:29 - 7:33
    que 1950 ya estaba un poco pasado de moda.
  • 7:33 - 7:35
    (Risas)
  • 7:35 - 7:37
    Y, así porque sí, estalló la burbuja.
  • 7:37 - 7:39
    (Risas)
  • 7:39 - 7:41
    Y la historia de 1950
  • 7:41 - 7:43
    es la historia de cada año que tenemos registrado
  • 7:43 - 7:46
    con un pequeño giro, porque ahora contamos con estos lindos gráficos.
  • 7:46 - 7:49
    Y, porque los tenemos, podemos medir cosas.
  • 7:49 - 7:51
    Podemos decir: "Bueno, ¿a qué velocidad estalla la burbuja?"
  • 7:51 - 7:54
    Y resulta que podemos medir con mucha precisión.
  • 7:54 - 7:57
    Se derivaron ecuaciones, se hicieron gráficos,
  • 7:57 - 7:59
    y el resultado neto
  • 7:59 - 8:02
    es que hallamos que la burbuja estalla cada vez más rápidamente
  • 8:02 - 8:04
    con cada año que pasa.
  • 8:04 - 8:09
    Estamos perdiendo interés por el pasado más rápidamente.
  • 8:09 - 8:11
    JM: Ahora un pequeño consejo de carrera.
  • 8:11 - 8:13
    Para los que buscan ser famosos
  • 8:13 - 8:15
    podemos aprender de los 25 personajes políticos más famosos:
  • 8:15 - 8:17
    autores, actores, etc.
  • 8:17 - 8:20
    Si quieren llegar a ser famosos desde temprano, deberían ser actores
  • 8:20 - 8:22
    porque empiezan a tener fama al final de los ventipico...
  • 8:22 - 8:24
    todavía son jóvenes, es genial.
  • 8:24 - 8:26
    Ahora, si pueden esperar un poquito, deberían ser autores
  • 8:26 - 8:28
    porque entonces alcanzarían grandes alturas
  • 8:28 - 8:30
    como Mark Twain, por ejemplo, que es sumamente famoso.
  • 8:30 - 8:32
    Pero si quieren llegar realmente a la cima
  • 8:32 - 8:34
    deberían demorar la gratificación
  • 8:34 - 8:36
    y, claro, ser políticos.
  • 8:36 - 8:38
    En este caso se harán famosos al final de los 50 y tantos
  • 8:38 - 8:40
    y se volverán muy, muy famosos en lo sucesivo.
  • 8:40 - 8:43
    Los científicos suelen hacerse famosos cuando son mucho mayores.
  • 8:43 - 8:45
    Por ejemplo, los biólogos y los físicos
  • 8:45 - 8:47
    suelen ser casi tan famosos como los actores.
  • 8:47 - 8:50
    Un error que no deben cometer es ser matemáticos.
  • 8:50 - 8:52
    (Risas)
  • 8:52 - 8:54
    Si lo hacen
  • 8:54 - 8:57
    podrían pensar: "Oh, genial. Voy a hacer mi mejor trabajo a los ventipico".
  • 8:57 - 8:59
    Pero adivinen qué; a nadie le importará.
  • 8:59 - 9:02
    (Risas)
  • 9:02 - 9:04
    ELA: Hay notas más preocupantes
  • 9:04 - 9:06
    entre los n-gramas.
  • 9:06 - 9:08
    Por ejemplo, esta es la trayectoria de Marc Chagall,
  • 9:08 - 9:10
    un artista nacido en 1887.
  • 9:10 - 9:13
    Parece la trayectoria normal de un famoso.
  • 9:13 - 9:17
    Se hace cada vez más y más famoso
  • 9:17 - 9:19
    salvo que miremos en alemán.
  • 9:19 - 9:21
    Si miramos en alemán vamos a notar algo muy extraño,
  • 9:21 - 9:23
    algo casi nunca visto
  • 9:23 - 9:25
    y es que se vuelve sumamente famoso
  • 9:25 - 9:27
    y de repente se desploma
  • 9:27 - 9:30
    cayendo al punto más bajo entre 1933 y 1945,
  • 9:30 - 9:33
    y después se recupera.
  • 9:33 - 9:35
    Por supuesto, lo que vemos
  • 9:35 - 9:38
    es que, de hecho, Marc Chagall era un artista judío
  • 9:38 - 9:40
    en la Alemania nazi.
  • 9:40 - 9:42
    Estas señales
  • 9:42 - 9:44
    son tan fuertes, en realidad,
  • 9:44 - 9:47
    que no hace falta saber que alguien fue censurado.
  • 9:47 - 9:49
    Podemos averiguarlo
  • 9:49 - 9:51
    mediante procesamiento básico de señales.
  • 9:51 - 9:53
    Esta es una manera simple de hacerlo.
  • 9:53 - 9:55
    Una expectativa razonable
  • 9:55 - 9:57
    es que la fama de alguien en un período dado de tiempo
  • 9:57 - 9:59
    debería ser aproximadamente el promedio de su fama antes
  • 9:59 - 10:01
    y su fama después de eso.
  • 10:01 - 10:03
    Es más o menos lo que esperamos.
  • 10:03 - 10:06
    Comparamos eso con la fama que observamos
  • 10:06 - 10:08
    y dividimos una por otra
  • 10:08 - 10:10
    para producir algo que llamamos «índice de represión».
  • 10:10 - 10:13
    Si el índice de represión es muy, muy, muy pequeño
  • 10:13 - 10:15
    podrían estar reprimiéndote.
  • 10:15 - 10:18
    Si es muy grande, quizá uno se está beneficiando de la propaganda.
  • 10:19 - 10:21
    JM: Ahora bien, podemos mirar
  • 10:21 - 10:24
    la distribución de los índices de represión en poblaciones enteras.
  • 10:24 - 10:26
    Así, por ejemplo, aquí...
  • 10:26 - 10:28
    este índice de represión es para 5.000 personas
  • 10:28 - 10:30
    calculado sobre libros de inglés, donde no hay represión conocida,
  • 10:30 - 10:32
    sería algo así, bastante centrado en el uno.
  • 10:32 - 10:34
    Lo que uno espera es básicamente lo que observa.
  • 10:34 - 10:36
    Esta es la distribución como se ve en Alemania...
  • 10:36 - 10:38
    muy diferente, está desplazada a la izquierda.
  • 10:38 - 10:41
    Se habla de la gente 2 veces menos de lo que se debería.
  • 10:41 - 10:43
    Pero aún más importante, la distribución es mucho más amplia.
  • 10:43 - 10:46
    Hay muchas personas que terminan en el extremo izquierdo de esta distribución;
  • 10:46 - 10:49
    gente de la que se habla unas 10 veces menos de lo que se debería.
  • 10:49 - 10:51
    Pero también mucha gente en el extremo derecho
  • 10:51 - 10:53
    que parece beneficiarse de la propaganda.
  • 10:53 - 10:56
    Esta imagen muestra el sello de la censura en el libro registrado.
  • 10:56 - 10:58
    ELA: «Culturomía»,
  • 10:58 - 11:00
    así denominamos al método.
  • 11:00 - 11:02
    Es una especie de genómica,
  • 11:02 - 11:04
    salvo que la genómica hace foco en la biología
  • 11:04 - 11:07
    mediante la ventana de la secuencia de bases del genoma humano.
  • 11:07 - 11:09
    La «culturomía» es similar.
  • 11:09 - 11:12
    Es la aplicación del análisis de grandes volúmenes de datos
  • 11:12 - 11:14
    al estudio de la cultura humana.
  • 11:14 - 11:16
    Aquí, en vez de mirar bajo la lente del genoma,
  • 11:16 - 11:19
    lo hacemos mediante la digitalización de registros históricos.
  • 11:19 - 11:21
    Lo genial de la «culturomía»
  • 11:21 - 11:23
    es que todos podemos practicarla.
  • 11:23 - 11:25
    ¿Por qué podemos todos?
  • 11:25 - 11:27
    Todo el mundo puede hacerlo porque tres muchachos
  • 11:27 - 11:30
    Jon Orwant, Matt Gray y Will Brockman en Google,
  • 11:30 - 11:32
    vieron el prototipo del visor de n-gramas
  • 11:32 - 11:34
    y dijeron: "Es algo muy divertido.
  • 11:34 - 11:37
    Tenemos que dejarlo disponible para la gente".
  • 11:37 - 11:39
    Así que en dos semanas -dos semanas antes de que salga nuestro artículo-
  • 11:39 - 11:42
    programaron una versión del visor de n-gramas para el público en general.
  • 11:42 - 11:45
    De ese modo, Uds también pueden escribir la palabra o frase que les interese
  • 11:45 - 11:47
    y ver su n-grama de inmediato;
  • 11:47 - 11:49
    también explorar ejemplos de los distintos libros
  • 11:49 - 11:51
    en los que aparece el n-grama.
  • 11:51 - 11:53
    JM: El primer día lo usaron más de un millón de veces
  • 11:53 - 11:55
    y esta es realmente la mejor de todas las consultas.
  • 11:55 - 11:58
    La gente quiere dar lo mejor de sí, en inglés se dice 'best'.
  • 11:58 - 12:01
    Pero resulta que en el siglo XVIII esto no importaba para nada.
  • 12:01 - 12:04
    En inglés, no decían "dar lo mejor de sí" usando 'best' sino 'beft'.
  • 12:04 - 12:07
    Por supuesto, se debe a un error.
  • 12:07 - 12:09
    No es que se esforzaran en ser mediocres,
  • 12:09 - 12:12
    sino que la S se solía escribir como una F.
  • 12:12 - 12:15
    Pero claro, Google no advirtió esto en ese momento
  • 12:15 - 12:18
    por eso lo informamos en el artículo científico que escribimos.
  • 12:18 - 12:20
    Pero resulta que esto nos recuerda
  • 12:20 - 12:22
    que, aunque es muy divertido,
  • 12:22 - 12:24
    al interpretar estos gráficos hay que tener mucho cuidado
  • 12:24 - 12:27
    y adoptar las normas básicas de la ciencia.
  • 12:27 - 12:30
    ELA: La gente ha estado usando esto para todo tipo de cosas.
  • 12:30 - 12:37
    (Risas)
  • 12:37 - 12:39
    En realidad no vamos a hablar
  • 12:39 - 12:42
    sino a mostrarles diapositivas y quedarnos en silencio.
  • 12:42 - 12:45
    Esta persona estaba interesada en la historia de la frustración.
  • 12:45 - 12:48
    Hay varios tipos de frustración.
  • 12:48 - 12:51
    Si nos damos con el pie en algo, es con 1A: "Ay".
  • 12:51 - 12:53
    Si la Tierra es aniquilada por la Vogons
  • 12:53 - 12:55
    para hacer espacio para una autopista interestelar
  • 12:55 - 12:57
    eso es con 8A: "Aaaaaaaay".
  • 12:57 - 12:59
    Esta persona estudia todos los "Ay"
  • 12:59 - 13:01
    que tienen de 1 a 8 aes.
  • 13:01 - 13:03
    Y resulta que
  • 13:03 - 13:05
    los "ay" menos frecuentes
  • 13:05 - 13:08
    son, por supuesto, los correspondientes a las cosas más frustrantes
  • 13:08 - 13:11
    salvo, curiosamente, en los años 80.
  • 13:11 - 13:13
    Pensamos que podría tener algo que ver con Reagan.
  • 13:13 - 13:15
    (Risas)
  • 13:15 - 13:18
    JM: Hay muchos usos para estos datos
  • 13:18 - 13:21
    pero la conclusión es que el registro histórico se está digitalizando.
  • 13:21 - 13:23
    Google ha empezado a digitalizar 15 millones de libros.
  • 13:23 - 13:25
    Eso representa el 12% de todos los libros publicados en la historia.
  • 13:25 - 13:28
    Es un fragmento considerable de la cultura humana.
  • 13:28 - 13:31
    La cultura tiene más cosas: hay manuscritos, hay periódicos,
  • 13:31 - 13:33
    hay cosas que no tienen texto, como el arte y las pinturas.
  • 13:33 - 13:35
    Todo está en nuestras computadoras,
  • 13:35 - 13:37
    en las computadores del mundo.
  • 13:37 - 13:40
    Y cuando eso suceda va a transformar nuestra manera
  • 13:40 - 13:42
    de entender nuestro pasado, nuestro presente y la cultura humana.
  • 13:42 - 13:44
    Muchas gracias.
  • 13:44 - 13:47
    (Aplausos)
Title:
¿Qué hemos aprendido de 5 millones de libros?
Speaker:
Jean-Baptiste Michel + Erez Lieberman Aiden
Description:

¿Has jugado con el visor de n-gramas de Google Labs? Es una herramienta adictiva que te permite buscar palabras e ideas en una base de datos de 5 millones de libros a través de los siglos. Erez Lieberman Aiden y Michel Jean-Baptiste nos muestran cómo funciona y algunas de las cosas sorprendentes que podemos aprender partiendo de 500.000 millones de palabras.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Sebastian Betti added a translation

Spanish subtitles

Revisions