0:00:00.880,0:00:04.677 Antes, si querías que un computador[br]hiciera algo nuevo 0:00:04.677,0:00:06.509 tenías, normalmente, que programarlo. 0:00:06.509,0:00:09.795 La programación, para quienes[br]no la han practicado, 0:00:09.818,0:00:12.898 requiere especificar[br]con el más mínimo detalle 0:00:12.898,0:00:16.487 cada paso que uno quiere[br]que haga su computador 0:00:16.487,0:00:18.734 para alcanzar el objetivo. 0:00:18.734,0:00:22.379 Si quieren hacer algo que[br]no saben hacer por sí mismos 0:00:22.379,0:00:24.385 entonces están ante un gran reto. 0:00:24.385,0:00:27.935 Ese fue el reto al que se enfrentó[br]este hombre, Arthur Samuel. 0:00:27.935,0:00:34.028 En 1956, quería hacer que su computador[br]pudiera ganarle a las damas. 0:00:34.028,0:00:35.785 ¿Cómo se puede diseñar un programa, 0:00:35.785,0:00:40.073 teniendo en cuenta el más mínimo detalle[br]que sea mejor que sí mismo a las damas? 0:00:40.073,0:00:41.780 Y se le ocurrió una idea: 0:00:41.780,0:00:45.623 hizo jugar al computador[br]contra sí mismo miles de veces 0:00:45.623,0:00:48.079 y le hizo aprender[br]a jugar a las damas. 0:00:48.079,0:00:51.027 De hecho funcionó, ya en 1962, 0:00:51.027,0:00:53.960 este computador había ganado[br]la competición estatal de Connecticut. 0:00:54.669,0:00:58.112 Arthur Samuel fue el padre[br]del aprendizaje automático, 0:00:58.112,0:00:59.694 y tengo una deuda con él, 0:00:59.694,0:01:02.532 porque soy un profesional[br]del aprendizaje automático. 0:01:02.532,0:01:04.159 Fui presidente de Kaggle, 0:01:04.159,0:01:05.786 una comunidad de unos 200 000 0:01:05.786,0:01:07.415 profesionales del[br]aprendizaje automático. 0:01:07.415,0:01:09.700 Kaggle contribuye con competiciones 0:01:09.700,0:01:13.146 para tratar de resolver problemas[br]anteriores no resueltos, 0:01:13.324,0:01:15.985 y tuvo éxito cientos de veces. 0:01:16.980,0:01:19.371 Así que desde esa perspectiva,[br]pude descubrir 0:01:19.371,0:01:23.422 mucho sobre lo que el aprendizaje[br]automático hizo, puede hacer hoy 0:01:23.422,0:01:25.620 y lo que podrá hacer en el futuro. 0:01:25.620,0:01:27.858 Quizás el primer gran éxito 0:01:27.858,0:01:30.462 del aprendizaje automático[br]en el mercado fue Google. 0:01:30.462,0:01:34.038 Google demostró que era posible[br]encontrar información 0:01:34.038,0:01:35.364 usando un algoritmo informático 0:01:35.364,0:01:38.778 y ese algoritmo se basa en[br]el aprendizaje automático. 0:01:38.778,0:01:42.524 Desde entonces, ha habido muchos éxitos[br]comerciales del aprendizaje automático. 0:01:42.524,0:01:45.469 Compañías como Amazon y Netflix[br]usan el aprendizaje automático 0:01:45.469,0:01:47.854 para sugerir artículos [br]que les puedan interesar comprar, 0:01:47.854,0:01:49.400 películas que les puedan interesar ver 0:01:49.400,0:01:51.114 A veces, es casi escalofriante. 0:01:51.114,0:01:53.168 Compañías como[br]LinkedIn y Facebook 0:01:53.168,0:01:55.993 dicen, en ocasiones, cuáles[br]pueden ser sus amigos 0:01:55.993,0:01:57.864 y uno no tiene ni idea[br]de cómo lo han hecho, 0:01:57.864,0:02:00.443 y es porque hace uso del poder[br]del aprendizaje automático. 0:02:00.443,0:02:03.872 Estos son algoritmos que han aprendido[br]como hacerlo a partir de los datos 0:02:03.872,0:02:06.639 en lugar de ser programados a mano. 0:02:07.113,0:02:09.447 Así es también como IBM tuvo éxito 0:02:09.447,0:02:13.489 en conseguir que Watson ganara[br]dos campeonatos mundiales de "Jeopardy" 0:02:13.769,0:02:16.446 respondiendo preguntas increíblemente[br]ingeniosas, como esta. 0:02:16.446,0:02:20.161 [El antiguo "León de Nimrud" se perdió[br]del Museo Nacional de esta ciudad en 2003] 0:02:20.161,0:02:23.307 También es por eso, que podemos ver[br]los primeros autos sin piloto. 0:02:23.377,0:02:26.009 Si pueden diferenciar[br]entre, por ejemplo 0:02:26.009,0:02:28.831 un árbol y un peatón,[br]es algo muy importante. 0:02:28.871,0:02:31.568 No sabemos diseñar[br]estos programas manualmente, 0:02:31.568,0:02:34.175 pero con el aprendizaje[br]automático es posible. 0:02:34.175,0:02:37.573 De hecho, este auto ha conducido[br]más de un millón y medio de kilómetros 0:02:37.573,0:02:40.076 sin tener accidentes en carretera. 0:02:40.076,0:02:43.643 Así, sabemos que los computadores[br]pueden aprender 0:02:43.643,0:02:45.803 y pueden aprender a hacer cosas 0:02:45.803,0:02:48.558 que de hecho nosotros, a veces,[br]no sabemos hacer, 0:02:48.558,0:02:51.315 o las pueden hacer mejor que nosotros. 0:02:51.315,0:02:55.585 Uno de los ejemplos más sorprendentes[br]que he visto en aprendizaje automático 0:02:55.585,0:02:58.116 ocurrió en un proyecto[br]que dirigía en Kaggle 0:02:58.116,0:03:01.604 donde un equipo dirigido por un chico[br]llamado Geoffrey Hinton 0:03:01.604,0:03:02.979 de la Universidad de Toronto 0:03:02.979,0:03:06.081 ganó un concurso para el descubrimiento[br]automático de medicamentos. 0:03:06.081,0:03:08.556 Lo extraordinario fue no solo que batiera 0:03:08.556,0:03:10.537 a todos los algoritmos [br]desarrollados por Merck 0:03:10.537,0:03:13.098 o la comunidad académica internacional, 0:03:13.098,0:03:15.739 sino que nadie del equipo [br]tenía experiencia en química 0:03:15.739,0:03:19.843 o biología o ciencias biológicas[br]y lo hicieron en dos semanas. 0:03:19.843,0:03:22.256 ¿Cómo lo hicieron? 0:03:22.256,0:03:25.261 Usaron un algoritmo extraordinario[br]llamado aprendizaje profundo. 0:03:25.261,0:03:28.325 Fue tan exitoso que tuvo cobertura 0:03:28.325,0:03:31.362 en The New York Times en un artículo[br]de portada unas semanas después. 0:03:31.362,0:03:33.980 Este es Geoffrey Hinton[br]a la izquierda. 0:03:33.980,0:03:37.991 El aprendizaje profundo es un algoritmo[br]inspirado en el cerebro humano 0:03:37.991,0:03:39.962 y como resultado 0:03:39.962,0:03:43.361 no tiene limitaciones teóricas[br]en lo que puede hacer. 0:03:43.361,0:03:46.762 Cuantos más datos[br]y tiempo de cálculo uno le dé 0:03:46.762,0:03:47.969 mejor funciona. 0:03:48.005,0:03:50.404 The New York Times mostró,[br]también en su artículo 0:03:50.404,0:03:52.927 otro resultado extraordinario[br]del aprendizaje profundo 0:03:52.927,0:03:55.181 que mostraré ahora. 0:03:55.181,0:03:59.125 Demuestra que los computadores[br]pueden escuchar y comprender. 0:04:01.077,0:04:03.251 (Vídeo) Richard Rashid:[br]El último paso 0:04:04.161,0:04:05.756 que quiero dar en este proceso 0:04:06.656,0:04:09.407 es hablar en chino. 0:04:11.877,0:04:13.163 La clave es, 0:04:13.163,0:04:17.784 hemos recopilado una gran información[br]de hablantes de chino 0:04:17.784,0:04:20.894 y producido un sistema de conversión[br]de texto a voz 0:04:20.894,0:04:25.025 que toma el texto en chino[br]y lo convierte en lengua oral, 0:04:26.681,0:04:30.205 luego hemos grabado[br]una hora de mi voz 0:04:30.205,0:04:32.471 que usamos para modular 0:04:32.471,0:04:36.197 el texto estándar de conversión[br]de texto a voz para que suene como yo. 0:04:36.441,0:04:38.979 De nuevo, el resultado no es perfecto. 0:04:38.979,0:04:41.807 De hecho, hay unos cuantos errores. 0:04:41.807,0:04:44.133 結果並不完美[br](los resultados no son perfectos) 0:04:44.133,0:04:47.826 (Aplausos) 0:04:49.432,0:04:52.243 Hay mucho que hacer en esta área. 0:04:52.702,0:04:56.146 在這方面有很多工作要做 (hay mucho[br]trabajo que hacer en esta área) 0:04:56.146,0:04:59.673 (Aplausos) 0:05:01.715,0:05:05.497 Jeremy Howard: Esto era una conferencia[br]de aprendizaje automático en China. 0:05:05.497,0:05:07.867 No es usual, en conferencias académicas 0:05:07.867,0:05:09.764 oír aplausos espontáneos, 0:05:09.764,0:05:12.830 aunque en las conferencias[br]de TEDx siéntanse libres. 0:05:12.830,0:05:15.115 Todo lo que han visto es gracias[br]al aprendizaje profundo. 0:05:15.115,0:05:16.880 (Aplausos) Gracias. 0:05:16.880,0:05:19.722 La transcripción en inglés[br]es aprendizaje profundo. 0:05:19.722,0:05:23.204 La traducción al chino y el texto arriba[br]a la derecha, es aprendizaje profundo, 0:05:23.204,0:05:26.041 y la construcción de la voz también[br]es aprendizaje profundo. 0:05:26.761,0:05:29.995 Eso es lo extraordinario[br]del aprendizaje profundo. 0:05:29.995,0:05:33.094 Es un solo algoritmo que parece[br]hacer casi cualquier cosa, 0:05:33.094,0:05:36.075 y descubrí que un año antes,[br]aprendió a ver. 0:05:36.075,0:05:37.891 En esta extraña competición en Alemania 0:05:37.891,0:05:40.427 llamada Banco de Prueba de[br]Reconocimiento de Señales de Tránsito 0:05:40.427,0:05:44.273 el aprendizaje profundo ha aprendido[br]a reconocer señales de tránsito como esta. 0:05:44.283,0:05:46.467 No solo reconoce señales de tránsito 0:05:46.491,0:05:48.223 mejor que cualquier otro algoritmo, 0:05:48.223,0:05:50.862 la clasificación mostró[br]que era mejor que las personas, 0:05:50.862,0:05:52.624 dos veces más bueno que las personas. 0:05:52.624,0:05:54.790 Para 2011, se da el primer ejemplo 0:05:54.790,0:05:58.195 de computadores que pueden ver[br]mejor que las personas. 0:05:58.195,0:06:00.244 Desde entonces, han ocurrido muchas cosas. 0:06:00.244,0:06:03.758 En 2012, Google anunció que había hecho[br]que un algoritmo de aprendizaje profundo 0:06:03.758,0:06:05.173 viera vídeos en YouTube 0:06:05.173,0:06:08.100 y procesaron la información[br]en 16 000 computadores al mes 0:06:08.100,0:06:10.301 y el computador aprendió [br]de manera independiente 0:06:10.301,0:06:14.780 conceptos como personas y gatos[br]solo viendo los vídeos. 0:06:14.780,0:06:17.132 Esto se parece mucho[br]al aprendizaje humano. 0:06:17.132,0:06:19.872 Los humanos no aprendemos[br]porque nos cuenten lo que vemos, 0:06:19.872,0:06:23.203 sino que aprendemos solos[br]qué son esas cosas. 0:06:23.203,0:06:26.572 También en 2012, Geoffrey Hinton,[br]que vimos anteriormente, 0:06:26.572,0:06:29.430 ganó la famosa competición de ImageNet, 0:06:29.430,0:06:32.861 tratando de averiguar, mirando[br]un millón y medio de imágenes, 0:06:32.861,0:06:34.559 sobre qué eran estas imágenes. 0:06:34.559,0:06:38.152 A partir de 2014, tenemos un porcentaje[br]de error por debajo del 6 % 0:06:38.152,0:06:39.535 en reconocimiento de imágenes. 0:06:39.535,0:06:42.021 De nuevo, mejor que las personas. 0:06:42.021,0:06:45.140 Las máquinas están haciendo[br]un trabajo increíble aquí, 0:06:45.140,0:06:47.609 y está siendo usadas en la industria. 0:06:47.609,0:06:50.671 Por ejemplo, Google anunció el año pasado 0:06:50.671,0:06:55.686 que había cartografiado cada sitio[br]de Francia en dos horas, 0:06:55.686,0:06:59.133 y lo hizo alimentando[br]con imágenes de las calles, 0:06:59.133,0:07:03.452 al algoritmo de aprendizaje profundo[br]para reconocer y leer los números. 0:07:03.452,0:07:05.672 Imaginen lo que se habría tardado antes: 0:07:05.672,0:07:09.027 docenas de personas, muchos años. 0:07:09.027,0:07:10.938 Esto también está pasando en China. 0:07:10.938,0:07:14.974 Baidu es como el Google chino, creo, 0:07:14.974,0:07:18.917 y lo que ven arriba a la izquierda[br]es un ejemplo de una imagen que subí 0:07:18.917,0:07:21.231 al sistema de aprendizaje profundo [br]de Baidu, 0:07:21.231,0:07:25.000 y debajo se puede ver que el sistema[br]ha entendido lo que es esa imagen 0:07:25.000,0:07:27.236 y encuentra imágenes similares. 0:07:27.236,0:07:29.972 Las imágenes similares[br]tienen fondos similares 0:07:29.972,0:07:33.418 similares de las caras,[br]incluso algunos con la lengua afuera. 0:07:33.418,0:07:36.138 Esto no es claramente mirar[br]el texto de una página web. 0:07:36.138,0:07:37.860 Todo lo que descargué eran imágenes. 0:07:37.860,0:07:41.621 Por lo que ahora tenemos computadores[br]que entienden lo que ven 0:07:41.621,0:07:43.505 y por ello pueden buscar bases de datos 0:07:43.505,0:07:45.859 de cientos de millones[br]de imágenes en tiempo real. 0:07:45.859,0:07:49.309 ¿Qué significado tiene que[br]los computadores puedan ver? 0:07:49.309,0:07:51.786 Bueno, no es solo que[br]los computadores puedan ver. 0:07:51.786,0:07:54.441 De hecho, el aprendizaje profundo[br]ha hecho más que eso. 0:07:54.441,0:07:56.433 Frases complejas y llenas[br]de matices como esta 0:07:56.433,0:07:59.217 son ahora comprensibles con[br]algoritmos del aprendizaje profundo. 0:07:59.217,0:08:00.280 Como pueden ver aquí, 0:08:00.280,0:08:04.138 este sistema basado en el de Stanford que[br]muestra el punto rojo en la parte superior 0:08:04.138,0:08:07.957 ha comprendido que esta frase[br]expresa sentimientos negativos. 0:08:07.957,0:08:10.795 El aprendizaje profundo está cercano[br]a la conducta humana al comprender 0:08:10.795,0:08:15.166 lo que significan las frases y lo que [br]se está diciendo sobre esas cosas. 0:08:16.556,0:08:19.404 El aprendizaje profundo se ha usado[br]también para leer chino, 0:08:19.404,0:08:22.560 de nuevo, a un nivel[br]casi de hablante nativo. 0:08:22.560,0:08:24.728 Este algoritmo, desarrollado en Suiza 0:08:24.728,0:08:28.084 por gente que no hablaba [br]ni entendía chino. 0:08:28.084,0:08:30.134 Como dije, usar el aprendizaje profundo 0:08:30.134,0:08:32.354 es el mejor sistema del mundo para esto, 0:08:32.354,0:08:36.175 hasta comparándolo[br]con el conocimiento humano. 0:08:37.471,0:08:40.304 Este es un sistema que[br]formamos en mi empresa 0:08:40.304,0:08:42.482 que demuestra todas estas cosas juntas. 0:08:42.506,0:08:44.942 Estas son imágenes sin texto adjunto, 0:08:44.942,0:08:47.294 y cuando tecleo aquí frases, 0:08:47.294,0:08:50.263 entiende, en tiempo real, estas imágenes 0:08:50.263,0:08:51.942 y comprende de qué se tratan 0:08:51.942,0:08:54.825 y encuentra imágenes similares[br]al texto que estoy escribiendo. 0:08:54.825,0:08:57.431 Como pueden ver, entiende mis frases 0:08:57.431,0:08:59.435 y de hecho entiende estas imágenes. 0:08:59.435,0:09:02.634 Se que han visto algo como esto en Google,[br]donde puede escribir algo 0:09:02.634,0:09:05.929 y te lo muestra en imágenes,[br]pero lo que realmente está haciendo 0:09:05.929,0:09:08.843 es buscar la página web [br]a través del texto. 0:09:08.843,0:09:11.524 Esto es muy diferente[br]a comprender las imágenes. 0:09:11.524,0:09:14.426 Esto es algo que los computadores[br]solo han podido hacer 0:09:14.426,0:09:16.434 por primera vez hace unos pocos meses. 0:09:17.164,0:09:19.952 Así que ahora podemos ver [br]que los computadores no solo ven 0:09:19.952,0:09:21.750 sino que pueden leer, 0:09:21.750,0:09:24.980 y, por supuesto, hemos demostrado[br]que pueden entender lo que oyen. 0:09:24.980,0:09:28.482 Quizá no sea sorprendente ahora[br]lo que voy a decir, pueden escribir. 0:09:28.482,0:09:30.524 Aquí hay parte de un texto que generé ayer 0:09:30.524,0:09:32.626 usando el algoritmo [br]de aprendizaje profundo. 0:09:34.736,0:09:37.849 Y aquí hay parte de un texto que generó[br]un algoritmo de Stanford. 0:09:37.849,0:09:39.613 Cada una de estas frases fue generada 0:09:39.613,0:09:43.582 por un algoritmo de aprendizaje profundo[br]para describir estas imágenes. 0:09:43.582,0:09:45.796 Este algoritmo nunca había visto 0:09:45.796,0:09:47.910 a un hombre con camisa negra [br]tocando la guitarra. 0:09:47.910,0:09:50.224 Ha visto a un hombre antes,[br]ha visto el negro antes 0:09:50.224,0:09:52.153 ha visto una guitarra antes,[br]pero ha generado 0:09:52.153,0:09:56.447 de manera independiente esta innovadora [br]descripción de esta imagen. 0:09:56.447,0:09:59.949 Aquí no estamos ante un comportamiento[br]humano, pero estamos cerca. 0:09:59.949,0:10:03.717 En las pruebas, las personas prefieren[br]las leyendas generadas por el computador 0:10:03.717,0:10:05.384 1 de cada 4 veces. 0:10:05.384,0:10:07.608 Este sistema tiene ahora solo[br]dos semanas de edad, 0:10:07.608,0:10:09.454 por lo que posiblemente[br]antes del año que viene, 0:10:09.454,0:10:12.255 el algoritmo del computador irá[br]más allá del comportamiento humano 0:10:12.255,0:10:14.117 al paso que van las cosas. 0:10:14.117,0:10:17.166 Así que los computadores pueden escribir. 0:10:17.166,0:10:20.301 Juntamos todo esto y lleva[br]a oportunidades apasionantes. 0:10:20.301,0:10:21.813 Por ejemplo, en medicina, 0:10:21.813,0:10:24.658 un equipo de Boston anunció[br]que habían descubierto 0:10:24.658,0:10:27.367 decenas de características[br]clínicas relevantes 0:10:27.367,0:10:31.849 sobre tumores que ayudan a los médicos[br]a hacer un diagnóstico de un cáncer. 0:10:32.973,0:10:35.269 Algo similar, en Stanford, 0:10:35.269,0:10:38.092 un grupo anunció que,[br]mirando un tejido con aumento, 0:10:38.092,0:10:41.313 habían desarrollado una máquina[br]basada en el sistema de aprendizaje 0:10:41.313,0:10:43.895 que de hecho es mejor[br]que los patólogos humanos 0:10:43.895,0:10:47.668 prediciendo las tasas de supervivencia[br]de los enfermos de cáncer. 0:10:47.668,0:10:51.177 En ambos casos, no solo fueron[br]las predicciones más precisas, 0:10:51.177,0:10:53.729 sino que generaron una[br]nueva ciencia reveladora. 0:10:53.729,0:10:55.534 En el caso de la radiología, 0:10:55.534,0:10:58.629 hubo nuevos indicadores clínicos[br]que las personas pueden entender. 0:10:58.629,0:11:00.421 En este caso de patología, 0:11:00.421,0:11:04.921 el sistema informático descubrió[br]que las células alrededor del cáncer 0:11:04.921,0:11:08.261 son tan importantes como[br]las células del cáncer mismo 0:11:08.261,0:11:10.013 al hacer un diagnóstico. 0:11:10.013,0:11:14.494 Esto es lo contrario de lo que[br]los patólogos han pensado por décadas. 0:11:15.374,0:11:18.666 En cada uno de estos casos,[br]fueron sistemas desarrollados 0:11:18.666,0:11:22.287 por una combinación de expertos médicos[br]y expertos del aprendizaje profundo, 0:11:22.287,0:11:25.028 pero a partir del año pasado,[br]dimos un paso más allá. 0:11:25.028,0:11:28.577 Este es un caso de identificación[br]de áreas cancerígenas 0:11:28.577,0:11:31.107 del tejido humano por microscopio. 0:11:31.107,0:11:34.040 El sistema que se muestra aquí [br]puede identificar esas áreas 0:11:34.040,0:11:38.005 de formar más precisa o casi tan precisa[br]como los patólogos humanos, 0:11:38.005,0:11:40.267 construido completamente [br]con aprendizaje profundo 0:11:40.267,0:11:41.799 sin usar experiencia médica 0:11:41.799,0:11:44.113 por gente que no tenía[br]experiencia en este campo. 0:11:45.483,0:11:48.038 De manera similar,[br]esta segmentación neuronal. 0:11:48.038,0:11:51.706 Ahora, podemos segmentar neuronas de forma[br]casi tan precisa como las personas, 0:11:51.706,0:11:54.423 y este sistema fue desarrollado[br]por aprendizaje profundo 0:11:54.423,0:11:56.694 usando a gente sin experiencia[br]previa en medicina. 0:11:57.414,0:12:00.901 Como yo, alguien sin experiencia[br]previa en medicina, 0:12:00.901,0:12:04.628 parezco completamente calificado[br]para empezar una empresa médica, 0:12:04.628,0:12:06.054 y lo hice. 0:12:06.774,0:12:08.514 Estaba aterrorizado de hacerlo, 0:12:08.514,0:12:11.403 pero la teoría parecía sugerir[br]que podía ser posible 0:12:11.403,0:12:15.965 hacer medicina muy útil usando solo[br]estas técnicas de información analítica. 0:12:16.475,0:12:18.835 Afortunadamente, la recompensa[br]ha sido fantástica, 0:12:18.835,0:12:21.191 no solo por parte de los medios[br]sino de la comunidad médica, 0:12:21.191,0:12:22.985 que nos ha apoyado mucho. 0:12:23.285,0:12:27.714 La teoría es que podemos tomar[br]media parte del proceso médico 0:12:27.714,0:12:30.437 y convertirlo todo lo posible[br]en análisis de datos, 0:12:30.437,0:12:33.032 dejando a los médicos[br]en lo que son mejores. 0:12:33.842,0:12:35.284 Quiero dar un ejemplo. 0:12:35.284,0:12:40.728 Nos lleva unos 15 minutos crear[br]una nueva prueba de diagnóstico médico 0:12:40.728,0:12:42.532 y ahora lo demostraré[br]en tiempo real, 0:12:42.532,0:12:44.304 pero lo he comprimido a 3 minutos 0:12:44.304,0:12:45.826 cortando algunas partes. 0:12:45.826,0:12:49.062 En vez de mostrar cómo crear[br]una prueba de diagnóstico médico, 0:12:49.062,0:12:52.599 mostraré una prueba de diagnóstico[br]de imágenes de autos, 0:12:52.599,0:12:54.821 porque es algo que[br]todos podemos entender. 0:12:54.821,0:12:57.612 Así que, empezamos con un millón[br]y medio de imágenes de autos, 0:12:57.612,0:13:01.228 y quiero crear algo que[br]pueda dividirlas en el ángulo 0:13:01.228,0:13:03.041 en el que la foto fue tomada. 0:13:03.041,0:13:06.979 Estas imágenes están sin etiquetar,[br]así que tengo que empezar desde cero. 0:13:06.979,0:13:09.204 Con nuestro algoritmo[br]de aprendizaje profundo, 0:13:09.204,0:13:12.611 se pueden identificar automáticamente[br]áreas de la estructura en estas imágenes. 0:13:12.611,0:13:16.531 Lo bueno es que la persona y el computador[br]pueden trabajar juntos. 0:13:16.531,0:13:18.709 Así que la persona,[br]como pueden ver aquí, 0:13:18.709,0:13:21.384 le está indicando al computador[br]áreas de interés 0:13:21.384,0:13:26.034 que quiere que el computador pruebe[br]y use para mejorar su algoritmo. 0:13:26.034,0:13:30.330 Estos sistemas de aprendizaje profundo[br]están en un espacio de 16 000 dimensiones, 0:13:30.330,0:13:33.762 así, pueden ver aquí cómo el computador[br]rota esto en ese espacio, 0:13:33.762,0:13:35.754 intentando encontrar [br]nuevas áreas de estructura. 0:13:35.754,0:13:37.535 Y cuando lo hace con éxito, 0:13:37.535,0:13:41.539 la persona que lo maneja puede, entonces,[br]señalar las áreas de interés. 0:13:41.539,0:13:43.961 Aquí, el computador ha encontrado,[br]con éxito, áreas, 0:13:43.961,0:13:46.143 por ejemplo, ángulos. 0:13:46.143,0:13:47.669 Conforme avanzamos en este proceso, 0:13:47.669,0:13:49.799 vamos diciendo, gradualmente,[br]al computador más y más 0:13:49.799,0:13:52.157 sobre los tipos de estructuras[br]que estamos buscando. 0:13:52.157,0:13:54.669 Pueden imaginar en una prueba diagnóstica[br]que esto debería ser 0:13:54.669,0:13:58.019 un patólogo identificando[br]áreas patológicas, por ejemplo, 0:13:58.019,0:14:03.045 o un radiólogo indicando nódulos[br]potencialmente problemáticos. 0:14:03.045,0:14:05.174 A veces puede ser difícil[br]para el algoritmo. 0:14:05.174,0:14:06.768 En este caso, queda algo confuso. 0:14:06.768,0:14:09.948 Las partes delanteras y traseras[br]de los autos están todas mezcladas. 0:14:09.948,0:14:12.000 Así que tenemos que ser[br]un poco más cuidadosos, 0:14:12.000,0:14:14.192 seleccionando manualmente [br]las partes delanteras 0:14:14.192,0:14:18.014 en contraposición a las traseras, 0:14:18.014,0:14:20.638 para luego decir al computador[br]que este es una especie de grupo 0:14:20.638,0:14:22.086 es en el que estamos interesados. 0:14:22.086,0:14:24.153 Hacemos esto por un tiempo,[br]nos saltamos un poco, 0:14:24.153,0:14:26.499 y luego probamos el algoritmo[br]de aprendizaje automático 0:14:26.499,0:14:29.173 basado en un par de cientos de cosas, 0:14:29.173,0:14:30.668 y esperamos que haya mejorado mucho. 0:14:30.668,0:14:33.631 Se puede ver, que han empezado [br]a desvanecerse algunas de estas imágenes, 0:14:33.631,0:14:36.077 mostrándonos que ya está reconociendo 0:14:36.077,0:14:38.153 cómo entender por sí mismo [br]algunas de ellas. 0:14:38.153,0:14:41.261 Entonces podemos usar este concepto[br]en imágenes similares, 0:14:41.261,0:14:43.975 y usando imágenes similares,[br]como pueden ver, en este punto, 0:14:43.975,0:14:47.994 el computador puede encontrar[br]solo la parte delantera de los autos. 0:14:47.994,0:14:50.942 En este punto, la persona[br]puede decir al computador, 0:14:50.942,0:14:53.235 de acuerdo, sí, has hecho[br]un buen trabajo. 0:14:54.405,0:14:56.590 En ocasiones, por supuesto,[br]incluso en este punto 0:14:56.590,0:14:59.854 sigue siendo difícil[br]separar los grupos. 0:15:00.034,0:15:02.105 En este caso, incluso[br]después de que dejamos 0:15:02.105,0:15:04.516 al computador que intente girar[br]esto por un momento, 0:15:04.516,0:15:06.377 seguimos encontrando [br]que la parte izquierda 0:15:06.377,0:15:08.595 y derecha de las imágenes[br]están mezcladas. 0:15:08.595,0:15:11.115 Así que podemos dar, de nuevo,[br]al computador algunas pistas, 0:15:11.115,0:15:14.091 y decimos, bien, intenta encontrar[br]una proyección que separe 0:15:14.091,0:15:16.698 los lados izquierdos de los derechos[br]de la manera más precisa 0:15:16.698,0:15:18.820 usando este algoritmo[br]de aprendizaje profundo. 0:15:18.820,0:15:21.762 Y dándole esta pista...[br]ah, bien, ha tenido éxito. 0:15:21.762,0:15:24.644 Consiguió encontrar la manera[br]de pensar estos objetos 0:15:24.644,0:15:27.024 que está separando[br]estos que están juntos. 0:15:27.024,0:15:29.462 Así se entiende la idea aquí. 0:15:29.462,0:15:35.641 Este es un caso en el que la persona[br]no es reemplazada por un computador, 0:15:37.659,0:15:40.299 sino que trabajan juntos. 0:15:40.299,0:15:43.849 Estamos reemplazando algo que[br]solía necesitar de un equipo 0:15:43.849,0:15:45.851 de 5 o 6 personas durante 7 años 0:15:45.851,0:15:48.456 por algo que lleva 15 minutos 0:15:48.456,0:15:50.961 a una sola persona. 0:15:50.961,0:15:54.911 Este proceso lleva[br]unas 4 o 5 iteraciones. 0:15:54.911,0:15:56.770 Ahora pueden ver que tenemos un 62 % 0:15:56.770,0:15:59.629 de nuestro millón y medio de imágenes[br]clasificadas correctamente. 0:15:59.629,0:16:01.871 En este punto, podemos empezar,[br]con bastante rapidez, 0:16:01.871,0:16:03.498 a tomar grandes secciones completas, 0:16:03.498,0:16:06.417 comprobándolas para asegurarse[br]que no hay errores. 0:16:06.417,0:16:10.369 Cuando hay errores,[br]podemos hacérselo saber al computador. 0:16:10.369,0:16:13.414 Usando este tipo de proceso[br]para cada uno de los diferentes grupos, 0:16:13.414,0:16:15.901 nos colocamos en un índice[br]del 80 % de éxito 0:16:15.901,0:16:18.316 en la clasificación de un millón[br]y medio de imágenes. 0:16:18.316,0:16:20.394 En este punto, es solo cuestión 0:16:20.394,0:16:23.973 de encontrar el pequeño número[br]que no está clasificado correctamente, 0:16:23.973,0:16:26.861 e intentar comprender el porqué. 0:16:26.861,0:16:28.604 Usando este enfoque, 0:16:28.604,0:16:32.725 en 15 minutos alcanza un índice[br]de clasificación del 97 %. 0:16:32.725,0:16:37.325 Este tipo de técnica nos permite[br]arreglar un problema mayor, 0:16:37.331,0:16:40.367 que es que hay una falta de[br]conocimientos médicos en el mundo. 0:16:40.367,0:16:43.856 El Foro Económico Mundial[br]dice que hay entre 10 y 20 veces 0:16:43.856,0:16:46.480 de escasez de físicos[br]en el mundo desarrollado, 0:16:46.480,0:16:48.593 y llevará unos 300 años 0:16:48.593,0:16:51.487 entrenar a gente suficiente[br]para arreglar el problema. 0:16:51.487,0:16:54.372 Imaginen que pudiésemos ayudar[br]a aumentar su eficiencia 0:16:54.372,0:16:57.211 usando estos métodos[br]de aprendizaje profundo. 0:16:57.211,0:16:59.443 Estoy muy entusiasmado[br]con las oportunidades. 0:16:59.443,0:17:02.032 También estoy preocupado[br]por los problemas. 0:17:02.032,0:17:05.156 El problema aquí es que[br]cada área azul de este mapa 0:17:05.156,0:17:08.925 es algún sitio donde el empleo,[br]de servicios es mayor del 80 %. 0:17:08.925,0:17:10.712 ¿Qué son los servicios? 0:17:10.712,0:17:12.226 Los servicios son estos. 0:17:12.226,0:17:14.542 Estas son también las mismas cosas 0:17:14.542,0:17:16.878 que los computadores acaban[br]de aprender a hacer. 0:17:16.878,0:17:20.184 Así que el 80 % del empleo mundial[br]en el mundo desarrollado 0:17:20.184,0:17:22.715 son cosas que los computadores[br]acaban de aprender a hacer. 0:17:22.715,0:17:24.156 ¿Qué significa esto? 0:17:24.156,0:17:26.739 Bueno, no habrá problema,[br]lo reemplazarán por otros trabajos. 0:17:26.739,0:17:29.446 Por ejemplo, habrá más trabajos[br]para los científicos de datos. 0:17:29.446,0:17:30.263 Bueno, realmente no. 0:17:30.263,0:17:33.381 A los científicos de datos no les lleva[br]mucho tiempo construir estas cosas. 0:17:33.381,0:17:36.633 Por ejemplo, estos 4 algoritmos[br]fueron creados por el mismo chico. 0:17:36.633,0:17:39.071 Así que si piensan,[br]todo ha pasado ya antes, 0:17:39.071,0:17:42.879 hemos visto los resultados en el pasado[br]de cuando surgen cosas nuevas 0:17:42.879,0:17:45.131 y son reemplazadas por nuevos trabajos. 0:17:45.131,0:17:47.247 ¿Qué trabajos van a ser? 0:17:47.247,0:17:49.118 Es muy difícil para nosotros[br]hacer una estimación 0:17:49.118,0:17:51.857 ya que el comportamiento humano[br]crece a un ritmo gradual, 0:17:51.857,0:17:54.419 pero ahora tenemos un sistema,[br]aprendizaje profundo, 0:17:54.419,0:17:57.646 que sabemos que crece en capacidad,[br]exponencialmente. 0:17:57.646,0:17:59.251 Y aquí estamos. 0:17:59.251,0:18:01.182 Actualmente, vemos las cosas[br]a nuestro alrededor 0:18:01.182,0:18:03.988 y decimos: "Los computadores siguen[br]siendo un poco estúpidos". ¿Verdad? 0:18:03.988,0:18:07.417 Pero en 5 años, los computadores[br]estarán fuera de esta gráfica. 0:18:07.417,0:18:10.932 Así que necesitamos empezar a pensar[br]sobre esta capacidad ahora mismo. 0:18:10.932,0:18:12.932 Lo hemos visto anteriormente,[br]por supuesto. 0:18:12.932,0:18:14.559 En la Revolución Industrial, 0:18:14.559,0:18:17.160 vimos un cambio en la capacidad[br]gracias a los motores. 0:18:18.060,0:18:21.418 El asunto es, sin embargo, que tras[br]un tiempo, las cosas se nivelan. 0:18:21.418,0:18:23.160 Hubo una alteración social,[br]pero una vez que 0:18:23.160,0:18:24.781 los motores se usaron 0:18:24.781,0:18:26.562 para generar energía[br]en todas las situaciones, 0:18:26.562,0:18:28.293 las cosas realmente se establecieron. 0:18:28.603,0:18:30.454 La Revolución del Aprendizaje Automático 0:18:30.454,0:18:32.895 va a ser diferente[br]a la Revolución Industrial porque 0:18:32.895,0:18:35.692 la Revolución del Aprendizaje Automático,[br]nunca se asienta. 0:18:36.229,0:18:39.367 Cuanto mejores son los computadores[br]en actividades intelectuales, 0:18:39.367,0:18:43.615 mejores computadores se crearán para[br]que mejoren su capacidad intelectual, 0:18:43.615,0:18:45.523 así que esto va a ser[br]una especie de cambio 0:18:45.523,0:18:48.001 que nunca antes había[br]experimentado el mundo, 0:18:48.001,0:18:51.307 por lo que el entendimiento previo[br]de lo posible, es diferente. 0:18:51.727,0:18:53.507 Esto nos impacta. 0:18:53.507,0:18:57.137 En los últimos 25 años, la productividad[br]del capital se ha incrementado, 0:18:57.153,0:19:01.341 la productividad laboral se ha mantenido,[br]incluso ha descendido. 0:19:02.161,0:19:04.902 Por lo que quiero que empecemos[br]a discutir esto ahora. 0:19:04.902,0:19:07.309 Sé que cuando hablo[br]sobre esta situación 0:19:07.309,0:19:09.049 la gente puede ser despectiva. 0:19:09.049,0:19:11.092 Bueno, los computadores[br]no pueden realmente pensar, 0:19:11.092,0:19:13.610 no tienen sentimientos,[br]no entienden poesía, 0:19:13.610,0:19:16.191 no entendemos realmente cómo funcionan. 0:19:16.191,0:19:17.197 Y, ¿qué? 0:19:17.197,0:19:19.631 Actualmente los computadores[br]pueden hacer cosas 0:19:19.631,0:19:22.520 en las que las personas gastan su tiempo[br]y les pagan por ello 0:19:22.520,0:19:24.486 así pues ahora tenemos [br]que empezar a pensar 0:19:24.486,0:19:28.552 sobre cómo vamos a ajustar[br]nuestras estructuras sociales y económicas 0:19:28.576,0:19:30.608 para ser conscientes de [br]esta nueva realidad. 0:19:30.608,0:19:32.141 Gracias. 0:19:32.141,0:19:33.141 (Aplausos)