WEBVTT 00:00:00.937 --> 00:00:02.112 En el futuro, 00:00:02.136 --> 00:00:05.790 los vehículos autónomos serán más seguros y confiables que las personas. 00:00:06.175 --> 00:00:09.988 Pero para esto, requerimos tecnologías que permitan a los vehículos responder 00:00:10.018 --> 00:00:11.442 más rápido que las personas. 00:00:11.466 --> 00:00:15.020 Necesitamos algoritmos capaces de conducir mejor que las personas, 00:00:15.204 --> 00:00:19.307 y cámaras capaces de ver más que el ojo humano. 00:00:20.061 --> 00:00:24.631 Por ejemplo, imaginen que un vehículo autónomo está por dar un giro a ciegas 00:00:24.655 --> 00:00:26.383 y otro automóvil se aproxima 00:00:26.393 --> 00:00:29.026 o quizá un niño está a punto de cruzar la calle. 00:00:29.458 --> 00:00:33.022 Por suerte, nuestro auto del futuro tendrá este superpoder: 00:00:33.046 --> 00:00:37.145 una cámara capaz de ver detrás de las esquinas y detectar posibles peligros. 00:00:37.876 --> 00:00:40.029 Los últimos años he trabajado como doctorando 00:00:40.039 --> 00:00:42.750 en el laboratorio de imágenes computacionales de Standford 00:00:42.770 --> 00:00:45.034 en una cámara que puede hacer exactamente eso: 00:00:45.058 --> 00:00:48.456 escanear objetos detrás de las esquinas 00:00:48.480 --> 00:00:51.162 o que no están al alcance directo de la vista. 00:00:51.276 --> 00:00:54.728 Déjenme mostrarles lo que nuestra cámara puede ver. 00:00:54.752 --> 00:00:57.315 En este experimento realizado en el exterior, 00:00:57.339 --> 00:01:01.149 nuestro sistema de cámaras escanea el lateral del edificio con un láser, 00:01:01.173 --> 00:01:03.133 y la escena que queremos capturar 00:01:03.157 --> 00:01:06.077 está oculta al doblar la esquina, detrás de esta cortina. 00:01:06.141 --> 00:01:09.218 Así que nuestra cámara no puede verla de forma directa. 00:01:09.561 --> 00:01:10.729 Aun así, de algún modo, 00:01:10.753 --> 00:01:15.301 nuestra cámara puede capturar la geometría 3D de la escena. 00:01:15.704 --> 00:01:17.104 ¿Cómo lo conseguimos? 00:01:17.498 --> 00:01:20.220 La magia sucede aquí, en este sistema de cámaras. 00:01:20.244 --> 00:01:23.499 Pueden considerarla como una cámara de gran velocidad, 00:01:23.593 --> 00:01:27.063 una que funciona no a 1000 cuadros por segundo, 00:01:27.087 --> 00:01:29.832 ni siquiera a un millón de cuadros por segundo, 00:01:29.856 --> 00:01:32.259 sino a un billón de cuadros por segundo. 00:01:33.023 --> 00:01:37.998 Funciona tan rápido, que hasta puede capturar el movimiento de la luz. 00:01:38.652 --> 00:01:42.295 Y para darles un ejemplo de lo muy rápido que viaja la luz, 00:01:42.319 --> 00:01:46.514 comparémosla con la velocidad de un superhéroe de historietas 00:01:46.518 --> 00:01:49.646 capaz de correr tres veces más rápido que la velocidad del sonido. 00:01:50.201 --> 00:01:54.400 Un rayo de luz demora unas 3300 millonésimas de segundo, 00:01:54.424 --> 00:01:56.297 o 3.3 nanosegundos, 00:01:56.321 --> 00:01:58.450 en recorrer la distancia de un metro. 00:01:58.474 --> 00:02:00.409 Al mismo tiempo, 00:02:00.433 --> 00:02:04.307 nuestro superhéroe se ha movido menos de 1 mm. 00:02:04.633 --> 00:02:05.900 Eso es bastante rápido. 00:02:06.306 --> 00:02:08.700 Pero tenemos que imaginarnos algo mucho más rápido 00:02:08.740 --> 00:02:10.792 si pretendemos capturar la luz en movimiento 00:02:10.813 --> 00:02:12.553 a escalas por debajo del cm. 00:02:12.784 --> 00:02:15.281 Nuestro sistema de cámaras puede capturar fotones 00:02:15.305 --> 00:02:18.821 en periodos de tiempo de apenas 50 billonésimas de segundo, 00:02:18.845 --> 00:02:20.590 o 50 picosegundos. 00:02:21.821 --> 00:02:24.323 Así que tomamos esta cámara ultrarápida 00:02:24.347 --> 00:02:28.021 y la combinamos con un láser que emite pulsos cortos de luz. 00:02:28.553 --> 00:02:31.048 Cada pulso viaja hacia esta pared visible 00:02:31.068 --> 00:02:33.413 y un poco de luz se dispersa hacia nuestra cámara, 00:02:33.433 --> 00:02:36.763 pero la pared también dispersa la luz hacia el otro lado de la esquina, 00:02:36.773 --> 00:02:38.736 hacia el objeto oculto y de regreso. 00:02:39.363 --> 00:02:41.601 Repetimos esto varias veces 00:02:41.625 --> 00:02:44.165 para capturar el tiempo de llegada de muchos fotones 00:02:44.189 --> 00:02:46.196 desde diferentes puntos de la pared. 00:02:46.300 --> 00:02:48.236 Tras capturar estas medidas, 00:02:48.300 --> 00:02:51.815 podemos crear un video de la pared de un billón de cuadros por segundo. 00:02:52.371 --> 00:02:55.379 Si bien esta pared nos parece corriente, 00:02:55.403 --> 00:02:59.878 a un billón de cuadros por segundo, podemos ver algo increíble. 00:03:00.275 --> 00:03:02.822 Podemos ver las ondas de luz 00:03:02.856 --> 00:03:06.733 que se dispersan y regresan desde la escena oculta y chocan contra la pared. 00:03:07.063 --> 00:03:10.015 Cada una de estas ondas transporta información 00:03:10.039 --> 00:03:12.317 sobre el objeto oculto que la envió. 00:03:12.341 --> 00:03:14.022 Podemos tomar estas medidas 00:03:14.046 --> 00:03:16.545 y pasarlas por un algoritmo de reconstrucción 00:03:16.569 --> 00:03:20.450 para recuperar de esta manera la geometría 3D de la escena oculta. 00:03:21.379 --> 00:03:25.189 Quiero mostrarles un ejemplo más de una escena de interior que capturamos, 00:03:25.213 --> 00:03:28.143 esta vez con varios objetos diferentes ocultos. 00:03:28.177 --> 00:03:30.384 Estos objetos tienen apariencias muy distintas, 00:03:30.408 --> 00:03:32.425 así que reflejan la luz de forma diferente. 00:03:32.465 --> 00:03:36.109 Por ejemplo, esta estatua brillante de dragón refleja la luz diferente 00:03:36.133 --> 00:03:40.600 que la bola de disco y que la estatua blanca del discóbolo. 00:03:40.998 --> 00:03:44.417 Hasta podemos ver las diferencias en la luz que se refleja 00:03:44.441 --> 00:03:50.451 al visualizarla como este volumen 3D, donde hemos apilado los cuadros del video. 00:03:50.640 --> 00:03:54.939 Aquí el tiempo se representa como la profundidad de este cubo. 00:03:55.914 --> 00:03:59.105 Estos puntos brillantes que ven son el reflejo de la luz 00:03:59.129 --> 00:04:01.675 desde cada una de las caras de la bola de disco 00:04:01.699 --> 00:04:03.980 que se dispersan por la pared con el tiempo. 00:04:04.422 --> 00:04:07.958 Las vetas brillantes de luz que ven llegar más rápido 00:04:07.982 --> 00:04:11.812 provienen de la estatua brillante de dragón, pues es lo más cercano a la pared, 00:04:11.966 --> 00:04:15.767 y las otras vetas de luz provienen de reflejos de luz del estante de libros 00:04:15.791 --> 00:04:17.154 y de la estatua. 00:04:17.727 --> 00:04:21.614 Ahora bien, podemos también visualizar estas medidas cuadro por cuadro, 00:04:21.638 --> 00:04:22.830 como un video, 00:04:22.854 --> 00:04:24.736 para así ver la luz dispersa. 00:04:25.461 --> 00:04:29.080 De nuevo, aquí vemos primero los reflejos de la luz del dragón, 00:04:29.104 --> 00:04:30.350 lo más cercano a la pared, 00:04:30.374 --> 00:04:33.763 luego los puntos brillantes de la bola de disco 00:04:33.787 --> 00:04:36.506 y otros reflejos provenientes del estante. 00:04:36.530 --> 00:04:41.072 Finalmente, vemos las ondas de luz que refleja la estatua. 00:04:41.840 --> 00:04:44.633 Estas ondas de luz que iluminan la pared 00:04:44.657 --> 00:04:49.455 son como fuegos artificiales que duran apenas billonésimas de segundo. 00:04:53.649 --> 00:04:56.778 Si bien estos objetos reflejan la luz de diversas formas, 00:04:56.919 --> 00:04:59.553 Aun así, es posible reconstruir sus formas. 00:04:59.577 --> 00:05:02.585 Esto es lo que pueden ver detrás de la esquina. 00:05:03.547 --> 00:05:06.906 Quiero mostrarles un ejemplo más que tiene una pequeña variante. 00:05:07.000 --> 00:05:10.300 En este video, me ven con un traje reflectivo 00:05:10.404 --> 00:05:12.589 y nuestro sistema de cámaras escanea la pared 00:05:12.609 --> 00:05:14.866 a un ritmo de cuatro veces por segundo. 00:05:15.173 --> 00:05:16.387 El traje es reflectivo 00:05:16.411 --> 00:05:19.039 así que podemos capturar los fotones necesarios 00:05:19.093 --> 00:05:22.641 para determinar dónde estoy y qué estoy haciendo 00:05:22.665 --> 00:05:25.562 sin que la cámara me enfoque de forma directa. 00:05:25.586 --> 00:05:30.085 Al capturar los fotones que se dispersan desde la pared hacia mi traje, 00:05:30.105 --> 00:05:32.487 de regreso a la pared y nuevamente hacia la cámara, 00:05:32.517 --> 00:05:36.003 podemos capturar este video "indirecto" en tiempo real. 00:05:36.954 --> 00:05:40.160 Creemos que este tipo de escaneo no lineal 00:05:40.184 --> 00:05:43.910 puede ser útil en distintas aplicaciones: en los vehículos autónomos 00:05:43.934 --> 00:05:46.029 pero también en las bioimágenes, 00:05:46.053 --> 00:05:49.624 donde necesitamos ver el interior de las estructuras diminutas del cuerpo. 00:05:49.974 --> 00:05:53.475 Quizá podríamos equipar con sistemas de cámaras similares a los robots 00:05:53.499 --> 00:05:56.264 que enviamos a explorar otros planetas. 00:05:56.789 --> 00:05:59.705 Tal vez ya escucharon sobre cómo mirar detrás de las esquinas, 00:05:59.735 --> 00:06:03.099 pero lo que les mostré hoy habría sido imposible hace dos años. 00:06:03.181 --> 00:06:07.268 Por ejemplo, podemos escanear enormes escenas ocultas en el exterior 00:06:07.292 --> 00:06:08.991 en tiempo real, 00:06:09.165 --> 00:06:13.362 y hemos avanzado bastante en conseguir que esta tecnología 00:06:13.386 --> 00:06:15.969 pueda efectivamente detectar un automóvil en el futuro. 00:06:16.156 --> 00:06:18.666 Pero por supuesto, aún hay desafíos que superar. 00:06:18.760 --> 00:06:22.823 Por ejemplo, ¿podemos escanear escenas ocultas a larga distancia, 00:06:22.847 --> 00:06:25.440 en cuyo caso se recolectan muy pocos fotones, 00:06:26.014 --> 00:06:29.291 con láseres que usen poca energía y sean seguros para la vista? 00:06:29.641 --> 00:06:31.976 ¿Podemos crear imágenes a partir de los fotones 00:06:32.000 --> 00:06:36.519 que se han dispersado muchas más veces que un único rebote detrás de la esquina? 00:06:36.680 --> 00:06:41.323 ¿Podemos tomar nuestro prototipo que es, pues, actualmente muy grande 00:06:41.347 --> 00:06:45.087 y reducir su tamaño a algo que sea útil para las bioimágenes, 00:06:45.134 --> 00:06:48.220 o para un tipo de sistema mejorado de seguridad para el hogar? 00:06:48.244 --> 00:06:53.686 ¿Podemos darle a esta nueva modalidad de escaneo de imágenes otras aplicaciones? 00:06:53.780 --> 00:06:55.669 Es una tecnología nueva emocionante 00:06:55.693 --> 00:06:59.040 y podría haber otras aplicaciones que no hemos ni imaginado aún. 00:06:59.603 --> 00:07:02.388 Así que... un futuro en el que haya vehículos autónomos 00:07:02.412 --> 00:07:06.248 puede ahora parecernos distante, pero estamos desarrollando las tecnologías 00:07:06.288 --> 00:07:09.300 que podrían hacer que los autos sean más seguros e inteligentes. 00:07:09.698 --> 00:07:12.374 Con el acelerado ritmo de los descubrimientos científicos 00:07:12.384 --> 00:07:13.394 y las innovaciones, 00:07:13.424 --> 00:07:16.071 nunca se sabe qué nuevas y emocionantes aplicaciones 00:07:16.095 --> 00:07:18.179 podríamos encontrar tras doblar la esquina. 00:07:18.810 --> 00:07:21.730 (Aplausos)