WEBVTT 00:00:06.070 --> 00:00:07.120 Hola, mi nombre es John. 00:00:07.510 --> 00:00:10.140 Lidero los equipos de búsqueda y aprendizaje de máquinas en Google. 00:00:12.130 --> 00:00:14.230 Creo que es increíblemente inspirador 00:00:14.230 --> 00:00:16.214 que personas de todo el mundo 00:00:16.215 --> 00:00:19.160 usen los motores de búsqueda para hacer preguntas simples 00:00:19.160 --> 00:00:20.930 y preguntas súper importantes. 00:00:20.930 --> 00:00:23.450 Por eso, es una gran responsabilidad darles 00:00:23.450 --> 00:00:24.864 las respuestas que buscan. 00:00:26.710 --> 00:00:30.610 Hola, mi nombres es Akshaya y trabajo en el equipo de búsqueda de Bing. 00:00:30.910 --> 00:00:33.190 Hay muchas veces en las que empezamos a investigar 00:00:33.190 --> 00:00:35.800 la inteligencia artificial y el aprendizaje de máquinas, 00:00:35.830 --> 00:00:39.010 pero tenemos que abordar cómo los usuarios van a utilizar esto, 00:00:39.140 --> 00:00:42.390 porque, al fin y al cabo, queremos generar un impacto en la sociedad. 00:00:43.780 --> 00:00:45.400 Hagamos una pregunta simple. 00:00:45.820 --> 00:00:48.070 ¿Cuánto tiempo se tarda en viajar a Marte? 00:00:49.330 --> 00:00:50.950 ¿De dónde vinieron estos resultados 00:00:51.370 --> 00:00:54.100 y por qué esto apareció antes que esto otro? 00:00:55.700 --> 00:00:58.150 Vamos a explorar cómo el motor de búsqueda 00:00:58.150 --> 00:00:59.860 convirtió tu solicitud en un resultado. 00:01:00.690 --> 00:01:03.360 Lo primero que necesitas saber es que, cuando haces una búsqueda, 00:01:03.430 --> 00:01:06.480 el motor de búsqueda en realidad no va a la World Wide Web 00:01:06.480 --> 00:01:08.010 para realizar tu búsqueda en tiempo real. 00:01:08.140 --> 00:01:10.610 Y eso es porque hay más de mil millones de sitios web 00:01:10.610 --> 00:01:14.140 en Internet y cientos más se crean cada minuto. 00:01:14.140 --> 00:01:16.210 Entonces, si el motor de búsqueda tiene que buscar a través de 00:01:16.240 --> 00:01:18.690 todos esos sitios para encontrar lo que solicitaste, 00:01:18.690 --> 00:01:20.120 podría tardar una eternidad. 00:01:20.500 --> 00:01:21.940 Para que tu búsqueda sea más rápida, 00:01:21.970 --> 00:01:24.940 los motores de búsqueda analizan la web constantemente 00:01:25.420 --> 00:01:28.560 para registrar información que puede ayudar con tu búsqueda más adelante. 00:01:28.930 --> 00:01:31.270 De esa manera, cuando buscas sobre viajar a Marte, 00:01:31.630 --> 00:01:33.700 el motor de búsqueda ya tiene lo que necesita 00:01:33.700 --> 00:01:35.728 para darte una respuesta en tiempo real. 00:01:36.250 --> 00:01:37.540 Así es cómo funciona. 00:01:37.900 --> 00:01:42.010 Internet es una red de páginas conectadas entre sí por hipervínculos. 00:01:42.400 --> 00:01:44.680 Los motores de búsqueda ejecutan constantemente un programa 00:01:44.680 --> 00:01:47.380 llamado Araña que atraviesa estas páginas web 00:01:47.380 --> 00:01:49.040 para recolectar información sobre ellas. 00:01:49.780 --> 00:01:51.550 Cada vez que encuentra un hipervínculo, 00:01:52.090 --> 00:01:55.000 lo sigue hasta que ha visitado todas las páginas 00:01:55.030 --> 00:01:57.240 que puede encontrar en Internet. 00:01:57.335 --> 00:01:59.170 En cada página que visita, 00:01:59.200 --> 00:02:02.320 registra información que puede necesitar para una búsqueda 00:02:02.500 --> 00:02:05.650 y la agrega a una base de datos especial llamada índice de búsqueda. 00:02:07.166 --> 00:02:09.530 Ahora, volvamos a la búsqueda anterior 00:02:09.590 --> 00:02:11.990 y veamos si podemos descubrir cómo el motor de búsqueda 00:02:11.990 --> 00:02:13.333 obtiene los resultados. 00:02:13.640 --> 00:02:16.460 Cuando preguntas cuánto tiempo se necesita para viajar a Marte, 00:02:16.640 --> 00:02:18.860 el motor de búsqueda busca cada una de esas palabras 00:02:18.920 --> 00:02:21.410 en el índice de búsqueda para obtener al instante una lista 00:02:21.410 --> 00:02:24.500 de todas las páginas de Internet que contienen esas palabras. 00:02:24.890 --> 00:02:26.870 Pero la búsqueda de esos términos de búsqueda 00:02:26.870 --> 00:02:28.760 puede devolver millones de páginas, 00:02:28.760 --> 00:02:31.110 por lo que el motor de búsqueda necesita poder determinar 00:02:31.110 --> 00:02:33.120 las mejores coincidencias para mostrártelas primero. 00:02:33.340 --> 00:02:36.010 Aquí es donde se pone complicado porque el motor de búsqueda 00:02:36.010 --> 00:02:38.040 puede que necesite adivinar qué estas buscando. 00:02:38.930 --> 00:02:41.360 Cada motor de búsqueda usa su propio algoritmo 00:02:41.360 --> 00:02:44.230 para clasificar las páginas según lo que cree que quieres. 00:02:44.930 --> 00:02:47.660 El algoritmo del motor de búsqueda puede comprobar 00:02:47.990 --> 00:02:50.360 si tu término de búsqueda se muestra arriba en la página, 00:02:50.900 --> 00:02:53.820 si todas las palabras aparecen una al lado de la otra, 00:02:54.520 --> 00:02:57.020 o cualquier otro cálculo 00:02:57.020 --> 00:02:58.610 que lo ayude a determinar mejor 00:02:58.670 --> 00:03:01.420 qué páginas querrás ver y cuáles no. 00:03:02.960 --> 00:03:04.960 Google inventó el algoritmo más famoso 00:03:04.960 --> 00:03:08.530 para elegir los resultados más relevantes en una búsqueda al tener en cuenta 00:03:08.560 --> 00:03:11.230 cuántas otras páginas web se vinculan a una página determinada. 00:03:11.830 --> 00:03:14.140 La idea es que si muchos sitios web piensan 00:03:14.140 --> 00:03:15.660 que una página web es interesante, 00:03:15.660 --> 00:03:17.940 entonces probablemente sea la que estás buscando. 00:03:18.190 --> 00:03:20.020 Este algoritmo se llama PageRank, 00:03:20.590 --> 00:03:22.330 no porque clasifique las páginas web, 00:03:22.570 --> 00:03:25.210 sino en honor a su inventor, Larry Page, 00:03:25.480 --> 00:03:27.333 uno de los fundadores de Google. 00:03:27.940 --> 00:03:30.520 Como un sitio web suele ganar dinero cuando lo visitas, 00:03:30.820 --> 00:03:32.950 los spammers siempre buscan formas 00:03:32.950 --> 00:03:35.741 de jugar con el algoritmo de búsqueda para que sus páginas 00:03:35.742 --> 00:03:37.931 se muestren primero en los resultados. 00:03:38.260 --> 00:03:40.750 Los motores de búsqueda actualizan periódicamente sus algoritmos 00:03:40.750 --> 00:03:44.296 para evitar que los sitios falsos o no confiables lleguen a la cima. 00:03:44.680 --> 00:03:47.350 En última instancia, depende de ti estar atento 00:03:47.500 --> 00:03:49.450 a estas páginas que no son confiables. 00:03:49.690 --> 00:03:52.990 Mira la dirección web y asegúrate de que sea una fuente confiable. 00:03:53.680 --> 00:03:55.390 Los programas de búsqueda siempre están evolucionando 00:03:55.420 --> 00:03:58.420 para mejorar los algoritmos y devolver mejores resultados, 00:03:58.540 --> 00:04:00.460 más rápido que sus competidores. 00:04:01.000 --> 00:04:03.100 Los motores de búsqueda hoy usan información 00:04:03.100 --> 00:04:06.820 que no proporcionaste explícitamente para ayudarte a precisar tu búsqueda. 00:04:07.150 --> 00:04:10.120 Por ejemplo, si hiciste una búsqueda de parques para perros, 00:04:10.240 --> 00:04:12.190 muchos motores de búsqueda te mostrarían resultados 00:04:12.190 --> 00:04:13.840 de todos los parques para perros cercanos, 00:04:14.080 --> 00:04:16.260 aunque no hayas escrito tu ubicación. 00:04:17.800 --> 00:04:20.530 Los motores de búsqueda modernos también entienden más 00:04:20.530 --> 00:04:22.060 que solo las palabras en una página. 00:04:22.300 --> 00:04:24.970 Entienden lo que realmente significan, para encontrar 00:04:24.970 --> 00:04:26.750 el resultado más adecuado para tu búsqueda. 00:04:27.130 --> 00:04:29.980 Por ejemplo, si buscas fast pitcher, 00:04:30.280 --> 00:04:32.300 sabrá que buscas un atleta. 00:04:32.500 --> 00:04:34.450 Pero si buscas large pitcher, 00:04:34.450 --> 00:04:36.730 encontrará opciones para tu cocina. 00:04:38.420 --> 00:04:41.910 Para entender mejor las palabras, usamos algo llamado aprendizaje de máquinas, 00:04:41.910 --> 00:04:43.985 un tipo de inteligencia artificial. 00:04:43.985 --> 00:04:46.050 Permite que los algoritmos de búsqueda busquen 00:04:46.090 --> 00:04:48.400 no solo letras o palabras sueltas en la página, 00:04:48.400 --> 00:04:51.280 sino que entiendan el significado detrás de las palabras. 00:04:53.690 --> 00:04:55.850 Internet crece exponencialmente 00:04:56.210 --> 00:04:59.810 pero, si los equipos que diseñan los motores de búsqueda hacen bien su trabajo, 00:05:00.080 --> 00:05:04.090 la información que buscas está siempre a unas pocas teclas de distancia.