1 00:00:06,070 --> 00:00:07,120 Hola, mi nombre es John. 2 00:00:07,510 --> 00:00:10,140 Lidero los equipos de búsqueda y aprendizaje de máquinas en Google. 3 00:00:12,130 --> 00:00:14,230 Creo que es increíblemente inspirador 4 00:00:14,230 --> 00:00:16,214 que personas de todo el mundo 5 00:00:16,215 --> 00:00:19,160 usen los motores de búsqueda para hacer preguntas simples 6 00:00:19,160 --> 00:00:20,930 y preguntas súper importantes. 7 00:00:20,930 --> 00:00:23,450 Por eso, es una gran responsabilidad darles 8 00:00:23,450 --> 00:00:24,864 las respuestas que buscan. 9 00:00:26,710 --> 00:00:30,610 Hola, mi nombres es Akshaya y trabajo en el equipo de búsqueda de Bing. 10 00:00:30,910 --> 00:00:33,190 Hay muchas veces en las que empezamos a investigar 11 00:00:33,190 --> 00:00:35,800 la inteligencia artificial y el aprendizaje de máquinas, 12 00:00:35,830 --> 00:00:39,010 pero tenemos que abordar cómo los usuarios van a utilizar esto, 13 00:00:39,140 --> 00:00:42,390 porque, al fin y al cabo, queremos generar un impacto en la sociedad. 14 00:00:43,780 --> 00:00:45,400 Hagamos una pregunta simple. 15 00:00:45,820 --> 00:00:48,070 ¿Cuánto tiempo se tarda en viajar a Marte? 16 00:00:49,330 --> 00:00:50,950 ¿De dónde vinieron estos resultados 17 00:00:51,370 --> 00:00:54,100 y por qué esto apareció antes que esto otro? 18 00:00:55,700 --> 00:00:58,150 Vamos a explorar cómo el motor de búsqueda 19 00:00:58,150 --> 00:00:59,860 convirtió tu solicitud en un resultado. 20 00:01:00,690 --> 00:01:03,360 Lo primero que necesitas saber es que, cuando haces una búsqueda, 21 00:01:03,430 --> 00:01:06,480 el motor de búsqueda en realidad no va a la World Wide Web 22 00:01:06,480 --> 00:01:08,010 para realizar tu búsqueda en tiempo real. 23 00:01:08,140 --> 00:01:10,610 Y eso es porque hay más de mil millones de sitios web 24 00:01:10,610 --> 00:01:14,140 en Internet y cientos más se crean cada minuto. 25 00:01:14,140 --> 00:01:16,210 Entonces, si el motor de búsqueda tiene que buscar a través de 26 00:01:16,240 --> 00:01:18,690 todos esos sitios para encontrar lo que solicitaste, 27 00:01:18,690 --> 00:01:20,120 podría tardar una eternidad. 28 00:01:20,500 --> 00:01:21,940 Para que tu búsqueda sea más rápida, 29 00:01:21,970 --> 00:01:24,940 los motores de búsqueda analizan la web constantemente 30 00:01:25,420 --> 00:01:28,560 para registrar información que puede ayudar con tu búsqueda más adelante. 31 00:01:28,930 --> 00:01:31,270 De esa manera, cuando buscas sobre viajar a Marte, 32 00:01:31,630 --> 00:01:33,700 el motor de búsqueda ya tiene lo que necesita 33 00:01:33,700 --> 00:01:35,728 para darte una respuesta en tiempo real. 34 00:01:36,250 --> 00:01:37,540 Así es cómo funciona. 35 00:01:37,900 --> 00:01:42,010 Internet es una red de páginas conectadas entre sí por hipervínculos. 36 00:01:42,400 --> 00:01:44,680 Los motores de búsqueda ejecutan constantemente un programa 37 00:01:44,680 --> 00:01:47,380 llamado Araña que atraviesa estas páginas web 38 00:01:47,380 --> 00:01:49,040 para recolectar información sobre ellas. 39 00:01:49,780 --> 00:01:51,550 Cada vez que encuentra un hipervínculo, 40 00:01:52,090 --> 00:01:55,000 lo sigue hasta que ha visitado todas las páginas 41 00:01:55,030 --> 00:01:57,240 que puede encontrar en Internet. 42 00:01:57,335 --> 00:01:59,170 En cada página que visita, 43 00:01:59,200 --> 00:02:02,320 registra información que puede necesitar para una búsqueda 44 00:02:02,500 --> 00:02:05,650 y la agrega a una base de datos especial llamada índice de búsqueda. 45 00:02:07,166 --> 00:02:09,530 Ahora, volvamos a la búsqueda anterior 46 00:02:09,590 --> 00:02:11,990 y veamos si podemos descubrir cómo el motor de búsqueda 47 00:02:11,990 --> 00:02:13,333 obtiene los resultados. 48 00:02:13,640 --> 00:02:16,460 Cuando preguntas cuánto tiempo se necesita para viajar a Marte, 49 00:02:16,640 --> 00:02:18,860 el motor de búsqueda busca cada una de esas palabras 50 00:02:18,920 --> 00:02:21,410 en el índice de búsqueda para obtener al instante una lista 51 00:02:21,410 --> 00:02:24,500 de todas las páginas de Internet que contienen esas palabras. 52 00:02:24,890 --> 00:02:26,870 Pero la búsqueda de esos términos de búsqueda 53 00:02:26,870 --> 00:02:28,760 puede devolver millones de páginas, 54 00:02:28,760 --> 00:02:31,110 por lo que el motor de búsqueda necesita poder determinar 55 00:02:31,110 --> 00:02:33,120 las mejores coincidencias para mostrártelas primero. 56 00:02:33,340 --> 00:02:36,010 Aquí es donde se pone complicado porque el motor de búsqueda 57 00:02:36,010 --> 00:02:38,040 puede que necesite adivinar qué estas buscando. 58 00:02:38,930 --> 00:02:41,360 Cada motor de búsqueda usa su propio algoritmo 59 00:02:41,360 --> 00:02:44,230 para clasificar las páginas según lo que cree que quieres. 60 00:02:44,930 --> 00:02:47,660 El algoritmo del motor de búsqueda puede comprobar 61 00:02:47,990 --> 00:02:50,360 si tu término de búsqueda se muestra arriba en la página, 62 00:02:50,900 --> 00:02:53,820 si todas las palabras aparecen una al lado de la otra, 63 00:02:54,520 --> 00:02:57,020 o cualquier otro cálculo 64 00:02:57,020 --> 00:02:58,610 que lo ayude a determinar mejor 65 00:02:58,670 --> 00:03:01,420 qué páginas querrás ver y cuáles no. 66 00:03:02,960 --> 00:03:04,960 Google inventó el algoritmo más famoso 67 00:03:04,960 --> 00:03:08,530 para elegir los resultados más relevantes en una búsqueda al tener en cuenta 68 00:03:08,560 --> 00:03:11,230 cuántas otras páginas web se vinculan a una página determinada. 69 00:03:11,830 --> 00:03:14,140 La idea es que si muchos sitios web piensan 70 00:03:14,140 --> 00:03:15,660 que una página web es interesante, 71 00:03:15,660 --> 00:03:17,940 entonces probablemente sea la que estás buscando. 72 00:03:18,190 --> 00:03:20,020 Este algoritmo se llama PageRank, 73 00:03:20,590 --> 00:03:22,330 no porque clasifique las páginas web, 74 00:03:22,570 --> 00:03:25,210 sino en honor a su inventor, Larry Page, 75 00:03:25,480 --> 00:03:27,333 uno de los fundadores de Google. 76 00:03:27,940 --> 00:03:30,520 Como un sitio web suele ganar dinero cuando lo visitas, 77 00:03:30,820 --> 00:03:32,950 los spammers siempre buscan formas 78 00:03:32,950 --> 00:03:35,741 de jugar con el algoritmo de búsqueda para que sus páginas 79 00:03:35,742 --> 00:03:37,931 se muestren primero en los resultados. 80 00:03:38,260 --> 00:03:40,750 Los motores de búsqueda actualizan periódicamente sus algoritmos 81 00:03:40,750 --> 00:03:44,296 para evitar que los sitios falsos o no confiables lleguen a la cima. 82 00:03:44,680 --> 00:03:47,350 En última instancia, depende de ti estar atento 83 00:03:47,500 --> 00:03:49,450 a estas páginas que no son confiables. 84 00:03:49,690 --> 00:03:52,990 Mira la dirección web y asegúrate de que sea una fuente confiable. 85 00:03:53,680 --> 00:03:55,390 Los programas de búsqueda siempre están evolucionando 86 00:03:55,420 --> 00:03:58,420 para mejorar los algoritmos y devolver mejores resultados, 87 00:03:58,540 --> 00:04:00,460 más rápido que sus competidores. 88 00:04:01,000 --> 00:04:03,100 Los motores de búsqueda hoy usan información 89 00:04:03,100 --> 00:04:06,820 que no proporcionaste explícitamente para ayudarte a precisar tu búsqueda. 90 00:04:07,150 --> 00:04:10,120 Por ejemplo, si hiciste una búsqueda de parques para perros, 91 00:04:10,240 --> 00:04:12,190 muchos motores de búsqueda te mostrarían resultados 92 00:04:12,190 --> 00:04:13,840 de todos los parques para perros cercanos, 93 00:04:14,080 --> 00:04:16,260 aunque no hayas escrito tu ubicación. 94 00:04:17,800 --> 00:04:20,530 Los motores de búsqueda modernos también entienden más 95 00:04:20,530 --> 00:04:22,060 que solo las palabras en una página. 96 00:04:22,300 --> 00:04:24,970 Entienden lo que realmente significan, para encontrar 97 00:04:24,970 --> 00:04:26,750 el resultado más adecuado para tu búsqueda. 98 00:04:27,130 --> 00:04:29,980 Por ejemplo, si buscas fast pitcher, 99 00:04:30,280 --> 00:04:32,300 sabrá que buscas un atleta. 100 00:04:32,500 --> 00:04:34,450 Pero si buscas large pitcher, 101 00:04:34,450 --> 00:04:36,730 encontrará opciones para tu cocina. 102 00:04:38,420 --> 00:04:41,910 Para entender mejor las palabras, usamos algo llamado aprendizaje de máquinas, 103 00:04:41,910 --> 00:04:43,985 un tipo de inteligencia artificial. 104 00:04:43,985 --> 00:04:46,050 Permite que los algoritmos de búsqueda busquen 105 00:04:46,090 --> 00:04:48,400 no solo letras o palabras sueltas en la página, 106 00:04:48,400 --> 00:04:51,280 sino que entiendan el significado detrás de las palabras. 107 00:04:53,690 --> 00:04:55,850 Internet crece exponencialmente 108 00:04:56,210 --> 00:04:59,810 pero, si los equipos que diseñan los motores de búsqueda hacen bien su trabajo, 109 00:05:00,080 --> 00:05:04,090 la información que buscas está siempre a unas pocas teclas de distancia.