1 00:00:06,000 --> 00:00:08,910 Hola. Mi nombre es John y lidero los equipos de búsqueda 2 00:00:08,910 --> 00:00:11,826 y aprendizaje automático en Google. 3 00:00:12,166 --> 00:00:16,380 Creo que es increíblemente inspirador que gente alrededor del mundo utilice 4 00:00:16,380 --> 00:00:20,614 buscadores para hacer preguntas triviales así como preguntas muy importantes. 5 00:00:20,614 --> 00:00:24,889 Por ello es una gran responsabilidad darles las mejores respuestas posibles. 6 00:00:26,128 --> 00:00:30,816 Hola. Mi nombre es Akshaya y yo trabajo en el equipo de búsqueda de Bing. 7 00:00:30,816 --> 00:00:35,577 Hay muchas ocasiones en las que pensamos en inteligencia artificial y aprendizaje 8 00:00:35,577 --> 00:00:39,247 automático, pero tenemos que contemplar cómo harán uso de ello los usuarios. 9 00:00:39,287 --> 00:00:43,243 Porque a final de cuentas queremos tener impacto en la sociedad. 10 00:00:44,013 --> 00:00:49,097 Hagamos una pregunta sencilla. ¿Cuánto tardamos en viajar a Marte? 11 00:00:49,097 --> 00:00:51,497 ¿De dónde vienen estos resultados? 12 00:00:51,497 --> 00:00:55,047 Y ¿por qué aparece primero un resultado antes que el otro? 13 00:00:55,047 --> 00:01:00,647 Bien. Veamos cómo el buscador convierte tu solicitud en un resultado. 14 00:01:00,817 --> 00:01:03,877 Lo primero que tienes que saber es que cuando haces una búsqueda, 15 00:01:03,877 --> 00:01:08,047 el buscador en realidad no va a Internet para hacer tu búsqueda en tiempo real. 16 00:01:08,370 --> 00:01:12,574 Y eso es porque hay más de mil millones de páginas en Internet y cientos más que 17 00:01:12,574 --> 00:01:14,517 están siendo creadas a cada minuto. 18 00:01:14,517 --> 00:01:18,337 Si el buscador tuviera que buscar en cada sitio para encontrar el que tú quieres, 19 00:01:18,337 --> 00:01:20,287 tomaría para siempre. 20 00:01:20,577 --> 00:01:23,797 Para hacer tu búsqueda más rápida, los buscadores están explorando 21 00:01:23,797 --> 00:01:27,327 constantemente la web de antemano para registrar la información que pueda 22 00:01:27,327 --> 00:01:29,407 ayudar con tu búsqueda después. 23 00:01:29,407 --> 00:01:33,467 De esa manera, cuando buscas información sobre viajes a Marte, el buscador ya tiene 24 00:01:33,467 --> 00:01:36,257 lo que necesita para darte una respuesta en tiempo real. 25 00:01:36,397 --> 00:01:38,397 Así es como funciona. 26 00:01:38,397 --> 00:01:42,707 Internet es como una telaraña de páginas conectadas a través de hipervínculos. 27 00:01:42,707 --> 00:01:46,640 Los buscadores constantemente corren un programa llamado "araña", que camina 28 00:01:46,640 --> 00:01:49,807 a través de estas páginas para recolectar información sobre ellas. 29 00:01:49,857 --> 00:01:53,947 Cada vez que encuentra un hipervínculo, lo sigue hasta que haya visitado cada 30 00:01:53,967 --> 00:01:57,227 página que pueda encontrar en toda la Internet. 31 00:01:57,227 --> 00:02:01,307 Por cada página que visita la "araña", graba información que pudiera necesitar 32 00:02:01,397 --> 00:02:05,627 para una búsqueda, pero la añade a una base de datos llamada índice de búsqueda. 33 00:02:07,496 --> 00:02:11,577 Ahora vayamos a esa búsqueda que hicimos antes y veamos si podemos descifrar cómo 34 00:02:11,577 --> 00:02:13,698 obtuvo los resultados el buscador. 35 00:02:13,767 --> 00:02:16,577 Cuando preguntas ¿cuánto tiempo toma viajar a Marte? 36 00:02:16,577 --> 00:02:20,037 El buscador busca cada una de esas palabras en el índice de búsqueda 37 00:02:20,037 --> 00:02:23,567 para obtener de inmediato una lista de todas las páginas de Internet que 38 00:02:23,567 --> 00:02:25,077 contienen esas palabras. 39 00:02:25,077 --> 00:02:29,067 Pero tan sólo buscar estas palabras puede resultar en millones de páginas. 40 00:02:29,067 --> 00:02:32,307 Así es que el buscador tiene que determinar cuáles son los mejores 41 00:02:32,307 --> 00:02:34,367 resultados que habrá de mostrarte primero. 42 00:02:34,367 --> 00:02:37,887 Aquí es donde se vuelve engañoso, porque el buscador tiene que adivinar 43 00:02:37,887 --> 00:02:39,326 qué es lo que estás buscando. 44 00:02:39,326 --> 00:02:43,287 Cada buscador utiliza su propio algoritmo para clasificar las páginas basado en lo 45 00:02:43,287 --> 00:02:45,297 que cree que estás buscando. 46 00:02:45,297 --> 00:02:48,852 El algoritmo de clasificación del buscador puede revisar si las palabras 47 00:02:48,852 --> 00:02:51,375 que buscas se encuentran en el título de la página. 48 00:02:51,375 --> 00:02:55,157 Quizás revise si todas las palabras aparecen juntas o hará otros cálculos 49 00:02:55,157 --> 00:03:01,752 que le permitan determinar mejor qué páginas quieres ver y cuáles no. 50 00:03:02,672 --> 00:03:07,466 Google inventó el algoritmo más famoso para elegir los resultados más relevantes en una 51 00:03:07,466 --> 00:03:11,937 búsqueda, considerando cómo otras páginas se vinculan con una página específica. 52 00:03:11,937 --> 00:03:15,827 La idea es que si muchos sitios web creen que una página web es interesante, 53 00:03:15,827 --> 00:03:18,477 entonces es probable que esa sea la que estás buscando. 54 00:03:18,477 --> 00:03:22,317 Este algoritmo fue llamado "Clasificación de página", no porque clasifica páginas 55 00:03:22,317 --> 00:03:25,844 sino porque fue nombrado en honor a su inventor, Larry Page, cuyo apellido 56 00:03:25,844 --> 00:03:28,949 significa página en inglés y es uno de los fundadores de Google. 57 00:03:28,949 --> 00:03:32,727 Debido a que un sitio web genera dinero cuando lo visitas, los spammers buscan 58 00:03:32,727 --> 00:03:36,587 constantemente la forma de descubrir el algoritmo para que sus páginas aparezcan 59 00:03:36,587 --> 00:03:38,677 más arriba en la lista de resultados. 60 00:03:38,677 --> 00:03:42,347 Los buscadores constantemente cambian sus algoritmos para evitar que páginas 61 00:03:42,347 --> 00:03:45,107 falsas o de origen dudoso aparezcan en la parte de arriba. 62 00:03:45,107 --> 00:03:49,172 Finalmente, depende de ti estar atento a estas páginas de origen dudoso, 63 00:03:49,172 --> 00:03:53,382 analizando la dirección web y verificando que sea de una fuente confiable. 64 00:03:53,382 --> 00:03:57,252 Los programas de búsqueda siempre están evolucionando para mejorar los algoritmos, 65 00:03:57,252 --> 00:04:01,132 y así poder ofrecer mejores resultados de manera más rápida que sus competidores. 66 00:04:01,132 --> 00:04:04,822 Los buscadores actuales incluso utilizan información que tú no les has dado de 67 00:04:04,822 --> 00:04:08,212 manera explícita para ayudarte a hacer más específica tu búsqueda. 68 00:04:08,212 --> 00:04:12,273 Por ejemplo, si necesitas buscar parques para perros, muchos buscadores te darían 69 00:04:12,273 --> 00:04:17,048 los resultados de los parques cercanos a ti aunque no hayas escrito tu ubicación. 70 00:04:17,657 --> 00:04:22,176 Los buscadores modernos entienden más que la lista de palabras en una página. 71 00:04:22,176 --> 00:04:27,036 Entienden su significado para encontrar la que más se acerque al resultado que buscas. 72 00:04:27,038 --> 00:04:31,804 Por ejemplo, si buscas a un "pitcher (lanzador) rápido" sabrá que buscas a un 73 00:04:31,804 --> 00:04:37,437 atleta, pero si escribes "pitcher (jarra) grande" te encontrará opciones para cocina. 74 00:04:38,678 --> 00:04:42,308 Para entender mejor las palabras usamos algo llamado aprendizaje automático, 75 00:04:42,308 --> 00:04:46,329 un tipo de inteligencia artificial. Le permite a los algoritmos no sólo buscar 76 00:04:46,329 --> 00:04:51,512 letras y palabras en una página, sino entender el significado de esas palabras. 77 00:04:53,802 --> 00:04:57,452 Internet está creciendo de manera exponencial, pero si los equipos que 78 00:04:57,452 --> 00:05:02,040 diseñamos los buscadores hacemos bien nuestro trabajo, la información que buscas 79 00:05:02,040 --> 00:05:06,290 siempre estará disponible con sólo escribir unas palabras. 80 00:05:23,897 --> 00:05:33,097 81 00:05:33,097 --> 00:05:38,497 82 00:05:38,497 --> 00:05:48,037 83 00:05:48,037 --> 00:05:54,117 84 00:05:54,117 --> 00:06:01,886 85 00:06:01,886 --> 00:06:06,997 86 00:06:06,997 --> 00:06:14,696 87 00:06:14,696 --> 00:06:22,027 88 00:06:22,027 --> 00:06:29,367 89 00:06:29,367 --> 00:06:36,537 90 00:06:36,537 --> 00:06:43,476 91 00:06:43,476 --> 00:06:49,737 92 00:06:49,737 --> 00:06:57,867 93 00:06:57,867 --> 00:07:04,787 94 00:07:04,787 --> 00:07:09,207