[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:02.02,Default,,0000,0000,0000,,[Sebastian Thrun] Entonces, ¿cuál es tu visión de cómo construir un motor de búsqueda? Dialogue: 0,0:00:02.02,0:00:03.08,Default,,0000,0000,0000,,has construido uno antes, ¿verdad? Dialogue: 0,0:00:03.08,0:00:06.01,Default,,0000,0000,0000,,[Sergey Brin - co-fundador, Google] Sí. Creo que lo más importante, Dialogue: 0,0:00:06.01,0:00:08.01,Default,,0000,0000,0000,,si vas a construir un buscador, Dialogue: 0,0:00:08.01,0:00:12.05,Default,,0000,0000,0000,,es tener un corpus realmente bueno para comenzar. Dialogue: 0,0:00:12.05,0:00:19.02,Default,,0000,0000,0000,,En nuestro caso, utilizamos la World Wide Web, que a su tiempo era sin duda más pequeño de lo que es hoy. Dialogue: 0,0:00:19.02,0:00:21.04,Default,,0000,0000,0000,,Pero también era muy nuevo y excitante. Dialogue: 0,0:00:21.04,0:00:23.08,Default,,0000,0000,0000,,Hubo todo tipo de cosas inesperadas allí. Dialogue: 0,0:00:23.08,0:00:26.10,Default,,0000,0000,0000,,[David Evans] Entonces, la meta para las tres primeras unidades del curso es construir ese corpus. Dialogue: 0,0:00:27.00,0:00:30.01,Default,,0000,0000,0000,,Y queremos construir el corpus de nuestro buscador Dialogue: 0,0:00:30.01,0:00:32.09,Default,,0000,0000,0000,,rastreando la web y es lo que hace un rastreador de web. Dialogue: 0,0:00:32.09,0:00:36.04,Default,,0000,0000,0000,,Lo que un rastreador de web es, es un programa que recopila el contenido de la web. Dialogue: 0,0:00:36.04,0:00:40.05,Default,,0000,0000,0000,,Si piensas en una página web que ves en tu explorador, tienes una página como esta. Dialogue: 0,0:00:40.05,0:00:43.10,Default,,0000,0000,0000,,Y utilizaremos el sitio de udacity como ejemplo de página web. Dialogue: 0,0:00:43.10,0:00:47.10,Default,,0000,0000,0000,,Tiene un montón de contenido, tiene algunas imágenes, tiene algo de texto. Dialogue: 0,0:00:47.10,0:00:51.04,Default,,0000,0000,0000,,Todo esto entra en el navegador cuando tu solicitas la página. Dialogue: 0,0:00:51.04,0:00:53.07,Default,,0000,0000,0000,,Lo importante que tiene es enlaces. Dialogue: 0,0:00:53.07,0:00:57.09,Default,,0000,0000,0000,,Y lo que un enlace es, es algo que va a otra página. Dialogue: 0,0:00:57.09,0:01:00.05,Default,,0000,0000,0000,,Así que tenemos un enlace a las preguntas frecuentes, Dialogue: 0,0:01:00.05,0:01:02.05,Default,,0000,0000,0000,,tenemos un vínculo a la página de CS 101. Dialogue: 0,0:01:02.05,0:01:04.04,Default,,0000,0000,0000,,Hay algún otro enlace en la página. Dialogue: 0,0:01:04.04,0:01:07.05,Default,,0000,0000,0000,,Y ese enlace puede aparecer subrayado en tu navegador , Dialogue: 0,0:01:07.05,0:01:09.09,Default,,0000,0000,0000,,o no, dependiendo de cómo tu navegador está configurado. Dialogue: 0,0:01:09.09,0:01:11.10,Default,,0000,0000,0000,,Pero lo mas importante que hace, Dialogue: 0,0:01:11.10,0:01:13.09,Default,,0000,0000,0000,,es apuntar a alguna otra página web. Dialogue: 0,0:01:13.09,0:01:16.04,Default,,0000,0000,0000,,Y esas otras páginas también pueden tener enlaces, Dialogue: 0,0:01:16.04,0:01:19.07,Default,,0000,0000,0000,,así que tenemos otro enlace en esta página. Dialogue: 0,0:01:19.07,0:01:23.05,Default,,0000,0000,0000,,Tal vez es mi nombre, puedes seguir a mi página de inicio. Dialogue: 0,0:01:23.05,0:01:26.09,Default,,0000,0000,0000,,Y todas las páginas que podemos encontrar con nuestro rastreador web Dialogue: 0,0:01:26.09,0:01:29.01,Default,,0000,0000,0000,,se encuentran siguiendo los enlaces. Dialogue: 0,0:01:29.01,0:01:31.07,Default,,0000,0000,0000,,Por lo que no necesariamente encontrará todas las páginas en la web Dialogue: 0,0:01:31.07,0:01:33.06,Default,,0000,0000,0000,,Sin embargo, si empezamos con una buena página inicial Dialogue: 0,0:01:33.06,0:01:35.00,Default,,0000,0000,0000,,encontraremos montones de páginas. Dialogue: 0,0:01:35.00,0:01:37.05,Default,,0000,0000,0000,,Y lo que el Rastreador va a hacer es empezar con una página, Dialogue: 0,0:01:37.05,0:01:41.06,Default,,0000,0000,0000,,encontrar todos los enlaces en esa página, seguirlos para encontrar otras páginas Dialogue: 0,0:01:41.06,0:01:45.01,Default,,0000,0000,0000,,y, a continuación, en esas otras páginas seguirá los vínculos en esas páginas Dialogue: 0,0:01:45.01,0:01:48.03,Default,,0000,0000,0000,,para encontrar otras páginas y habrá muchos más vínculos en esas páginas. Dialogue: 0,0:01:48.03,0:01:51.04,Default,,0000,0000,0000,,Y finalmente tendremos una colección de muchas páginas en la web. Dialogue: 0,0:01:51.04,0:01:54.01,Default,,0000,0000,0000,,Así que eso es lo que queremos hacer para construir un rastreador web. Dialogue: 0,0:01:54.01,0:01:56.10,Default,,0000,0000,0000,,Queremos encontrar alguna manera para empezar por una página inicial. Dialogue: 0,0:01:56.10,0:01:59.06,Default,,0000,0000,0000,,extraer los enlaces en esa página, Dialogue: 0,0:01:59.06,0:02:01.08,Default,,0000,0000,0000,,Seguir los vínculos a otras páginas, Dialogue: 0,0:02:01.08,0:02:03.07,Default,,0000,0000,0000,,luego recoger los enlaces en esas otras páginas, Dialogue: 0,0:02:03.07,0:02:05.02,Default,,0000,0000,0000,,seguirlos, recoger todo eso. Dialogue: 0,0:02:05.02,0:02:07.04,Default,,0000,0000,0000,,Así que eso suena como mucho por hacer. Dialogue: 0,0:02:07.04,0:02:09.01,Default,,0000,0000,0000,,No lo vamos a hacer todo eso esta primera clase. Dialogue: 0,0:02:09.01,0:02:12.07,Default,,0000,0000,0000,,Lo que vamos a hacer en esta primera unidad, es simplemente extraer un vínculo. Dialogue: 0,0:02:12.07,0:02:14.06,Default,,0000,0000,0000,,Así que vamos a empezar con una porción de texto. Dialogue: 0,0:02:14.06,0:02:17.03,Default,,0000,0000,0000,,Va a tener un vínculo en ella con una dirección URL. Dialogue: 0,0:02:17.03,0:02:19.06,Default,,0000,0000,0000,,Lo que queremos encontrar es esa URL, Dialogue: 0,0:02:19.06,0:02:21.09,Default,,0000,0000,0000,,por lo tanto podemos solicitar la página siguiente. Dialogue: 0,0:02:21.09,0:02:23.08,Default,,0000,0000,0000,,El objetivo de la segunda unidad Dialogue: 0,0:02:23.08,0:02:25.02,Default,,0000,0000,0000,,es ser capaz de seguir adelante. Dialogue: 0,0:02:25.02,0:02:28.05,Default,,0000,0000,0000,,Si hay muchos enlaces en una página, querrás poder encontrarlos todos. Dialogue: 0,0:02:28.05,0:02:30.01,Default,,0000,0000,0000,,y lo que haremos en la unidad 2, Dialogue: 0,0:02:30.01,0:02:32.07,Default,,0000,0000,0000,,es averiguar cómo seguir adelante para extraer todos esos enlaces. Dialogue: 0,0:02:32.07,0:02:36.06,Default,,0000,0000,0000,,En la unidad tres, bueno, queremos ir más allá de una sola página. Dialogue: 0,0:02:36.06,0:02:40.03,Default,,0000,0000,0000,,Así que al final de la unidad dos podremos imprimir todos los enlaces en una página. Dialogue: 0,0:02:40.03,0:02:44.00,Default,,0000,0000,0000,,Unidad 3 queremos reunir todos esos vínculos, para poder seguir adelante, Dialogue: 0,0:02:44.00,0:02:47.02,Default,,0000,0000,0000,,siguiendo nuestro rastreador para recopilar muchas, muchas páginas. Dialogue: 0,0:02:47.02,0:02:50.01,Default,,0000,0000,0000,,Por lo que al final de la unidad tres habremos construido un rastreador de web. Dialogue: 0,0:02:50.01,0:02:52.03,Default,,0000,0000,0000,,Tendremos un modo de construir nuestro corpus. Dialogue: 0,0:02:52.03,0:02:57.08,Default,,0000,0000,0000,,A continuación, las otras tres unidades verán la forma de responder efectivamente a las consultas. Dialogue: 0,0:02:57.08,0:03:01.03,Default,,0000,0000,0000,,Así que en la unidad cuatro comprenderemos la manera de dar una buena respuesta. Dialogue: 0,0:03:01.03,0:03:08.02,Default,,0000,0000,0000,,Si buscas una cierta palabra clave, quieres obtener una respuesta que es una lista de las páginas Dialogue: 0,0:03:08.02,0:03:10.06,Default,,0000,0000,0000,,donde aparece esa palabra clave. Dialogue: 0,0:03:10.06,0:03:15.09,Default,,0000,0000,0000,,Y descubriremos, en la unidad cinco, una manera de hacerlo, que escala, si tenemos un gran corpus. Dialogue: 0,0:03:15.09,0:03:19.08,Default,,0000,0000,0000,,Y a continuación, en la unidad seis lo que queremos hacer es, bueno, no queremos solo encontrar una lista Dialogue: 0,0:03:19.08,0:03:21.07,Default,,0000,0000,0000,,queremos encontrar la mejor. Dialogue: 0,0:03:21.07,0:03:24.08,Default,,0000,0000,0000,,Así que descubriremos cómo clasificar todas las páginas donde aparece esa palabra clave. Dialogue: 0,0:03:24.08,0:03:27.07,Default,,0000,0000,0000,,Así que nos estamos adelantando ahora, Dialogue: 0,0:03:27.07,0:03:30.04,Default,,0000,0000,0000,,porque todo lo que vamos a hacer en la unidad uno Dialogue: 0,0:03:30.04,0:03:32.06,Default,,0000,0000,0000,,es averiguar cómo extraer un vínculo de la página. Dialogue: 0,0:03:32.06,0:03:35.07,Default,,0000,0000,0000,,Y el motor de búsqueda que nosotros construiremos al final de esto Dialogue: 0,0:03:35.07,0:03:37.03,Default,,0000,0000,0000,,será un motor de búsqueda funcional. Dialogue: 0,0:03:37.03,0:03:40.06,Default,,0000,0000,0000,,Contará con los principales componentes que tiene un motor de búsqueda como Google. Dialogue: 0,0:03:40.06,0:03:43.01,Default,,0000,0000,0000,,Sin duda no será tan poderoso como Google será, Dialogue: 0,0:03:43.01,0:03:44.03,Default,,0000,0000,0000,,queremos mantener las cosas simples. Dialogue: 0,0:03:44.03,0:03:46.06,Default,,0000,0000,0000,,Queremos tener una pequeña cantidad de código para escribir. Dialogue: 0,0:03:46.06,0:03:48.01,Default,,0000,0000,0000,,Y debemos recordar que nuestro verdadero objetivo Dialogue: 0,0:03:48.01,0:03:50.02,Default,,0000,0000,0000,,no es tanto construir un motor de búsqueda Dialogue: 0,0:03:50.02,0:03:52.08,Default,,0000,0000,0000,,sino utilizar la meta de construir un motor de búsqueda como vehículo Dialogue: 0,0:03:52.08,0:03:55.02,Default,,0000,0000,0000,,para aprender sobre ciencia de la computación Dialogue: 0,0:03:55.02,0:03:56.08,Default,,0000,0000,0000,,y aprender acerca de programación Dialogue: 0,0:03:56.08,0:03:58.02,Default,,0000,0000,0000,,por lo que las cosas que aprendamos haciendo esto Dialogue: 0,0:03:58.02,9:59:59.99,Default,,0000,0000,0000,,nos permitirán resolver gran cantidad de distintos problemas .