1 00:00:00,630 --> 00:00:04,030 Bem-vindo ao CS 101. Eu sou Dave Evans. Eu guiarei vocês nesta jornada. 2 00:00:04,030 --> 00:00:07,047 Este curso introduzirá vocês para as idéias fundamentais em computação 3 00:00:07,047 --> 00:00:09,563 e ensinará ler e escrever seus próprios progragamas de computador. 4 00:00:09,563 --> 00:00:13,063 Nós vamos fazer tudo no contexto de construir uma (search engine) ferramenta de pesquisa na Web. 5 00:00:13,063 --> 00:00:16,363 Eu estou supondo que todos aqui tenham usado uma ferramenta de pesquisa. 6 00:00:16,363 --> 00:00:19,562 O objetivo das primeiras três unidades desse curso é construir um (Web crawler) rastreador Web. 7 00:00:19,562 --> 00:00:22,129 Eles colecionarão dados da Web para sua ferramenta de pesquisa. 8 00:00:22,129 --> 00:00:24,663 E aprender sobre as grandes idéias da computação fazendo isso. 9 00:00:24,663 --> 00:00:29,680 Na Unidade 1, nós iniciaremos extraindo o primeiro link em uma página web. 10 00:00:29,680 --> 00:00:32,730 Um rastreador Web (Web crawler) procura páginas web para sua ferramenta de pesquisa 11 00:00:32,730 --> 00:00:37,797 iniciando de uma página "semeada" e seguindo links naquela página para encontrar outras páginas. 12 00:00:37,797 --> 00:00:43,930 Cada um desses links leva a alguma nova página web, a qual pode ter links que levam a outras páginas. 13 00:00:43,930 --> 00:00:46,507 Como nós seguimos esses links, nós encontraremos mais e mais páginas Web 14 00:00:46,507 --> 00:00:50,232 construindo uma coleção de dados que usaremos para nossa ferramenta de pesquisa. 15 00:00:50,479 --> 00:00:54,712 Uma página web é realmente só um pedado de texto que vem da Internete para o seu navegador Web. 16 00:00:54,712 --> 00:00:56,580 Nós falaremos mais sobre como isso funciona na Unidade 4. 17 00:00:56,580 --> 00:00:59,563 Mas, por agora, a coisa importante a compreender é que 18 00:00:59,563 --> 00:01:02,497 um link é somente um pedaço especial do texto na página Web. 19 00:01:02,497 --> 00:01:07,347 Quando você clica em um link no seu navegador, ele o direcioina para uma nova página. 20 00:01:07,347 --> 00:01:09,496 E você pode permanecer seguindo esses links (...) 21 00:01:09,496 --> 00:01:14,213 O que nós faremos nessa Unidade é escrever um programa para extrair aquele primeiro link da página Web. 22 00:01:14,213 --> 00:01:18,213 Nas próximas unidades, nós vamos descobrir como extrair todos os link e construir a coleção para nossa ferramenta de busca.