[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,A coisa importante que ele tem são os links. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,A meta para a segunda unidade Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Ao final da unidade 3 teremos contruído um web crawler. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Descobriremos na unidade 5 uma forma de fazer isso, dimensionando, caso tenhamos um grande corpus. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,E esse link pode ser exibido no seu navegador com um sublinhado, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,E o motor de busca que construiremos até o final, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,E o que o rastreador vai fazer é começar com uma página, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,E o que um link é? É algo que aponta para outra página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,E queremos construir o corpus para o nosso motor de busca Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,E, finalmente vamos ter uma coleção de várias páginas da web. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Ele certamente não será poderoso como Google, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Ele terá os principais componentes que um motor de busca como o Google possui. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então isso parece um monte de coisa pra fazer. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então nós temos um link para as perguntas frequentes (FAQ), Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então é isso que nós queremos fazer para construir um web crawler. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então, compreenderemos como classificar todas as páginas que a palavra chave aparece. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então, estamos nos adiantando um pouco, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então, nas três unidades restantes veremos como responder às solicitações. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então, não necessariamante encontraremos cada página da web Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então, perto do fim da Unidade 2 podemos imprimir todos os links de uma página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então, se você pesquisar por uma palavra chave, você precisa de uma resposta com a lista de paginas Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Então, vamos começar com um monte de texto. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Havia todo o tipo de coisa inesperada lá. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Há alguns outros links na página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Já ma unidade 6, nós não queremos apenas encontrar uma lista, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Mas era algo muito novo e excitante. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Mas o importante é o que ele faz, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Na Unidade 3, queremos ir mais além de uma página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Na unidade 4, descobriremos como dar uma boa resposta. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,No nosso caso, usamos a web (www), que na época certamente era menor do que é hoje. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Nós não trataremos de tudo isto na primeira aula. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Nós teremos um pouco de código a escrever Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Nós usaremos o site da Udacity como exemplo. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Nós vamos ter uma forma de construir o nosso corpus. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,O que queremos é encontrar essa URL, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,O que um web crawler é? é um programa que coleta conteúdos da web. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,O que vamos fazer na primeira unidade, é só extrair um link. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Para unidade 3 queremos coletar todos esses links, então podemos continuar, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Queremos encontrar uma maneira de começar a partir de uma página semente (inicial), Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Se começarmos com uma boa página semente (inicial) Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Se você pensar em uma página web que você vê no seu navegador, você tem uma página como esta. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Talvez com o meu nome e você pode seguir para a minha home page. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Tem muito conteúdo, tem algumas imagens, tem algum texto. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Todas as páginas que nós podemos procurar com nosso web crawler Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Tudo isso surge no seu navegador quando você solicitar a página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,Vai ter um link nele com uma URL. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,[David Evans] Então a meta para as três primeiras unidades do curso é construir esse corpus. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,[Sebastian Thrun] Então, qual é sua opinião sobre como construir um motor de busca, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,[Sergey Brin - Co-Fundador, Google] Sim. Acho que a coisa mais importante Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,e então nestas outras páginas ele seguirá os links destas páginas Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,e estas outras páginas web talvez tenham links também Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,e nós devemos nos lembrar do nosso real objetivo, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,e sobre programação. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,entender como continuar a extrair todos estes links. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,então coletar os links destas outras páginas, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,então nós temos outro link nesta página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,então podemos solicitar a próxima página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,então, o que aprenderemos fazendo isto Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,extrair os links desta página, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,já que precisamos mante-lo simples. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,já que tudo que vamos fazer na unidade 1, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,mas usar esta contrução como veiculo Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,nos permitirá resolver muitos e muitos outros problemas. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,nós queremos encontrar a melhor. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,ou não, dependendo de como seu navegador está definido. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,para aprender sobre ciência da computação Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,para encontrar outras páginas e haverão muito mais links sobre essas páginas. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,procurar todos os links desta página, seguindo-os para encontrar outras páginas Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,que a palavra chave aparece. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,que não é contruir um motor de busca, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,que é apontar para outra página web. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,rastreando a web e é isso que um web crawler faz. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,se há muitos links em uma página, você vai querer encontrar todos eles. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,se você estiver indo construir um motor de busca Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,segui-las e coletar tudo. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,seguindo o nosso rastreador na coleta de muitas e muitas páginas. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,seguir os links para outras páginas, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,será totalmente funcional. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,são encontradas seguindo os links. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,temos um link para a página CS 101. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,vamos encontrar muitas páginas. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,você construiu um antes, certo? Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,É isso o que faremos na Unidade 2, Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,é compreender como extrair um link da página. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,é ser capaz de continuar. Dialogue: 0,9:59:59.99,9:59:59.99,Default,,0000,0000,0000,,é ter um bom "corpus" para começar.