Portuguese, Brazilian subtitles

← Procedure - Data Wranging with MongoDB

Get Embed Code
4 Languages

Showing Revision 9 created 06/20/2016 by Udacity Robot.

  1. Vamos falar um pouco sobre procedimento. Primeiro,
  2. vamos criar uma lista de todos os valores carrier. Poderíamos
  3. fazer isso manualmente. Talvez fosse mais fácil fazer isso
  4. verificando apenas o HTML. Depois, precisamos criar uma
  5. lista de valores airport. Há muitos valores aqui. Na verdade,
  6. provavelmente desejamos escrever um
  7. script que extrairá
  8. isso. Certo. Todas as páginas terão exatamente a mesma lista nos
  9. dois casos. Podemos usar o navegador para baixar uma página de
  10. exemplo e extrair esses valores. Em seguida, precisamos
  11. fazer requisições HTTP para baixar todos os dados. Daqui a pouco,
  12. você saberá por que quero baixar tudo isso. Depois,
  13. queremos analisar os arquivos de dados. Queremos fazer
  14. desta forma porque, ao criar o analisador, buscamos garantir
  15. que estamos trabalhando com dados que não vão mudar.
  16. Depois disso, após alguma limpeza de dados,
  17. podemos descobrir que o motivo da presença de dados sujos é,
  18. na verdade, um bug no nosso analisador. É bem mais
  19. fácil descobrir onde está o bug se ainda temos os dados originais
  20. usados na análise. Devo frisar que também não faz
  21. sentido baixar os dados várias vezes pois estamos tentando descobrir como
  22. analisá-los. Lembre-se também de que,
  23. muitos anos antes do ano vigente, os dados não mudariam; então, não há motivo
  24. para recuperá-los mais de uma vez. Esta
  25. é a prática recomendável. Ao se deparar com uma situação
  26. assim, e quando tiver uma tarefa de captura,
  27. ela terá esta aparência. Primeiro, você
  28. quer reunir todos os dados necessários. Depois, fará
  29. a captura em um processo separado. Temos, basicamente, três etapas diferentes
  30. para este problema específico. Primeiro, criamos todos os
  31. valores que usaremos para fazer a requisição HTTP. Depois,
  32. precisamos fazer todas as requisições HTTP e baixar os dados necessários.
  33. Finalmente, analisaremos os dados desses arquivos de
  34. dados, definindo-os como dados específicos,
  35. os itens específicos que queremos usar.