Portuguese, Brazilian subtitles

← Intro - Data Wrangling with MongoDB

Get Embed Code
6 Languages

Showing Revision 9 created 06/20/2016 by Udacity Robot.

  1. Olá, sou Shanon Bradshaw, diretor de ensino
  2. na MongoDB, a empresa responsável pelo
  3. banco de dados noSQL de código aberto com o mesmo nome. Antes de me associar à MongoDB, eu era um
  4. cientista da computação que trabalhava na instituição e consultor
  5. em vários projetos de ciência de dados
  6. no setor financeiro, de mídia social e de outras
  7. áreas. Esta é uma aula sobre preparação de dados.
  8. O cientista de dados gasta cerca de 70% de seu tempo na preparação
  9. de dados. Então, o que é preparação de dados? Bem, é um processo
  10. de obtenção, extração, limpeza e armazenamento de nossos dados. Só
  11. depois disso é que realmente faz sentido fazer qualquer
  12. análise. Se você for um profissional de Wall Street e
  13. quiser compilar modelos para automatizar os negócios, primeiro, precisa
  14. certificar-se de que está baseando seus modelos em dados
  15. confiáveis. Ou se estiver criando um aplicativo de mapa
  16. para garantir ao seu corretor de dados que você pode localizar-se rapidamente, no caso de um
  17. desastre de relações públicas. Outro exemplo, se você estiver trabalhando na
  18. análise de dados de escala menor para uma equipe de pesquisa, você vai querer
  19. garantir que sua equipe tome decisões com base nos dados que está fornecendo. Se
  20. não tiver tempo para garantir o formato
  21. correto dos dados antes de qualquer análise, você poderá perder
  22. muito tempo depois; ou pior, perder a credibilidade de
  23. seus colegas, que dependem dos dados preparados. É como
  24. colocar a carroça à frente dos bois. Por enquanto, vamos
  25. fazer uma analise; é por isso que estamos fazendo tudo isso
  26. primeiro. Esta aula é realmente sobre obtenção
  27. de dados prontos para que qualquer análise seja criada em uma boa
  28. base sólida de dados. Aqui você vai ter a
  29. chance de fazer alguns consertos. Vamos desenvolver seus
  30. músculos de hacker ou, digamos, músculos de preparadores. Vamos trabalhar
  31. com vários tipos diferentes de dados. Citando alguns, música, energia, Wikipédia
  32. e Twitter. Também vamos ensinar a
  33. trabalhar com dados na maioria dos formatos que você provavelmente
  34. verá. JSON, XML, CSV, Excel e HTML. E até mesmo alguns
  35. formatos de texto legado. Na última metade do curso,
  36. mostraremos como armazenar seus dados no MondoDB e usá-lo
  37. para suportar a análise. O Mongo DB está se tornando muito importante para
  38. os cientistas de dados de todo o mundo, como uma ferramenta escalável e avançada
  39. para resolver problemas de grandes dados. E vamos incluí-lo em um
  40. estudo de caso, que permitirá colocar todas as peças juntas.
  41. Estamos felizes com sua presença na aula. Vamos começar.