YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Portuguese, Brazilian subtitles

← Sources of Dirty Data - Data Wranging with MongoDB

Get Embed Code
4 Languages

Showing Revision 8 created 06/20/2016 by Udacity Robot.

  1. Há várias fontes de dados brutos. Basicamente, sempre que houver
  2. humanos envolvidos, haverá dados brutos. É
  3. como quando meus filhos estão envolvidos:
  4. tem muita bagunça na cozinha. Há
  5. muitas maneiras de lidar com os dados com os quais
  6. trabalhamos. Vou limpar as mãos e
  7. vamos começar. Vamos ver os erros de entrada do usuário.
  8. Em algumas situações, não teremos padrões de codificação de dados,
  9. ou se tivermos, eles serão mal aplicados,
  10. causando problemas nos dados resultantes. Talvez
  11. seja necessário integrar dados onde diferentes esquemas foram
  12. usados para o mesmo tipo de item. Teremos
  13. sistemas de dados legados, onde os dados não são codificados quando as restrições
  14. de disco e memória são mais rigorosas do que
  15. agora. Os sistemas evoluem com o tempo. Precisam de modificações e
  16. alterações nos dados. Alguns de nossos dados não têm os identificadores
  17. exclusivos que deveriam. Outros serão perdidos na transformação de um
  18. formato em outro. E depois, claro, há sempre o erro do programador. E
  19. para finalizar, os dados podem ser corrompidos na transmissão ou armazenamento por
  20. raios ou outro fenômeno físico. Então veja, não é culpa nossa.