YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Portuguese, Brazilian subtitles

← Mapper and Reducer with Aadhaar Data - Intro to Data Science

Get Embed Code
4 Languages

Showing Revision 8 created 06/20/2016 by Udacity Robot.

  1. Vamos analisar o arquivo CSV contendo nossos
  2. dados de matrícula Aadhaar novamente. Cada linha tem
  3. um número de colunas como, registrador, agência de
  4. matrícula, estado, distrito, Aadhaar gerado, matrícula rejeitada e um
  5. monte de outras informações. Se quisermos contar
  6. o número de Aadhaar gerado por distrito, as
  7. colunas nas quais estaremos mais interessados são de distrito
  8. e Aadhaar gerado. Você pode preencher as partes
  9. que faltam do mapeador? Se você quisesse concluir este
  10. trabalho usando o modelo de programação do mapeador, precisaríamos escrever
  11. um mapeador e um redutor. Que tal você tentar?
  12. Aqui está o esqueleto de um mapeador para este trabalho. Vamos
  13. passar por cada uma das linhas na entrada. Neste caso,
  14. será nosso arquivo CSV contendo todas as
  15. linhas e nossos dados gerados por Aadhaar. Você terá que passar
  16. por cada linha, que será uma lista de valores separados por vírgula.
  17. A linha de cabeçalho será incluída. Crie um token em cada
  18. linha usando as vírgulas e emita um par chave-valor
  19. contendo o distrito e o número do Aadhaar gerado, separados
  20. por uma tabulação. Verifique se cada linha tem o
  21. número correto de tokens e se não é a
  22. linha de cabeçalho. Para contar o número de Aadhaar
  23. gerado por distrito usando redução de mapa, também teremos que
  24. escrever um redutor. Aqui está o esqueleto de uma função redutora
  25. que você preencherá. Inicializamos aadhaar_generated como 0
  26. e definimos old-key como None. Você circulará na lista
  27. de pares chave-valor emitidos pelo seu mapeador e imprimirá
  28. cada chave uma vez, com o número total de
  29. Aadhaar gerado, separados por uma tabulação. Você pode supor que
  30. a lista de pares chave-valor será ordenada por
  31. chave. Verifique se cada par chave-valor está formatado
  32. corretamente antes de processá-lo. Aqui está um exemplo final de par
  33. chave-valor. Gujarat\t5.0.