YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Japanese subtitles

← Mapper and reducer with aadhar data

Get Embed Code
4 Languages

Showing Revision 2 created 03/18/2015 by Udacity.

  1. Aadhaarデータが入ったCSVファイルを
    もう一度見てみましょう
  2. 登録者、登録機関、階層、地域、
  3. 作成されたAadhaar、不可となった登録など
    他にもたくさんの情報が
  4. 各列に並んでいます
  5. 地域ごとの登録数が知りたければ
  6. 関係する列は地域と作成されたAadhaarでしょう
  7. Mapperの空白を埋められますか?
  8. Mapperのプログラミングモデルを使い
    ジョブを完成させるには
  9. MapperとReducerを書く必要があります
  10. では実際にやってみましょう
  11. これはこのジョブに使うMapperのスケルトンです
  12. 処理は1行ずつ行います
  13. 入力データは作成されたAadhaarデータを含む
  14. CSVファイルのすべての行です
  15. 先頭行を含む値がカンマで区切られた行を
    1行ずつ処理していきます
  16. 中には先頭行も含まれています
  17. カンマを使って各行をトークン化し
  18. タブで分けられた地域と作成されたAadhharを含む
    キーと値のペアを生成します
  19. 各行のトークン数が正しいことと
  20. 先頭行がないことを確認してください
  21. MapReduceを使って
    地域ごとの登録数を集計するには
  22. Reducerのコードも書く必要があります
  23. これはあとで埋めてもらう
    reducer関数のスケルトンです
  24. aadhaar_generatedをゼロに初期化し
  25. old_keyにはNoneをセットします
  26. Mapperで生成したキーと値のペアのリストを調べて
  27. キーと作成済みAadhaarの合計を
  28. タブで区切って出力します
  29. キーと値のペアはキーでソートされます
    それぞれのキーと値のペアは
  30. 作業する前に
    フォーマットが正しいか確認してください
  31. 最終的なキーと値のペアの例は
    ʺGujarat\t5.0ʺです