YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Japanese subtitles

← Counting words

Get Embed Code
4 Languages

Showing Revision 2 created 03/18/2015 by Udacity.

  1. ではMapReduceプログラミングモデルの説明です
  2. ある文書に出てくる単語について
    それぞれの出現数をカウントするとします
  3. 「ふしぎの国のアリス」でやってみましょう
  4. これは一文を抜き出したものです
  5. Alice was beginning to get very tired
    of sitting by her sister on the bank
  6. and of having nothing to do
  7. MapReduceを使わずにこの問題を解くとしたら
  8. すべての単語とそのカウント数で構成される
    辞書を作ります
  9. 文を読んでいき文中に出てくる各単語について
  10. 単語のキーが出てきたら1を加えます
  11. なければその単語のキーの初期値を1にセットします
  12. このような本の中の短い一文ではなく
    本全体を調べます
  13. MapReduceでこれを解く前に
  14. 今の説明に従ってPythonスクリプトを記述し
    処理してみましょう
  15. このようにテキスト行が多い場合キーを各単語とし
    値を単語のカウント数とした辞書を作成します
  16. 単語はすべて小文字にし句読点記号などは除き
  17. 単数形や現在形で使います
  18. これは準備段階のコードです
  19. まずsysとstringをインポートし
  20. 空の辞書の初期化を行います
    単語と値が入るところです
  21. 流れとしては入力する行全体を読み
  22. 各行に対して配列を作成します これがdataです
  23. これは行の中のすべての単語から成り
    これをホワイトスペースで区切ります
  24. 例えば "Hello, how are you?"という行の場合
  25. この配列は
    hello、how、are、youの4つの要素を持ちます
  26. コードはこの部分に書きます
  27. 行をホワイトスペースで区切ったあと
    辞書に出力させる前です