Return to Video

07-05 Top 10

  • 0:00 - 0:03
    MapReduceのデザインパターンで
  • 0:03 - 0:07
    上位N件のリストを作成します
  • 0:07 - 0:10
    リスト記事を扱うような会社で使います
  • 0:10 - 0:13
    もしそのような会社に勤めていなくても
    この機能は使ってみてください
  • 0:13 - 0:17
    ここでは長い投稿のうち
    上位10件をリストします
  • 0:17 - 0:19
    リレーショナルデータベース管理システムでは
  • 0:19 - 0:23
    まずはデータをソートします
    フォーラムへの投稿が対象です
  • 0:23 - 0:27
    そして上位N件のレコードを取得します
  • 0:27 - 0:31
    MapReduceでは少し異なります
  • 0:31 - 0:34
    データはソートされておらず
    複数マシンで処理されます
  • 0:34 - 0:40
    各マシン上でマッパーに
    上位N件のリストを生成させます
  • 0:41 - 0:46
    できたローカルリストをリデューサに渡し
    リデューサが全体の上位を抽出します
  • 0:48 - 0:49
    オリンピックで見られる光景と同じです
  • 0:49 - 0:52
    例えば水泳選手の上位3人を知りたい場合
  • 0:52 - 0:57
    各国がそれぞれの上位3人を
    オリンピックに出場させます
  • 0:57 - 1:02
    そして大会の結果から
    世界の上位3人が分かります
  • 1:02 - 1:08
    さてUDACITYのフォーラムデータの中から
    上位10件の長い投稿を見つけましょう
Tytuł:
07-05 Top 10
Opis:

07-05 Top 10

more » « less
Video Language:
English
Team:
Udacity
Projekt:
ud617 - Intro to Hadoop and Mapreduce
Duration:
01:10

Japanese subtitles

Revisions Compare revisions