Japanese subtitles

← 21-02 Language Models

Get Embed Code
3 Languages

Showing Revision 1 created 11/29/2014 by Udacity.

  1. 言語モデルの話から始めます
  2. AIの分野の歴史を見てみると自然言語理解には
  3. 2種類の有名なモデルがあります
  4. 1つは文字や語の並び順と関係があります
  5. このタイプのモデルは
    文字や語の順序を論じる際に
  6. 確率論的になる傾向があります
  7. また扱うのは表面的な語や
    文字そのものであるという点で
  8. 語中心と言えます
  9. ただし扱っているのは
    根底にあるエッセンスではなく
  10. 目の前にあるデータです
  11. こうしたモデルは主にデータから学習したものです
  12. 対照的なのがもう1つのタイプで
    皆さんも知っているかもしれません
  13. それは主として木構造や抽象構造を扱います
  14. 例えばここに名詞句と動詞句から成る
    文章があります
  15. 名詞句は“サム”というような人の名前で
  16. 動詞句は“眠った”であるとします
  17. 非常に簡単な文章です
  18. 2つのモデルの性質は異なります
  19. 右のモデルは確率論的というより
    論理的な傾向があります
  20. 一方左のモデルは語系列の確率に注目しています
  21. 右のモデルは一組の文章を取り上げて
    言語を定義します
  22. 対象言語の中にこの文章が
    あるかないかのどちらかです
  23. 確率論的な識別というより
    ブーリアン型の識別です
  24. このモデルは木構造やカテゴリといった
    抽象化に基づいています
  25. カテゴリとは名詞句や動詞句や
    このような木構造のようなものです
  26. 実際それは表層形式
    つまり観察できる単語レベルでは現れません
  27. エージェントは“サム”や“眠った”という
    単語を観察できても
  28. “眠った”は動詞でこの木構造の一部であることを
    直接には観察できません
  29. 従来からこうしたアプローチは主に
    ハンドコーディングで行われてきました
  30. つまりこうした構造を
    データから学習するのではなく
  31. 言語学者など外部の専門家に
    ルールを書いてもらって学んだのです
  32. 今ではこうした区別は不要です
  33. 木構造モデルや確率論的モデルを自由に採用して
  34. どちらでも学べます
  35. 私たちは両モデルを自由に行き来できますが
    従来はこのような区別がありました