Return to Video

21-30 Best Segmentation 1

  • 0:00 - 0:02
    2のn乗は大変大きい数です
  • 0:02 - 0:09
    例えば30文字があれば
    可能なセグメンテーションは10億通りにもなります
  • 0:09 - 0:12
    それをすべて列挙することは不可能です
  • 0:12 - 0:15
    可能なセグメンテーションの確率のすべてを
  • 0:15 - 0:19
    考えずに済む効率的な探索方法が必要でしょう
  • 0:19 - 0:25
    ナイーブベイズを利用するのは
    そういった理由で好都合だからです
  • 0:25 - 0:29
    あらゆる単語の間に相互関係を持たないので
  • 0:29 - 0:31
    1回につき1語考えればいいわけです
  • 0:31 - 0:33
    1つにまとめるとこう表されます
  • 0:33 - 0:36
    最適セグメンテーションは
  • 0:36 - 0:45
    文字列を第1語と残りの語に区切る
    すべてのセグメンテーションのargmaxで
  • 0:45 - 0:53
    第1語の確率と残りの語の
    最適セグメンテーションの確率の積です
  • 0:53 - 0:55
    ここは独立しています
  • 0:55 - 1:00
    残りの語の最適セグメンテーションは
    第1語に依存しないので
  • 1:00 - 1:03
    相互関係をすべて考える必要はありません
  • 1:03 - 1:06
    2のn乗個も考えなくてよいのです
  • 1:06 - 1:10
    従ってナイーブベイズが適している理由は2つあり
  • 1:10 - 1:13
    1つは計算が非常に効率的になることです
  • 1:13 - 1:16
    そしてもう1つは学習しやすくなることです
  • 1:16 - 1:19
    ユニグラムの確率なら簡単に見つけられます
  • 1:19 - 1:23
    テキストコーパスにある単語の確率を
    求めればよいのです
  • 1:23 - 1:27
    複数の語系列の連結から
    解を得るのは非常に困難です
  • 1:27 - 1:32
    平滑化や確率の推測も
    さらに必要になってくるでしょう
  • 1:32 - 1:35
    すべてを数えるのは不可能です
Title:
21-30 Best Segmentation 1
Team:
Udacity
Project:
CS271 - Intro to Artificial Intelligence
Duration:
01:36

Japanese subtitles

Revisions