Japanese subtitles

← 22-07 Pcfg

Get Embed Code
2 Languages

Showing Revision 1 created 11/29/2014 by Udacity.

  1. 1つ目のステップは
    確率的文脈自由文法つまりPCFGです
  2. それはこれまで扱った文脈自由文法に
    基づいています
  3. ここでは1つの記述を複数の行の文法に分け
    代替案は“または”を示す縦棒で区切っています
  4. 左にある記号に対応する
    右の記号の確率を求めて関連づけます
  5. ある文章について書き直す方法が1つだけなら
    その確率は1になります
  6. 名詞句には4つの種類があり4つそれぞれに
    確率の1を分配する必要があります
  7. それぞれの確率を0.3、0.4、0.2、0.1とします
    この3つの名詞複合語はめったにないでしょう
  8. しかしthe dogのような名詞が続く
    限定詞はごく一般的です
  9. 動詞句の確率はそれぞれ0.4、0.4、0.2で
  10. こちらも同様にこの単語が各カテゴリで
    一般的かどうかを判断し数字を入れていきます
  11. ではこれを埋めてみましょう
  12. この文法によってここで成立する
    すべての木が特定されます
  13. 木はこのルールと共起して構成されます
    文から始めて名詞句や動詞句を生成し
  14. 名詞句はこの中のどれかを1つを選んで生成します
  15. 確率はそれぞれの選択に関係しています
  16. そして文章の確率は選択した木に関連し
    すべての確率の積になります
  17. 例えば“Fed raises interest rates”という
    文章を書くとそこに木が関連づけられ
  18. 木の確率が算出されるわけです
    余白がないので自分の紙に書いてみましょう
  19. さてここに文章と1つ目の木があり
    そして確率文脈自由文法の記述があります
  20. これで解析木の確率を計算することができます
  21. 木にあるノードの確率を上の記述から探します
  22. Fedが名詞Nになる確率はいくつか見てみます
  23. NがFedになる確率は0.3です
    ここに書きましょう
  24. Vがraisesになる確率は0.6で
    Nがinterestになる確率は0.3です
  25. Nがratesになるのも0.3で
    NPがNになる確率はここで同じく0.3です
  26. NPが2つの名詞になる確率は0.2で
    VPが名詞句が続く動詞になる確率は0.4です
  27. この文章が動詞句が続く名詞句となる確率は
    この文法では1になります
  28. これらをすべて掛けると0.0003888で
    およそ0.039%になります