Return to Video

21-38 Spelling Data

  • 0:00 - 0:06
    こちらはスペル修正を扱うサイトから
    集めたデータです
  • 0:06 - 0:12
    すべてつづりに誤りがあり
    スペル修正をした単語の例です
  • 0:12 - 0:15
    各単語の修正例はいくつかあります
  • 0:15 - 0:22
    ここから修正が必要な単語が出現する確率
    P(w|c)を求めます
  • 0:22 - 0:29
    例えば正しくはpulseという単語が
  • 0:29 - 0:33
    誤ってpluseで出現する確率を求めるわけです
  • 0:33 - 0:38
    ここにその例があります 修正例は1つですね
  • 0:38 - 0:42
    しかしこれはスペルに誤りが起こり得る
    単語のごく一部です
  • 0:42 - 0:46
    起こり得るスペルミスすべてを
    カバーするには不十分です
  • 0:46 - 0:49
    ただ数万の例さえあれば
  • 0:49 - 0:53
    すべてではなくても
    かなり多くの英単語が得られます
  • 0:53 - 0:57
    単語ごとのスペルエラーを扱うのではなく
  • 0:57 - 1:00
    文字ごとのエラーを扱いましょう
  • 1:00 - 1:06
    従ってpulseのスペルが誤って
    pluseになったとは捉えず
  • 1:06 - 1:12
    ulが誤ってluになったと捉えましょう
  • 1:12 - 1:19
    ここではelegantのeがaに間違えられたと捉えます
  • 1:19 - 1:24
    1つの単語から別の単語へのこうした編集方法は
  • 1:24 - 1:32
    文字の転位や交換及び
    1文字の挿入または削除です
  • 1:32 - 1:37
    すべての単語ではなく
    そういった修正の確率の表を構築します
  • 1:37 - 1:41
    より少ないデータで扱いやすくなります
Title:
21-38 Spelling Data
Team:
Udacity
Project:
CS271 - Intro to Artificial Intelligence
Duration:
01:42

Japanese subtitles

Revisions