Japanese subtitles

← 21-17 Language Question Solution

Get Embed Code
2 Languages

Showing Revision 1 created 11/29/2014 by Udacity.

  1. この問題はそれほど難しくありません
  2. これは英語でこれはドイツ語でしょう
  3. アゼルバイジャン語はよく分かりませんが
  4. 英語、ドイツ語、フランス語、スペイン語には
    見えないので
  5. おそらくこれがアゼルバイジャン語で
    正解でしょう
  6. これはいくつかの単語を見分けることで
    解くことができます
  7. しかし文字列を見るだけでも
    同じように見分けることができるのです
  8. 1文字、2文字、3文字の文字列の
    出現頻度を見るわけです
  9. 実際に言語認識では文字表を見るだけで
    99%の精度が得られます
  10. 文字モデルを使うのが優れている点は
  11. 必要な確率表が小さく扱いやすいことです
  12. 3つの単語を考えても
    100万セットくらいの語彙があるでしょう
  13. そうなると3語の文字表は
    100万の3乗になってしまいます
  14. それは相当な数のエントリです
  15. 一方アルファベットの文字数は
    せいぜい30くらいです
  16. そのうちの3文字を格納するのは
    簡単かつ小さくて済みます
  17. 実際に言語識別を実行する時は
  18. 文字の連結を見るだけでなく
    他の特徴も加えるのが一般的です
  19. それが単語の時もあるでしょう
  20. その言語で最も一般的な単語を追加したり
  21. あるいは他の言語にはなく
    その言語にだけ出てくるような
  22. 最も特徴的な単語を追加したりするのが
    よいかもしれません
  23. そしてその単語の出現数を数えます