YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Japanese subtitles

← 05_Reinforcement Learning

Get Embed Code
2 Languages

Showing Revision 1 created 10/19/2014 by Udacity.

  1. 教師あり学習と教師なし学習については学びました
  2. 最後は強化学習です
  3. 私たちが研究しているものですが
    特にマイケルは活発に取り組んでいます
  4. 論文は全部でいくつ出版されましたか?
  5. 数編だけです
  6. 彼は大量に強化学習の論文を書いています
  7. 実際に彼は同僚とすばらしい調査論文を書き
    雑誌に発表しました
  8. 強化学習の最新情報でしたね
  9. 112年前のことかな
  10. 1992年頃でしょう
  11. とにかくあれはもう古いですよ
    誰かが新しい論文を書かないと
  12. でもそれ以降に機械学習の本が書かれました
  13. 私たちは人気の高い分野で活動し
  14. マイケルは多くを実証しています
  15. それが理由ではありません
  16. 何のことですか?
  17. 私たちの動機は人気の高い分野だからと
  18. そんな風に言っていません
  19. そう聞こえました
  20. 巻き戻して見てみますか
  21. 人気の高い分野だと言っただけです
  22. あなたがそう思っているのでは?
  23. いいえ 私は学部生の頃から
    本当に学びたかったのです
  24. 人工知能に関する考え方に興味も持ちました
  25. 人は経験によって向上できるかを調べるために
  26. 3目並べのプログラムを作り
    プレイを重ねて強くしようと考えました
  27. なぜなら実践的で社会的に影響力を持つ問題に
    とても関心があったからです
  28. 3目並べは貧困層に普及していますね
  29. 結果的にはそうですが当時の私は
    そのゲームの名前すら知りませんでした
  30. そのゲームが面白くて人気があると分かったのは
    強化学習を始めてからです
  31. つまり私たちが科学を研究しているのは
  32. 人気があるからではなく関心があるからですね
  33. はい
  34. 私は強化学習に関心があります
  35. そこには私の関心のすべてがあるからです
  36. 私は一般的な人工知能分野の出身で
    人間のモデリングに関心があります
  37. スマートエージェントにも取り組んでいます
  38. 互いに協調しながら動く
    何千何万のエージェントを作りたいのです
  39. 人間のエージェントもいます
  40. エージェントが何をすべきか
    予測することに取り組んでいます
  41. さて専門的な立場から考えると
    教師あり学習は関数近似で
  42. 教師なし学習は正確で簡潔な説明でしたね
  43. これら2つの学習と強化学習の違いは何でしょう?
  44. よく言われることですが強化学習は
  45. 結果を振り返って学ぶ学習法です
  46. 教師あり学習では途中で
    直接的なフィードバックをしますし
  47. 教師なし学習ではフィードバックはこんな感じです
  48. しかし強化学習では先に結果を見てから
    何段階ものフィードバックを行います
  49. あなたの3目並べプログラムがいい例ですね
  50. 一緒に3目並べをしましょう
  51. まず中心にX 次にここにOを置いてください
  52. 私はここにXを置くと
  53. あなたは考えなしに角にOを置きます
  54. すると私はXをここに置いて勝ちます
  55. 面白いのは私が勝つまで
    あなたに何も助言しませんでした
  56. ええ 途中で間違いをしたはずですが
    どこで間違えたか分かりません
  57. ゲームを振り返ってどこで何を間違えたのか
    考えなければなりません
  58. 強化学習一般ではあなたが間違ったのではなく
  59. 単にゲームがそういうものだった
    ということもあります
  60. しかしどの動きが問題だったのか知りたいですね
  61. これが教師あり学習なら
  62. “私はここにXを あなたはここにOを”と
    教えられ
  63. “はい よくできました”
  64. “次は私はここで あなたはそこに
    そこはよくないですね”という具合です
  65. 置き方をすべて教えられるのです
  66. この方法ではうまくいったかどうかという
    合図のようなものを受け取るだけで
  67. 結局 前に受け取った合図に関連づけて終わりです
  68. その点 強化学習の方が大変ですね
  69. 何も指示されませんから
  70. 自分の力でやるのです
  71. ルールを知らずにゲームをするようなものですね
  72. どうやって勝つか負けるかは知らずに
  73. たまに勝ち負けを知らされるのです
  74. 私は知りたいです
  75. でしょうね