YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Japanese subtitles

← 10ps-06 Passive Rl Agent Solution

Homework 5 3 Passive RL Agent ANSWER.mp4

Get Embed Code
2 Languages

Showing Revision 1 created 11/29/2014 by Udacity.

  1. ポリシーに従うとエージェントは
    この直線の道を選ぶでしょう
  2. ゴールに直接向かっているからです
  3. しかしこの上のマスのどこかに
    外れる可能性もあります
  4. これらはすべて探索可能ですが
  5. そこを探索すれば元の道に戻ります
  6. 同じようにこの道の下のマスに
    外れるかもしれません
  7. その場合も同じように元の道に戻ってくるでしょう
  8. 道を外れた時このマスの状況は確かに真ですが
  9. しかしこことここも真になるのです
  10. なぜならゴールへの近道が
    北に向かっているからです
  11. 従ってこの3列はすべて探索可能になります
  12. しかしエージェントが
    この固定されたポリシーに従っている限り
  13. 確率論的に何があろうとどんな状況でも
    下の2列は探索可能にはなりません