YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Japanese subtitles

← 04-24 Dynamic Programming

Get Embed Code
3 Languages

Showing Revision 1 created 10/29/2014 by Udacity.

  1. 今回は計画の代替手法に関する講義です
  2. この代替手法にはたくさんの長所と短所があります
  3. ダイナミック・プログラミングと呼ばれ
    A*と同様に最短経路を探索します
  4. A*と同様に環境の地図を指定し
    ゴール位置は1つまたは複数でも指定できます
  5. まずゴール位置は1つだけと仮定しましょう
  6. 出力結果は任意の出発地からの最適経路です
  7. この計画手法は
    1つの出発地に限定されるのではなく
  8. どの出発地でも可能です
    これはなぜ重要なのでしょうか?
  9. 例を挙げてみましょう
  10. あなたはこのような環境にいる
    Googleの自動運転車だとします
  11. 小さな通りのこの位置にいて右折を指示されます
  12. ゴールはここです
  13. これまでのように2種類の車線があります
  14. 左折車線と直進車線です
  15. 直進車線に進むとゴールまでの道は
  16. このブロックを一周してこの方向に進む道だけです
  17. この例は以前に説明しました
  18. 今回私が説明したいのは別の点です
  19. ここで車線変更しようとすると
    失敗する可能性があります なぜでしょうか?
  20. 車線のここにとても大きなトラックが
    いるかもしれません
  21. トラックがいなくなるまで待とうと
    右側の車線に入ると
  22. あなたの後ろでクラクションを鳴らす人がいます
  23. トラックがいなくなるまで待つのは嫌ですね
  24. つまり環境は確率論的で
    動作の結果は非決定論的です
  25. これまでの計画ではそれを無視しましたが
    現実では起こり得ます
  26. 現実ではどうして私はここにいるんだ?と
    思うかもしれません
  27. それは世界が確率論的だから起こるのです
  28. またこのトラックがあなたを入れなかったからです
  29. つまりあなたには可能性が最も高い
    位置の計画だけではなく
  30. 同様に別の位置の計画も必要かもしれません
  31. ダイナミック・プログラミングが可能にするのは
    あらゆる位置の計画です
  32. この環境をゴール地点と特定の障害物を含む
  33. グリッドとして描き直すと
    ダイナミック・プログラミングは
  34. すべてのグリッドセルで
    最適な動作を行うことを可能にします
  35. ご覧のとおり各グリッドセルに
    ラベルがついています
  36. ラベルはよくポリシーと呼ばれます
  37. ポリシーはグリッドセルを
    動作にマッピングする関数です
  38. このケースでは左、下、
    右、上への移動の各動作です
  39. これからダイナミック・プログラミングを用いて
    ポリシーを計算します
  40. つまりこのようなグリッド世界と
    ゴール状態を指定され
  41. ロボットがその位置で選択すべき最適な動作を
  42. 各グリッドセルに出力するソフトウェアを
    プログラミングします
  43. このためにはA*とは別のさらに計算が必要な
    コンピュータアルゴリズムが不可欠です
  44. これがロボット経路計画のための
    ダイナミック・プログラミングです