Russian subtitles

← 04-34 Left Turn Policy Solution

Get Embed Code
3 Languages

Subtitles translated from English Showing Revision 1 created 12/27/2012 by Eldar.

  1. Вот мое решение, я имею значение функции инициализации. Он имеет множество 999s.
  2. Политика является аналогичные функции в 3D.
  3. Затем у меня есть функция под названием policy2d, который является один, я позже собираюсь печатать.
  4. Это то же самое в 2D.
  5. Прокрутка вниз, моя функция update является точно так же, как и раньше для динамического программирования
  6. Хотя изменение существует пройти через [x, y] и все направления
  7. из которых есть 4, так что теперь более глубокого цикла.
  8. Если вы нашли местоположение цели, затем обновите значение,
  9. и если фактическое обновление, установите «изменить» в значение True
  10. а также пометить его как местоположение цели.
  11. Иначе, если наши ячейки сетки судоходен на всех,
  12. Давайте пройдемся по 3 различных действий и здесь Каверзная часть
  13. как сделать работу действий, но он работает прекрасно.
  14. Мы идем через 3 различных действий.
  15. Когда мы помечать ith действий,
  16. Мы добавляем соответствующего изменения ориентации нашей ориентации по модулю 4.
  17. Это циклический буфер, поэтому это может вычесть 1.
  18. Сохранение же будет добавить 1 ориентации.
  19. Затем мы применяем соответствующие новой модели движения к x и y для получения x 2 и y2.
  20. Затем над здесь является наша модель автомобиля, который направляет сначала и затем перемещается.
  21. Прокрутка вниз далее, если мы прибыли в ячейке действительный сетки в том, что до сих пор внутри grid
  22. и это не является препятствием, тогда как прежде мы добавить к значению
  23. значение этой новой ячейки сетки плюс стоимость соответствующих действий.
  24. Это non-uniform, в зависимости от того, какие меры мы выбираем сейчас.
  25. Это улучшает существующее значение.
  26. Это значение будет новое значение, и мы отмечаем изменения как True.
  27. Мы также запомнить имя действия как раньше.
  28. Это все фактически тот же код, как у нас было раньше
  29. Когда мы сделали динамического программирования в мире, 2-мерных.
  30. Он получает нас значение функции, и он получает нас действие политики.
  31. Однако я распечатать 2-мерных, а не 3-мерного таблицы.
  32. Чтобы попасть в таблице 2-мерных, я теперь нужно быть чувствительным моего первоначального государства.
  33. В противном случае на самом деле оказывается, чтобы быть неопределенным.
  34. Позвольте мне задать начальное состояние быть x, y и ориентации.
  35. Все, что я делаю теперь запускается политики.
  36. С самого первого государства скопировать над формой политики 3-мерного таблицы
  37. в 2-мерной один, который будет этот хэш знак над здесь.
  38. Хотя я еще не достиг цели государство совсем еще как указано
  39. установив для звезды в моей таблице политики.
  40. Теперь моя таблица политики имеет хэш знак R и L,
  41. но в остальном же, как и раньше.
  42. Если это хэш знак, мы просто держать наши ориентации так, как это.
  43. Если это R, я перехожу к праву. L поверните налево.
  44. Я применить мой движение вперед
  45. и затем обновить мой новый x и y координат
  46. чтобы быть соответствующий после движения,
  47. и я обновить мою ориентации быть o2.
  48. Наконец я скопировать 3-мерного символ для моей политики прямо в 2-мерный массив.
  49. Это массив, который наконец печати.
  50. Ключевой Инсайт здесь заключается в переходе от 3-мерного полного политики
  51. 2-мерный массив пришлось выполнить политики.
  52. Это то, что вы бы сделали получить обратно в этой таблице здесь.
  53. Вот несколько нетривиальной задачей. Я не говорю вам это, но я надеюсь, что вы догадались.
  54. Но все остальное же динамического программирования цикл, который вы уже видели раньше.