[Narrator] This is the belief state space
for the sensor-less vacuum problem.
So we started off here.
We drew the circle around this belief state.
So we don't anything about where we are,
but the amazing thing is,
if we execute actions, we can gain knowledge
about the world even without sensing.
So let's say we move right,
then we'll know we're in the right-hand location.
Either we were in the left, and we moved right
and arrived there, or we were in the right
to begin with, and we bumped against the wall
and stayed there.
So now we end up in this state.
We now know more about the world.
We're down to 4 possibilities rather than 8,
even though we haven't observed anything,
and now note something interesting,
that in the real world, the operations
of going left and going right are
inverses of each other, but
in the belief state world
going right and going left are not inverses.
If we go right, and then we go left,
we don't end up back where we were
in a state of total uncertainty, rather
going left takes us over here
where we still know we're in 1 of 4 states
rather than in 1 of 8 states.
Note that it's possible to form a plan that
reaches a goal without ever observing the world.
Plans like that are called conform-it plans.
For example, if the goal is to be
in a clean location
all we have to do is suck.
So we go from one of these 8 states
to one of these 4 states and,
every one of those 4,
we're in a clean location.
We don't know which of the 4 we're in,
but we know we've achieved the goal.
It's also possible to arrive
at a completely known state.
For example, if we start here,
we go left; we suck up the dirt there.
If we go right and suck up the dirt,
now we're down to a belief state
consisting of 1 single state that is
we know exactly where we are.
Here's a question for you:
How do I get from the state where I know
my current square is clean,
but know nothing else, to the belief state
where I know that I'm in the right-hand side
location and that that location is clean?
What I want you to do is click on the
sequence of actions, left, right, or suck
that will take us from that start to that goal.
これはセンサのない掃除機の問題について表した
信念空間の図です
ここから始めます
この信念空間を円で囲みます
現在の位置につては何も分かりませんが
驚いたことにセンサがなくても行為を通して
世界に関する情報を手に入れられるのです
例えば右に移動したならば
部屋の右側にいることが分かります
最初に左にいたならば右に移動できますし
右にいたならば壁に阻まれて動けないからです
従ってこのような状態に遷移します
世界の状態に関する知識が増えました
観測をしていないのに
あり得る状態が8から4に減っています
面白いことに実世界の状態空間では
右への移動と左への移動は逆の操作ですが
信念空間では右への移動と左への移動は
逆の操作ではありません
右に行ったあとで左に移動した場合
何も分からない状態に戻るのではありません
8つではなく4つの可能性が考えられる
この状態に遷移します
観測をしなくても目標に達する計画を
立案できることに注意してください
そのような計画をconform-it planと言います
例えばゴミのない場所に行くことが
目標であるとします
ゴミを吸い取れば目標は達成できます
8つの状態から始めて
この4つの状態のいずれかになり
どの状態を見ても掃除機はゴミのない場所にいます
4つのうちのどの状態かは分かりませんが
目標に達したことは分かります
現在の状態が1つに定まる場合もあります
例えばここから初めて左へ移動してゴミを吸い取り
右へ移動してまたゴミを吸い取れば
1つの状態から成る信念状態に到達します
現在の状態が1つに定まるのです
ここで問題です
今いる場所がきれいなことだけが
分かっている信念状態から
右側にいてかつゴミがない状態に
どうやって遷移できるでしょうか?
右へ行く、左へ行く、ゴミを吸い取るといった
行為の順番どおりにクリックしてください
Đây là không gian trạng thái tin cậy
khi mà máy hút bụi có rất ít quan sát về môi trường.
Chúng ta bắt đầu ở đây
Chúng ta đã vẽ 1 vòng tròn bao quanh trạng thái này.
Nên chúng ta không có bất kỳ thông tin gì về nơi ta ở
nhưng tuyệt vời là
nếu chúng ta thực hiện hành động, chúng ta có thêm thông tin
về thế giới mà không cần nhìn thấy nó.
Nên chúng ta đi sang phải,
chúng ta biết chắc chắn chúng ta đang ở bên phải.
Vì nếu ta đang ở bên trái, chúng ta sẽ sang phải
và nếu sang phải tiếp, ta vẫn ở bên phải
máy chạm vào tường
và vẫn ở bên phải.
Nên bây giờ chúng ta kết thúc ở trạng thái này.
Chúng ta bây giờ biết khá nhiều về thế giới.
Chúng ta bây giờ chỉ có 4 khả năng chứ không phải là 8
dù chúng ta không nhìn thấy gì
và bây giờ mọi thứ đã rất thú vị,
đó là môi trường thực, bất kỳ hành động nào,
sang trái hay sang phải hay là
đi ngược sang bên kia, nhưng
trong thế giới tin cậy
Nếu chúng ta sang phải, và tiếp đó chúng ta sang trái,
chúng ta không thể
Đây là câu hỏi cho bạn: