[Narrator] You remember our problem-solving work?
We have a state space like this, and
we're given a start space and
a goal to reach,
and then we'd search for a path
to find that goal, and maybe we find
this path.
Now the way a problem-solving agent
would work is first it does all the work
to figure out the path to the goal
just doing by thinking,
and then it starts to execute that path
to drive or walk, however you want to get there,
from the start state to the end state,
but think about what would happen
if you did that in real life; if you did all
your planning ahead of time, you had the complete goal,
and then without interacting with the world,
without sensing it at all,
you started to execute that path.
Well this has, in fact, been studied.
People have gone out and
blindfolded walkers, put them in a field
and told them to walk in a straight line,
and the results are not pretty.
Here are the GPS tracks to prove it.
So we take a hiker, we put him at a
start location, say here,
and we blindfold him so that he can't
see anything in the horizon,
but just has enough to see his or her feet
so that they won't stumble over something,
and tell them execute the plan of going forward.
Put one foot in front of each other and walk forward in a straight line,
and these are the typical paths we see.
They start out going straight for awhile
but then go in loop de loops
and end up not at a straight path at all.
These ones over here, starting in this location,
are even more convoluted.
They get going straight for a little bit
and then go in very tight loops.
So people are incapable of walking a straight line
without any feedback from the environment.
Now here on this yellow path, this one did much better,
and why was that?
Well it's because these paths were on overcast days,
and so there was no input to make sense of.
Whereas on this path was on a very sunny day,
and so even though the hiker couldn't
see farther than a few feet in front of him,
he could see shadows and say,
"As long as I keep the shadows pointing in the right direction then
I can go in a relatively straight line."
So the moral is we need some feedback from the environment.
We can't just plan ahead and come up with a whole plan.
We've got to interleave planning
and executing.
זוכרים איך עבד פתרון בעיות?
יש לנו מרחב מצבים, כמו זה,
וניתן לנו מצב התחלתי
ומטרה אליה צריך להגיע,
ואז חיפשנו מסלול
אל המטרה, ואולי מצאנו
את המסלול הזה.
עכשיו, הצורה בה יעבוד סוכן "פותר בעיות"
היא קודם כל לעשות את כל העבודה
כדי למצוא מהו המסלול אל המטרה
רק על ידי חשיבה,
ואז הוא מוציא את המסלול לפועל
ללכת, או לנסוע, איך שלא תרצו להגיע
ממצב ההתחלה אל מצב המטרה.
אבל תחשבו מה יקרה
אם הייתם עושים את זה בחיים האמיתיים. אילו הייתם
עושים את כל התכנון מראש, היה לכם את המסלול השלם למטרה,
ואז מבלי להגיב להעולם,
מבלי לחוש את המסלול
הייתם מתחילים לבצע אותו.
למען האמת, הנושא הזה, נחקר בעבר.
אנשים יצאו
כיסו את העיניים למטיילים. שמו אותם בשדה
ואז אמרו להם ללכת בקו ישר
והתוצאות אינן יפות.
הנה מעקב הGPS שלהם כדי להוכיח זאת.
אז אנחנו לוקחים מטייל, שמים אותו
בנקודת התחלה, נגיד פה,
ואנחנו מכסים לו את העיניים כך שהוא לא יכול
לראות כלום באופק,
אבל משאירים מספיק מקום שיוכל לראות את הרגליים שלו
כדי שלא יפול או משהו,
ואז אנחנו אומרים להם לבצע את התוכנית: ללכת קדימה
לשים רגל אחת לפני השניה וללכת קדימה בקו ישר,
ואלו המסלולים הטיפוסיים שנראה.
הם מתחילים בללכת ישר לזמן מה
אבל אז הולכים בסיבובים
ומסיימים לא בקו ישר בכלל.
זה כאן, שהתחיל במקום הזה,
אפילו יותר מתפתל.
הם מתחילים ללכת בקו ישר לקצת זמן,
ואז הולכים במעגלים צמודים מאוד.
אז אנשים אינם מסוגלים ללכת בקו ישר
בלי אף משוב מהסביבה.
עכשיו כאן במסלול הצהוב הזה, זה הצליח הרבה יותר טוב,
ולמה זה?
טוב, זה כי המסלולים האלה היו בימים מעוננים,
כך שלא היה שם מידע להתבסס עליו.
בעוד שהמסלול הזה היה ביום שמשי,
כך שאפילו שהמטייל לא יכל
לראות רחוק יותר מכמה מטרים לפניו,
הוא יכל לראות צלליות ולומר,
כל עוד אני אלך ככה שהצל יהיה לאותו כיוון
אני יכול ללכת בקו ישר יחסית.
אז הלקח הוא שאנחנו צריכים משוב כלשהו מהסביבה.
אנחנו לא יכולים פשוט לתכנן מראש ולהמציא תוכנית שלמה.
אנחנו צריכים לשלב תכנון
וביצוע.
問題解決がどのように行われるか覚えていますか?
このような状態空間が与えられて
開始状態と目指すべきゴールが与えられます
ゴールへの経路を探索した結果
この経路を見つけるかもしれません
問題解決を行うエージェントは
まずゴールに到達するための作業を
思考によって洗い出します
そのあとで運転したり歩いたりして
開始状態から終了状態へ向けて
経路の移動を実行します
しかし現実的に考えてみれば
外部との交流や観測を一切行わずに
目標達成の計画を立てて
作業を実行することになります
実はこれが今まで勉強してきた内容です
目隠しをした人を外に連れ出して野原に放り出し
真っすぐに歩いてくださいと言っても
うまくいかないでしょう
そのことを示すGPSの軌跡があります
ハイカーをスタート地点に立たせて
地平線より上が一切見えないように目隠しをします
つまずいたりしないよう
足元だけはよく見える状態で
真っすぐ歩くようにお願いしました
直線上を歩こうとして踏み出すのですが
経路はこうなりました
最初のうちは直線上を歩くのですが何回かループし
真っすぐには歩けなかったのです
ここからスタートした人はもっと複雑です
少しだけ真っすぐ歩いたあとは
ぐるぐる回っています
このように人間は環境からの
フィードバックなしでは真っすぐに歩けません
黄色い経路の人はかなり真っすぐ歩いていますが
なぜでしょう?
青い経路は曇りの日に行われた実験のため
何も情報が得られませんでした
黄色の経路の時はとても天気がよかったので
遠くは見えなくても影を見ることができました
“常に影が右側を向くようにすれば
ほぼ真っすぐに歩けるはずだ”と
考えることができました
事前に立てた計画だけでは不十分で
環境からのフィードバックが必要だということです
実行を挟みながら
プランニングを行う必要があります
Pamiętacie, jak rozwiązywaliśmy problemy?
Mamy taką przestrzeń stanu i
otrzymujemy stan początkowy
oraz cel, który chcemy osiągnąć
i wówczas poszukujemy ścieżki
prowadzącej do celu, którą być może
odnajdziemy.
Sposobem, w jaki agent rozwiązujący problemy
byłoby najpierw wykonanie całej pracy
rozpoznania drogi do celu
przy pomocy samego myślenia,
a następnie rozpoczęcie wykonania tej ścieżki,
dojechania tam albo dojścia, albo zastosowania innego sposobu
na dostanie się ze stanu początkowego do końcowego,
ale zastanówmy się, co by się stało
gdybyśmy postępowali tak w życiu: gdybyśmy robili plany
dotyczące przyszlości, wiedzieli, jak osiągnąć cel
i wtedy, nie zważając na świat zewnętrzny
bez użycia żadnych zmysłów
rozpocznali wykonywanie tej ścieżki.
Właściwie ta strategia została przebadana.
Ludzie wychodzili na dwór
mając na oczach zawiązane opaski
i mieli iść po linii prostej,
ale wyniki nie były zachęcające.
Oto dowód w postaci danych z GPSa.
Mamy wędrownika, umieszczamy go
w punkcie startowym, na przykład tutaj,
zawiązujemy mu oczy, żeby nie mógł
widzieć niczego na horyzoncie
ale żeby był tylko w stanie widzieć swoje stopy
żeby się na nic nie napatoczył i nie przewrócił,
i każemy mu wykonać plan polegający na poruszaniu się prosto do przodu.
Umieść jedną stopę przed drugą i idź do przodu po linii prostej
i zazwyczaj obserwowaliśmy takie ścieżki.
Na początku przez jakiś czas idą prosto
ale później zaczynają się zapętlać
i ich ścieżka w ogóle nie przypomina linii prostej.
A osoby, które zaczynały z tego połozenia
są jeszcze bardziej zawinięte.
Idą przez jakiś czas prosto
ale później wpadają w bardzo ciasne pętle.
Zatem ludzie nie potrafią iść po linii prostej
bez informacji zwrotnych ze środowiska.
Jeżeli idzie o żółtą ścieżkę, to widać, że tu poszło dużo lepiej.
a dlaczegóż to?
To dlatego, że te ścieżki były przebyte w pochmurne dni,
więc nie było żadnych użytecznych danych,
natomiast ta ścieżka została przebyta w bardzo słoneczny dzień,
dlatego chociaż wędrownik nie mógł
widzieć dalej, niż na kilka stóp przed sobą,
mógł widzieć cienie i stwierdzić
"Dopóki cienie wskazują na ten kierunek,
mogę iść po względnie prostej linii".
Morał jest taki, że potrzebujemy informacji zwrotnej ze środowiska.
Nie możemy po prostu planować i wymyślić gotowy plan.
Musimy przeplatać planowanie
z wykonywaniem.
Bạn có nhớ cách chúng ta giải quyết vấn đề
Chúng ta có 1 trạng thái thế này,
chúng ta được cho điểm bắt đầu và
một mục tiêu đề tìm kiếm
và chúng ta đã tìm ra con đường
để tìm đến mục tiêu, và có lẽ đó là
đường này.
Bây giờ là cách để agent giải quyết vấn đề
chúng sẽ chỉ làm tất cả những việc
để tìm ra con đường đến mục tiêu
chỉ bằng cách suy nghĩ,
và tiếp đó chúng bắt đầu thực hiện hành trình,
đi hoặc chạy, tuy nhiên bạn muốn là,
đi từ điểm bắt đầu đến điểm kết thúc,
nhưng nghĩ về điều đã xảy ra
Nếu bạn đang trong cuộc sống thật, nếu tất cả nhũng gì bạn làm
chiến lược của bạn là đi về phía trước, bạn đạt được mục tiêu,
và không cần tác động đến thế giới,
không cần cảm nhận luôn,
bạn đã thực hiện được hành trình.
Vâng điều này thực tế đã được nghiên cứu.
Mọi người đi ra ngoài
và bị bịt mắt, đặt gữa 1 cành đồng
và được lệnh đi thẳng,
kết quả không tốt lắm.
Dưới đây là kết quả với GPS.
Nói chung là họ đi lang thang, chúng tôi để 1 người ở
điểm xuất phát,
và anh ấy bj bjt mắt nên anh ấy không thể
thấy bất kỳ thứ gì,