WEBVTT

00:00:00.800 --> 00:00:03.924
אז, אני מוביל צוות בגוגל 
שעובד על למידה חישובית;

00:00:03.948 --> 00:00:08.598
כלומר, תחום ההנדסה שגורם
למחשבים ומכשירים

00:00:08.622 --> 00:00:11.041
לעשות כמה מהדברים שמוחותינו עושים.

00:00:11.439 --> 00:00:14.538
וזה גורם לנו להתעניין במוחות אמיתיים

00:00:14.562 --> 00:00:15.851
וגם במדעי המוח,

00:00:15.875 --> 00:00:20.047
ובמיוחד בדברים שבביצועם מוחותינו

00:00:20.071 --> 00:00:24.113
עדיין עולים בהרבה על מחשבים.

NOTE Paragraph

00:00:25.209 --> 00:00:28.818
מבחינה היסטורית, אחד התחומים האלה
הוא תפיסה,

00:00:28.842 --> 00:00:31.881
ההליך שדרכו כל הדברים שיש בעולם החיצוני --

00:00:31.905 --> 00:00:33.489
צלילים ותמונות --

00:00:33.513 --> 00:00:35.691
נעשים למושגים בשכל.

00:00:36.235 --> 00:00:38.752
זה חיוני למוחות שלנו,

00:00:38.776 --> 00:00:41.240
וגם די שימושי במחשב.

00:00:41.636 --> 00:00:44.986
האלגוריתמים לתפיסה חישובית, לדוגמא,
שהצוות שלנו מוציא,

00:00:45.010 --> 00:00:48.884
הם מה שמאפשר לתמונותיכם 
בגוגל פוטוז להיות ניתנות-חיפוש,

00:00:48.908 --> 00:00:50.305
על פי תוכנן.

00:00:51.594 --> 00:00:55.087
הפן השני של תפיסה הוא יצירתיות:

00:00:55.111 --> 00:00:58.149
הפיכת מושג לעצם בעולם.

00:00:58.173 --> 00:01:01.728
וכך במשך השנה האחרונה,
עבודתנו על תפיסה חישובית

00:01:01.752 --> 00:01:06.611
התחברה באופן לא צפוי
לעולם היצירתיות החישובית,

00:01:06.635 --> 00:01:07.795
ולאמנות ממוחשבת.

NOTE Paragraph

00:01:08.556 --> 00:01:11.840
אני חושב שלמיכלאלג'לו הייתה תובנה חודרת

00:01:11.864 --> 00:01:15.520
לגבי היחס הדואלי הזה שבין תפיסה ליצירתיות.

00:01:16.023 --> 00:01:18.029
זאת ציטטה מפורסמת שלו:

00:01:18.053 --> 00:01:21.376
"לכל אבן יש פסל בתוכה,

00:01:22.036 --> 00:01:25.038
ועבודת הפסל לגלות אותו."

00:01:26.029 --> 00:01:29.245
אז, אני חושב שמיכלאנג'לו התכוון לזה

00:01:29.269 --> 00:01:32.449
שאנחנו יוצרים באמצעות תפיסה,

00:01:32.473 --> 00:01:35.496
ושתפיסה עצמה היא מעשה של דמיון

00:01:35.520 --> 00:01:37.981
והיא חומר היצירתיות.

NOTE Paragraph

00:01:38.691 --> 00:01:42.616
האיבר שמבצע את כל המחשבה והתפיסה והדמיון,

00:01:42.640 --> 00:01:44.228
הוא כמובן המוח.

00:01:45.089 --> 00:01:47.634
ואני רוצה לפתוח בקטע קצר של היסטוריה

00:01:47.658 --> 00:01:49.960
על מה שאנחנו יודעים על המוח.

00:01:50.496 --> 00:01:52.942
כי לא כמו, כגון, הלב או המעיים,

00:01:52.966 --> 00:01:56.110
אי אפשר לומר הרבה על המוח
פשוט מלהסתכל עליו,

00:01:56.134 --> 00:01:57.546
לפחות, בעין בלתי מזויינת.

00:01:57.983 --> 00:02:00.399
האנטומיסטים המוקדמים שהסתכלו על מוחות

00:02:00.423 --> 00:02:04.230
קראו למבנים השטחיים של הדבר הזה
בכל מיני שמות דמיוניים,

00:02:04.254 --> 00:02:06.687
כגון היפוקמפוס, שמשמעו "חסילון קטן."

00:02:06.711 --> 00:02:09.475
אך בבירור דבר מסוג זה לא מספר לנו הרבה

00:02:09.499 --> 00:02:11.817
על מה שבאמת קורה בפנים.

NOTE Paragraph

00:02:12.780 --> 00:02:16.393
האדם הראשון, לדעתי, שבפועל פיתח 
איזה מין של הבנה

00:02:16.417 --> 00:02:18.347
של מה שבאמת קורה בתוך המוח

00:02:18.371 --> 00:02:22.291
היה הניורואנטומיסט הספרדי הגדול, 
סנטיאגו רמון אי קחאל,

00:02:22.315 --> 00:02:23.859
במאה התשע-עשרה,

00:02:23.883 --> 00:02:27.638
שהשתמש במיקרוסקופ וצבעים מיוחדים

00:02:27.662 --> 00:02:31.832
שיכלו לדמות בבררנות ובניגוד גבוה

00:02:31.856 --> 00:02:33.864
תאים יחידים במוח,

00:02:33.888 --> 00:02:37.042
כדי להתחיל להבין את המורפולוגיה שלהם.

00:02:37.972 --> 00:02:40.863
ואלה סוגי הציורים שהוא צייר של תאי עצב

00:02:40.887 --> 00:02:42.096
במאה התשע-עשרה.

NOTE Paragraph

00:02:42.120 --> 00:02:44.004
זה מתוך מוח של ציפור.

00:02:44.028 --> 00:02:47.085
ותראו את המגוון המדהים הזה
של תאים מסוגים שונים,


00:02:47.109 --> 00:02:50.544
אפילו תיאוריית התא עצמה
הייתה חדשה למדי בעת הזו

00:02:50.568 --> 00:02:51.846
והמבנים האלה,

00:02:51.870 --> 00:02:54.129
התאים האלה שיש להם הסתעפויות כאלה

00:02:54.153 --> 00:02:56.761
וענפים כאלה שמסוגלים להאריך מרחקים רבים --

00:02:56.785 --> 00:02:58.401
זה היה מאד חדשני ומקורי בתקופה זו.

00:02:58.779 --> 00:03:01.682
הם מזכירים חוטים כמובן.

00:03:01.706 --> 00:03:05.163
אפשר שכבר תפסו כך כמה אנשים 
במאה התשע-עשרה;

00:03:05.187 --> 00:03:09.501
מהפכות החיווט והחישמול בדיוק החלו.

00:03:09.964 --> 00:03:11.142
אבל מבחינות רבות,

00:03:11.166 --> 00:03:14.479
הציורים המיקרו-אנטומיים האלה
של רמון אי קחאל, כגון זה,

00:03:14.503 --> 00:03:16.835
מבחינת-מה עוד לא הושגו.

NOTE Paragraph

00:03:16.859 --> 00:03:18.713
ואנחנו מאה שנים אחרי כן,

00:03:18.737 --> 00:03:21.562
מנסים לגמור את העבודה בו רמון אי קחאל החל.

00:03:21.586 --> 00:03:24.720
אלה הם נתונים לא-מעובדים
ממשתפי הפעולה שלנו

00:03:24.744 --> 00:03:27.625
במכון מקס פלאנק למדעי מוח.


00:03:27.649 --> 00:03:29.439
ומה שמשתפי הפעולה שלנו עשו

00:03:29.463 --> 00:03:34.464
זה לדמת חלקיקים קטנים של רקמה מוחית.

00:03:34.488 --> 00:03:37.814
כל הדגימה הינה קרובה
בגודלה למילימטר מעוקב אחד,

00:03:37.838 --> 00:03:40.459
ואני מראה לכם חלק מאד קטן ממנה פה.

00:03:40.483 --> 00:03:42.829
הפס הזה שלצד שמאל בגודל מיקרון אחד בערך.

00:03:42.853 --> 00:03:45.262
המבנים שאתם רואים הם מיטוכונדריה

00:03:45.286 --> 00:03:47.330
ששווים בגודלם לחיידק.

00:03:47.354 --> 00:03:48.905
ואלה פרוסות עוקבות

00:03:48.929 --> 00:03:52.077
בתוך הגוש הקטנטן מאד הזה של רקמה.

00:03:52.101 --> 00:03:54.504
רק לשם השוואה,

00:03:54.528 --> 00:03:58.320
קוטר קווצה ממוצעת של שיער היא כמאה מיקרון.

00:03:58.344 --> 00:04:00.618
וכך אנחנו מתבוננים במשהו הרבה יותר זעיר

00:04:00.642 --> 00:04:02.040
משערה אחת.

NOTE Paragraph

00:04:02.064 --> 00:04:06.095
ועל פי כל הסוגים האלה של פרוסות סדרתיות 
מוגדלות מיקרוסקופ-אלקטרוני,

00:04:06.119 --> 00:04:11.127
אפשר להתחיל בשיחזורים תלת-ממדיים
של תאי עצב, הנראים ככה.

00:04:11.151 --> 00:04:14.308
ובכן, אלה נוהגים על פי אותו סגנון
בקירוב של רמון אי קחאל.

00:04:14.332 --> 00:04:15.824
רק תאי עצב אחדים נדלקו,

00:04:15.848 --> 00:04:18.629
אחרת לא היינו יכולים לראות
פה שום דבר.

00:04:18.653 --> 00:04:19.965
יהיה כל כך צפוף,

00:04:19.989 --> 00:04:21.319
כל כך מלא מבנים,

00:04:21.343 --> 00:04:24.067
מלא חיווט המקשר תאי עצב אחד לשני.

NOTE Paragraph

00:04:25.293 --> 00:04:28.097
אז רמון אי קחאל במידה הקדים את זמנו,

00:04:28.121 --> 00:04:30.676
והתקדמות בהבנת המוח

00:04:30.700 --> 00:04:32.971
התקדמה לאט לאט במשך העשורים הבאים.

00:04:33.455 --> 00:04:36.308
אבל ידענו שתאי עצב עשו שימוש בחשמל,

00:04:36.332 --> 00:04:39.268
ועד מלחמת העולם השנייה, 
הטכנולוגיה שלנו התקדמה דיה

00:04:39.292 --> 00:04:42.098
כדי להתחיל ניסויים חשמליים 
אמיתיים בתאי עצב חיים

00:04:42.122 --> 00:04:44.228
בשביל להבין טוב יותר כיצד הם עבדו.

00:04:44.631 --> 00:04:48.987
זה אותו הזמן שמחשבים הומצאו לראשונה,

00:04:49.011 --> 00:04:52.111
ממש בהתבסס על הרעיון של בניית דגם המוח --

00:04:52.135 --> 00:04:55.220
של "מנגנון נבון,"
כמו שאלן טיורינג כינה אותו,

00:04:55.244 --> 00:04:57.235
אחד מאבות מדעי המחשב.

NOTE Paragraph

00:04:57.923 --> 00:05:02.555
ווארן מקולוק ווואלטר פיטס
הביטו בציורו של רמון אי קחאל

00:05:02.579 --> 00:05:03.896
של קליפת הראייה,

00:05:03.920 --> 00:05:05.482
שאותו אני מראה פה.

00:05:05.506 --> 00:05:09.948
זאת הקליפה שמעבדת
דימויים המגיעים מהעין.

00:05:10.424 --> 00:05:13.932
ומבחינתם, זה נראה כמו
דיאגרמת מעגל חשמלי.

00:05:14.353 --> 00:05:18.188
לכן יש הרבה פרטים בדיאגרמת
המעגל של מקולוק ופיטס

00:05:18.212 --> 00:05:19.564
שאינם לגמרי נכונים.

00:05:19.588 --> 00:05:20.823
אבל הרעיון המרכזי הזה

00:05:20.847 --> 00:05:24.839
שקליפת הראייה עובדת
כסדרה של רכיבים חישוביים

00:05:24.863 --> 00:05:27.609
המעבירים מידע אחד לרעהו במפל,

00:05:27.633 --> 00:05:29.235
בעיקרו של דבר נכון.

NOTE Paragraph

00:05:29.259 --> 00:05:31.609
בואו נדבר רגע 


00:05:31.633 --> 00:05:35.665
על מה שדגם לעיבוד מידע חזותי צריך לעשות.

00:05:36.228 --> 00:05:38.969
המשימה היסודית של תפיסה

00:05:38.993 --> 00:05:43.187
היא החזקת תמונה כזו שמשמאל ולאמר כי

00:05:43.211 --> 00:05:44.387
"זאת ציפור,"

00:05:44.411 --> 00:05:47.285
היא דבר מאד פשוט לעשות בעזרת מוחותינו.

00:05:47.309 --> 00:05:50.730
אבל צריכים להבין שעבור מחשבים,

00:05:50.754 --> 00:05:53.841
זה היה כמעט בלתי אפשרי רק לפני כמה שנים.

00:05:53.865 --> 00:05:55.781
במסגרת הפרדיגמה החישובית הקלאסית

00:05:55.805 --> 00:05:58.312
אין זאת משימה קלת-ביצוע.

NOTE Paragraph

00:05:59.366 --> 00:06:01.918
אז מה שקורה בין הפיקסלים,

00:06:01.942 --> 00:06:05.970
בין דמות הציפור לבין המילה "ציפור,"

00:06:05.994 --> 00:06:08.808
ביסוד הוא התקשרות
בין מערכת תאי עצב מקושרים

00:06:08.832 --> 00:06:09.987
זה לזה ברשת עצבית,

00:06:10.011 --> 00:06:11.234
כפי שאני משרטט פה.

00:06:11.258 --> 00:06:14.530
הרשת העצבית יכולה להיות ביולוגית,
בתוך קליפתנו הראייתית,

00:06:14.554 --> 00:06:16.716
או, כיום, מתחילה להיות לנו היכולת

00:06:16.740 --> 00:06:19.194
לבנות דגמים של רשתות אלה במחשב.

00:06:19.834 --> 00:06:22.187
ואראה לכם איך זה נראה באמת.

NOTE Paragraph

00:06:22.211 --> 00:06:25.627
אז אתם יכולים לחשוב על הפיקסלים
כשכבה הראשונה של ניורונים,

00:06:25.651 --> 00:06:27.890
וזה, למעשה, איך שזה עובד בעין --

00:06:27.914 --> 00:06:29.577
אלה הניורונים ברשתית.

00:06:29.601 --> 00:06:31.101
ואלה מזינים הלאה

00:06:31.125 --> 00:06:34.528
לתוך שכבה אחת אחרי אחרת
אחרי הבאה של ניורונים,

00:06:34.552 --> 00:06:37.585
כולם מחוברים על ידי סינפסות במשקלים שונים.

00:06:37.609 --> 00:06:38.944
ההתנהגות של הרשת הזו

00:06:38.968 --> 00:06:42.252
מאופיינת על ידי הכוחות
של כל הסינפסות האלה.

00:06:42.276 --> 00:06:45.564
אלה מאפיינים את התכונות המחשוביות
של הרשת הזו.

00:06:45.588 --> 00:06:47.058
ובסופו של יום,

00:06:47.082 --> 00:06:49.529
יש לכם ניורון או קבוצה קטנה של ניורונים

00:06:49.553 --> 00:06:51.200
שנדלקים, ואומרים, "ציפור."

NOTE Paragraph

00:06:51.824 --> 00:06:54.956
עכשיו אני עומד לייצג
את שלושת הדברים האלה --

00:06:54.980 --> 00:06:59.676
פיקסל הקלט והסינפסות ברשתות העצביות,

00:06:59.700 --> 00:07:01.285
וציפור, הפלט --

00:07:01.309 --> 00:07:04.366
על ידי שלושה משתנים: X, W ו Y.

00:07:04.853 --> 00:07:06.664
יש אולי מליון Xים בערך --

00:07:06.688 --> 00:07:08.641
מליון פיקסלים בתמונה הזו.

00:07:08.665 --> 00:07:11.111
יש מיליארדים או טריליונים של W,

00:07:11.135 --> 00:07:14.556
שמייצגים את המשקל של כל הסינפסות האלו
ברשתות העצביות.

00:07:14.580 --> 00:07:16.455
ויש מספר מאוד קטן של Y,

00:07:16.479 --> 00:07:18.337
של פלטים שיש לרשת הזו.

00:07:18.361 --> 00:07:20.110
"ציפור " היא רק חמש אותיות, נכון?

00:07:21.088 --> 00:07:24.514
אז בואו נעמיד פנים שזו רק נוסחה פשוטה,

00:07:24.538 --> 00:07:26.701
x "x" w = y.

00:07:26.725 --> 00:07:28.761
אני שם את הכפול בגרשיים

00:07:28.785 --> 00:07:31.065
בגלל שמה שבאמת מתרחש פה, כמובן,

00:07:31.089 --> 00:07:34.135
זה סדרה מאוד מורכבת של פעולות מתמטיות.

NOTE Paragraph

00:07:35.172 --> 00:07:36.393
זו משוואה אחת.

00:07:36.417 --> 00:07:38.089
יש שלושה משתנים.

00:07:38.113 --> 00:07:40.839
וכולנו יודעים שאם יש לכם משוואה אחת,

00:07:40.863 --> 00:07:44.505
אתם יכולים לפתור משתנה אחד
אם יודעים את שני הדברים האחרים.

00:07:45.158 --> 00:07:48.538
אז הבעיה של הסקה,

00:07:48.562 --> 00:07:51.435
שהיא, להבין שהתמונה של הציפור היא ציפור,

00:07:51.459 --> 00:07:52.733
היא זו:

00:07:52.757 --> 00:07:56.216
פה Y הוא המשתנה ו W ו X ידועים.

00:07:56.240 --> 00:07:58.699
אתם יודעים את הרשת העצבית,
אתם יודעים את הפיקסלים.

00:07:58.723 --> 00:08:02.050
כמו שאתם יכולים לראות,
זו למעשה בעיה די פשוטה.

00:08:02.074 --> 00:08:04.260
אתם מכפילים שתיים כפול שלוש וסיימתם.

00:08:04.862 --> 00:08:06.985
אני אראה לכם רשת עצבית מלאכותית

00:08:07.009 --> 00:08:09.305
שבנינו לאחרונה, ועשינו בדיוק את זה.

NOTE Paragraph

00:08:09.634 --> 00:08:12.494
זה רץ בזמן אמת על טלפון נייד,

00:08:12.518 --> 00:08:15.831
וזה, כמובן, מדהים בפני עצמו,

00:08:15.855 --> 00:08:19.323
הטלפונים הניידים יכולים לעשות
כל כך הרבה מליארדים וטריליונים של פעולות

00:08:19.347 --> 00:08:20.595
לשניה.

00:08:20.619 --> 00:08:22.234
מה שאתם רואים זה טלפון

00:08:22.258 --> 00:08:25.805
מביט בתמונות של ציפורים אחת אחרי השניה,

00:08:25.829 --> 00:08:28.544
ולמעשה לא רק אומר, "כן, זו ציפור,"

00:08:28.568 --> 00:08:31.979
אלא מזהה את המין
של הציפור עם רשת מסוג כזה.

00:08:32.890 --> 00:08:34.716
אז בתמונה הזו,

00:08:34.740 --> 00:08:38.542
ה X וה W ידועים, וה Y לא ידוע.

00:08:38.566 --> 00:08:41.074
אני מרפרף על החלקים הממש קשים כמובן,

00:08:41.098 --> 00:08:44.959
שזה איך בעצם אנחנו מגלים את ה W,

00:08:44.983 --> 00:08:47.170
המוח שיכול לעשות כזה דבר?

00:08:47.194 --> 00:08:49.028
איך אי פעם נלמד מודל כזה?

NOTE Paragraph

00:08:49.418 --> 00:08:52.651
אז התהליך הזה של למידה, או פתירת ה W,

00:08:52.675 --> 00:08:55.322
אם היינו עושים את זה עם משוואות פשוטות

00:08:55.346 --> 00:08:57.346
בהן אנחנו חושבים על אלה כמספרים,

00:08:57.370 --> 00:09:00.057
אנחנו יודעים בדיוק
איך לעשות את זה: 6 = 2 *w,

00:09:00.081 --> 00:09:03.393
ובכן, אנחנו מחלקים בשניים וסיימנו.

00:09:04.001 --> 00:09:06.221
הבעיה היא עם הפעולה הזו.

00:09:06.823 --> 00:09:07.974
אז, חלוקה --

00:09:07.998 --> 00:09:11.119
השתמשו בחלוקה בגלל שהיא ההפך מכפל,

00:09:11.143 --> 00:09:12.583
אבל כמו שכרגע אמרתי,

00:09:12.607 --> 00:09:15.056
ההכפלה היא מעט שקר פה.

00:09:15.080 --> 00:09:18.406
זו פעולה מאוד מאוד מורכבת,
מאוד לא לינארית;

00:09:18.430 --> 00:09:20.134
אין לה פעולה הופכית.

00:09:20.158 --> 00:09:23.308
אז אנחנו צריכים למצוא דרך לפתור את המשוואה

00:09:23.332 --> 00:09:25.356
בלי פעולת החילוק.

00:09:25.380 --> 00:09:27.723
והדרך לעשות את זה היא די ישירה.

00:09:27.747 --> 00:09:30.418
אתם פשוט אומרים,
בואו נשחק בטריק אלגבראי פשוט,

00:09:30.442 --> 00:09:33.348
ונעביר את השש לצד ימין של המשוואה.

00:09:33.372 --> 00:09:35.198
עכשיו, אנחנו עדיין משתמשים בכפל.

00:09:35.675 --> 00:09:39.255
והאפס הזה -- בואו נחשוב עליו כשגיאה.

00:09:39.279 --> 00:09:41.794
במילים אחרות, אם פתרנו עבור W נכון,

00:09:41.818 --> 00:09:43.474
אז השגיאה תהיה אפס.

00:09:43.498 --> 00:09:45.436
ואם זה לא יצא לנו ממש נכון,

00:09:45.460 --> 00:09:47.209
השגיאה תהיה גדולה מאפס.

NOTE Paragraph

00:09:47.233 --> 00:09:50.599
אז עכשיו אנחנו יכולים פשוט לנחש
כדי להקטין את השגיאה,

00:09:50.623 --> 00:09:53.310
וזה סוג הדבר שמחשבים ממש טובים בו.

00:09:53.334 --> 00:09:54.927
אז לקחתם ניחוש ראשוני:

00:09:54.951 --> 00:09:56.107
מה אם W=0?

00:09:56.131 --> 00:09:57.371
ובכן, אז השגיאה היא 6.

00:09:57.395 --> 00:09:58.841
מה עם W =1? השגיאה היא 4.

00:09:58.865 --> 00:10:01.232
ואז המחשב יכול לשחק סוג של מרקו פולו,

00:10:01.256 --> 00:10:03.623
ולהוריד את השגיאה קרוב לאפס.

00:10:03.647 --> 00:10:07.021
וכשהוא עושה את זה,
הוא מקבל קרובים עוקבים ל W.

00:10:07.045 --> 00:10:10.701
ובאופן טיפוסי, הוא לעולם לא ממש מגיע לשם,
אבל אחרי בערך שנים עשר צעדים,

00:10:10.725 --> 00:10:15.349
אנחנו מגיעים ל W = 2.999, שזה קרוב מספיק.

00:10:16.302 --> 00:10:18.116
וזה תהליך הלמידה.

NOTE Paragraph

00:10:18.140 --> 00:10:20.870
אז זכרו שמה שמתרחש פה

00:10:20.894 --> 00:10:25.272
זה שלקחנו הרבה X ידועים ו Y ידועים

00:10:25.296 --> 00:10:28.750
ופתרנו עבור W במרכז דרך תהליך לולאתי.

00:10:28.774 --> 00:10:32.330
זו בדיוק אותה דרך שאנחנו עושים
את הלמידה בעצמנו.

00:10:32.354 --> 00:10:34.584
יש לנו הרבה הרבה תמונות כתינוקות

00:10:34.608 --> 00:10:37.241
ואומרים לנו, "זו ציפור; זו לא ציפור."

00:10:37.714 --> 00:10:39.812
ובמשך הזמן, דרך חזרה,

00:10:39.836 --> 00:10:42.764
אנחנו פותרים עבור W,
אנחנו פותרים עבור החיבורים העצביים האלה.

NOTE Paragraph

00:10:43.460 --> 00:10:47.546
אז עכשיו, החזקנו את X ואת W קבועים
כדי לפתור עבור Y;

00:10:47.570 --> 00:10:49.417
זו תפישה מהירה, יום יומית.

00:10:49.441 --> 00:10:51.204
הבנו איך אנחנו יכולים לפתור עבור W,

00:10:51.228 --> 00:10:53.131
זה למידה, שהיא הרבה יותר קשה,

00:10:53.155 --> 00:10:55.140
בגלל שאנחנו צריכים לעשות מזעור שגיאות,

00:10:55.164 --> 00:10:56.851
בשימוש בהרבה דוגמאות אימון.

NOTE Paragraph

00:10:56.875 --> 00:11:00.062
ולפני בערך שנה,
אלכס מורדבינטסב, בצוות שלנו,

00:11:00.086 --> 00:11:03.636
החליט להתנסות עם מה שקורה
אם אנחנו מנסים לפתור עבור X,

00:11:03.660 --> 00:11:05.697
בהתחשב ב W ו Y ידועים.

00:11:06.124 --> 00:11:07.275
במילים אחרות,

00:11:07.299 --> 00:11:08.651
אתם יודעים שזו ציפור,

00:11:08.675 --> 00:11:11.978
וכבר יש לכם את הרשת העצבית
שאימנתם על ציפורים,

00:11:12.002 --> 00:11:14.346
אבל מה היא התמונה של הציפור?

00:11:15.034 --> 00:11:20.058
מסתבר שבשימוש בדיוק
באותו תהליך מזעור שגיאות,

00:11:20.082 --> 00:11:23.512
שאפשר לעשות עם רשת שמאומנת להכיר ציפורים,

00:11:23.536 --> 00:11:26.924
ומסתבר שהתוצאה היא...

00:11:30.400 --> 00:11:31.705
תמונה של ציפורים.

00:11:32.814 --> 00:11:36.551
אז זו תמונה של ציפורים
שמייוצרת לגמרי על ידי רשת עצבית

00:11:36.575 --> 00:11:38.401
שאומנה להכיר ציפורים,

00:11:38.425 --> 00:11:41.963
פשוט על ידי פיתרון ל X במקום לפתור ל Y,

00:11:41.987 --> 00:11:43.275
ולעשות את זה בחזרתיות.

NOTE Paragraph

00:11:43.732 --> 00:11:45.579
הנה דוגמה כיפית נוספת.

00:11:45.603 --> 00:11:49.040
זו היתה עבודה שנעשתה
על ידי מייק טייקה בקבוצה שלנו,

00:11:49.064 --> 00:11:51.372
שנקראה "תהלוכת החיות."

00:11:51.396 --> 00:11:54.272
זה מזכיר לי מעט את האמנות
של ווליאם קמטרידג',

00:11:54.296 --> 00:11:56.785
בה הוא יוצר איורים, מוחק אותם,

00:11:56.809 --> 00:11:58.269
יוצר איורים, מוחק אותם,

00:11:58.293 --> 00:11:59.691
ויוצר סרט בדרך זו.

00:11:59.715 --> 00:12:00.866
במקרה הזה,

00:12:00.890 --> 00:12:04.167
מה שמייק עושה זה לשנות את Y
במרחב של חיות שונות,

00:12:04.191 --> 00:12:06.573
ברשת שמתוכננת להכיר ולהבחין

00:12:06.597 --> 00:12:08.407
בין חיות שונות.

00:12:08.431 --> 00:12:12.182
ואתם מקבלים את הסוג במוזר הזה של שינויים
כמו של אשר, מחיה אחת לאחרת.

NOTE Paragraph

00:12:14.221 --> 00:12:18.835
פה הוא ואלכס יחד ניסו להפחית

00:12:18.859 --> 00:12:21.618
את ה Y לחלל של רק שני מימדים,

00:12:21.642 --> 00:12:25.080
לכן הם יוצרים מפה מהחלל של כל הדברים

00:12:25.104 --> 00:12:26.823
שמוכרים על ידי הרשת הזו.

00:12:26.847 --> 00:12:28.870
לעשות סוג כזה של סינטזה

00:12:28.894 --> 00:12:31.276
או יצירה של תמונות על פני כל המשטח,

00:12:31.300 --> 00:12:34.146
שמשנים את Y על המשטח,
אתם עושים סוג של מפה --

00:12:34.170 --> 00:12:37.311
מפה ויזואלית של כל הדברים
שהרשת יודעת איך להכיר.

00:12:37.335 --> 00:12:40.200
החיות כולן פה; "ארמדילו"
בדיוק בנקודה הזו בנקודה ההיא.

NOTE Paragraph

00:12:40.919 --> 00:12:43.398
אתם יכולים לעשות זאת
גם עם סוגים אחרים של רשתות.

00:12:43.422 --> 00:12:46.296
זו רשת שמתוכננת להכיר פרצופים,

00:12:46.320 --> 00:12:48.320
כדי להבחין בין פרצוף אחד לאחר.

00:12:48.344 --> 00:12:51.593
ופה, אנחנו שמים את ה Y שאומר, "אני,"

00:12:51.617 --> 00:12:53.192
הפרמטרים של הפנים שלי.

00:12:53.216 --> 00:12:54.922
וכשהדבר הזה פותר ל X,

00:12:54.946 --> 00:12:57.564
הוא יוצר תמונה די משוגעת,

00:12:57.588 --> 00:13:02.016
סוג של תמונה קוביסטית, סוראליסטית, 
ופסיכדלית שלי

00:13:02.040 --> 00:13:03.846
ממספר נקודות צפיה יחד.

00:13:03.870 --> 00:13:06.604
הסיבה שזה נראה כמו מספר רב
של נקודות מבט יחד

00:13:06.628 --> 00:13:10.315
זה בגלל שהרשת הזו מעוצבת להפתר מדו-משמעות

00:13:10.339 --> 00:13:12.815
של פנים שבפוזה אחת או אחרת,

00:13:12.839 --> 00:13:16.215
כשמסתכלים עליהם עם סוג אחד של תאורה,
או סוג אחר של תאורה.

00:13:16.239 --> 00:13:18.324
אז כשאתם עושים סוג זה של בנייה מחדש,

00:13:18.348 --> 00:13:20.652
אם אתם לא משתמשים
בסוג מסווים של תמונת הנחייה

00:13:20.676 --> 00:13:21.887
או סטטיסטיקה מנחה,

00:13:21.911 --> 00:13:25.676
אז אתם תקבלו סוג של בלבול
מנקודות מבט שונות,

00:13:25.700 --> 00:13:27.068
בגלל שזה דו משמעי.

00:13:27.786 --> 00:13:32.009
זה מה שקורה אם אלכס
משתמש בפנים של עצמו כתמונה מנחה

00:13:32.033 --> 00:13:35.354
במהלך תהליך האופטימיזציה
כדי לבנות מחדש את הפנים שלי.

00:13:36.284 --> 00:13:38.612
אז אתם יכולים לראות שזה לא מושלם.

00:13:38.636 --> 00:13:40.510
יש עדיין די הרבה עבודה לעשות

00:13:40.534 --> 00:13:42.987
על איך אנחנו עושים מיטוב של תהליך המיטוב.

00:13:43.011 --> 00:13:45.838
אבל אתם מתחילים לקבל משהו
יותר כמו פנים ברורות,

00:13:45.862 --> 00:13:47.876
שמצויירות בשימוש בפנים שלי כהנחיה.

NOTE Paragraph

00:13:48.892 --> 00:13:51.393
אתם לא צריכים להתחיל עם קאנבס ריק

00:13:51.417 --> 00:13:52.573
או עם צליל לבן.

00:13:52.597 --> 00:13:53.901
כשאתם פותרים עבור X,

00:13:53.925 --> 00:13:57.814
אתם יכולים להתחיל עם X,
שהוא בעצמו כבר תמונה אחרת.

00:13:57.838 --> 00:14:00.394
זו מה שההדגמה הקטנה הזו.

00:14:00.418 --> 00:14:04.540
זו רשת שמתוכננת לקטלג

00:14:04.564 --> 00:14:07.683
כל מיני אובייקטים שונים --
מבנים מעשה ידי אדם, חיות...

00:14:07.707 --> 00:14:10.300
פה אנחנו מתחילים עם רק תמונה של עננים,

00:14:10.324 --> 00:14:11.995
וכשאנחנו ממטבים,

00:14:12.019 --> 00:14:16.505
בעיקרון, הרשת הזו מבינה
מה היא רואה בעננים.

00:14:16.931 --> 00:14:19.251
וככל שאתם מבלים יותר זמן בלהביט בהם,

00:14:19.275 --> 00:14:22.028
אתם גם תראו הרבה יותר דברים בעננים.

00:14:23.004 --> 00:14:26.379
אתם תוכלו גם להשתמש
ברשת הפנים כדי להזות לתוך זה,

00:14:26.403 --> 00:14:28.215
ואתם מקבלים דברים די מטורפים.

NOTE Paragraph

00:14:28.239 --> 00:14:29.389
(צחוק)

NOTE Paragraph

00:14:30.401 --> 00:14:33.145
או, מייק עשה כמה ניסויים אחרים

00:14:33.169 --> 00:14:37.074
בהם הוא לוקח את תמונת העננים ההיא,

00:14:37.098 --> 00:14:40.605
הוזה, עושה זום, הוזה, זום, הוזה, זום.

00:14:40.629 --> 00:14:41.780
ובדרך זו,

00:14:41.804 --> 00:14:45.479
אתם יכולים לקבל סוג של מצב
של פוגה של הרשת, אני מניח,

00:14:45.503 --> 00:14:49.183
או סוג של אסוציאציה חופשית,

00:14:49.207 --> 00:14:51.434
בה הרשת אוכלת את הזנב של עצמה.

00:14:51.458 --> 00:14:54.879
אז כל תמונה היא עכשיו הבסיס,

00:14:54.903 --> 00:14:56.404
ל"מה אני חושב שאני רואה עכשיו?

00:14:56.404 --> 00:14:59.151
מה אני חושב שאני רואה עכשיו?
מה אני חושב שאני רואה עכשיו?"

NOTE Paragraph

00:14:59.487 --> 00:15:02.423
הראתי את זה בפעם הראשונה בציבור

00:15:02.447 --> 00:15:07.884
לקבוצה בהרצאה בסיאטל
שנקראה "חינוך גבוה יותר" --

00:15:07.908 --> 00:15:10.345
זה היה מייד אחרי שמריחואנה הפכה לחוקית.

NOTE Paragraph

00:15:10.369 --> 00:15:12.784
(צחוק)

NOTE Paragraph

00:15:14.627 --> 00:15:16.731
אז הייתי רוצה לסיים במהירות

00:15:16.755 --> 00:15:21.010
פשוט בלהעיר שהטכנולוגיה הזו לא מוגבלת.

00:15:21.034 --> 00:15:24.699
הראתי לכם דוגמאות ויזאוליות לגמרי
בגלל שבאמת כיף להביט בהן.

00:15:24.723 --> 00:15:27.174
זו לא טכנולוגיה ויזואלית לגמרי.

00:15:27.198 --> 00:15:29.191
האמן ששיתף איתנו פעולה, רוס גודווין,

00:15:29.215 --> 00:15:32.886
עשה ניסויים שכללו מצלמה שמצלמת תמונות,

00:15:32.910 --> 00:15:37.144
ואז המחשב בתיק שלו כותב פואמה
בשימוש ברשתות עצביות,

00:15:37.168 --> 00:15:39.112
בהתבסס על התוכן של התמונה.

00:15:39.136 --> 00:15:42.083
והרשת העצבית הזו של השירה אומנה

00:15:42.107 --> 00:15:44.341
על קורפוס גדול של השירה של המאה ה20.

00:15:44.365 --> 00:15:45.864
והשירה היא, אתם יודעים,

00:15:45.888 --> 00:15:47.802
אני חושב, סוג של לא רעה, למעשה.

NOTE Paragraph

00:15:47.826 --> 00:15:49.210
(צחוק)

NOTE Paragraph

00:15:49.234 --> 00:15:50.393
לסיכום.

00:15:50.417 --> 00:15:52.549
אני חושב שעבור מיכאלאנג'לו,

00:15:52.573 --> 00:15:53.807
אני חושב שהוא צדק;

00:15:53.831 --> 00:15:57.267
תפישה ויצירתיות מחוברות מאוד אינטימית.

00:15:57.611 --> 00:16:00.245
מה שכרגע ראינו הן רשתות עצביות

00:16:00.269 --> 00:16:02.572
שלגמרי מאומנות להפלות,

00:16:02.596 --> 00:16:04.838
או להכיר דברים שונים בעולם,

00:16:04.862 --> 00:16:08.023
מסוגלת להיות מורצת אחורנית, כדי לייצר.

00:16:08.047 --> 00:16:09.830
אחד הדברים שמראים לי

00:16:09.854 --> 00:16:12.252
הם לא רק שמיכאלאנג'לו באמת ראה

00:16:12.276 --> 00:16:14.728
את הפסל בתוך בלוק האבן,

00:16:14.752 --> 00:16:18.390
אלא שכל יצור, כל ישות, כל חייזר

00:16:18.414 --> 00:16:22.071
שמסוגל לעשות פעולות תפישתיות מסוג כלשהו

00:16:22.095 --> 00:16:23.470
גם מסוגל ליצור

00:16:23.494 --> 00:16:26.718
בגלל שזה בדיוק אותו מנגנון
שבשימוש בשני המקרים.

NOTE Paragraph

00:16:26.742 --> 00:16:31.274
כמו כן ,אני חושב שתפישה ויצירתיות
הן בשום צורה

00:16:31.298 --> 00:16:32.508
לא רק אנושיות.

00:16:32.532 --> 00:16:36.240
מתחילים להיות לנו מודלים ממוחשבים
שיכולים לעשות בדיוק דברים מהסוג הזה.

00:16:36.264 --> 00:16:39.592
וזה לא צריך להפתיע; המוח הוא חישובי.

NOTE Paragraph

00:16:39.616 --> 00:16:41.273
ולבסוף,

00:16:41.297 --> 00:16:45.965
מחשוב החל כתרגיל בעיצוב מכונות חכמות.

00:16:45.989 --> 00:16:48.451
הוא מודל אחר הרעיון

00:16:48.475 --> 00:16:51.488
של איך אנחנו יכולים ליצור מכונות חכמות.

00:16:51.512 --> 00:16:53.674
ואנחנו לבסוף מתחילים להגשים עכשיו

00:16:53.698 --> 00:16:56.104
כמה מההבטחות של החלוצים הראשונים האלה,

00:16:56.128 --> 00:16:57.841
של טיורינג וואן ניומן

00:16:57.865 --> 00:17:00.130
ומקקולוך ופיטס.

00:17:00.154 --> 00:17:04.252
ואני חושב שמחשוב לא נוגע רק לחשבונאות

00:17:04.276 --> 00:17:06.423
או לשחק קנדי קראש או משהו.

00:17:06.447 --> 00:17:09.025
מההתחלה, מידלנו אותם לפי המוח שלנו.

00:17:09.049 --> 00:17:12.318
והם נותנים לנו גם את היכולת
להבין את המוחות שלנו טוב יותר

00:17:12.342 --> 00:17:13.871
ולהרחיב אותם.

NOTE Paragraph

00:17:14.627 --> 00:17:15.794
תודה רבה לכם.

NOTE Paragraph

00:17:15.818 --> 00:17:21.757
(מחיאות כפיים)