WEBVTT 00:00:00.800 --> 00:00:03.924 אז, אני מוביל צוות בגוגל שעובד על למידה חישובית; 00:00:03.948 --> 00:00:08.598 כלומר, תחום ההנדסה שגורם למחשבים ומכשירים 00:00:08.622 --> 00:00:11.041 לעשות כמה מהדברים שמוחותינו עושים. 00:00:11.439 --> 00:00:14.538 וזה גורם לנו להתעניין במוחות אמיתיים 00:00:14.562 --> 00:00:15.851 וגם במדעי המוח, 00:00:15.875 --> 00:00:20.047 ובמיוחד בדברים שבביצועם מוחותינו 00:00:20.071 --> 00:00:24.113 עדיין עולים בהרבה על מחשבים. NOTE Paragraph 00:00:25.209 --> 00:00:28.818 מבחינה היסטורית, אחד התחומים האלה הוא תפיסה, 00:00:28.842 --> 00:00:31.881 ההליך שדרכו כל הדברים שיש בעולם החיצוני -- 00:00:31.905 --> 00:00:33.489 צלילים ותמונות -- 00:00:33.513 --> 00:00:35.691 נעשים למושגים בשכל. 00:00:36.235 --> 00:00:38.752 זה חיוני למוחות שלנו, 00:00:38.776 --> 00:00:41.240 וגם די שימושי במחשב. 00:00:41.636 --> 00:00:44.986 האלגוריתמים לתפיסה חישובית, לדוגמא, שהצוות שלנו מוציא, 00:00:45.010 --> 00:00:48.884 הם מה שמאפשר לתמונותיכם בגוגל פוטוז להיות ניתנות-חיפוש, 00:00:48.908 --> 00:00:50.305 על פי תוכנן. 00:00:51.594 --> 00:00:55.087 הפן השני של תפיסה הוא יצירתיות: 00:00:55.111 --> 00:00:58.149 הפיכת מושג לעצם בעולם. 00:00:58.173 --> 00:01:01.728 וכך במשך השנה האחרונה, עבודתנו על תפיסה חישובית 00:01:01.752 --> 00:01:06.611 התחברה באופן לא צפוי לעולם היצירתיות החישובית, 00:01:06.635 --> 00:01:07.795 ולאמנות ממוחשבת. NOTE Paragraph 00:01:08.556 --> 00:01:11.840 אני חושב שלמיכלאלג'לו הייתה תובנה חודרת 00:01:11.864 --> 00:01:15.520 לגבי היחס הדואלי הזה שבין תפיסה ליצירתיות. 00:01:16.023 --> 00:01:18.029 זאת ציטטה מפורסמת שלו: 00:01:18.053 --> 00:01:21.376 "לכל אבן יש פסל בתוכה, 00:01:22.036 --> 00:01:25.038 ועבודת הפסל לגלות אותו." 00:01:26.029 --> 00:01:29.245 אז, אני חושב שמיכלאנג'לו התכוון לזה 00:01:29.269 --> 00:01:32.449 שאנחנו יוצרים באמצעות תפיסה, 00:01:32.473 --> 00:01:35.496 ושתפיסה עצמה היא מעשה של דמיון 00:01:35.520 --> 00:01:37.981 והיא חומר היצירתיות. NOTE Paragraph 00:01:38.691 --> 00:01:42.616 האיבר שמבצע את כל המחשבה והתפיסה והדמיון, 00:01:42.640 --> 00:01:44.228 הוא כמובן המוח. 00:01:45.089 --> 00:01:47.634 ואני רוצה לפתוח בקטע קצר של היסטוריה 00:01:47.658 --> 00:01:49.960 על מה שאנחנו יודעים על המוח. 00:01:50.496 --> 00:01:52.942 כי לא כמו, כגון, הלב או המעיים, 00:01:52.966 --> 00:01:56.110 אי אפשר לומר הרבה על המוח פשוט מלהסתכל עליו, 00:01:56.134 --> 00:01:57.546 לפחות, בעין בלתי מזויינת. 00:01:57.983 --> 00:02:00.399 האנטומיסטים המוקדמים שהסתכלו על מוחות 00:02:00.423 --> 00:02:04.230 קראו למבנים השטחיים של הדבר הזה בכל מיני שמות דמיוניים, 00:02:04.254 --> 00:02:06.687 כגון היפוקמפוס, שמשמעו "חסילון קטן." 00:02:06.711 --> 00:02:09.475 אך בבירור דבר מסוג זה לא מספר לנו הרבה 00:02:09.499 --> 00:02:11.817 על מה שבאמת קורה בפנים. NOTE Paragraph 00:02:12.780 --> 00:02:16.393 האדם הראשון, לדעתי, שבפועל פיתח איזה מין של הבנה 00:02:16.417 --> 00:02:18.347 של מה שבאמת קורה בתוך המוח 00:02:18.371 --> 00:02:22.291 היה הניורואנטומיסט הספרדי הגדול, סנטיאגו רמון אי קחאל, 00:02:22.315 --> 00:02:23.859 במאה התשע-עשרה, 00:02:23.883 --> 00:02:27.638 שהשתמש במיקרוסקופ וצבעים מיוחדים 00:02:27.662 --> 00:02:31.832 שיכלו לדמות בבררנות ובניגוד גבוה 00:02:31.856 --> 00:02:33.864 תאים יחידים במוח, 00:02:33.888 --> 00:02:37.042 כדי להתחיל להבין את המורפולוגיה שלהם. 00:02:37.972 --> 00:02:40.863 ואלה סוגי הציורים שהוא צייר של תאי עצב 00:02:40.887 --> 00:02:42.096 במאה התשע-עשרה. NOTE Paragraph 00:02:42.120 --> 00:02:44.004 זה מתוך מוח של ציפור. 00:02:44.028 --> 00:02:47.085 ותראו את המגוון המדהים הזה של תאים מסוגים שונים, 00:02:47.109 --> 00:02:50.544 אפילו תיאוריית התא עצמה הייתה חדשה למדי בעת הזו 00:02:50.568 --> 00:02:51.846 והמבנים האלה, 00:02:51.870 --> 00:02:54.129 התאים האלה שיש להם הסתעפויות כאלה 00:02:54.153 --> 00:02:56.761 וענפים כאלה שמסוגלים להאריך מרחקים רבים -- 00:02:56.785 --> 00:02:58.401 זה היה מאד חדשני ומקורי בתקופה זו. 00:02:58.779 --> 00:03:01.682 הם מזכירים חוטים כמובן. 00:03:01.706 --> 00:03:05.163 אפשר שכבר תפסו כך כמה אנשים במאה התשע-עשרה; 00:03:05.187 --> 00:03:09.501 מהפכות החיווט והחישמול בדיוק החלו. 00:03:09.964 --> 00:03:11.142 אבל מבחינות רבות, 00:03:11.166 --> 00:03:14.479 הציורים המיקרו-אנטומיים האלה של רמון אי קחאל, כגון זה, 00:03:14.503 --> 00:03:16.835 מבחינת-מה עוד לא הושגו. NOTE Paragraph 00:03:16.859 --> 00:03:18.713 ואנחנו מאה שנים אחרי כן, 00:03:18.737 --> 00:03:21.562 מנסים לגמור את העבודה בו רמון אי קחאל החל. 00:03:21.586 --> 00:03:24.720 אלה הם נתונים לא-מעובדים ממשתפי הפעולה שלנו 00:03:24.744 --> 00:03:27.625 במכון מקס פלאנק למדעי מוח. 00:03:27.649 --> 00:03:29.439 ומה שמשתפי הפעולה שלנו עשו 00:03:29.463 --> 00:03:34.464 זה לדמת חלקיקים קטנים של רקמה מוחית. 00:03:34.488 --> 00:03:37.814 כל הדגימה הינה קרובה בגודלה למילימטר מעוקב אחד, 00:03:37.838 --> 00:03:40.459 ואני מראה לכם חלק מאד קטן ממנה פה. 00:03:40.483 --> 00:03:42.829 הפס הזה שלצד שמאל בגודל מיקרון אחד בערך. 00:03:42.853 --> 00:03:45.262 המבנים שאתם רואים הם מיטוכונדריה 00:03:45.286 --> 00:03:47.330 ששווים בגודלם לחיידק. 00:03:47.354 --> 00:03:48.905 ואלה פרוסות עוקבות 00:03:48.929 --> 00:03:52.077 בתוך הגוש הקטנטן מאד הזה של רקמה. 00:03:52.101 --> 00:03:54.504 רק לשם השוואה, 00:03:54.528 --> 00:03:58.320 קוטר קווצה ממוצעת של שיער היא כמאה מיקרון. 00:03:58.344 --> 00:04:00.618 וכך אנחנו מתבוננים במשהו הרבה יותר זעיר 00:04:00.642 --> 00:04:02.040 משערה אחת. NOTE Paragraph 00:04:02.064 --> 00:04:06.095 ועל פי כל הסוגים האלה של פרוסות סדרתיות מוגדלות מיקרוסקופ-אלקטרוני, 00:04:06.119 --> 00:04:11.127 אפשר להתחיל בשיחזורים תלת-ממדיים של תאי עצב, הנראים ככה. 00:04:11.151 --> 00:04:14.308 ובכן, אלה נוהגים על פי אותו סגנון בקירוב של רמון אי קחאל. 00:04:14.332 --> 00:04:15.824 רק תאי עצב אחדים נדלקו, 00:04:15.848 --> 00:04:18.629 אחרת לא היינו יכולים לראות פה שום דבר. 00:04:18.653 --> 00:04:19.965 יהיה כל כך צפוף, 00:04:19.989 --> 00:04:21.319 כל כך מלא מבנים, 00:04:21.343 --> 00:04:24.067 מלא חיווט המקשר תאי עצב אחד לשני. NOTE Paragraph 00:04:25.293 --> 00:04:28.097 אז רמון אי קחאל במידה הקדים את זמנו, 00:04:28.121 --> 00:04:30.676 והתקדמות בהבנת המוח 00:04:30.700 --> 00:04:32.971 התקדמה לאט לאט במשך העשורים הבאים. 00:04:33.455 --> 00:04:36.308 אבל ידענו שתאי עצב עשו שימוש בחשמל, 00:04:36.332 --> 00:04:39.268 ועד מלחמת העולם השנייה, הטכנולוגיה שלנו התקדמה דיה 00:04:39.292 --> 00:04:42.098 כדי להתחיל ניסויים חשמליים אמיתיים בתאי עצב חיים 00:04:42.122 --> 00:04:44.228 בשביל להבין טוב יותר כיצד הם עבדו. 00:04:44.631 --> 00:04:48.987 זה אותו הזמן שמחשבים הומצאו לראשונה, 00:04:49.011 --> 00:04:52.111 ממש בהתבסס על הרעיון של בניית דגם המוח -- 00:04:52.135 --> 00:04:55.220 של "מנגנון נבון," כמו שאלן טיורינג כינה אותו, 00:04:55.244 --> 00:04:57.235 אחד מאבות מדעי המחשב. NOTE Paragraph 00:04:57.923 --> 00:05:02.555 ווארן מקולוק ווואלטר פיטס הביטו בציורו של רמון אי קחאל 00:05:02.579 --> 00:05:03.896 של קליפת הראייה, 00:05:03.920 --> 00:05:05.482 שאותו אני מראה פה. 00:05:05.506 --> 00:05:09.948 זאת הקליפה שמעבדת דימויים המגיעים מהעין. 00:05:10.424 --> 00:05:13.932 ומבחינתם, זה נראה כמו דיאגרמת מעגל חשמלי. 00:05:14.353 --> 00:05:18.188 לכן יש הרבה פרטים בדיאגרמת המעגל של מקולוק ופיטס 00:05:18.212 --> 00:05:19.564 שאינם לגמרי נכונים. 00:05:19.588 --> 00:05:20.823 אבל הרעיון המרכזי הזה 00:05:20.847 --> 00:05:24.839 שקליפת הראייה עובדת כסדרה של רכיבים חישוביים 00:05:24.863 --> 00:05:27.609 המעבירים מידע אחד לרעהו במפל, 00:05:27.633 --> 00:05:29.235 בעיקרו של דבר נכון. NOTE Paragraph 00:05:29.259 --> 00:05:31.609 בואו נדבר רגע 00:05:31.633 --> 00:05:35.665 על מה שדגם לעיבוד מידע חזותי צריך לעשות. 00:05:36.228 --> 00:05:38.969 המשימה היסודית של תפיסה 00:05:38.993 --> 00:05:43.187 היא החזקת תמונה כזו שמשמאל ולאמר כי 00:05:43.211 --> 00:05:44.387 "זאת ציפור," 00:05:44.411 --> 00:05:47.285 היא דבר מאד פשוט לעשות בעזרת מוחותינו. 00:05:47.309 --> 00:05:50.730 אבל צריכים להבין שעבור מחשבים, 00:05:50.754 --> 00:05:53.841 זה היה כמעט בלתי אפשרי רק לפני כמה שנים. 00:05:53.865 --> 00:05:55.781 במסגרת הפרדיגמה החישובית הקלאסית 00:05:55.805 --> 00:05:58.312 אין זאת משימה קלת-ביצוע. NOTE Paragraph 00:05:59.366 --> 00:06:01.918 אז מה שקורה בין הפיקסלים, 00:06:01.942 --> 00:06:05.970 בין דמות הציפור לבין המילה "ציפור," 00:06:05.994 --> 00:06:08.808 ביסוד הוא התקשרות בין מערכת תאי עצב מקושרים 00:06:08.832 --> 00:06:09.987 זה לזה ברשת עצבית, 00:06:10.011 --> 00:06:11.234 כפי שאני משרטט פה. 00:06:11.258 --> 00:06:14.530 הרשת העצבית יכולה להיות ביולוגית, בתוך קליפתנו הראייתית, 00:06:14.554 --> 00:06:16.716 או, כיום, מתחילה להיות לנו היכולת 00:06:16.740 --> 00:06:19.194 לבנות דגמים של רשתות אלה במחשב. 00:06:19.834 --> 00:06:22.187 ואראה לכם איך זה נראה באמת. NOTE Paragraph 00:06:22.211 --> 00:06:25.627 אז אתם יכולים לחשוב על הפיקסלים כשכבה הראשונה של ניורונים, 00:06:25.651 --> 00:06:27.890 וזה, למעשה, איך שזה עובד בעין -- 00:06:27.914 --> 00:06:29.577 אלה הניורונים ברשתית. 00:06:29.601 --> 00:06:31.101 ואלה מזינים הלאה 00:06:31.125 --> 00:06:34.528 לתוך שכבה אחת אחרי אחרת אחרי הבאה של ניורונים, 00:06:34.552 --> 00:06:37.585 כולם מחוברים על ידי סינפסות במשקלים שונים. 00:06:37.609 --> 00:06:38.944 ההתנהגות של הרשת הזו 00:06:38.968 --> 00:06:42.252 מאופיינת על ידי הכוחות של כל הסינפסות האלה. 00:06:42.276 --> 00:06:45.564 אלה מאפיינים את התכונות המחשוביות של הרשת הזו. 00:06:45.588 --> 00:06:47.058 ובסופו של יום, 00:06:47.082 --> 00:06:49.529 יש לכם ניורון או קבוצה קטנה של ניורונים 00:06:49.553 --> 00:06:51.200 שנדלקים, ואומרים, "ציפור." NOTE Paragraph 00:06:51.824 --> 00:06:54.956 עכשיו אני עומד לייצג את שלושת הדברים האלה -- 00:06:54.980 --> 00:06:59.676 פיקסל הקלט והסינפסות ברשתות העצביות, 00:06:59.700 --> 00:07:01.285 וציפור, הפלט -- 00:07:01.309 --> 00:07:04.366 על ידי שלושה משתנים: X, W ו Y. 00:07:04.853 --> 00:07:06.664 יש אולי מליון Xים בערך -- 00:07:06.688 --> 00:07:08.641 מליון פיקסלים בתמונה הזו. 00:07:08.665 --> 00:07:11.111 יש מיליארדים או טריליונים של W, 00:07:11.135 --> 00:07:14.556 שמייצגים את המשקל של כל הסינפסות האלו ברשתות העצביות. 00:07:14.580 --> 00:07:16.455 ויש מספר מאוד קטן של Y, 00:07:16.479 --> 00:07:18.337 של פלטים שיש לרשת הזו. 00:07:18.361 --> 00:07:20.110 "ציפור " היא רק חמש אותיות, נכון? 00:07:21.088 --> 00:07:24.514 אז בואו נעמיד פנים שזו רק נוסחה פשוטה, 00:07:24.538 --> 00:07:26.701 x "x" w = y. 00:07:26.725 --> 00:07:28.761 אני שם את הכפול בגרשיים 00:07:28.785 --> 00:07:31.065 בגלל שמה שבאמת מתרחש פה, כמובן, 00:07:31.089 --> 00:07:34.135 זה סדרה מאוד מורכבת של פעולות מתמטיות. NOTE Paragraph 00:07:35.172 --> 00:07:36.393 זו משוואה אחת. 00:07:36.417 --> 00:07:38.089 יש שלושה משתנים. 00:07:38.113 --> 00:07:40.839 וכולנו יודעים שאם יש לכם משוואה אחת, 00:07:40.863 --> 00:07:44.505 אתם יכולים לפתור משתנה אחד אם יודעים את שני הדברים האחרים. 00:07:45.158 --> 00:07:48.538 אז הבעיה של הסקה, 00:07:48.562 --> 00:07:51.435 שהיא, להבין שהתמונה של הציפור היא ציפור, 00:07:51.459 --> 00:07:52.733 היא זו: 00:07:52.757 --> 00:07:56.216 פה Y הוא המשתנה ו W ו X ידועים. 00:07:56.240 --> 00:07:58.699 אתם יודעים את הרשת העצבית, אתם יודעים את הפיקסלים. 00:07:58.723 --> 00:08:02.050 כמו שאתם יכולים לראות, זו למעשה בעיה די פשוטה. 00:08:02.074 --> 00:08:04.260 אתם מכפילים שתיים כפול שלוש וסיימתם. 00:08:04.862 --> 00:08:06.985 אני אראה לכם רשת עצבית מלאכותית 00:08:07.009 --> 00:08:09.305 שבנינו לאחרונה, ועשינו בדיוק את זה. NOTE Paragraph 00:08:09.634 --> 00:08:12.494 זה רץ בזמן אמת על טלפון נייד, 00:08:12.518 --> 00:08:15.831 וזה, כמובן, מדהים בפני עצמו, 00:08:15.855 --> 00:08:19.323 הטלפונים הניידים יכולים לעשות כל כך הרבה מליארדים וטריליונים של פעולות 00:08:19.347 --> 00:08:20.595 לשניה. 00:08:20.619 --> 00:08:22.234 מה שאתם רואים זה טלפון 00:08:22.258 --> 00:08:25.805 מביט בתמונות של ציפורים אחת אחרי השניה, 00:08:25.829 --> 00:08:28.544 ולמעשה לא רק אומר, "כן, זו ציפור," 00:08:28.568 --> 00:08:31.979 אלא מזהה את המין של הציפור עם רשת מסוג כזה. 00:08:32.890 --> 00:08:34.716 אז בתמונה הזו, 00:08:34.740 --> 00:08:38.542 ה X וה W ידועים, וה Y לא ידוע. 00:08:38.566 --> 00:08:41.074 אני מרפרף על החלקים הממש קשים כמובן, 00:08:41.098 --> 00:08:44.959 שזה איך בעצם אנחנו מגלים את ה W, 00:08:44.983 --> 00:08:47.170 המוח שיכול לעשות כזה דבר? 00:08:47.194 --> 00:08:49.028 איך אי פעם נלמד מודל כזה? NOTE Paragraph 00:08:49.418 --> 00:08:52.651 אז התהליך הזה של למידה, או פתירת ה W, 00:08:52.675 --> 00:08:55.322 אם היינו עושים את זה עם משוואות פשוטות 00:08:55.346 --> 00:08:57.346 בהן אנחנו חושבים על אלה כמספרים, 00:08:57.370 --> 00:09:00.057 אנחנו יודעים בדיוק איך לעשות את זה: 6 = 2 *w, 00:09:00.081 --> 00:09:03.393 ובכן, אנחנו מחלקים בשניים וסיימנו. 00:09:04.001 --> 00:09:06.221 הבעיה היא עם הפעולה הזו. 00:09:06.823 --> 00:09:07.974 אז, חלוקה -- 00:09:07.998 --> 00:09:11.119 השתמשו בחלוקה בגלל שהיא ההפך מכפל, 00:09:11.143 --> 00:09:12.583 אבל כמו שכרגע אמרתי, 00:09:12.607 --> 00:09:15.056 ההכפלה היא מעט שקר פה. 00:09:15.080 --> 00:09:18.406 זו פעולה מאוד מאוד מורכבת, מאוד לא לינארית; 00:09:18.430 --> 00:09:20.134 אין לה פעולה הופכית. 00:09:20.158 --> 00:09:23.308 אז אנחנו צריכים למצוא דרך לפתור את המשוואה 00:09:23.332 --> 00:09:25.356 בלי פעולת החילוק. 00:09:25.380 --> 00:09:27.723 והדרך לעשות את זה היא די ישירה. 00:09:27.747 --> 00:09:30.418 אתם פשוט אומרים, בואו נשחק בטריק אלגבראי פשוט, 00:09:30.442 --> 00:09:33.348 ונעביר את השש לצד ימין של המשוואה. 00:09:33.372 --> 00:09:35.198 עכשיו, אנחנו עדיין משתמשים בכפל. 00:09:35.675 --> 00:09:39.255 והאפס הזה -- בואו נחשוב עליו כשגיאה. 00:09:39.279 --> 00:09:41.794 במילים אחרות, אם פתרנו עבור W נכון, 00:09:41.818 --> 00:09:43.474 אז השגיאה תהיה אפס. 00:09:43.498 --> 00:09:45.436 ואם זה לא יצא לנו ממש נכון, 00:09:45.460 --> 00:09:47.209 השגיאה תהיה גדולה מאפס. NOTE Paragraph 00:09:47.233 --> 00:09:50.599 אז עכשיו אנחנו יכולים פשוט לנחש כדי להקטין את השגיאה, 00:09:50.623 --> 00:09:53.310 וזה סוג הדבר שמחשבים ממש טובים בו. 00:09:53.334 --> 00:09:54.927 אז לקחתם ניחוש ראשוני: 00:09:54.951 --> 00:09:56.107 מה אם W=0? 00:09:56.131 --> 00:09:57.371 ובכן, אז השגיאה היא 6. 00:09:57.395 --> 00:09:58.841 מה עם W =1? השגיאה היא 4. 00:09:58.865 --> 00:10:01.232 ואז המחשב יכול לשחק סוג של מרקו פולו, 00:10:01.256 --> 00:10:03.623 ולהוריד את השגיאה קרוב לאפס. 00:10:03.647 --> 00:10:07.021 וכשהוא עושה את זה, הוא מקבל קרובים עוקבים ל W. 00:10:07.045 --> 00:10:10.701 ובאופן טיפוסי, הוא לעולם לא ממש מגיע לשם, אבל אחרי בערך שנים עשר צעדים, 00:10:10.725 --> 00:10:15.349 אנחנו מגיעים ל W = 2.999, שזה קרוב מספיק. 00:10:16.302 --> 00:10:18.116 וזה תהליך הלמידה. NOTE Paragraph 00:10:18.140 --> 00:10:20.870 אז זכרו שמה שמתרחש פה 00:10:20.894 --> 00:10:25.272 זה שלקחנו הרבה X ידועים ו Y ידועים 00:10:25.296 --> 00:10:28.750 ופתרנו עבור W במרכז דרך תהליך לולאתי. 00:10:28.774 --> 00:10:32.330 זו בדיוק אותה דרך שאנחנו עושים את הלמידה בעצמנו. 00:10:32.354 --> 00:10:34.584 יש לנו הרבה הרבה תמונות כתינוקות 00:10:34.608 --> 00:10:37.241 ואומרים לנו, "זו ציפור; זו לא ציפור." 00:10:37.714 --> 00:10:39.812 ובמשך הזמן, דרך חזרה, 00:10:39.836 --> 00:10:42.764 אנחנו פותרים עבור W, אנחנו פותרים עבור החיבורים העצביים האלה. NOTE Paragraph 00:10:43.460 --> 00:10:47.546 אז עכשיו, החזקנו את X ואת W קבועים כדי לפתור עבור Y; 00:10:47.570 --> 00:10:49.417 זו תפישה מהירה, יום יומית. 00:10:49.441 --> 00:10:51.204 הבנו איך אנחנו יכולים לפתור עבור W, 00:10:51.228 --> 00:10:53.131 זה למידה, שהיא הרבה יותר קשה, 00:10:53.155 --> 00:10:55.140 בגלל שאנחנו צריכים לעשות מזעור שגיאות, 00:10:55.164 --> 00:10:56.851 בשימוש בהרבה דוגמאות אימון. NOTE Paragraph 00:10:56.875 --> 00:11:00.062 ולפני בערך שנה, אלכס מורדבינטסב, בצוות שלנו, 00:11:00.086 --> 00:11:03.636 החליט להתנסות עם מה שקורה אם אנחנו מנסים לפתור עבור X, 00:11:03.660 --> 00:11:05.697 בהתחשב ב W ו Y ידועים. 00:11:06.124 --> 00:11:07.275 במילים אחרות, 00:11:07.299 --> 00:11:08.651 אתם יודעים שזו ציפור, 00:11:08.675 --> 00:11:11.978 וכבר יש לכם את הרשת העצבית שאימנתם על ציפורים, 00:11:12.002 --> 00:11:14.346 אבל מה היא התמונה של הציפור? 00:11:15.034 --> 00:11:20.058 מסתבר שבשימוש בדיוק באותו תהליך מזעור שגיאות, 00:11:20.082 --> 00:11:23.512 שאפשר לעשות עם רשת שמאומנת להכיר ציפורים, 00:11:23.536 --> 00:11:26.924 ומסתבר שהתוצאה היא... 00:11:30.400 --> 00:11:31.705 תמונה של ציפורים. 00:11:32.814 --> 00:11:36.551 אז זו תמונה של ציפורים שמייוצרת לגמרי על ידי רשת עצבית 00:11:36.575 --> 00:11:38.401 שאומנה להכיר ציפורים, 00:11:38.425 --> 00:11:41.963 פשוט על ידי פיתרון ל X במקום לפתור ל Y, 00:11:41.987 --> 00:11:43.275 ולעשות את זה בחזרתיות. NOTE Paragraph 00:11:43.732 --> 00:11:45.579 הנה דוגמה כיפית נוספת. 00:11:45.603 --> 00:11:49.040 זו היתה עבודה שנעשתה על ידי מייק טייקה בקבוצה שלנו, 00:11:49.064 --> 00:11:51.372 שנקראה "תהלוכת החיות." 00:11:51.396 --> 00:11:54.272 זה מזכיר לי מעט את האמנות של ווליאם קמטרידג', 00:11:54.296 --> 00:11:56.785 בה הוא יוצר איורים, מוחק אותם, 00:11:56.809 --> 00:11:58.269 יוצר איורים, מוחק אותם, 00:11:58.293 --> 00:11:59.691 ויוצר סרט בדרך זו. 00:11:59.715 --> 00:12:00.866 במקרה הזה, 00:12:00.890 --> 00:12:04.167 מה שמייק עושה זה לשנות את Y במרחב של חיות שונות, 00:12:04.191 --> 00:12:06.573 ברשת שמתוכננת להכיר ולהבחין 00:12:06.597 --> 00:12:08.407 בין חיות שונות. 00:12:08.431 --> 00:12:12.182 ואתם מקבלים את הסוג במוזר הזה של שינויים כמו של אשר, מחיה אחת לאחרת. NOTE Paragraph 00:12:14.221 --> 00:12:18.835 פה הוא ואלכס יחד ניסו להפחית 00:12:18.859 --> 00:12:21.618 את ה Y לחלל של רק שני מימדים, 00:12:21.642 --> 00:12:25.080 לכן הם יוצרים מפה מהחלל של כל הדברים 00:12:25.104 --> 00:12:26.823 שמוכרים על ידי הרשת הזו. 00:12:26.847 --> 00:12:28.870 לעשות סוג כזה של סינטזה 00:12:28.894 --> 00:12:31.276 או יצירה של תמונות על פני כל המשטח, 00:12:31.300 --> 00:12:34.146 שמשנים את Y על המשטח, אתם עושים סוג של מפה -- 00:12:34.170 --> 00:12:37.311 מפה ויזואלית של כל הדברים שהרשת יודעת איך להכיר. 00:12:37.335 --> 00:12:40.200 החיות כולן פה; "ארמדילו" בדיוק בנקודה הזו בנקודה ההיא. NOTE Paragraph 00:12:40.919 --> 00:12:43.398 אתם יכולים לעשות זאת גם עם סוגים אחרים של רשתות. 00:12:43.422 --> 00:12:46.296 זו רשת שמתוכננת להכיר פרצופים, 00:12:46.320 --> 00:12:48.320 כדי להבחין בין פרצוף אחד לאחר. 00:12:48.344 --> 00:12:51.593 ופה, אנחנו שמים את ה Y שאומר, "אני," 00:12:51.617 --> 00:12:53.192 הפרמטרים של הפנים שלי. 00:12:53.216 --> 00:12:54.922 וכשהדבר הזה פותר ל X, 00:12:54.946 --> 00:12:57.564 הוא יוצר תמונה די משוגעת, 00:12:57.588 --> 00:13:02.016 סוג של תמונה קוביסטית, סוראליסטית, ופסיכדלית שלי 00:13:02.040 --> 00:13:03.846 ממספר נקודות צפיה יחד. 00:13:03.870 --> 00:13:06.604 הסיבה שזה נראה כמו מספר רב של נקודות מבט יחד 00:13:06.628 --> 00:13:10.315 זה בגלל שהרשת הזו מעוצבת להפתר מדו-משמעות 00:13:10.339 --> 00:13:12.815 של פנים שבפוזה אחת או אחרת, 00:13:12.839 --> 00:13:16.215 כשמסתכלים עליהם עם סוג אחד של תאורה, או סוג אחר של תאורה. 00:13:16.239 --> 00:13:18.324 אז כשאתם עושים סוג זה של בנייה מחדש, 00:13:18.348 --> 00:13:20.652 אם אתם לא משתמשים בסוג מסווים של תמונת הנחייה 00:13:20.676 --> 00:13:21.887 או סטטיסטיקה מנחה, 00:13:21.911 --> 00:13:25.676 אז אתם תקבלו סוג של בלבול מנקודות מבט שונות, 00:13:25.700 --> 00:13:27.068 בגלל שזה דו משמעי. 00:13:27.786 --> 00:13:32.009 זה מה שקורה אם אלכס משתמש בפנים של עצמו כתמונה מנחה 00:13:32.033 --> 00:13:35.354 במהלך תהליך האופטימיזציה כדי לבנות מחדש את הפנים שלי. 00:13:36.284 --> 00:13:38.612 אז אתם יכולים לראות שזה לא מושלם. 00:13:38.636 --> 00:13:40.510 יש עדיין די הרבה עבודה לעשות 00:13:40.534 --> 00:13:42.987 על איך אנחנו עושים מיטוב של תהליך המיטוב. 00:13:43.011 --> 00:13:45.838 אבל אתם מתחילים לקבל משהו יותר כמו פנים ברורות, 00:13:45.862 --> 00:13:47.876 שמצויירות בשימוש בפנים שלי כהנחיה. NOTE Paragraph 00:13:48.892 --> 00:13:51.393 אתם לא צריכים להתחיל עם קאנבס ריק 00:13:51.417 --> 00:13:52.573 או עם צליל לבן. 00:13:52.597 --> 00:13:53.901 כשאתם פותרים עבור X, 00:13:53.925 --> 00:13:57.814 אתם יכולים להתחיל עם X, שהוא בעצמו כבר תמונה אחרת. 00:13:57.838 --> 00:14:00.394 זו מה שההדגמה הקטנה הזו. 00:14:00.418 --> 00:14:04.540 זו רשת שמתוכננת לקטלג 00:14:04.564 --> 00:14:07.683 כל מיני אובייקטים שונים -- מבנים מעשה ידי אדם, חיות... 00:14:07.707 --> 00:14:10.300 פה אנחנו מתחילים עם רק תמונה של עננים, 00:14:10.324 --> 00:14:11.995 וכשאנחנו ממטבים, 00:14:12.019 --> 00:14:16.505 בעיקרון, הרשת הזו מבינה מה היא רואה בעננים. 00:14:16.931 --> 00:14:19.251 וככל שאתם מבלים יותר זמן בלהביט בהם, 00:14:19.275 --> 00:14:22.028 אתם גם תראו הרבה יותר דברים בעננים. 00:14:23.004 --> 00:14:26.379 אתם תוכלו גם להשתמש ברשת הפנים כדי להזות לתוך זה, 00:14:26.403 --> 00:14:28.215 ואתם מקבלים דברים די מטורפים. NOTE Paragraph 00:14:28.239 --> 00:14:29.389 (צחוק) NOTE Paragraph 00:14:30.401 --> 00:14:33.145 או, מייק עשה כמה ניסויים אחרים 00:14:33.169 --> 00:14:37.074 בהם הוא לוקח את תמונת העננים ההיא, 00:14:37.098 --> 00:14:40.605 הוזה, עושה זום, הוזה, זום, הוזה, זום. 00:14:40.629 --> 00:14:41.780 ובדרך זו, 00:14:41.804 --> 00:14:45.479 אתם יכולים לקבל סוג של מצב של פוגה של הרשת, אני מניח, 00:14:45.503 --> 00:14:49.183 או סוג של אסוציאציה חופשית, 00:14:49.207 --> 00:14:51.434 בה הרשת אוכלת את הזנב של עצמה. 00:14:51.458 --> 00:14:54.879 אז כל תמונה היא עכשיו הבסיס, 00:14:54.903 --> 00:14:56.404 ל"מה אני חושב שאני רואה עכשיו? 00:14:56.404 --> 00:14:59.151 מה אני חושב שאני רואה עכשיו? מה אני חושב שאני רואה עכשיו?" NOTE Paragraph 00:14:59.487 --> 00:15:02.423 הראתי את זה בפעם הראשונה בציבור 00:15:02.447 --> 00:15:07.884 לקבוצה בהרצאה בסיאטל שנקראה "חינוך גבוה יותר" -- 00:15:07.908 --> 00:15:10.345 זה היה מייד אחרי שמריחואנה הפכה לחוקית. NOTE Paragraph 00:15:10.369 --> 00:15:12.784 (צחוק) NOTE Paragraph 00:15:14.627 --> 00:15:16.731 אז הייתי רוצה לסיים במהירות 00:15:16.755 --> 00:15:21.010 פשוט בלהעיר שהטכנולוגיה הזו לא מוגבלת. 00:15:21.034 --> 00:15:24.699 הראתי לכם דוגמאות ויזאוליות לגמרי בגלל שבאמת כיף להביט בהן. 00:15:24.723 --> 00:15:27.174 זו לא טכנולוגיה ויזואלית לגמרי. 00:15:27.198 --> 00:15:29.191 האמן ששיתף איתנו פעולה, רוס גודווין, 00:15:29.215 --> 00:15:32.886 עשה ניסויים שכללו מצלמה שמצלמת תמונות, 00:15:32.910 --> 00:15:37.144 ואז המחשב בתיק שלו כותב פואמה בשימוש ברשתות עצביות, 00:15:37.168 --> 00:15:39.112 בהתבסס על התוכן של התמונה. 00:15:39.136 --> 00:15:42.083 והרשת העצבית הזו של השירה אומנה 00:15:42.107 --> 00:15:44.341 על קורפוס גדול של השירה של המאה ה20. 00:15:44.365 --> 00:15:45.864 והשירה היא, אתם יודעים, 00:15:45.888 --> 00:15:47.802 אני חושב, סוג של לא רעה, למעשה. NOTE Paragraph 00:15:47.826 --> 00:15:49.210 (צחוק) NOTE Paragraph 00:15:49.234 --> 00:15:50.393 לסיכום. 00:15:50.417 --> 00:15:52.549 אני חושב שעבור מיכאלאנג'לו, 00:15:52.573 --> 00:15:53.807 אני חושב שהוא צדק; 00:15:53.831 --> 00:15:57.267 תפישה ויצירתיות מחוברות מאוד אינטימית. 00:15:57.611 --> 00:16:00.245 מה שכרגע ראינו הן רשתות עצביות 00:16:00.269 --> 00:16:02.572 שלגמרי מאומנות להפלות, 00:16:02.596 --> 00:16:04.838 או להכיר דברים שונים בעולם, 00:16:04.862 --> 00:16:08.023 מסוגלת להיות מורצת אחורנית, כדי לייצר. 00:16:08.047 --> 00:16:09.830 אחד הדברים שמראים לי 00:16:09.854 --> 00:16:12.252 הם לא רק שמיכאלאנג'לו באמת ראה 00:16:12.276 --> 00:16:14.728 את הפסל בתוך בלוק האבן, 00:16:14.752 --> 00:16:18.390 אלא שכל יצור, כל ישות, כל חייזר 00:16:18.414 --> 00:16:22.071 שמסוגל לעשות פעולות תפישתיות מסוג כלשהו 00:16:22.095 --> 00:16:23.470 גם מסוגל ליצור 00:16:23.494 --> 00:16:26.718 בגלל שזה בדיוק אותו מנגנון שבשימוש בשני המקרים. NOTE Paragraph 00:16:26.742 --> 00:16:31.274 כמו כן ,אני חושב שתפישה ויצירתיות הן בשום צורה 00:16:31.298 --> 00:16:32.508 לא רק אנושיות. 00:16:32.532 --> 00:16:36.240 מתחילים להיות לנו מודלים ממוחשבים שיכולים לעשות בדיוק דברים מהסוג הזה. 00:16:36.264 --> 00:16:39.592 וזה לא צריך להפתיע; המוח הוא חישובי. NOTE Paragraph 00:16:39.616 --> 00:16:41.273 ולבסוף, 00:16:41.297 --> 00:16:45.965 מחשוב החל כתרגיל בעיצוב מכונות חכמות. 00:16:45.989 --> 00:16:48.451 הוא מודל אחר הרעיון 00:16:48.475 --> 00:16:51.488 של איך אנחנו יכולים ליצור מכונות חכמות. 00:16:51.512 --> 00:16:53.674 ואנחנו לבסוף מתחילים להגשים עכשיו 00:16:53.698 --> 00:16:56.104 כמה מההבטחות של החלוצים הראשונים האלה, 00:16:56.128 --> 00:16:57.841 של טיורינג וואן ניומן 00:16:57.865 --> 00:17:00.130 ומקקולוך ופיטס. 00:17:00.154 --> 00:17:04.252 ואני חושב שמחשוב לא נוגע רק לחשבונאות 00:17:04.276 --> 00:17:06.423 או לשחק קנדי קראש או משהו. 00:17:06.447 --> 00:17:09.025 מההתחלה, מידלנו אותם לפי המוח שלנו. 00:17:09.049 --> 00:17:12.318 והם נותנים לנו גם את היכולת להבין את המוחות שלנו טוב יותר 00:17:12.342 --> 00:17:13.871 ולהרחיב אותם. NOTE Paragraph 00:17:14.627 --> 00:17:15.794 תודה רבה לכם. NOTE Paragraph 00:17:15.818 --> 00:17:21.757 (מחיאות כפיים)