1 00:00:00,800 --> 00:00:03,924 אז, אני מוביל צוות בגוגל שעובד על למידה חישובית; 2 00:00:03,948 --> 00:00:08,598 כלומר, תחום ההנדסה שגורם למחשבים ומכשירים 3 00:00:08,622 --> 00:00:11,041 לעשות כמה מהדברים שמוחותינו עושים. 4 00:00:11,439 --> 00:00:14,538 וזה גורם לנו להתעניין במוחות אמיתיים 5 00:00:14,562 --> 00:00:15,851 וגם במדעי המוח, 6 00:00:15,875 --> 00:00:20,047 ובמיוחד בדברים שבביצועם מוחותינו 7 00:00:20,071 --> 00:00:24,113 עדיין עולים בהרבה על מחשבים. 8 00:00:25,209 --> 00:00:28,818 מבחינה היסטורית, אחד התחומים האלה הוא תפיסה, 9 00:00:28,842 --> 00:00:31,881 ההליך שדרכו כל הדברים שיש בעולם החיצוני -- 10 00:00:31,905 --> 00:00:33,489 צלילים ותמונות -- 11 00:00:33,513 --> 00:00:35,691 נעשים למושגים בשכל. 12 00:00:36,235 --> 00:00:38,752 זה חיוני למוחות שלנו, 13 00:00:38,776 --> 00:00:41,240 וגם די שימושי במחשב. 14 00:00:41,636 --> 00:00:44,986 האלגוריתמים לתפיסה חישובית, לדוגמא, שהצוות שלנו מוציא, 15 00:00:45,010 --> 00:00:48,884 הם מה שמאפשר לתמונותיכם בגוגל פוטוז להיות ניתנות-חיפוש, 16 00:00:48,908 --> 00:00:50,305 על פי תוכנן. 17 00:00:51,594 --> 00:00:55,087 הפן השני של תפיסה הוא יצירתיות: 18 00:00:55,111 --> 00:00:58,149 הפיכת מושג לעצם בעולם. 19 00:00:58,173 --> 00:01:01,728 וכך במשך השנה האחרונה, עבודתנו על תפיסה חישובית 20 00:01:01,752 --> 00:01:06,611 התחברה באופן לא צפוי לעולם היצירתיות החישובית, 21 00:01:06,635 --> 00:01:07,795 ולאמנות ממוחשבת. 22 00:01:08,556 --> 00:01:11,840 אני חושב שלמיכלאלג'לו הייתה תובנה חודרת 23 00:01:11,864 --> 00:01:15,520 לגבי היחס הדואלי הזה שבין תפיסה ליצירתיות. 24 00:01:16,023 --> 00:01:18,029 זאת ציטטה מפורסמת שלו: 25 00:01:18,053 --> 00:01:21,376 "לכל אבן יש פסל בתוכה, 26 00:01:22,036 --> 00:01:25,038 ועבודת הפסל לגלות אותו." 27 00:01:26,029 --> 00:01:29,245 אז, אני חושב שמיכלאנג'לו התכוון לזה 28 00:01:29,269 --> 00:01:32,449 שאנחנו יוצרים באמצעות תפיסה, 29 00:01:32,473 --> 00:01:35,496 ושתפיסה עצמה היא מעשה של דמיון 30 00:01:35,520 --> 00:01:37,981 והיא חומר היצירתיות. 31 00:01:38,691 --> 00:01:42,616 האיבר שמבצע את כל המחשבה והתפיסה והדמיון, 32 00:01:42,640 --> 00:01:44,228 הוא כמובן המוח. 33 00:01:45,089 --> 00:01:47,634 ואני רוצה לפתוח בקטע קצר של היסטוריה 34 00:01:47,658 --> 00:01:49,960 על מה שאנחנו יודעים על המוח. 35 00:01:50,496 --> 00:01:52,942 כי לא כמו, כגון, הלב או המעיים, 36 00:01:52,966 --> 00:01:56,110 אי אפשר לומר הרבה על המוח פשוט מלהסתכל עליו, 37 00:01:56,134 --> 00:01:57,546 לפחות, בעין בלתי מזויינת. 38 00:01:57,983 --> 00:02:00,399 האנטומיסטים המוקדמים שהסתכלו על מוחות 39 00:02:00,423 --> 00:02:04,230 קראו למבנים השטחיים של הדבר הזה בכל מיני שמות דמיוניים, 40 00:02:04,254 --> 00:02:06,687 כגון היפוקמפוס, שמשמעו "חסילון קטן." 41 00:02:06,711 --> 00:02:09,475 אך בבירור דבר מסוג זה לא מספר לנו הרבה 42 00:02:09,499 --> 00:02:11,817 על מה שבאמת קורה בפנים. 43 00:02:12,780 --> 00:02:16,393 האדם הראשון, לדעתי, שבפועל פיתח איזה מין של הבנה 44 00:02:16,417 --> 00:02:18,347 של מה שבאמת קורה בתוך המוח 45 00:02:18,371 --> 00:02:22,291 היה הניורואנטומיסט הספרדי הגדול, סנטיאגו רמון אי קחאל, 46 00:02:22,315 --> 00:02:23,859 במאה התשע-עשרה, 47 00:02:23,883 --> 00:02:27,638 שהשתמש במיקרוסקופ וצבעים מיוחדים 48 00:02:27,662 --> 00:02:31,832 שיכלו לדמות בבררנות ובניגוד גבוה 49 00:02:31,856 --> 00:02:33,864 תאים יחידים במוח, 50 00:02:33,888 --> 00:02:37,042 כדי להתחיל להבין את המורפולוגיה שלהם. 51 00:02:37,972 --> 00:02:40,863 ואלה סוגי הציורים שהוא צייר של תאי עצב 52 00:02:40,887 --> 00:02:42,096 במאה התשע-עשרה. 53 00:02:42,120 --> 00:02:44,004 זה מתוך מוח של ציפור. 54 00:02:44,028 --> 00:02:47,085 ותראו את המגוון המדהים הזה של תאים מסוגים שונים, 55 00:02:47,109 --> 00:02:50,544 אפילו תיאוריית התא עצמה הייתה חדשה למדי בעת הזו 56 00:02:50,568 --> 00:02:51,846 והמבנים האלה, 57 00:02:51,870 --> 00:02:54,129 התאים האלה שיש להם הסתעפויות כאלה 58 00:02:54,153 --> 00:02:56,761 וענפים כאלה שמסוגלים להאריך מרחקים רבים -- 59 00:02:56,785 --> 00:02:58,401 זה היה מאד חדשני ומקורי בתקופה זו. 60 00:02:58,779 --> 00:03:01,682 הם מזכירים חוטים כמובן. 61 00:03:01,706 --> 00:03:05,163 אפשר שכבר תפסו כך כמה אנשים במאה התשע-עשרה; 62 00:03:05,187 --> 00:03:09,501 מהפכות החיווט והחישמול בדיוק החלו. 63 00:03:09,964 --> 00:03:11,142 אבל מבחינות רבות, 64 00:03:11,166 --> 00:03:14,479 הציורים המיקרו-אנטומיים האלה של רמון אי קחאל, כגון זה, 65 00:03:14,503 --> 00:03:16,835 מבחינת-מה עוד לא הושגו. 66 00:03:16,859 --> 00:03:18,713 ואנחנו מאה שנים אחרי כן, 67 00:03:18,737 --> 00:03:21,562 מנסים לגמור את העבודה בו רמון אי קחאל החל. 68 00:03:21,586 --> 00:03:24,720 אלה הם נתונים לא-מעובדים ממשתפי הפעולה שלנו 69 00:03:24,744 --> 00:03:27,625 במכון מקס פלאנק למדעי מוח. 70 00:03:27,649 --> 00:03:29,439 ומה שמשתפי הפעולה שלנו עשו 71 00:03:29,463 --> 00:03:34,464 זה לדמת חלקיקים קטנים של רקמה מוחית. 72 00:03:34,488 --> 00:03:37,814 כל הדגימה הינה קרובה בגודלה למילימטר מעוקב אחד, 73 00:03:37,838 --> 00:03:40,459 ואני מראה לכם חלק מאד קטן ממנה פה. 74 00:03:40,483 --> 00:03:42,829 הפס הזה שלצד שמאל בגודל מיקרון אחד בערך. 75 00:03:42,853 --> 00:03:45,262 המבנים שאתם רואים הם מיטוכונדריה 76 00:03:45,286 --> 00:03:47,330 ששווים בגודלם לחיידק. 77 00:03:47,354 --> 00:03:48,905 ואלה פרוסות עוקבות 78 00:03:48,929 --> 00:03:52,077 בתוך הגוש הקטנטן מאד הזה של רקמה. 79 00:03:52,101 --> 00:03:54,504 רק לשם השוואה, 80 00:03:54,528 --> 00:03:58,320 קוטר קווצה ממוצעת של שיער היא כמאה מיקרון. 81 00:03:58,344 --> 00:04:00,618 וכך אנחנו מתבוננים במשהו הרבה יותר זעיר 82 00:04:00,642 --> 00:04:02,040 משערה אחת. 83 00:04:02,064 --> 00:04:06,095 ועל פי כל הסוגים האלה של פרוסות סדרתיות מוגדלות מיקרוסקופ-אלקטרוני, 84 00:04:06,119 --> 00:04:11,127 אפשר להתחיל בשיחזורים תלת-ממדיים של תאי עצב, הנראים ככה. 85 00:04:11,151 --> 00:04:14,308 ובכן, אלה נוהגים על פי אותו סגנון בקירוב של רמון אי קחאל. 86 00:04:14,332 --> 00:04:15,824 רק תאי עצב אחדים נדלקו, 87 00:04:15,848 --> 00:04:18,629 אחרת לא היינו יכולים לראות פה שום דבר. 88 00:04:18,653 --> 00:04:19,965 יהיה כל כך צפוף, 89 00:04:19,989 --> 00:04:21,319 כל כך מלא מבנים, 90 00:04:21,343 --> 00:04:24,067 מלא חיווט המקשר תאי עצב אחד לשני. 91 00:04:25,293 --> 00:04:28,097 אז רמון אי קחאל במידה הקדים את זמנו, 92 00:04:28,121 --> 00:04:30,676 והתקדמות בהבנת המוח 93 00:04:30,700 --> 00:04:32,971 התקדמה לאט לאט במשך העשורים הבאים. 94 00:04:33,455 --> 00:04:36,308 אבל ידענו שתאי עצב עשו שימוש בחשמל, 95 00:04:36,332 --> 00:04:39,268 ועד מלחמת העולם השנייה, הטכנולוגיה שלנו התקדמה דיה 96 00:04:39,292 --> 00:04:42,098 כדי להתחיל ניסויים חשמליים אמיתיים בתאי עצב חיים 97 00:04:42,122 --> 00:04:44,228 בשביל להבין טוב יותר כיצד הם עבדו. 98 00:04:44,631 --> 00:04:48,987 זה אותו הזמן שמחשבים הומצאו לראשונה, 99 00:04:49,011 --> 00:04:52,111 ממש בהתבסס על הרעיון של בניית דגם המוח -- 100 00:04:52,135 --> 00:04:55,220 של "מנגנון נבון," כמו שאלן טיורינג כינה אותו, 101 00:04:55,244 --> 00:04:57,235 אחד מאבות מדעי המחשב. 102 00:04:57,923 --> 00:05:02,555 ווארן מקולוק ווואלטר פיטס הביטו בציורו של רמון אי קחאל 103 00:05:02,579 --> 00:05:03,896 של קליפת הראייה, 104 00:05:03,920 --> 00:05:05,482 שאותו אני מראה פה. 105 00:05:05,506 --> 00:05:09,948 זאת הקליפה שמעבדת דימויים המגיעים מהעין. 106 00:05:10,424 --> 00:05:13,932 ומבחינתם, זה נראה כמו דיאגרמת מעגל חשמלי. 107 00:05:14,353 --> 00:05:18,188 לכן יש הרבה פרטים בדיאגרמת המעגל של מקולוק ופיטס 108 00:05:18,212 --> 00:05:19,564 שאינם לגמרי נכונים. 109 00:05:19,588 --> 00:05:20,823 אבל הרעיון המרכזי הזה 110 00:05:20,847 --> 00:05:24,839 שקליפת הראייה עובדת כסדרה של רכיבים חישוביים 111 00:05:24,863 --> 00:05:27,609 המעבירים מידע אחד לרעהו במפל, 112 00:05:27,633 --> 00:05:29,235 בעיקרו של דבר נכון. 113 00:05:29,259 --> 00:05:31,609 בואו נדבר רגע 114 00:05:31,633 --> 00:05:35,665 על מה שדגם לעיבוד מידע חזותי צריך לעשות. 115 00:05:36,228 --> 00:05:38,969 המשימה היסודית של תפיסה 116 00:05:38,993 --> 00:05:43,187 היא החזקת תמונה כזו שמשמאל ולאמר כי 117 00:05:43,211 --> 00:05:44,387 "זאת ציפור," 118 00:05:44,411 --> 00:05:47,285 היא דבר מאד פשוט לעשות בעזרת מוחותינו. 119 00:05:47,309 --> 00:05:50,730 אבל צריכים להבין שעבור מחשבים, 120 00:05:50,754 --> 00:05:53,841 זה היה כמעט בלתי אפשרי רק לפני כמה שנים. 121 00:05:53,865 --> 00:05:55,781 במסגרת הפרדיגמה החישובית הקלאסית 122 00:05:55,805 --> 00:05:58,312 אין זאת משימה קלת-ביצוע. 123 00:05:59,366 --> 00:06:01,918 אז מה שקורה בין הפיקסלים, 124 00:06:01,942 --> 00:06:05,970 בין דמות הציפור לבין המילה "ציפור," 125 00:06:05,994 --> 00:06:08,808 ביסוד הוא התקשרות בין מערכת תאי עצב מקושרים 126 00:06:08,832 --> 00:06:09,987 זה לזה ברשת עצבית, 127 00:06:10,011 --> 00:06:11,234 כפי שאני משרטט פה. 128 00:06:11,258 --> 00:06:14,530 הרשת העצבית יכולה להיות ביולוגית, בתוך קליפתנו הראייתית, 129 00:06:14,554 --> 00:06:16,716 או, כיום, מתחילה להיות לנו היכולת 130 00:06:16,740 --> 00:06:19,194 לבנות דגמים של רשתות אלה במחשב. 131 00:06:19,834 --> 00:06:22,187 ואראה לכם איך זה נראה באמת. 132 00:06:22,211 --> 00:06:25,627 אז אתם יכולים לחשוב על הפיקסלים כשכבה הראשונה של ניורונים, 133 00:06:25,651 --> 00:06:27,890 וזה, למעשה, איך שזה עובד בעין -- 134 00:06:27,914 --> 00:06:29,577 אלה הניורונים ברשתית. 135 00:06:29,601 --> 00:06:31,101 ואלה מזינים הלאה 136 00:06:31,125 --> 00:06:34,528 לתוך שכבה אחת אחרי אחרת אחרי הבאה של ניורונים, 137 00:06:34,552 --> 00:06:37,585 כולם מחוברים על ידי סינפסות במשקלים שונים. 138 00:06:37,609 --> 00:06:38,944 ההתנהגות של הרשת הזו 139 00:06:38,968 --> 00:06:42,252 מאופיינת על ידי הכוחות של כל הסינפסות האלה. 140 00:06:42,276 --> 00:06:45,564 אלה מאפיינים את התכונות המחשוביות של הרשת הזו. 141 00:06:45,588 --> 00:06:47,058 ובסופו של יום, 142 00:06:47,082 --> 00:06:49,529 יש לכם ניורון או קבוצה קטנה של ניורונים 143 00:06:49,553 --> 00:06:51,200 שנדלקים, ואומרים, "ציפור." 144 00:06:51,824 --> 00:06:54,956 עכשיו אני עומד לייצג את שלושת הדברים האלה -- 145 00:06:54,980 --> 00:06:59,676 פיקסל הקלט והסינפסות ברשתות העצביות, 146 00:06:59,700 --> 00:07:01,285 וציפור, הפלט -- 147 00:07:01,309 --> 00:07:04,366 על ידי שלושה משתנים: X, W ו Y. 148 00:07:04,853 --> 00:07:06,664 יש אולי מליון Xים בערך -- 149 00:07:06,688 --> 00:07:08,641 מליון פיקסלים בתמונה הזו. 150 00:07:08,665 --> 00:07:11,111 יש מיליארדים או טריליונים של W, 151 00:07:11,135 --> 00:07:14,556 שמייצגים את המשקל של כל הסינפסות האלו ברשתות העצביות. 152 00:07:14,580 --> 00:07:16,455 ויש מספר מאוד קטן של Y, 153 00:07:16,479 --> 00:07:18,337 של פלטים שיש לרשת הזו. 154 00:07:18,361 --> 00:07:20,110 "ציפור " היא רק חמש אותיות, נכון? 155 00:07:21,088 --> 00:07:24,514 אז בואו נעמיד פנים שזו רק נוסחה פשוטה, 156 00:07:24,538 --> 00:07:26,701 x "x" w = y. 157 00:07:26,725 --> 00:07:28,761 אני שם את הכפול בגרשיים 158 00:07:28,785 --> 00:07:31,065 בגלל שמה שבאמת מתרחש פה, כמובן, 159 00:07:31,089 --> 00:07:34,135 זה סדרה מאוד מורכבת של פעולות מתמטיות. 160 00:07:35,172 --> 00:07:36,393 זו משוואה אחת. 161 00:07:36,417 --> 00:07:38,089 יש שלושה משתנים. 162 00:07:38,113 --> 00:07:40,839 וכולנו יודעים שאם יש לכם משוואה אחת, 163 00:07:40,863 --> 00:07:44,505 אתם יכולים לפתור משתנה אחד אם יודעים את שני הדברים האחרים. 164 00:07:45,158 --> 00:07:48,538 אז הבעיה של הסקה, 165 00:07:48,562 --> 00:07:51,435 שהיא, להבין שהתמונה של הציפור היא ציפור, 166 00:07:51,459 --> 00:07:52,733 היא זו: 167 00:07:52,757 --> 00:07:56,216 פה Y הוא המשתנה ו W ו X ידועים. 168 00:07:56,240 --> 00:07:58,699 אתם יודעים את הרשת העצבית, אתם יודעים את הפיקסלים. 169 00:07:58,723 --> 00:08:02,050 כמו שאתם יכולים לראות, זו למעשה בעיה די פשוטה. 170 00:08:02,074 --> 00:08:04,260 אתם מכפילים שתיים כפול שלוש וסיימתם. 171 00:08:04,862 --> 00:08:06,985 אני אראה לכם רשת עצבית מלאכותית 172 00:08:07,009 --> 00:08:09,305 שבנינו לאחרונה, ועשינו בדיוק את זה. 173 00:08:09,634 --> 00:08:12,494 זה רץ בזמן אמת על טלפון נייד, 174 00:08:12,518 --> 00:08:15,831 וזה, כמובן, מדהים בפני עצמו, 175 00:08:15,855 --> 00:08:19,323 הטלפונים הניידים יכולים לעשות כל כך הרבה מליארדים וטריליונים של פעולות 176 00:08:19,347 --> 00:08:20,595 לשניה. 177 00:08:20,619 --> 00:08:22,234 מה שאתם רואים זה טלפון 178 00:08:22,258 --> 00:08:25,805 מביט בתמונות של ציפורים אחת אחרי השניה, 179 00:08:25,829 --> 00:08:28,544 ולמעשה לא רק אומר, "כן, זו ציפור," 180 00:08:28,568 --> 00:08:31,979 אלא מזהה את המין של הציפור עם רשת מסוג כזה. 181 00:08:32,890 --> 00:08:34,716 אז בתמונה הזו, 182 00:08:34,740 --> 00:08:38,542 ה X וה W ידועים, וה Y לא ידוע. 183 00:08:38,566 --> 00:08:41,074 אני מרפרף על החלקים הממש קשים כמובן, 184 00:08:41,098 --> 00:08:44,959 שזה איך בעצם אנחנו מגלים את ה W, 185 00:08:44,983 --> 00:08:47,170 המוח שיכול לעשות כזה דבר? 186 00:08:47,194 --> 00:08:49,028 איך אי פעם נלמד מודל כזה? 187 00:08:49,418 --> 00:08:52,651 אז התהליך הזה של למידה, או פתירת ה W, 188 00:08:52,675 --> 00:08:55,322 אם היינו עושים את זה עם משוואות פשוטות 189 00:08:55,346 --> 00:08:57,346 בהן אנחנו חושבים על אלה כמספרים, 190 00:08:57,370 --> 00:09:00,057 אנחנו יודעים בדיוק איך לעשות את זה: 6 = 2 *w, 191 00:09:00,081 --> 00:09:03,393 ובכן, אנחנו מחלקים בשניים וסיימנו. 192 00:09:04,001 --> 00:09:06,221 הבעיה היא עם הפעולה הזו. 193 00:09:06,823 --> 00:09:07,974 אז, חלוקה -- 194 00:09:07,998 --> 00:09:11,119 השתמשו בחלוקה בגלל שהיא ההפך מכפל, 195 00:09:11,143 --> 00:09:12,583 אבל כמו שכרגע אמרתי, 196 00:09:12,607 --> 00:09:15,056 ההכפלה היא מעט שקר פה. 197 00:09:15,080 --> 00:09:18,406 זו פעולה מאוד מאוד מורכבת, מאוד לא לינארית; 198 00:09:18,430 --> 00:09:20,134 אין לה פעולה הופכית. 199 00:09:20,158 --> 00:09:23,308 אז אנחנו צריכים למצוא דרך לפתור את המשוואה 200 00:09:23,332 --> 00:09:25,356 בלי פעולת החילוק. 201 00:09:25,380 --> 00:09:27,723 והדרך לעשות את זה היא די ישירה. 202 00:09:27,747 --> 00:09:30,418 אתם פשוט אומרים, בואו נשחק בטריק אלגבראי פשוט, 203 00:09:30,442 --> 00:09:33,348 ונעביר את השש לצד ימין של המשוואה. 204 00:09:33,372 --> 00:09:35,198 עכשיו, אנחנו עדיין משתמשים בכפל. 205 00:09:35,675 --> 00:09:39,255 והאפס הזה -- בואו נחשוב עליו כשגיאה. 206 00:09:39,279 --> 00:09:41,794 במילים אחרות, אם פתרנו עבור W נכון, 207 00:09:41,818 --> 00:09:43,474 אז השגיאה תהיה אפס. 208 00:09:43,498 --> 00:09:45,436 ואם זה לא יצא לנו ממש נכון, 209 00:09:45,460 --> 00:09:47,209 השגיאה תהיה גדולה מאפס. 210 00:09:47,233 --> 00:09:50,599 אז עכשיו אנחנו יכולים פשוט לנחש כדי להקטין את השגיאה, 211 00:09:50,623 --> 00:09:53,310 וזה סוג הדבר שמחשבים ממש טובים בו. 212 00:09:53,334 --> 00:09:54,927 אז לקחתם ניחוש ראשוני: 213 00:09:54,951 --> 00:09:56,107 מה אם W=0? 214 00:09:56,131 --> 00:09:57,371 ובכן, אז השגיאה היא 6. 215 00:09:57,395 --> 00:09:58,841 מה עם W =1? השגיאה היא 4. 216 00:09:58,865 --> 00:10:01,232 ואז המחשב יכול לשחק סוג של מרקו פולו, 217 00:10:01,256 --> 00:10:03,623 ולהוריד את השגיאה קרוב לאפס. 218 00:10:03,647 --> 00:10:07,021 וכשהוא עושה את זה, הוא מקבל קרובים עוקבים ל W. 219 00:10:07,045 --> 00:10:10,701 ובאופן טיפוסי, הוא לעולם לא ממש מגיע לשם, אבל אחרי בערך שנים עשר צעדים, 220 00:10:10,725 --> 00:10:15,349 אנחנו מגיעים ל W = 2.999, שזה קרוב מספיק. 221 00:10:16,302 --> 00:10:18,116 וזה תהליך הלמידה. 222 00:10:18,140 --> 00:10:20,870 אז זכרו שמה שמתרחש פה 223 00:10:20,894 --> 00:10:25,272 זה שלקחנו הרבה X ידועים ו Y ידועים 224 00:10:25,296 --> 00:10:28,750 ופתרנו עבור W במרכז דרך תהליך לולאתי. 225 00:10:28,774 --> 00:10:32,330 זו בדיוק אותה דרך שאנחנו עושים את הלמידה בעצמנו. 226 00:10:32,354 --> 00:10:34,584 יש לנו הרבה הרבה תמונות כתינוקות 227 00:10:34,608 --> 00:10:37,241 ואומרים לנו, "זו ציפור; זו לא ציפור." 228 00:10:37,714 --> 00:10:39,812 ובמשך הזמן, דרך חזרה, 229 00:10:39,836 --> 00:10:42,764 אנחנו פותרים עבור W, אנחנו פותרים עבור החיבורים העצביים האלה. 230 00:10:43,460 --> 00:10:47,546 אז עכשיו, החזקנו את X ואת W קבועים כדי לפתור עבור Y; 231 00:10:47,570 --> 00:10:49,417 זו תפישה מהירה, יום יומית. 232 00:10:49,441 --> 00:10:51,204 הבנו איך אנחנו יכולים לפתור עבור W, 233 00:10:51,228 --> 00:10:53,131 זה למידה, שהיא הרבה יותר קשה, 234 00:10:53,155 --> 00:10:55,140 בגלל שאנחנו צריכים לעשות מזעור שגיאות, 235 00:10:55,164 --> 00:10:56,851 בשימוש בהרבה דוגמאות אימון. 236 00:10:56,875 --> 00:11:00,062 ולפני בערך שנה, אלכס מורדבינטסב, בצוות שלנו, 237 00:11:00,086 --> 00:11:03,636 החליט להתנסות עם מה שקורה אם אנחנו מנסים לפתור עבור X, 238 00:11:03,660 --> 00:11:05,697 בהתחשב ב W ו Y ידועים. 239 00:11:06,124 --> 00:11:07,275 במילים אחרות, 240 00:11:07,299 --> 00:11:08,651 אתם יודעים שזו ציפור, 241 00:11:08,675 --> 00:11:11,978 וכבר יש לכם את הרשת העצבית שאימנתם על ציפורים, 242 00:11:12,002 --> 00:11:14,346 אבל מה היא התמונה של הציפור? 243 00:11:15,034 --> 00:11:20,058 מסתבר שבשימוש בדיוק באותו תהליך מזעור שגיאות, 244 00:11:20,082 --> 00:11:23,512 שאפשר לעשות עם רשת שמאומנת להכיר ציפורים, 245 00:11:23,536 --> 00:11:26,924 ומסתבר שהתוצאה היא... 246 00:11:30,400 --> 00:11:31,705 תמונה של ציפורים. 247 00:11:32,814 --> 00:11:36,551 אז זו תמונה של ציפורים שמייוצרת לגמרי על ידי רשת עצבית 248 00:11:36,575 --> 00:11:38,401 שאומנה להכיר ציפורים, 249 00:11:38,425 --> 00:11:41,963 פשוט על ידי פיתרון ל X במקום לפתור ל Y, 250 00:11:41,987 --> 00:11:43,275 ולעשות את זה בחזרתיות. 251 00:11:43,732 --> 00:11:45,579 הנה דוגמה כיפית נוספת. 252 00:11:45,603 --> 00:11:49,040 זו היתה עבודה שנעשתה על ידי מייק טייקה בקבוצה שלנו, 253 00:11:49,064 --> 00:11:51,372 שנקראה "תהלוכת החיות." 254 00:11:51,396 --> 00:11:54,272 זה מזכיר לי מעט את האמנות של ווליאם קמטרידג', 255 00:11:54,296 --> 00:11:56,785 בה הוא יוצר איורים, מוחק אותם, 256 00:11:56,809 --> 00:11:58,269 יוצר איורים, מוחק אותם, 257 00:11:58,293 --> 00:11:59,691 ויוצר סרט בדרך זו. 258 00:11:59,715 --> 00:12:00,866 במקרה הזה, 259 00:12:00,890 --> 00:12:04,167 מה שמייק עושה זה לשנות את Y במרחב של חיות שונות, 260 00:12:04,191 --> 00:12:06,573 ברשת שמתוכננת להכיר ולהבחין 261 00:12:06,597 --> 00:12:08,407 בין חיות שונות. 262 00:12:08,431 --> 00:12:12,182 ואתם מקבלים את הסוג במוזר הזה של שינויים כמו של אשר, מחיה אחת לאחרת. 263 00:12:14,221 --> 00:12:18,835 פה הוא ואלכס יחד ניסו להפחית 264 00:12:18,859 --> 00:12:21,618 את ה Y לחלל של רק שני מימדים, 265 00:12:21,642 --> 00:12:25,080 לכן הם יוצרים מפה מהחלל של כל הדברים 266 00:12:25,104 --> 00:12:26,823 שמוכרים על ידי הרשת הזו. 267 00:12:26,847 --> 00:12:28,870 לעשות סוג כזה של סינטזה 268 00:12:28,894 --> 00:12:31,276 או יצירה של תמונות על פני כל המשטח, 269 00:12:31,300 --> 00:12:34,146 שמשנים את Y על המשטח, אתם עושים סוג של מפה -- 270 00:12:34,170 --> 00:12:37,311 מפה ויזואלית של כל הדברים שהרשת יודעת איך להכיר. 271 00:12:37,335 --> 00:12:40,200 החיות כולן פה; "ארמדילו" בדיוק בנקודה הזו בנקודה ההיא. 272 00:12:40,919 --> 00:12:43,398 אתם יכולים לעשות זאת גם עם סוגים אחרים של רשתות. 273 00:12:43,422 --> 00:12:46,296 זו רשת שמתוכננת להכיר פרצופים, 274 00:12:46,320 --> 00:12:48,320 כדי להבחין בין פרצוף אחד לאחר. 275 00:12:48,344 --> 00:12:51,593 ופה, אנחנו שמים את ה Y שאומר, "אני," 276 00:12:51,617 --> 00:12:53,192 הפרמטרים של הפנים שלי. 277 00:12:53,216 --> 00:12:54,922 וכשהדבר הזה פותר ל X, 278 00:12:54,946 --> 00:12:57,564 הוא יוצר תמונה די משוגעת, 279 00:12:57,588 --> 00:13:02,016 סוג של תמונה קוביסטית, סוראליסטית, ופסיכדלית שלי 280 00:13:02,040 --> 00:13:03,846 ממספר נקודות צפיה יחד. 281 00:13:03,870 --> 00:13:06,604 הסיבה שזה נראה כמו מספר רב של נקודות מבט יחד 282 00:13:06,628 --> 00:13:10,315 זה בגלל שהרשת הזו מעוצבת להפתר מדו-משמעות 283 00:13:10,339 --> 00:13:12,815 של פנים שבפוזה אחת או אחרת, 284 00:13:12,839 --> 00:13:16,215 כשמסתכלים עליהם עם סוג אחד של תאורה, או סוג אחר של תאורה. 285 00:13:16,239 --> 00:13:18,324 אז כשאתם עושים סוג זה של בנייה מחדש, 286 00:13:18,348 --> 00:13:20,652 אם אתם לא משתמשים בסוג מסווים של תמונת הנחייה 287 00:13:20,676 --> 00:13:21,887 או סטטיסטיקה מנחה, 288 00:13:21,911 --> 00:13:25,676 אז אתם תקבלו סוג של בלבול מנקודות מבט שונות, 289 00:13:25,700 --> 00:13:27,068 בגלל שזה דו משמעי. 290 00:13:27,786 --> 00:13:32,009 זה מה שקורה אם אלכס משתמש בפנים של עצמו כתמונה מנחה 291 00:13:32,033 --> 00:13:35,354 במהלך תהליך האופטימיזציה כדי לבנות מחדש את הפנים שלי. 292 00:13:36,284 --> 00:13:38,612 אז אתם יכולים לראות שזה לא מושלם. 293 00:13:38,636 --> 00:13:40,510 יש עדיין די הרבה עבודה לעשות 294 00:13:40,534 --> 00:13:42,987 על איך אנחנו עושים מיטוב של תהליך המיטוב. 295 00:13:43,011 --> 00:13:45,838 אבל אתם מתחילים לקבל משהו יותר כמו פנים ברורות, 296 00:13:45,862 --> 00:13:47,876 שמצויירות בשימוש בפנים שלי כהנחיה. 297 00:13:48,892 --> 00:13:51,393 אתם לא צריכים להתחיל עם קאנבס ריק 298 00:13:51,417 --> 00:13:52,573 או עם צליל לבן. 299 00:13:52,597 --> 00:13:53,901 כשאתם פותרים עבור X, 300 00:13:53,925 --> 00:13:57,814 אתם יכולים להתחיל עם X, שהוא בעצמו כבר תמונה אחרת. 301 00:13:57,838 --> 00:14:00,394 זו מה שההדגמה הקטנה הזו. 302 00:14:00,418 --> 00:14:04,540 זו רשת שמתוכננת לקטלג 303 00:14:04,564 --> 00:14:07,683 כל מיני אובייקטים שונים -- מבנים מעשה ידי אדם, חיות... 304 00:14:07,707 --> 00:14:10,300 פה אנחנו מתחילים עם רק תמונה של עננים, 305 00:14:10,324 --> 00:14:11,995 וכשאנחנו ממטבים, 306 00:14:12,019 --> 00:14:16,505 בעיקרון, הרשת הזו מבינה מה היא רואה בעננים. 307 00:14:16,931 --> 00:14:19,251 וככל שאתם מבלים יותר זמן בלהביט בהם, 308 00:14:19,275 --> 00:14:22,028 אתם גם תראו הרבה יותר דברים בעננים. 309 00:14:23,004 --> 00:14:26,379 אתם תוכלו גם להשתמש ברשת הפנים כדי להזות לתוך זה, 310 00:14:26,403 --> 00:14:28,215 ואתם מקבלים דברים די מטורפים. 311 00:14:28,239 --> 00:14:29,389 (צחוק) 312 00:14:30,401 --> 00:14:33,145 או, מייק עשה כמה ניסויים אחרים 313 00:14:33,169 --> 00:14:37,074 בהם הוא לוקח את תמונת העננים ההיא, 314 00:14:37,098 --> 00:14:40,605 הוזה, עושה זום, הוזה, זום, הוזה, זום. 315 00:14:40,629 --> 00:14:41,780 ובדרך זו, 316 00:14:41,804 --> 00:14:45,479 אתם יכולים לקבל סוג של מצב של פוגה של הרשת, אני מניח, 317 00:14:45,503 --> 00:14:49,183 או סוג של אסוציאציה חופשית, 318 00:14:49,207 --> 00:14:51,434 בה הרשת אוכלת את הזנב של עצמה. 319 00:14:51,458 --> 00:14:54,879 אז כל תמונה היא עכשיו הבסיס, 320 00:14:54,903 --> 00:14:56,404 ל"מה אני חושב שאני רואה עכשיו? 321 00:14:56,404 --> 00:14:59,151 מה אני חושב שאני רואה עכשיו? מה אני חושב שאני רואה עכשיו?" 322 00:14:59,487 --> 00:15:02,423 הראתי את זה בפעם הראשונה בציבור 323 00:15:02,447 --> 00:15:07,884 לקבוצה בהרצאה בסיאטל שנקראה "חינוך גבוה יותר" -- 324 00:15:07,908 --> 00:15:10,345 זה היה מייד אחרי שמריחואנה הפכה לחוקית. 325 00:15:10,369 --> 00:15:12,784 (צחוק) 326 00:15:14,627 --> 00:15:16,731 אז הייתי רוצה לסיים במהירות 327 00:15:16,755 --> 00:15:21,010 פשוט בלהעיר שהטכנולוגיה הזו לא מוגבלת. 328 00:15:21,034 --> 00:15:24,699 הראתי לכם דוגמאות ויזאוליות לגמרי בגלל שבאמת כיף להביט בהן. 329 00:15:24,723 --> 00:15:27,174 זו לא טכנולוגיה ויזואלית לגמרי. 330 00:15:27,198 --> 00:15:29,191 האמן ששיתף איתנו פעולה, רוס גודווין, 331 00:15:29,215 --> 00:15:32,886 עשה ניסויים שכללו מצלמה שמצלמת תמונות, 332 00:15:32,910 --> 00:15:37,144 ואז המחשב בתיק שלו כותב פואמה בשימוש ברשתות עצביות, 333 00:15:37,168 --> 00:15:39,112 בהתבסס על התוכן של התמונה. 334 00:15:39,136 --> 00:15:42,083 והרשת העצבית הזו של השירה אומנה 335 00:15:42,107 --> 00:15:44,341 על קורפוס גדול של השירה של המאה ה20. 336 00:15:44,365 --> 00:15:45,864 והשירה היא, אתם יודעים, 337 00:15:45,888 --> 00:15:47,802 אני חושב, סוג של לא רעה, למעשה. 338 00:15:47,826 --> 00:15:49,210 (צחוק) 339 00:15:49,234 --> 00:15:50,393 לסיכום. 340 00:15:50,417 --> 00:15:52,549 אני חושב שעבור מיכאלאנג'לו, 341 00:15:52,573 --> 00:15:53,807 אני חושב שהוא צדק; 342 00:15:53,831 --> 00:15:57,267 תפישה ויצירתיות מחוברות מאוד אינטימית. 343 00:15:57,611 --> 00:16:00,245 מה שכרגע ראינו הן רשתות עצביות 344 00:16:00,269 --> 00:16:02,572 שלגמרי מאומנות להפלות, 345 00:16:02,596 --> 00:16:04,838 או להכיר דברים שונים בעולם, 346 00:16:04,862 --> 00:16:08,023 מסוגלת להיות מורצת אחורנית, כדי לייצר. 347 00:16:08,047 --> 00:16:09,830 אחד הדברים שמראים לי 348 00:16:09,854 --> 00:16:12,252 הם לא רק שמיכאלאנג'לו באמת ראה 349 00:16:12,276 --> 00:16:14,728 את הפסל בתוך בלוק האבן, 350 00:16:14,752 --> 00:16:18,390 אלא שכל יצור, כל ישות, כל חייזר 351 00:16:18,414 --> 00:16:22,071 שמסוגל לעשות פעולות תפישתיות מסוג כלשהו 352 00:16:22,095 --> 00:16:23,470 גם מסוגל ליצור 353 00:16:23,494 --> 00:16:26,718 בגלל שזה בדיוק אותו מנגנון שבשימוש בשני המקרים. 354 00:16:26,742 --> 00:16:31,274 כמו כן ,אני חושב שתפישה ויצירתיות הן בשום צורה 355 00:16:31,298 --> 00:16:32,508 לא רק אנושיות. 356 00:16:32,532 --> 00:16:36,240 מתחילים להיות לנו מודלים ממוחשבים שיכולים לעשות בדיוק דברים מהסוג הזה. 357 00:16:36,264 --> 00:16:39,592 וזה לא צריך להפתיע; המוח הוא חישובי. 358 00:16:39,616 --> 00:16:41,273 ולבסוף, 359 00:16:41,297 --> 00:16:45,965 מחשוב החל כתרגיל בעיצוב מכונות חכמות. 360 00:16:45,989 --> 00:16:48,451 הוא מודל אחר הרעיון 361 00:16:48,475 --> 00:16:51,488 של איך אנחנו יכולים ליצור מכונות חכמות. 362 00:16:51,512 --> 00:16:53,674 ואנחנו לבסוף מתחילים להגשים עכשיו 363 00:16:53,698 --> 00:16:56,104 כמה מההבטחות של החלוצים הראשונים האלה, 364 00:16:56,128 --> 00:16:57,841 של טיורינג וואן ניומן 365 00:16:57,865 --> 00:17:00,130 ומקקולוך ופיטס. 366 00:17:00,154 --> 00:17:04,252 ואני חושב שמחשוב לא נוגע רק לחשבונאות 367 00:17:04,276 --> 00:17:06,423 או לשחק קנדי קראש או משהו. 368 00:17:06,447 --> 00:17:09,025 מההתחלה, מידלנו אותם לפי המוח שלנו. 369 00:17:09,049 --> 00:17:12,318 והם נותנים לנו גם את היכולת להבין את המוחות שלנו טוב יותר 370 00:17:12,342 --> 00:17:13,871 ולהרחיב אותם. 371 00:17:14,627 --> 00:17:15,794 תודה רבה לכם. 372 00:17:15,818 --> 00:17:21,757 (מחיאות כפיים)