1 00:00:00,880 --> 00:00:04,893 פעם, אם רצית לגרום למחשב לעשות משהו חדש 2 00:00:04,893 --> 00:00:06,509 היית צריך לתכנת אותו. 3 00:00:06,509 --> 00:00:09,423 כעת, תכנות, למי מכם שלא עשו זאת בעצמם, 4 00:00:09,423 --> 00:00:12,918 דורש לפרוש בפירוט מייגע 5 00:00:12,918 --> 00:00:16,070 כל צעד וצעד שאתה רוצה שהמחשב יעשה 6 00:00:16,070 --> 00:00:18,157 על מנת להשיג את המטרה שלך. 7 00:00:18,157 --> 00:00:22,479 כעת, אם אתה רוצה לעשות משהו שאתה לא יודע איך לעשות בעצמך, 8 00:00:22,479 --> 00:00:24,325 אז זה הולך להיות אתגר רציני. 9 00:00:24,325 --> 00:00:27,888 אז זה היה האתגר שעמד בפני האיש הזה, ארתור סמואל. 10 00:00:27,888 --> 00:00:31,991 ב-1956, הוא רצה לגרום למחשב הזה 11 00:00:31,991 --> 00:00:34,208 להיות מסוגל להביס אותו בדמקה. 12 00:00:34,208 --> 00:00:36,008 איך אתה יכול לכתוב תוכנה, 13 00:00:36,008 --> 00:00:40,098 לפרוש בפירוט מייגע, איך להיות יותר טוב ממך בדמקה? 14 00:00:40,098 --> 00:00:41,714 אז הוא הגה רעיון: 15 00:00:41,714 --> 00:00:45,946 הוא נתן למחשב לשחק נגד עצמו אלפי פעמים 16 00:00:45,946 --> 00:00:48,100 וללמוד איך לשחק דמקה. 17 00:00:48,100 --> 00:00:51,494 ואכן זה עבד, ולמעשה עד 1962, 18 00:00:51,494 --> 00:00:54,124 המחשב הזה ניצח את האלוף של קונטיקט. 19 00:00:55,484 --> 00:00:58,221 אז ארתור סמואל היה אבי הלמידה החישובית. 20 00:00:58,221 --> 00:00:59,931 ואני חב לו חוב ענק. 21 00:00:59,931 --> 00:01:02,509 בגלל שאני עוסק בלמידה חישובית. 22 00:01:02,509 --> 00:01:04,229 הייתי הנשיא של קאגל, 23 00:01:04,229 --> 00:01:07,649 קהילה שמונה מעל 200,000 אנשים שעוסקים בלמידה חישובית. 24 00:01:07,649 --> 00:01:10,107 קאגל מארגנת תחרויות 25 00:01:10,107 --> 00:01:13,605 לנסות ולגרום להם לפתור בעיות שלא נפתרו עד כה, 26 00:01:13,605 --> 00:01:17,043 וזו הייתה הצלחה מאות פעמים. 27 00:01:17,043 --> 00:01:19,900 אז מתצפית מנקודת יתרון זו, הצלחתי לגלות 28 00:01:19,900 --> 00:01:23,700 הרבה על מה שלמידה חישובית יכולה לעשות בעבר, לעשות היום, 29 00:01:23,712 --> 00:01:25,273 ומה היא יכולה לעשות בעתיד. 30 00:01:25,273 --> 00:01:30,272 אולי ההצלחה הגדולה הראשונה של למידה חישובית באופן מסחרי הייתה גוגל. 31 00:01:30,272 --> 00:01:33,480 גוגל הראתה שזה אפשרי למצוא מידע 32 00:01:33,480 --> 00:01:35,739 על ידי שימוש באלגוריתם ממוחשב, 33 00:01:35,739 --> 00:01:38,264 והאלגוריתם הזה מבוסס על למידה חישובית. 34 00:01:38,264 --> 00:01:42,123 מאז, היו הרבה הצלחות מסחריות של למידה ממוחשבת. 35 00:01:42,123 --> 00:01:44,309 חברות כמו אמזון ונטפליקס 36 00:01:44,309 --> 00:01:47,496 משתמשות בלמידה חישובית כדי להציע מוצרים שאולי תרצה לקנות, 37 00:01:47,496 --> 00:01:49,206 סרטים שאולי תרצה לראות. 38 00:01:49,206 --> 00:01:51,346 לפעמים, זה כמעט מפחיד. 39 00:01:51,346 --> 00:01:53,413 חברות כמו לינקדאין ופייסבוק 40 00:01:53,413 --> 00:01:56,101 לפעמים אומרות לך מי עשויים להיות החברים שלך 41 00:01:56,101 --> 00:01:58,228 ואין לך מושג איך הן עשו את זה, 42 00:01:58,228 --> 00:02:01,195 וזה בגלל שהן משתמשות בכוחה של הלמידה החישובית. 43 00:02:01,195 --> 00:02:04,152 אלו הם אלגוריתמים שלמדו איך לעשות זאת מנתונים 44 00:02:04,152 --> 00:02:07,399 במקום להיות מתוכנתות לעשות זאת באופן ידני. 45 00:02:07,399 --> 00:02:09,877 כך גם IBM הצליחה 46 00:02:09,877 --> 00:02:13,739 לגרום לווטסון להביס את שני אלופי העולם ב"ג'פרדי", 47 00:02:13,739 --> 00:02:16,964 ולענות על שאלות עדינות ומורכבות להפליא כמו זאת: 48 00:02:16,964 --> 00:02:19,799 ["ה'אריה של נמרוד' העתיק נעלם מהמוזיאון הלאומי של העיר הזאת ב-2003 (יחד עם עוד הרבה דברים)"] 49 00:02:19,799 --> 00:02:23,034 זו גם הסיבה בגללה אנו עכשיו רואים את המכוניות הראשונות שנוהגות לבד. 50 00:02:23,034 --> 00:02:25,856 אם אתם רוצים להיות מסוגלים להבחין בין, למשל, 51 00:02:25,856 --> 00:02:28,488 עץ והולך רגל, ובכן, זה די חשוב. 52 00:02:28,488 --> 00:02:31,075 אנחנו לא יודעים איך לכתוב את התוכנות הללו באופן ידני, 53 00:02:31,075 --> 00:02:34,072 אך עם למידה חישובית, זה אפשרי כעת. 54 00:02:34,072 --> 00:02:36,680 ולמעשה, המכונית הזו נסעה מעל מיליון מיילים 55 00:02:36,680 --> 00:02:40,186 ללא אף תאונה בכבישים רגילים. 56 00:02:40,196 --> 00:02:44,110 אז אנחנו יודעים שמחשבים יכולים ללמוד, 57 00:02:44,110 --> 00:02:46,010 ומחשבים יכולים ללמוד לעשות דברים 58 00:02:46,010 --> 00:02:48,848 שאנחנו למעשה לפעמים לא יודעים לעשות בעצמנו, 59 00:02:48,848 --> 00:02:51,733 או אולי יכולים לעשות אותם יותר טוב מאיתנו. 60 00:02:51,733 --> 00:02:55,928 אחת מהדוגמאות המדהימות ביותר שראיתי ללמידה חישובית 61 00:02:55,928 --> 00:02:58,320 קרתה בפרוייקט שהובלתי בקאגל 62 00:02:58,320 --> 00:03:01,911 שבו צוות שהובל על ידי בחור בשם ג'פרי הינטון 63 00:03:01,911 --> 00:03:03,463 מאוניברסיטת טורונטו 64 00:03:03,463 --> 00:03:06,140 זכה בתחרות על פיתוח תרופות אוטומטי. 65 00:03:06,140 --> 00:03:08,987 כעת, מה שמדהים פה זה לא רק שהם ניצחו 66 00:03:08,987 --> 00:03:13,000 את כל האלגוריתמים שפותחו על ידי מרק או קהילת האקדמיה העולמית, 67 00:03:13,000 --> 00:03:18,061 אלא שלאף אחד בצוות לא היה רקע בכימיה, ביולוגיה או מדעי החיים, 68 00:03:18,061 --> 00:03:20,230 והם עשו זאת בשבועיים. 69 00:03:20,230 --> 00:03:21,611 איך הם עשו זאת? 70 00:03:22,421 --> 00:03:25,342 הם השתמשו באלגוריתם יוצא דופן שנקרא למידה עמוקה. 71 00:03:25,342 --> 00:03:28,291 זה היה כל כך חשוב שההצלחה סוקרה 72 00:03:28,291 --> 00:03:31,412 בניו יורק טיימס במאמר בעמוד הראשי כמה שבועות לאחר מכן. 73 00:03:31,412 --> 00:03:34,147 זה ג'פרי הינטון כאן משמאל. 74 00:03:34,147 --> 00:03:38,488 למידה עמוקה הוא אלגוריתם ששואב השראה מהמוח האנושי, 75 00:03:38,488 --> 00:03:40,300 וכתוצאה מכך הוא אלגוריתם 76 00:03:40,300 --> 00:03:44,141 שאין לו מגבלות תיאורטיות על מה שהוא מסוגל לעשות. 77 00:03:44,141 --> 00:03:46,964 ככל שנותנים לו יותר נתונים וזמן חישוב, 78 00:03:46,964 --> 00:03:48,276 כך הוא משתפר. 79 00:03:48,276 --> 00:03:50,615 הניו יורק טיימס גם הראה במאמר הזה 80 00:03:50,615 --> 00:03:52,857 תוצאה מדהימה נוספת של למידה חישובית 81 00:03:52,857 --> 00:03:55,569 שאני הולך להראות לכם כעת. 82 00:03:55,569 --> 00:04:00,510 הם מראים שמחשבים יכולים להקשיב ולהבין. 83 00:04:00,510 --> 00:04:03,221 (וידאו) ריצ'רד ראשיד: עכשיו, הצעד האחרון 84 00:04:03,221 --> 00:04:06,246 שאני רוצה להיות מסוגל לבצע בתהליך הזה 85 00:04:06,246 --> 00:04:10,961 הוא למעשה לדבר אליכם בסינית. 86 00:04:10,961 --> 00:04:13,596 עכשיו המפתח פה, 87 00:04:13,596 --> 00:04:18,598 הוא שהצלחנו לקחת כמות גדולה של מידע מהרבה דוברי סינית 88 00:04:18,598 --> 00:04:21,128 ולייצר מערכת של טקסט-לדיבור 89 00:04:21,128 --> 00:04:25,801 שלוקחת טקסט בסינית והופכת אותו לשפה סינית, 90 00:04:25,801 --> 00:04:29,929 ואז לקחנו כשעה של הקול שלי 91 00:04:29,929 --> 00:04:31,820 והשתמשנו בזה כדי להתאים 92 00:04:31,820 --> 00:04:36,364 את המערכת הסטנדרטית של טקסט-לדיבור כך שהיא תישמע כמוני. 93 00:04:36,364 --> 00:04:38,904 שוב, התוצאה לא מושלמת. 94 00:04:38,904 --> 00:04:41,552 יש למעשה די הרבה שגיאות. 95 00:04:41,552 --> 00:04:44,036 (בסינית) 96 00:04:44,036 --> 00:04:47,403 (מחיאות כפיים) 97 00:04:49,446 --> 00:04:53,022 יש הרבה עבודה לעשות בתחום הזה. 98 00:04:53,022 --> 00:04:56,667 (סינית) 99 00:04:56,667 --> 00:05:00,100 (מחיאות כפיים) 100 00:05:01,345 --> 00:05:04,744 (ג'רמי הווארד:) ובכן, זה היה בכנס למידה חישובית בסין. 101 00:05:04,744 --> 00:05:07,114 זה די נדיר, למעשה, בכנסים אקדמאים 102 00:05:07,114 --> 00:05:09,011 לשמוע מחיאות כפיים ספונטניות, 103 00:05:09,011 --> 00:05:12,687 למרות שכמובן לפעמים בכנסים של TEDx, הרגישו חופשי. 104 00:05:12,687 --> 00:05:15,482 כל מה שראיתם שם קרה עם למידה עמוקה. 105 00:05:15,482 --> 00:05:17,007 (מחיאות כפיים) תודה. 106 00:05:17,007 --> 00:05:19,289 התמלול לאנגלית היה למידה עמוקה. 107 00:05:19,289 --> 00:05:22,701 התרגום לסינית והטקסט מימין למעלה- למידה עמוקה. 108 00:05:22,701 --> 00:05:26,008 והבניה של הקול היתה למידה עמוקה גם כן. 109 00:05:26,008 --> 00:05:29,242 אז למידה עמוקה היא דבר מדהים. 110 00:05:29,242 --> 00:05:32,341 זה אלגוריתם יחיד שיכול לעשות כמעט הכל. 111 00:05:32,341 --> 00:05:35,452 וגיליתי ששנה קודם לכן, הוא גם למד לראות. 112 00:05:35,452 --> 00:05:37,628 בתחרות לא מוכרת בגרמניה 113 00:05:37,628 --> 00:05:40,225 בשם הבוחן הגרמני לביצועי זיהוי שלטי תנועה 114 00:05:40,225 --> 00:05:43,618 למידה עמוקה למדה לזהות שלטי תנועה כמו זה 115 00:05:43,618 --> 00:05:45,712 היא לא רק זיהתה את השלטים 116 00:05:45,712 --> 00:05:47,470 יותר טוב מכל אלגוריתם אחר, 117 00:05:47,470 --> 00:05:50,189 לוח התוצאות ממש הראה שהיא יותר טובה מאנשים, 118 00:05:50,189 --> 00:05:52,041 בערך פי 2 יותר טוב מאנשים. 119 00:05:52,041 --> 00:05:54,037 אז עד 2011, היתה לנו את הדוגמה הראשונה 120 00:05:54,037 --> 00:05:57,442 למחשבים שיכולים לראות יותר טוב מאנשים. 121 00:05:57,442 --> 00:05:59,491 מאז, הרבה התרחש. 122 00:05:59,491 --> 00:06:03,005 ב-2012, גוגל הכריזה שהיא נתנה לאלגוריתם למידה עמוקה 123 00:06:03,005 --> 00:06:04,420 לצפות בסרטוני יוטיוב 124 00:06:04,420 --> 00:06:07,857 והם עבדו על הנתונים על 16,000 מחשבים למשך חודש, 125 00:06:07,857 --> 00:06:12,218 והמחשב למד באופן עצמאי על מושגים כמו אנשים וחתולים 126 00:06:12,218 --> 00:06:14,027 רק מצפייה בסרטונים. 127 00:06:14,027 --> 00:06:16,379 זה מאוד דומה לדרך בה אנשים לומדים. 128 00:06:16,379 --> 00:06:19,119 בני אדם לא לומדים על ידי כך שאומרים להם מה הם רואים, 129 00:06:19,119 --> 00:06:22,450 אלא על ידי למידה עצמאית של מהם אותם דברים. 130 00:06:22,450 --> 00:06:25,819 גם ב-2012, ג'פרי הינטון, שראינו קודם, 131 00:06:25,819 --> 00:06:28,677 ניצח בתחרות אימג'נט המאוד פופולרית, 132 00:06:28,677 --> 00:06:32,818 שביקשה לנסות לגלות על 1.5 מיליון תמונות 133 00:06:32,818 --> 00:06:34,256 תמונות של מה הן. 134 00:06:34,256 --> 00:06:37,789 נכון ל-2014, ירדנו לשיעור שגיאות של 6% 135 00:06:37,789 --> 00:06:39,242 בזיהוי תמונה. 136 00:06:39,242 --> 00:06:41,268 זה יותר טוב מאנשים, שוב. 137 00:06:41,268 --> 00:06:45,037 אז מכונות באמת עושות עבודה מצויינת בכך, 138 00:06:45,037 --> 00:06:47,306 וזה עכשיו נכנס לשימוש בתעשייה. 139 00:06:47,306 --> 00:06:50,348 למשל, גוגל הכריזה בשנה שעברה 140 00:06:50,348 --> 00:06:54,933 שהם מיפו כל מיקום ומיקום בצרפת תוך שעתיים, 141 00:06:54,933 --> 00:06:58,380 והדרך בה הם עשו זאת היתה הזנת תמונות רחוב 142 00:06:58,380 --> 00:07:02,699 לאלגוריתם למידה עמוקה שיזהה ויקרא מספרי רחובות. 143 00:07:02,699 --> 00:07:04,919 דמיינו כמה זמן זה היה לוקח בעבר: 144 00:07:04,919 --> 00:07:08,274 עשרות אנשים, שנים רבות. 145 00:07:08,274 --> 00:07:10,185 זה גם קורה בסין. 146 00:07:10,185 --> 00:07:14,221 באידו הוא סוג של הגוגל הסיני, אני מניח. 147 00:07:14,221 --> 00:07:16,504 ומה שרואים כאן בשמאל למעלה 148 00:07:16,504 --> 00:07:20,478 הוא דוגמה לתמונה שאני העליתי למערכת הלמידה העמוקה של באידו, 149 00:07:20,478 --> 00:07:24,247 ומתחת אפשר לראות שהמערכת הבינה מה התמונה 150 00:07:24,247 --> 00:07:26,483 ומצאה תמונות דומות. 151 00:07:26,483 --> 00:07:29,219 לתמונות הדומות למעשה יש רקעים דומים, 152 00:07:29,219 --> 00:07:30,877 כיווני פרצופים דומים, 153 00:07:30,877 --> 00:07:32,665 אפילו כמה עם הלשון בחוץ. 154 00:07:32,665 --> 00:07:35,695 זה לא להסתכל על טקסט של דף אינטרנט. 155 00:07:35,695 --> 00:07:37,107 כל מה שאני העליתי היה תמונה. 156 00:07:37,107 --> 00:07:41,128 אז כעת יש לנו מחשבים שבאמת מבינים מה הם רואים 157 00:07:41,128 --> 00:07:42,752 ולכן יכולים לחפש במאגרי מידע 158 00:07:42,752 --> 00:07:46,306 של מאות מיליוני תמונות בזמן אמת. 159 00:07:46,306 --> 00:07:49,536 אז מה זה אומר עכשיו שמחשבים יכולים לראות? 160 00:07:49,536 --> 00:07:51,553 ובכן, זה לא רק שמחשבים יכולים לראות. 161 00:07:51,553 --> 00:07:53,622 למעשה, למידה עמוקה עשתה יותר מכך. 162 00:07:53,622 --> 00:07:56,570 משפטים מורכבים עם ניואנסים, כמו זה 163 00:07:56,570 --> 00:07:59,394 הם כעת מובנים בעזרת אלגוריתמים של למידה עמוקה. 164 00:07:59,394 --> 00:08:00,697 כמו שאתם רואים פה, 165 00:08:00,697 --> 00:08:03,465 המערכת הזו שמבוססת בסטנפורד שמראה את הנקודה האדומה למעלה 166 00:08:03,465 --> 00:08:07,384 הבינה שהמשפט הזה מבטא רגש שלילי. 167 00:08:07,384 --> 00:08:10,790 למידה עמוקה היא כעת למעשה כמעט ברמה של בן אדם 168 00:08:10,802 --> 00:08:15,923 בלהבין על מה משפטים מדברים ומה הם אומרים על אותם דברים. 169 00:08:15,923 --> 00:08:18,651 בנוסף, עשו שימוש בלמידה עמוקה לקריאת סינית, 170 00:08:18,651 --> 00:08:21,807 שוב, בערך ברמה של דובר סינית מלידה. 171 00:08:21,807 --> 00:08:23,975 האלגוריתם הזה שפותח בשוויץ 172 00:08:23,975 --> 00:08:27,331 על ידי אנשים שאף אחד מהם לא דובר או מבין סינית. 173 00:08:27,331 --> 00:08:29,382 כמו שאמרתי, שימוש בלמידה עמוקה 174 00:08:29,382 --> 00:08:31,601 היא בערך המערכת הכי טובה בעולם לשם כך, 175 00:08:31,601 --> 00:08:36,718 אפילו בהשוואה להבנה אנושית. 176 00:08:36,718 --> 00:08:39,682 זוהי מערכת אותה אנו בונים בחברה שלי 177 00:08:39,682 --> 00:08:41,728 שמראה איך מחברים את כל הדברים האלה. 178 00:08:41,728 --> 00:08:44,189 אלו תמונות להן לא מצורף טקסט, 179 00:08:44,189 --> 00:08:46,541 וכשאני מקליד את המשפטים האלה כאן, 180 00:08:46,541 --> 00:08:49,510 בזמן אמת זה מבין את התמונות האלו 181 00:08:49,510 --> 00:08:51,189 ומבין על מה הן 182 00:08:51,189 --> 00:08:54,352 ומבין שהתמונות דומות לטקסט שאני כותב. 183 00:08:54,352 --> 00:08:57,108 אז אתם רואים, זה למעשה מבין את המשפטים שלי 184 00:08:57,108 --> 00:08:59,332 וממש מבין את התמונות הללו. 185 00:08:59,332 --> 00:09:01,891 אני יודע שראיתם משהו דומה בגוגל, 186 00:09:01,891 --> 00:09:04,666 שבו אפשר להקליד דברים וזה מראה לך תמונות, 187 00:09:04,666 --> 00:09:08,090 אבל למעשה מה שזה עושה זה לחפש בדף האינטרנט אחר טקסט. 188 00:09:08,090 --> 00:09:11,091 זה מאוד שונה מאשר ממש להבין את התמונות. 189 00:09:11,091 --> 00:09:13,843 זה משהו שמחשבים היו מסוגלים לעשות 190 00:09:13,843 --> 00:09:17,091 בפעם הראשונה רק בחודשים האחרונים. 191 00:09:17,091 --> 00:09:21,182 אז אנו רואים עכשיו שמחשבים יכולים לא רק לראות אלא גם לקרוא, 192 00:09:21,182 --> 00:09:24,947 וכמובן, הראינו שהם יכולים להבין את מה שהם שומעים. 193 00:09:24,947 --> 00:09:28,389 אולי זה לא מפתיע כעת שאני עומד לספר לכם שהם יכולים לכתוב. 194 00:09:28,389 --> 00:09:33,172 הנה טקסט שייצרתי על ידי אלגוריתם למידה עמוקה אתמול. 195 00:09:33,172 --> 00:09:37,096 והנה טקסט שאלגוריתם מסטנפורד ייצר. 196 00:09:37,096 --> 00:09:38,860 כל אחד מהמשפטים הללו נוצר 197 00:09:38,860 --> 00:09:43,109 על יגי אלגוריתם למידה עמוקה על מנת לתאר כל אחת מהתמונות האלו. 198 00:09:43,109 --> 00:09:47,581 האלגוריתם הזה לא ראה לפני כן מעולם איש בחולצה שחורה שמנגן בגיטרה. 199 00:09:47,581 --> 00:09:49,801 הוא ראה אדם בעבר, הוא ראה שחור בעבר, 200 00:09:49,801 --> 00:09:51,400 הוא ראה גיטרה בעבר, 201 00:09:51,400 --> 00:09:55,694 אך הוא ייצר באופן עצמאי את התיאור החדש של התמונה. 202 00:09:55,694 --> 00:09:59,196 אנחנו עדיין לא בדיוק ברמה אנושית כאן, אך אנחנו קרובים. 203 00:09:59,196 --> 00:10:03,264 במבחנים, בני אדם מעדיפים את הכותרת המיוצרת על ידי מחשב 204 00:10:03,264 --> 00:10:04,791 אחת לכל ארבע פעמים. 205 00:10:04,791 --> 00:10:06,855 עכשיו המערכת הזו היא רק בת שבועיים, 206 00:10:06,855 --> 00:10:08,701 אז סביר שמתישהו בשנה הבאה, 207 00:10:08,701 --> 00:10:11,502 האלגוריתם הממוחשב יעבור בהרבה את היכולות האנושיות 208 00:10:11,502 --> 00:10:13,364 בקצב שבו דברים מתקדמים. 209 00:10:13,364 --> 00:10:16,413 אז מחשבים גם יכולים לכתוב. 210 00:10:16,413 --> 00:10:19,888 אם לוקחים את כל זה יחד זה מוביל לאפשרויות מרגשות. 211 00:10:19,888 --> 00:10:21,380 למשל, ברפואה, 212 00:10:21,380 --> 00:10:23,905 צוות בבוסטון הכריז שהם גילו 213 00:10:23,905 --> 00:10:26,854 עשרות מאפיינים רלוונטיים קלינית 214 00:10:26,854 --> 00:10:31,120 של גידולים, שיכולים לעזור לרופאים לקבל פרוגנוזה של הסרטן. 215 00:10:32,220 --> 00:10:34,516 באופן דומה, בסטנפורד, 216 00:10:34,516 --> 00:10:38,179 קבוצה הכריזה כי, לאחר שהסתכלו על רקמות בהגדלה, 217 00:10:38,179 --> 00:10:40,560 הם פיתחו מערכת מבוססת למידה חישובית 218 00:10:40,560 --> 00:10:43,142 שהיא למעשה טובה יותר מפתולוגים אנושיים 219 00:10:43,142 --> 00:10:47,519 בחיזוי סיכויי הישרדות עבור הסובלים מסרטן. 220 00:10:47,519 --> 00:10:50,764 בשני המקרים האלה, לא רק שהתחזיות היו יותר מדוייקות, 221 00:10:50,764 --> 00:10:53,266 אלא שהן גם הפיקו מדע חדש בעל תובנות. 222 00:10:53,276 --> 00:10:54,781 במקרה של הרדיולוגיה, 223 00:10:54,781 --> 00:10:57,876 היו אינדיקטורים קליניים חדשים שבני אדם יכולים להבין. 224 00:10:57,876 --> 00:10:59,668 במקרה הזה של הפתולוגיה, 225 00:10:59,668 --> 00:11:04,168 המערכת הממוחשבת גילתה למעשה שהתאים שסביב הסרטן 226 00:11:04,168 --> 00:11:07,508 הם חשובים כמו תאי הסרטן עצמם 227 00:11:07,508 --> 00:11:09,240 לאבחנה. 228 00:11:09,240 --> 00:11:14,621 זה ההיפך ממה שפתולוגים למדו במשך עשורים. 229 00:11:14,621 --> 00:11:17,913 בכל אחד משני המקרים הללו, אלו היו מערכות שפותחו 230 00:11:17,913 --> 00:11:21,534 על ידי שילוב של מומחים רפואיים ומומחי למידה חישובית, 231 00:11:21,534 --> 00:11:24,275 אך החל מהשנה שעברה, אנחנו מעבר גם לכך. 232 00:11:24,275 --> 00:11:27,824 הנה דוגמה לזיהוי איזורים סרטניים 233 00:11:27,824 --> 00:11:30,354 ברקמה אנושית תחת מיקרוסקופ. 234 00:11:30,354 --> 00:11:34,967 המערכת שאתם רואים כאן יכולה לזהות את אותם איזורים באופו יותר מדוייק, 235 00:11:34,967 --> 00:11:37,742 או בערך מדוייק באותה מידה, כמו פתולוג אנושי, 236 00:11:37,742 --> 00:11:41,134 אך נבנתה אך ורק על ידי למידה עמוקה, ללא מומחיות רפואית 237 00:11:41,134 --> 00:11:43,660 על ידי אנשים שאין להם רקע בתחום כלל. 238 00:11:44,730 --> 00:11:47,285 באופן דומה, כאן, הסגמנטציה של הנוירון. 239 00:11:47,285 --> 00:11:50,953 אנו יכולים כעת לחלק נוירונים לסגמנטים כמעט באופן מדוייק כמו בני אדם, 240 00:11:50,953 --> 00:11:53,670 אך המערכת הזו פותחה על ידי למידה עמוקה 241 00:11:53,670 --> 00:11:56,921 ואנשים ללא רקע ברפואה. 242 00:11:56,921 --> 00:12:00,148 אז אני, כמישהו ללא רקע ברפואה, 243 00:12:00,148 --> 00:12:03,875 נראה שאני מספיק מצוייד להקים חברה רפואית חדשה. 244 00:12:03,875 --> 00:12:06,021 וזה מה שעשיתי. 245 00:12:06,021 --> 00:12:07,761 הייתי די מבועת מכך, 246 00:12:07,761 --> 00:12:10,650 אבל התיאוריה הציעה שזה צריך להיות אפשרי 247 00:12:10,650 --> 00:12:16,142 לעשות רפואה שימושית בשימוש בטכניקות אנליזת מידע בלבד. 248 00:12:16,142 --> 00:12:18,622 ולמרבה המזל, המשוב היה פנטסנטי, 249 00:12:18,622 --> 00:12:20,978 לא רק מהתקשורת אלא גם מהקהילה הרפואית, 250 00:12:20,978 --> 00:12:23,322 שהיו מאוד תומכים. 251 00:12:23,322 --> 00:12:27,471 התאוריה היא שאנחנו יכולים לקחת את חלק הביניים של התהליך הרפואי 252 00:12:27,471 --> 00:12:30,364 ולהפוך אותו לאנליזת מידע ככל הניתן, 253 00:12:30,364 --> 00:12:33,429 ולאפשר לרופאים לעשות את מה שהם הכי טובים בו. 254 00:12:33,429 --> 00:12:35,031 אני רוצה לתת לכם דוגמה. 255 00:12:35,031 --> 00:12:39,975 כיום זה לוקח 15 דקות לייצר מבחן דיאגנוסטי חדש 256 00:12:39,975 --> 00:12:41,929 ואני אראה לכם זאת בזמן אמת עכשיו, 257 00:12:41,929 --> 00:12:45,416 אבל דחסתי את זה ל-3 דקות על ידי הוצאת כמה חלקים. 258 00:12:45,416 --> 00:12:48,477 במקום להראות לכם יצירת מבחן דיאגנוסטי רפואי חדש, 259 00:12:48,477 --> 00:12:51,846 אני הולך להראות לכם מבחן דיאגנוסטי של תמונות של מכוניות, 260 00:12:51,846 --> 00:12:54,068 בגלל שזה משהו שכולנו יכולים להבין. 261 00:12:54,068 --> 00:12:57,269 אז הנה אנחנו מתחילים עם בערך 1.5 מיליון תמונות של מכוניות, 262 00:12:57,269 --> 00:13:00,475 ואני רוצה ליצור משהו שיכול לפצל אותם לזוית 263 00:13:00,475 --> 00:13:02,698 שבה התמונה צולמה. 264 00:13:02,698 --> 00:13:06,586 אז התמונות האלה הן לגמרי לא מתוייגות, אז אני צריך להתחיל מאפס. 265 00:13:06,586 --> 00:13:08,451 בעזרת אלגוריתם הלמידה העמוקה שלנו, 266 00:13:08,451 --> 00:13:12,158 הוא יכול לזהות אוטומטית איזורים של מבנה בתמונות אלו. 267 00:13:12,158 --> 00:13:15,778 אז הדבר הנחמד הוא שהאדם והמחשב יכולים לעבוד עתה יחד. 268 00:13:15,778 --> 00:13:17,956 אז האדם, כמו שאתם רואים כאן, 269 00:13:17,956 --> 00:13:20,631 אומר למחשב על איזורי עניין 270 00:13:20,631 --> 00:13:25,281 שהוא רוצה שהמחשב ינסה להשתמש בהם לשיפור האלגוריתם. 271 00:13:25,281 --> 00:13:29,577 כעת, מערכות הלמידה העמוקה הללו הן למעשה בחלל בעל 16,000 מימדים, 272 00:13:29,577 --> 00:13:33,009 אז אתם רואים כאן שהמחשב מסובב זאת דרך המרחב הזה, 273 00:13:33,009 --> 00:13:35,001 ומנסה למצוא איזורים חדשים של מבנה. 274 00:13:35,001 --> 00:13:36,776 וכשהוא מצליח, 275 00:13:36,776 --> 00:13:40,471 האדם שנוהג בו יכול לציין את האיזורים שמעניינים. 276 00:13:40,471 --> 00:13:43,208 אז הנה, המחשב מצא בהצלחה איזורים, 277 00:13:43,208 --> 00:13:45,770 לדוגמה, זוויות. 278 00:13:45,770 --> 00:13:47,376 אז כשאנחנו מתקדמים בתהליך הזה, 279 00:13:47,376 --> 00:13:49,716 אנחנו בהדרגה אומרים למחשב עוד ועוד 280 00:13:49,716 --> 00:13:52,144 אודות סוגי המבנים שאנחנו מחפשים. 281 00:13:52,144 --> 00:13:53,916 אתם יכולים לדמיין זאת במבחן דיאגנוסטי 282 00:13:53,916 --> 00:13:57,266 זה יהיה פתולוג שמזהה איזורי מחלה, לדוגמה, 283 00:13:57,266 --> 00:14:02,292 או רדיולוג שמצביע על קשריות שיכולות להיות בעייתיות. 284 00:14:02,292 --> 00:14:04,851 ולפעמים זה יכול להיות קשה לאלגוריתם. 285 00:14:04,851 --> 00:14:06,815 במקרה הזה, הוא די התבלבל. 286 00:14:06,815 --> 00:14:09,365 החלקים הקדמיים והאחוריים של המכוניות מעורבבים. 287 00:14:09,365 --> 00:14:11,437 אז כאן עלינו להיות טיפה יותר זהירים, 288 00:14:11,437 --> 00:14:14,669 ולבחור באופן ידני את החלקים הקדמיים בניגוד לאלו האחוריים, 289 00:14:14,669 --> 00:14:20,175 ואז להגיד למחשב שזו סוג של קבוצה 290 00:14:20,175 --> 00:14:21,523 שאנחנו מעונינים בה. 291 00:14:21,523 --> 00:14:24,200 אז אנחנו עושים זאת למשך זמן מה, מדלגים על קצת, 292 00:14:24,200 --> 00:14:26,446 ואז אנחנו מאמנים את אלגוריתם הלמידה החישובית 293 00:14:26,446 --> 00:14:28,420 בהתבסס על אותם 200 דברים, 294 00:14:28,420 --> 00:14:30,445 ומקווים שהוא השתפר בהרבה. 295 00:14:30,445 --> 00:14:33,518 אתם רואים, הוא התחיל להדהות כמה מהתמונות האלו, 296 00:14:33,518 --> 00:14:38,226 ומראה לנו שהוא כבר מזהה איך להבין כמה מאלה בעצמו. 297 00:14:38,226 --> 00:14:41,128 אז אנחנו יכולים להשתמש בקונספט הזה של תמונות דומות, 298 00:14:41,128 --> 00:14:43,222 ועל ידי שימוש בתמונות דומות, אתם יכולים עכשיו לראות, 299 00:14:43,222 --> 00:14:47,241 שהמחשב בנקודה זו מסוגל למצוא רק את החזית של מכוניות. 300 00:14:47,241 --> 00:14:50,189 אז בנקודה זו, האדם יכול לומר למחשב, 301 00:14:50,189 --> 00:14:52,482 אוקיי, כן, עשית עבודה טובה. 302 00:14:53,652 --> 00:14:55,837 לפעמים, כמובן, אפילו בנקודה זו 303 00:14:55,837 --> 00:14:59,511 זה עדיין קשה להפריד בין קבוצות. 304 00:14:59,511 --> 00:15:03,395 במקרה הזה, אפילו אחרי שאנחנו נותנים למחשב לנסות לסובב זאת למשך זמן מה, 305 00:15:03,399 --> 00:15:06,744 אנחנו עדיין מוצאים שהתמונות של הצדדים השמאלייים והימניים 306 00:15:06,744 --> 00:15:08,222 מעורבבות זו בזו. 307 00:15:08,222 --> 00:15:10,362 אז אנחנו שוב יכולים לתת למחשב כמה רמזים, 308 00:15:10,362 --> 00:15:13,338 ולהגיד, אוקיי, נסה למצוא תכנית שמפרידה 309 00:15:13,338 --> 00:15:15,945 את צד ימין מצד שמאל עד כמה שניתן 310 00:15:15,945 --> 00:15:18,067 על ידי שימוש באלגוריתם הלמידה העמוקה הזה. 311 00:15:18,067 --> 00:15:21,009 ואחרי שנתנו לו את הרמז הזה-- אה, אוקיי, הוא הצליח. 312 00:15:21,009 --> 00:15:23,891 הוא הצליח למצוא דרך לחשוב על האובייקטים האלה 313 00:15:23,891 --> 00:15:26,271 שהפרידו את זה יחד. 314 00:15:26,271 --> 00:15:28,709 אז אתם מבינים את הרעיון פה. 315 00:15:28,709 --> 00:15:36,906 זה לא מקרה שבו האדם מוחלף על ידי המחשב, 316 00:15:36,906 --> 00:15:39,546 אלא שהם עובדים יחד. 317 00:15:39,546 --> 00:15:43,096 מה שאנחנו עושים כאן הוא להחליף משהו שהיה לוקח לצוות 318 00:15:43,096 --> 00:15:45,098 של חמישה או שישה אנשים בערך שבע שנים 319 00:15:45,098 --> 00:15:47,703 ומחליפים אותו במשהו שלוקח 15 דקות 320 00:15:47,703 --> 00:15:50,208 לאדם אחד שפועל לבד. 321 00:15:50,208 --> 00:15:54,158 אז התהליך הזה לוקח בערך ארבע או חמש חזרות. 322 00:15:54,158 --> 00:15:56,017 אתם רואים עכשיו שיש לנו 62 אחוז 323 00:15:56,017 --> 00:15:58,976 מ-1.5 מיליון התמונות שלנו מסווגות נכונה. 324 00:15:58,976 --> 00:16:01,448 בנקודה זו, אנחנו יכולים להתחיל די במהירות 325 00:16:01,448 --> 00:16:02,745 לקחת חלקם גדולים במלואם, 326 00:16:02,745 --> 00:16:05,664 לעבור עליהם ולוודא שאין טעויות. 327 00:16:05,664 --> 00:16:09,616 היכן שישנן טעויות, אנו יכולים ליידע את המחשב עליהן. 328 00:16:09,616 --> 00:16:12,661 ועל ידי שימוש בסוג זה של תהליך עבור כל אחת מהקבוצות השונות, 329 00:16:12,661 --> 00:16:15,148 אנחנו עכשיו מגיעים ל-80 אחוזי הצלחה 330 00:16:15,148 --> 00:16:17,563 בסיווג מיליון וחצי התמונות. 331 00:16:17,563 --> 00:16:19,641 ובנקודה זו, זהו רק מקרה 332 00:16:19,641 --> 00:16:23,220 של מציאת המספר הקטן שלא מסווג כראוי, 333 00:16:23,220 --> 00:16:26,108 ולנסות להבין למה. 334 00:16:26,108 --> 00:16:27,851 על ידי שימוש בגישה זו, 335 00:16:27,851 --> 00:16:31,972 תוך 15 דקות אנו מגיעים ל-97 אחוזי סיווג. 336 00:16:31,972 --> 00:16:36,572 אז סוג כזה של טכניקה יכול לאפשר לנו לתקן בעיה גדולה, 337 00:16:36,578 --> 00:16:39,614 שהיא שיש חוסר במומחיות רפואית בעולם. 338 00:16:39,614 --> 00:16:43,103 פורום הכלכלה העולמי אומר שיש בין 10X ו-20X 339 00:16:43,103 --> 00:16:45,727 של מחסור ברופאים בעולם המתפתח, 340 00:16:45,727 --> 00:16:47,395 ושזה ייקח בערך 300 שנה 341 00:16:47,395 --> 00:16:50,734 לאמן מספיק אנשים לתקן את הבעיה הזו. 342 00:16:50,734 --> 00:16:53,619 אז דמיינו אם היינו יכולים לעזור להגביר את היעילות שלהם 343 00:16:53,619 --> 00:16:56,458 על ידי שימוש בגישת הלמידה העמוקה הזו? 344 00:16:56,458 --> 00:16:58,690 אז אני מאוד מתרגש מהאפשרויות. 345 00:16:58,690 --> 00:17:01,279 אני גם מאוד מודאג מהבעיות. 346 00:17:01,279 --> 00:17:04,403 הבעיה כאן היא שכל איזור בכחול על המפה 347 00:17:04,403 --> 00:17:08,172 הוא מקום שבו שירותים הם מעל ל-80 אחוז מהתעסוקה. 348 00:17:08,172 --> 00:17:09,959 מה זה שירותים? 349 00:17:09,959 --> 00:17:11,473 אלו שירותים. 350 00:17:11,473 --> 00:17:15,627 אלו הם גם בדיוק הדברים שמחשבים בדיוק למדו איך לעשות. 351 00:17:15,627 --> 00:17:19,431 אז 80 אחוז מהתעסוקה העולמית בעולם המפותח 352 00:17:19,431 --> 00:17:21,963 הם דברים שמחשבים בדיוק למדו איך לעשות. 353 00:17:21,963 --> 00:17:23,403 מה זה אומר? 354 00:17:23,403 --> 00:17:25,986 ובכן, זה יהיה בסדר. הן יוחלפו בעבודות אחרות. 355 00:17:25,986 --> 00:17:28,693 למשל, יהיו יותר עבודות עבור מדעני נתונים. 356 00:17:28,693 --> 00:17:29,510 ובכן, לא באמת. 357 00:17:29,510 --> 00:17:32,628 לא לוקח למדענים זמן רב לבנות את הדברים הללו. 358 00:17:32,628 --> 00:17:35,880 למשל, ארבעת האלגוריתמים האלה נבנו כולם על ידי אותו אדם. 359 00:17:35,880 --> 00:17:38,318 אז אם אתם חושבים, הו, כל זה כבר קרה בעבר, 360 00:17:38,318 --> 00:17:42,138 ראינו את התוצאות בעבר כאשר דברים חדשים הגיעו 361 00:17:42,138 --> 00:17:44,378 והם מוחלפים בעבודות חדשות, 362 00:17:44,378 --> 00:17:46,489 אבל מה העבודות החדשות הללו הולכות להיות? 363 00:17:46,489 --> 00:17:48,860 זה מאוד קשה בשבילנו להעריך זאת, 364 00:17:48,860 --> 00:17:51,103 בגלל שהביצועים האנושיים גדלים בקצב ההדרגתי הזה, 365 00:17:51,103 --> 00:17:53,672 אבל יש לנו עכשיו מערכת, למידה עמוקה, 366 00:17:53,672 --> 00:17:56,884 שאנחנו יודעים שממש גדלה ביכולות שלה באופן אקספוננציאלי. 367 00:17:56,884 --> 00:17:58,501 ואנחנו כאן. 368 00:17:58,501 --> 00:18:00,566 אז כרגע, אנחנו רואים את הדברים שסביבנו 369 00:18:00,566 --> 00:18:03,237 ואומרים, "הו, מחשבים הם עדיין די טיפשים." נכון? 370 00:18:03,237 --> 00:18:06,063 אבל תוך חמש שנים, מחשבים יהיו מחוץ לטבלה הזו. 371 00:18:06,063 --> 00:18:10,329 אז אנחנו צריכים להתחיל לחשוב על היכולת הזו כבר עכשיו. 372 00:18:10,329 --> 00:18:12,167 ראינו את זה קורה בעבר, כמובן. 373 00:18:12,167 --> 00:18:13,966 במהפכה התעשייתית, 374 00:18:13,966 --> 00:18:16,817 ראינו שינוי משמעותי ביכולות הודות למנועים. 375 00:18:17,667 --> 00:18:20,805 העניין הוא שאחרי זמן מה, העניינים השתטחו. 376 00:18:20,805 --> 00:18:22,507 הייתה הפרעה חברתית, 377 00:18:22,507 --> 00:18:25,946 אבל ברגע שהשתמשו במנועים על מנת לייצר חשמל בכל המצבים, 378 00:18:25,946 --> 00:18:28,300 דברים התחילו להירגע. 379 00:18:28,300 --> 00:18:29,773 מהפיכת הלמידה החישובית 380 00:18:29,773 --> 00:18:32,682 הולכת להיות שונה מאוד מהמהפיכה התעשייתית, 381 00:18:32,682 --> 00:18:35,632 כיוון שמהפיכת הלמידה החישובית, היא לעולם לא נרגעת. 382 00:18:35,632 --> 00:18:38,614 ככל שמחשבים יהיו יותר טובים בפעילוית אינטלקטואליות, 383 00:18:38,614 --> 00:18:42,862 כך הם יכולים לבנות מחשבים טובים יותר שיהיו טובים יותר ביכולות אינטלקטואליות, 384 00:18:42,862 --> 00:18:44,770 אז זה הולך להיות סוג של שינוי 385 00:18:44,770 --> 00:18:47,248 שהעולם למעשה לא חווה מעולם, 386 00:18:47,248 --> 00:18:50,554 אז ההבנה הקודמת שלכם של מה אפשרי, היא שונה. 387 00:18:50,974 --> 00:18:52,754 זה כבר מכה בנו. 388 00:18:52,754 --> 00:18:56,384 ב-25 השנים האחרונות, כשפריון ההון הולך וגדל, 389 00:18:56,400 --> 00:19:00,588 פריון העבודה נשאר שטוח, למעשה אפילו מעט ירד. 390 00:19:01,408 --> 00:19:04,149 אז אני רוצה שאנחנו נתחיל לנהל את הדיון הזה כעת. 391 00:19:04,149 --> 00:19:07,176 אני יודע שהרבה פעמים כשאני מספר לאנשים על המצב הזה, 392 00:19:07,176 --> 00:19:08,666 אנשים יכולים לבטל אותי. 393 00:19:08,666 --> 00:19:10,339 ובכן, מחשבים לא יכולים ממש לחשוב, 394 00:19:10,339 --> 00:19:13,367 הם לא מביעים רגשות, הם לא מבינים שירה, 395 00:19:13,367 --> 00:19:15,888 אנחנו לא ממש מבינים איך הם עובדים. 396 00:19:15,888 --> 00:19:17,374 אז מה? 397 00:19:17,374 --> 00:19:19,178 מחשבים כרגע יכולים לעשות את הדברים 398 00:19:19,178 --> 00:19:21,897 שבני אדם מקבלים תשלום לעשות במשך רוב חייהם, 399 00:19:21,897 --> 00:19:23,628 אז עכשיו הזמן להתחיל לחשוב 400 00:19:23,628 --> 00:19:28,015 על איך אנחנו הולכים להתאים את המבנים החברתיים והכלכליים שלנו 401 00:19:28,015 --> 00:19:29,855 כך שיהיו מודעים למציאות החדשה הזו. 402 00:19:29,855 --> 00:19:31,388 תודה. 403 00:19:31,388 --> 00:19:32,190 (מחיאות כפיים)