WEBVTT 00:00:00.880 --> 00:00:04.893 פעם, אם רצית לגרום למחשב לעשות משהו חדש 00:00:04.893 --> 00:00:06.509 היית צריך לתכנת אותו. 00:00:06.509 --> 00:00:09.423 כעת, תכנות, למי מכם שלא עשו זאת בעצמם, NOTE Paragraph 00:00:09.423 --> 00:00:12.918 דורש לפרוש בפירוט מייגע 00:00:12.918 --> 00:00:16.070 כל צעד וצעד שאתה רוצה שהמחשב יעשה 00:00:16.070 --> 00:00:18.157 על מנת להשיג את המטרה שלך. 00:00:18.157 --> 00:00:22.479 כעת, אם אתה רוצה לעשות משהו שאתה לא יודע איך לעשות בעצמך, 00:00:22.479 --> 00:00:24.325 אז זה הולך להיות אתגר רציני. 00:00:24.325 --> 00:00:27.888 אז זה היה האתגר שעמד בפני האיש הזה, ארתור סמואל. NOTE Paragraph 00:00:27.888 --> 00:00:31.991 ב-1956, הוא רצה לגרום למחשב הזה 00:00:31.991 --> 00:00:34.208 להיות מסוגל להביס אותו בדמקה. 00:00:34.208 --> 00:00:36.008 איך אתה יכול לכתוב תוכנה, 00:00:36.008 --> 00:00:40.098 לפרוש בפירוט מייגע, איך להיות יותר טוב ממך בדמקה? 00:00:40.098 --> 00:00:41.714 אז הוא הגה רעיון: 00:00:41.714 --> 00:00:45.946 הוא נתן למחשב לשחק נגד עצמו אלפי פעמים 00:00:45.946 --> 00:00:48.100 וללמוד איך לשחק דמקה. 00:00:48.100 --> 00:00:51.494 ואכן זה עבד, ולמעשה עד 1962, 00:00:51.494 --> 00:00:54.124 המחשב הזה ניצח את האלוף של קונטיקט. 00:00:55.484 --> 00:00:58.221 אז ארתור סמואל היה אבי הלמידה החישובית. NOTE Paragraph 00:00:58.221 --> 00:00:59.931 ואני חב לו חוב ענק. 00:00:59.931 --> 00:01:02.509 בגלל שאני עוסק בלמידה חישובית. 00:01:02.509 --> 00:01:04.229 הייתי הנשיא של קאגל, 00:01:04.229 --> 00:01:07.649 קהילה שמונה מעל 200,000 אנשים שעוסקים בלמידה חישובית. 00:01:07.649 --> 00:01:10.107 קאגל מארגנת תחרויות 00:01:10.107 --> 00:01:13.605 לנסות ולגרום להם לפתור בעיות שלא נפתרו עד כה, 00:01:13.605 --> 00:01:17.043 וזו הייתה הצלחה מאות פעמים. 00:01:17.043 --> 00:01:19.900 אז מתצפית מנקודת יתרון זו, הצלחתי לגלות 00:01:19.900 --> 00:01:23.700 הרבה על מה שלמידה חישובית יכולה לעשות בעבר, לעשות היום, 00:01:23.712 --> 00:01:25.273 ומה היא יכולה לעשות בעתיד. 00:01:25.273 --> 00:01:30.272 אולי ההצלחה הגדולה הראשונה של למידה חישובית באופן מסחרי הייתה גוגל. 00:01:30.272 --> 00:01:33.480 גוגל הראתה שזה אפשרי למצוא מידע 00:01:33.480 --> 00:01:35.739 על ידי שימוש באלגוריתם ממוחשב, 00:01:35.739 --> 00:01:38.264 והאלגוריתם הזה מבוסס על למידה חישובית. 00:01:38.264 --> 00:01:42.123 מאז, היו הרבה הצלחות מסחריות של למידה ממוחשבת. 00:01:42.123 --> 00:01:44.309 חברות כמו אמזון ונטפליקס 00:01:44.309 --> 00:01:47.496 משתמשות בלמידה חישובית כדי להציע מוצרים שאולי תרצה לקנות, 00:01:47.496 --> 00:01:49.206 סרטים שאולי תרצה לראות. 00:01:49.206 --> 00:01:51.346 לפעמים, זה כמעט מפחיד. 00:01:51.346 --> 00:01:53.413 חברות כמו לינקדאין ופייסבוק 00:01:53.413 --> 00:01:56.101 לפעמים אומרות לך מי עשויים להיות החברים שלך 00:01:56.101 --> 00:01:58.228 ואין לך מושג איך הן עשו את זה, 00:01:58.228 --> 00:02:01.195 וזה בגלל שהן משתמשות בכוחה של הלמידה החישובית. 00:02:01.195 --> 00:02:04.152 אלו הם אלגוריתמים שלמדו איך לעשות זאת מנתונים 00:02:04.152 --> 00:02:07.399 במקום להיות מתוכנתות לעשות זאת באופן ידני. NOTE Paragraph 00:02:07.399 --> 00:02:09.877 כך גם IBM הצליחה 00:02:09.877 --> 00:02:13.739 לגרום לווטסון להביס את שני אלופי העולם ב"ג'פרדי", 00:02:13.739 --> 00:02:16.964 ולענות על שאלות עדינות ומורכבות להפליא כמו זאת: 00:02:16.964 --> 00:02:19.799 ["ה'אריה של נמרוד' העתיק נעלם מהמוזיאון הלאומי של העיר הזאת ב-2003 (יחד עם עוד הרבה דברים)"] 00:02:19.799 --> 00:02:23.034 זו גם הסיבה בגללה אנו עכשיו רואים את המכוניות הראשונות שנוהגות לבד. 00:02:23.034 --> 00:02:25.856 אם אתם רוצים להיות מסוגלים להבחין בין, למשל, 00:02:25.856 --> 00:02:28.488 עץ והולך רגל, ובכן, זה די חשוב. 00:02:28.488 --> 00:02:31.075 אנחנו לא יודעים איך לכתוב את התוכנות הללו באופן ידני, 00:02:31.075 --> 00:02:34.072 אך עם למידה חישובית, זה אפשרי כעת. 00:02:34.072 --> 00:02:36.680 ולמעשה, המכונית הזו נסעה מעל מיליון מיילים 00:02:36.680 --> 00:02:40.186 ללא אף תאונה בכבישים רגילים. NOTE Paragraph 00:02:40.196 --> 00:02:44.110 אז אנחנו יודעים שמחשבים יכולים ללמוד, 00:02:44.110 --> 00:02:46.010 ומחשבים יכולים ללמוד לעשות דברים 00:02:46.010 --> 00:02:48.848 שאנחנו למעשה לפעמים לא יודעים לעשות בעצמנו, 00:02:48.848 --> 00:02:51.733 או אולי יכולים לעשות אותם יותר טוב מאיתנו. 00:02:51.733 --> 00:02:55.928 אחת מהדוגמאות המדהימות ביותר שראיתי ללמידה חישובית 00:02:55.928 --> 00:02:58.320 קרתה בפרוייקט שהובלתי בקאגל 00:02:58.320 --> 00:03:01.911 שבו צוות שהובל על ידי בחור בשם ג'פרי הינטון 00:03:01.911 --> 00:03:03.463 מאוניברסיטת טורונטו 00:03:03.463 --> 00:03:06.140 זכה בתחרות על פיתוח תרופות אוטומטי. 00:03:06.140 --> 00:03:08.987 כעת, מה שמדהים פה זה לא רק שהם ניצחו 00:03:08.987 --> 00:03:13.000 את כל האלגוריתמים שפותחו על ידי מרק או קהילת האקדמיה העולמית, 00:03:13.000 --> 00:03:18.061 אלא שלאף אחד בצוות לא היה רקע בכימיה, ביולוגיה או מדעי החיים, 00:03:18.061 --> 00:03:20.230 והם עשו זאת בשבועיים. 00:03:20.230 --> 00:03:21.611 איך הם עשו זאת? 00:03:22.421 --> 00:03:25.342 הם השתמשו באלגוריתם יוצא דופן שנקרא למידה עמוקה. 00:03:25.342 --> 00:03:28.291 זה היה כל כך חשוב שההצלחה סוקרה 00:03:28.291 --> 00:03:31.412 בניו יורק טיימס במאמר בעמוד הראשי כמה שבועות לאחר מכן. 00:03:31.412 --> 00:03:34.147 זה ג'פרי הינטון כאן משמאל. 00:03:34.147 --> 00:03:38.488 למידה עמוקה הוא אלגוריתם ששואב השראה מהמוח האנושי, 00:03:38.488 --> 00:03:40.300 וכתוצאה מכך הוא אלגוריתם 00:03:40.300 --> 00:03:44.141 שאין לו מגבלות תיאורטיות על מה שהוא מסוגל לעשות. 00:03:44.141 --> 00:03:46.964 ככל שנותנים לו יותר נתונים וזמן חישוב, 00:03:46.964 --> 00:03:48.276 כך הוא משתפר. NOTE Paragraph 00:03:48.276 --> 00:03:50.615 הניו יורק טיימס גם הראה במאמר הזה 00:03:50.615 --> 00:03:52.857 תוצאה מדהימה נוספת של למידה חישובית 00:03:52.857 --> 00:03:55.569 שאני הולך להראות לכם כעת. 00:03:55.569 --> 00:04:00.510 הם מראים שמחשבים יכולים להקשיב ולהבין. NOTE Paragraph 00:04:00.510 --> 00:04:03.221 (וידאו) ריצ'רד ראשיד: עכשיו, הצעד האחרון 00:04:03.221 --> 00:04:06.246 שאני רוצה להיות מסוגל לבצע בתהליך הזה 00:04:06.246 --> 00:04:10.961 הוא למעשה לדבר אליכם בסינית. 00:04:10.961 --> 00:04:13.596 עכשיו המפתח פה, 00:04:13.596 --> 00:04:18.598 הוא שהצלחנו לקחת כמות גדולה של מידע מהרבה דוברי סינית 00:04:18.598 --> 00:04:21.128 ולייצר מערכת של טקסט-לדיבור 00:04:21.128 --> 00:04:25.801 שלוקחת טקסט בסינית והופכת אותו לשפה סינית, 00:04:25.801 --> 00:04:29.929 ואז לקחנו כשעה של הקול שלי 00:04:29.929 --> 00:04:31.820 והשתמשנו בזה כדי להתאים 00:04:31.820 --> 00:04:36.364 את המערכת הסטנדרטית של טקסט-לדיבור כך שהיא תישמע כמוני. 00:04:36.364 --> 00:04:38.904 שוב, התוצאה לא מושלמת. 00:04:38.904 --> 00:04:41.552 יש למעשה די הרבה שגיאות. 00:04:41.552 --> 00:04:44.036 (בסינית) 00:04:44.036 --> 00:04:47.403 (מחיאות כפיים) 00:04:49.446 --> 00:04:53.022 יש הרבה עבודה לעשות בתחום הזה. 00:04:53.022 --> 00:04:56.667 (סינית) 00:04:56.667 --> 00:05:00.100 (מחיאות כפיים) NOTE Paragraph 00:05:01.345 --> 00:05:04.744 (ג'רמי הווארד:) ובכן, זה היה בכנס למידה חישובית בסין. 00:05:04.744 --> 00:05:07.114 זה די נדיר, למעשה, בכנסים אקדמאים 00:05:07.114 --> 00:05:09.011 לשמוע מחיאות כפיים ספונטניות, 00:05:09.011 --> 00:05:12.687 למרות שכמובן לפעמים בכנסים של TEDx, הרגישו חופשי. 00:05:12.687 --> 00:05:15.482 כל מה שראיתם שם קרה עם למידה עמוקה. 00:05:15.482 --> 00:05:17.007 (מחיאות כפיים) תודה. 00:05:17.007 --> 00:05:19.289 התמלול לאנגלית היה למידה עמוקה. 00:05:19.289 --> 00:05:22.701 התרגום לסינית והטקסט מימין למעלה- למידה עמוקה. 00:05:22.701 --> 00:05:26.008 והבניה של הקול היתה למידה עמוקה גם כן. NOTE Paragraph 00:05:26.008 --> 00:05:29.242 אז למידה עמוקה היא דבר מדהים. 00:05:29.242 --> 00:05:32.341 זה אלגוריתם יחיד שיכול לעשות כמעט הכל. 00:05:32.341 --> 00:05:35.452 וגיליתי ששנה קודם לכן, הוא גם למד לראות. 00:05:35.452 --> 00:05:37.628 בתחרות לא מוכרת בגרמניה 00:05:37.628 --> 00:05:40.225 בשם הבוחן הגרמני לביצועי זיהוי שלטי תנועה 00:05:40.225 --> 00:05:43.618 למידה עמוקה למדה לזהות שלטי תנועה כמו זה 00:05:43.618 --> 00:05:45.712 היא לא רק זיהתה את השלטים 00:05:45.712 --> 00:05:47.470 יותר טוב מכל אלגוריתם אחר, 00:05:47.470 --> 00:05:50.189 לוח התוצאות ממש הראה שהיא יותר טובה מאנשים, 00:05:50.189 --> 00:05:52.041 בערך פי 2 יותר טוב מאנשים. 00:05:52.041 --> 00:05:54.037 אז עד 2011, היתה לנו את הדוגמה הראשונה 00:05:54.037 --> 00:05:57.442 למחשבים שיכולים לראות יותר טוב מאנשים. 00:05:57.442 --> 00:05:59.491 מאז, הרבה התרחש. 00:05:59.491 --> 00:06:03.005 ב-2012, גוגל הכריזה שהיא נתנה לאלגוריתם למידה עמוקה 00:06:03.005 --> 00:06:04.420 לצפות בסרטוני יוטיוב 00:06:04.420 --> 00:06:07.857 והם עבדו על הנתונים על 16,000 מחשבים למשך חודש, 00:06:07.857 --> 00:06:12.218 והמחשב למד באופן עצמאי על מושגים כמו אנשים וחתולים 00:06:12.218 --> 00:06:14.027 רק מצפייה בסרטונים. 00:06:14.027 --> 00:06:16.379 זה מאוד דומה לדרך בה אנשים לומדים. 00:06:16.379 --> 00:06:19.119 בני אדם לא לומדים על ידי כך שאומרים להם מה הם רואים, 00:06:19.119 --> 00:06:22.450 אלא על ידי למידה עצמאית של מהם אותם דברים. 00:06:22.450 --> 00:06:25.819 גם ב-2012, ג'פרי הינטון, שראינו קודם, 00:06:25.819 --> 00:06:28.677 ניצח בתחרות אימג'נט המאוד פופולרית, 00:06:28.677 --> 00:06:32.818 שביקשה לנסות לגלות על 1.5 מיליון תמונות 00:06:32.818 --> 00:06:34.256 תמונות של מה הן. 00:06:34.256 --> 00:06:37.789 נכון ל-2014, ירדנו לשיעור שגיאות של 6% 00:06:37.789 --> 00:06:39.242 בזיהוי תמונה. 00:06:39.242 --> 00:06:41.268 זה יותר טוב מאנשים, שוב. NOTE Paragraph 00:06:41.268 --> 00:06:45.037 אז מכונות באמת עושות עבודה מצויינת בכך, 00:06:45.037 --> 00:06:47.306 וזה עכשיו נכנס לשימוש בתעשייה. 00:06:47.306 --> 00:06:50.348 למשל, גוגל הכריזה בשנה שעברה 00:06:50.348 --> 00:06:54.933 שהם מיפו כל מיקום ומיקום בצרפת תוך שעתיים, 00:06:54.933 --> 00:06:58.380 והדרך בה הם עשו זאת היתה הזנת תמונות רחוב 00:06:58.380 --> 00:07:02.699 לאלגוריתם למידה עמוקה שיזהה ויקרא מספרי רחובות. 00:07:02.699 --> 00:07:04.919 דמיינו כמה זמן זה היה לוקח בעבר: 00:07:04.919 --> 00:07:08.274 עשרות אנשים, שנים רבות. 00:07:08.274 --> 00:07:10.185 זה גם קורה בסין. 00:07:10.185 --> 00:07:14.221 באידו הוא סוג של הגוגל הסיני, אני מניח. 00:07:14.221 --> 00:07:16.504 ומה שרואים כאן בשמאל למעלה 00:07:16.504 --> 00:07:20.478 הוא דוגמה לתמונה שאני העליתי למערכת הלמידה העמוקה של באידו, 00:07:20.478 --> 00:07:24.247 ומתחת אפשר לראות שהמערכת הבינה מה התמונה 00:07:24.247 --> 00:07:26.483 ומצאה תמונות דומות. 00:07:26.483 --> 00:07:29.219 לתמונות הדומות למעשה יש רקעים דומים, 00:07:29.219 --> 00:07:30.877 כיווני פרצופים דומים, 00:07:30.877 --> 00:07:32.665 אפילו כמה עם הלשון בחוץ. 00:07:32.665 --> 00:07:35.695 זה לא להסתכל על טקסט של דף אינטרנט. 00:07:35.695 --> 00:07:37.107 כל מה שאני העליתי היה תמונה. 00:07:37.107 --> 00:07:41.128 אז כעת יש לנו מחשבים שבאמת מבינים מה הם רואים 00:07:41.128 --> 00:07:42.752 ולכן יכולים לחפש במאגרי מידע 00:07:42.752 --> 00:07:46.306 של מאות מיליוני תמונות בזמן אמת. NOTE Paragraph 00:07:46.306 --> 00:07:49.536 אז מה זה אומר עכשיו שמחשבים יכולים לראות? 00:07:49.536 --> 00:07:51.553 ובכן, זה לא רק שמחשבים יכולים לראות. 00:07:51.553 --> 00:07:53.622 למעשה, למידה עמוקה עשתה יותר מכך. 00:07:53.622 --> 00:07:56.570 משפטים מורכבים עם ניואנסים, כמו זה 00:07:56.570 --> 00:07:59.394 הם כעת מובנים בעזרת אלגוריתמים של למידה עמוקה. 00:07:59.394 --> 00:08:00.697 כמו שאתם רואים פה, 00:08:00.697 --> 00:08:03.465 המערכת הזו שמבוססת בסטנפורד שמראה את הנקודה האדומה למעלה 00:08:03.465 --> 00:08:07.384 הבינה שהמשפט הזה מבטא רגש שלילי. 00:08:07.384 --> 00:08:10.790 למידה עמוקה היא כעת למעשה כמעט ברמה של בן אדם 00:08:10.802 --> 00:08:15.923 בלהבין על מה משפטים מדברים ומה הם אומרים על אותם דברים. 00:08:15.923 --> 00:08:18.651 בנוסף, עשו שימוש בלמידה עמוקה לקריאת סינית, 00:08:18.651 --> 00:08:21.807 שוב, בערך ברמה של דובר סינית מלידה. 00:08:21.807 --> 00:08:23.975 האלגוריתם הזה שפותח בשוויץ 00:08:23.975 --> 00:08:27.331 על ידי אנשים שאף אחד מהם לא דובר או מבין סינית. 00:08:27.331 --> 00:08:29.382 כמו שאמרתי, שימוש בלמידה עמוקה 00:08:29.382 --> 00:08:31.601 היא בערך המערכת הכי טובה בעולם לשם כך, 00:08:31.601 --> 00:08:36.718 אפילו בהשוואה להבנה אנושית. NOTE Paragraph 00:08:36.718 --> 00:08:39.682 זוהי מערכת אותה אנו בונים בחברה שלי 00:08:39.682 --> 00:08:41.728 שמראה איך מחברים את כל הדברים האלה. 00:08:41.728 --> 00:08:44.189 אלו תמונות להן לא מצורף טקסט, 00:08:44.189 --> 00:08:46.541 וכשאני מקליד את המשפטים האלה כאן, 00:08:46.541 --> 00:08:49.510 בזמן אמת זה מבין את התמונות האלו 00:08:49.510 --> 00:08:51.189 ומבין על מה הן 00:08:51.189 --> 00:08:54.352 ומבין שהתמונות דומות לטקסט שאני כותב. 00:08:54.352 --> 00:08:57.108 אז אתם רואים, זה למעשה מבין את המשפטים שלי 00:08:57.108 --> 00:08:59.332 וממש מבין את התמונות הללו. 00:08:59.332 --> 00:09:01.891 אני יודע שראיתם משהו דומה בגוגל, 00:09:01.891 --> 00:09:04.666 שבו אפשר להקליד דברים וזה מראה לך תמונות, 00:09:04.666 --> 00:09:08.090 אבל למעשה מה שזה עושה זה לחפש בדף האינטרנט אחר טקסט. 00:09:08.090 --> 00:09:11.091 זה מאוד שונה מאשר ממש להבין את התמונות. 00:09:11.091 --> 00:09:13.843 זה משהו שמחשבים היו מסוגלים לעשות 00:09:13.843 --> 00:09:17.091 בפעם הראשונה רק בחודשים האחרונים. NOTE Paragraph 00:09:17.091 --> 00:09:21.182 אז אנו רואים עכשיו שמחשבים יכולים לא רק לראות אלא גם לקרוא, 00:09:21.182 --> 00:09:24.947 וכמובן, הראינו שהם יכולים להבין את מה שהם שומעים. 00:09:24.947 --> 00:09:28.389 אולי זה לא מפתיע כעת שאני עומד לספר לכם שהם יכולים לכתוב. 00:09:28.389 --> 00:09:33.172 הנה טקסט שייצרתי על ידי אלגוריתם למידה עמוקה אתמול. 00:09:33.172 --> 00:09:37.096 והנה טקסט שאלגוריתם מסטנפורד ייצר. 00:09:37.096 --> 00:09:38.860 כל אחד מהמשפטים הללו נוצר 00:09:38.860 --> 00:09:43.109 על יגי אלגוריתם למידה עמוקה על מנת לתאר כל אחת מהתמונות האלו. 00:09:43.109 --> 00:09:47.581 האלגוריתם הזה לא ראה לפני כן מעולם איש בחולצה שחורה שמנגן בגיטרה. 00:09:47.581 --> 00:09:49.801 הוא ראה אדם בעבר, הוא ראה שחור בעבר, 00:09:49.801 --> 00:09:51.400 הוא ראה גיטרה בעבר, 00:09:51.400 --> 00:09:55.694 אך הוא ייצר באופן עצמאי את התיאור החדש של התמונה. 00:09:55.694 --> 00:09:59.196 אנחנו עדיין לא בדיוק ברמה אנושית כאן, אך אנחנו קרובים. 00:09:59.196 --> 00:10:03.264 במבחנים, בני אדם מעדיפים את הכותרת המיוצרת על ידי מחשב 00:10:03.264 --> 00:10:04.791 אחת לכל ארבע פעמים. 00:10:04.791 --> 00:10:06.855 עכשיו המערכת הזו היא רק בת שבועיים, 00:10:06.855 --> 00:10:08.701 אז סביר שמתישהו בשנה הבאה, 00:10:08.701 --> 00:10:11.502 האלגוריתם הממוחשב יעבור בהרבה את היכולות האנושיות 00:10:11.502 --> 00:10:13.364 בקצב שבו דברים מתקדמים. 00:10:13.364 --> 00:10:16.413 אז מחשבים גם יכולים לכתוב. NOTE Paragraph 00:10:16.413 --> 00:10:19.888 אם לוקחים את כל זה יחד זה מוביל לאפשרויות מרגשות. 00:10:19.888 --> 00:10:21.380 למשל, ברפואה, 00:10:21.380 --> 00:10:23.905 צוות בבוסטון הכריז שהם גילו 00:10:23.905 --> 00:10:26.854 עשרות מאפיינים רלוונטיים קלינית 00:10:26.854 --> 00:10:31.120 של גידולים, שיכולים לעזור לרופאים לקבל פרוגנוזה של הסרטן. 00:10:32.220 --> 00:10:34.516 באופן דומה, בסטנפורד, 00:10:34.516 --> 00:10:38.179 קבוצה הכריזה כי, לאחר שהסתכלו על רקמות בהגדלה, 00:10:38.179 --> 00:10:40.560 הם פיתחו מערכת מבוססת למידה חישובית 00:10:40.560 --> 00:10:43.142 שהיא למעשה טובה יותר מפתולוגים אנושיים 00:10:43.142 --> 00:10:47.519 בחיזוי סיכויי הישרדות עבור הסובלים מסרטן. 00:10:47.519 --> 00:10:50.764 בשני המקרים האלה, לא רק שהתחזיות היו יותר מדוייקות, 00:10:50.764 --> 00:10:53.266 אלא שהן גם הפיקו מדע חדש בעל תובנות. 00:10:53.276 --> 00:10:54.781 במקרה של הרדיולוגיה, 00:10:54.781 --> 00:10:57.876 היו אינדיקטורים קליניים חדשים שבני אדם יכולים להבין. 00:10:57.876 --> 00:10:59.668 במקרה הזה של הפתולוגיה, 00:10:59.668 --> 00:11:04.168 המערכת הממוחשבת גילתה למעשה שהתאים שסביב הסרטן 00:11:04.168 --> 00:11:07.508 הם חשובים כמו תאי הסרטן עצמם 00:11:07.508 --> 00:11:09.240 לאבחנה. 00:11:09.240 --> 00:11:14.621 זה ההיפך ממה שפתולוגים למדו במשך עשורים. 00:11:14.621 --> 00:11:17.913 בכל אחד משני המקרים הללו, אלו היו מערכות שפותחו 00:11:17.913 --> 00:11:21.534 על ידי שילוב של מומחים רפואיים ומומחי למידה חישובית, 00:11:21.534 --> 00:11:24.275 אך החל מהשנה שעברה, אנחנו מעבר גם לכך. 00:11:24.275 --> 00:11:27.824 הנה דוגמה לזיהוי איזורים סרטניים 00:11:27.824 --> 00:11:30.354 ברקמה אנושית תחת מיקרוסקופ. 00:11:30.354 --> 00:11:34.967 המערכת שאתם רואים כאן יכולה לזהות את אותם איזורים באופו יותר מדוייק, 00:11:34.967 --> 00:11:37.742 או בערך מדוייק באותה מידה, כמו פתולוג אנושי, 00:11:37.742 --> 00:11:41.134 אך נבנתה אך ורק על ידי למידה עמוקה, ללא מומחיות רפואית 00:11:41.134 --> 00:11:43.660 על ידי אנשים שאין להם רקע בתחום כלל. 00:11:44.730 --> 00:11:47.285 באופן דומה, כאן, הסגמנטציה של הנוירון. 00:11:47.285 --> 00:11:50.953 אנו יכולים כעת לחלק נוירונים לסגמנטים כמעט באופן מדוייק כמו בני אדם, 00:11:50.953 --> 00:11:53.670 אך המערכת הזו פותחה על ידי למידה עמוקה 00:11:53.670 --> 00:11:56.921 ואנשים ללא רקע ברפואה. NOTE Paragraph 00:11:56.921 --> 00:12:00.148 אז אני, כמישהו ללא רקע ברפואה, 00:12:00.148 --> 00:12:03.875 נראה שאני מספיק מצוייד להקים חברה רפואית חדשה. 00:12:03.875 --> 00:12:06.021 וזה מה שעשיתי. 00:12:06.021 --> 00:12:07.761 הייתי די מבועת מכך, 00:12:07.761 --> 00:12:10.650 אבל התיאוריה הציעה שזה צריך להיות אפשרי 00:12:10.650 --> 00:12:16.142 לעשות רפואה שימושית בשימוש בטכניקות אנליזת מידע בלבד. 00:12:16.142 --> 00:12:18.622 ולמרבה המזל, המשוב היה פנטסנטי, 00:12:18.622 --> 00:12:20.978 לא רק מהתקשורת אלא גם מהקהילה הרפואית, 00:12:20.978 --> 00:12:23.322 שהיו מאוד תומכים. 00:12:23.322 --> 00:12:27.471 התאוריה היא שאנחנו יכולים לקחת את חלק הביניים של התהליך הרפואי 00:12:27.471 --> 00:12:30.364 ולהפוך אותו לאנליזת מידע ככל הניתן, 00:12:30.364 --> 00:12:33.429 ולאפשר לרופאים לעשות את מה שהם הכי טובים בו. 00:12:33.429 --> 00:12:35.031 אני רוצה לתת לכם דוגמה. 00:12:35.031 --> 00:12:39.975 כיום זה לוקח 15 דקות לייצר מבחן דיאגנוסטי חדש 00:12:39.975 --> 00:12:41.929 ואני אראה לכם זאת בזמן אמת עכשיו, 00:12:41.929 --> 00:12:45.416 אבל דחסתי את זה ל-3 דקות על ידי הוצאת כמה חלקים. 00:12:45.416 --> 00:12:48.477 במקום להראות לכם יצירת מבחן דיאגנוסטי רפואי חדש, 00:12:48.477 --> 00:12:51.846 אני הולך להראות לכם מבחן דיאגנוסטי של תמונות של מכוניות, 00:12:51.846 --> 00:12:54.068 בגלל שזה משהו שכולנו יכולים להבין. NOTE Paragraph 00:12:54.068 --> 00:12:57.269 אז הנה אנחנו מתחילים עם בערך 1.5 מיליון תמונות של מכוניות, 00:12:57.269 --> 00:13:00.475 ואני רוצה ליצור משהו שיכול לפצל אותם לזוית 00:13:00.475 --> 00:13:02.698 שבה התמונה צולמה. 00:13:02.698 --> 00:13:06.586 אז התמונות האלה הן לגמרי לא מתוייגות, אז אני צריך להתחיל מאפס. 00:13:06.586 --> 00:13:08.451 בעזרת אלגוריתם הלמידה העמוקה שלנו, 00:13:08.451 --> 00:13:12.158 הוא יכול לזהות אוטומטית איזורים של מבנה בתמונות אלו. 00:13:12.158 --> 00:13:15.778 אז הדבר הנחמד הוא שהאדם והמחשב יכולים לעבוד עתה יחד. 00:13:15.778 --> 00:13:17.956 אז האדם, כמו שאתם רואים כאן, 00:13:17.956 --> 00:13:20.631 אומר למחשב על איזורי עניין 00:13:20.631 --> 00:13:25.281 שהוא רוצה שהמחשב ינסה להשתמש בהם לשיפור האלגוריתם. 00:13:25.281 --> 00:13:29.577 כעת, מערכות הלמידה העמוקה הללו הן למעשה בחלל בעל 16,000 מימדים, 00:13:29.577 --> 00:13:33.009 אז אתם רואים כאן שהמחשב מסובב זאת דרך המרחב הזה, 00:13:33.009 --> 00:13:35.001 ומנסה למצוא איזורים חדשים של מבנה. 00:13:35.001 --> 00:13:36.776 וכשהוא מצליח, 00:13:36.776 --> 00:13:40.471 האדם שנוהג בו יכול לציין את האיזורים שמעניינים. 00:13:40.471 --> 00:13:43.208 אז הנה, המחשב מצא בהצלחה איזורים, 00:13:43.208 --> 00:13:45.770 לדוגמה, זוויות. 00:13:45.770 --> 00:13:47.376 אז כשאנחנו מתקדמים בתהליך הזה, 00:13:47.376 --> 00:13:49.716 אנחנו בהדרגה אומרים למחשב עוד ועוד 00:13:49.716 --> 00:13:52.144 אודות סוגי המבנים שאנחנו מחפשים. 00:13:52.144 --> 00:13:53.916 אתם יכולים לדמיין זאת במבחן דיאגנוסטי 00:13:53.916 --> 00:13:57.266 זה יהיה פתולוג שמזהה איזורי מחלה, לדוגמה, 00:13:57.266 --> 00:14:02.292 או רדיולוג שמצביע על קשריות שיכולות להיות בעייתיות. 00:14:02.292 --> 00:14:04.851 ולפעמים זה יכול להיות קשה לאלגוריתם. 00:14:04.851 --> 00:14:06.815 במקרה הזה, הוא די התבלבל. 00:14:06.815 --> 00:14:09.365 החלקים הקדמיים והאחוריים של המכוניות מעורבבים. 00:14:09.365 --> 00:14:11.437 אז כאן עלינו להיות טיפה יותר זהירים, 00:14:11.437 --> 00:14:14.669 ולבחור באופן ידני את החלקים הקדמיים בניגוד לאלו האחוריים, 00:14:14.669 --> 00:14:20.175 ואז להגיד למחשב שזו סוג של קבוצה 00:14:20.175 --> 00:14:21.523 שאנחנו מעונינים בה. NOTE Paragraph 00:14:21.523 --> 00:14:24.200 אז אנחנו עושים זאת למשך זמן מה, מדלגים על קצת, 00:14:24.200 --> 00:14:26.446 ואז אנחנו מאמנים את אלגוריתם הלמידה החישובית 00:14:26.446 --> 00:14:28.420 בהתבסס על אותם 200 דברים, 00:14:28.420 --> 00:14:30.445 ומקווים שהוא השתפר בהרבה. 00:14:30.445 --> 00:14:33.518 אתם רואים, הוא התחיל להדהות כמה מהתמונות האלו, 00:14:33.518 --> 00:14:38.226 ומראה לנו שהוא כבר מזהה איך להבין כמה מאלה בעצמו. 00:14:38.226 --> 00:14:41.128 אז אנחנו יכולים להשתמש בקונספט הזה של תמונות דומות, 00:14:41.128 --> 00:14:43.222 ועל ידי שימוש בתמונות דומות, אתם יכולים עכשיו לראות, 00:14:43.222 --> 00:14:47.241 שהמחשב בנקודה זו מסוגל למצוא רק את החזית של מכוניות. 00:14:47.241 --> 00:14:50.189 אז בנקודה זו, האדם יכול לומר למחשב, 00:14:50.189 --> 00:14:52.482 אוקיי, כן, עשית עבודה טובה. NOTE Paragraph 00:14:53.652 --> 00:14:55.837 לפעמים, כמובן, אפילו בנקודה זו 00:14:55.837 --> 00:14:59.511 זה עדיין קשה להפריד בין קבוצות. 00:14:59.511 --> 00:15:03.395 במקרה הזה, אפילו אחרי שאנחנו נותנים למחשב לנסות לסובב זאת למשך זמן מה, 00:15:03.399 --> 00:15:06.744 אנחנו עדיין מוצאים שהתמונות של הצדדים השמאלייים והימניים 00:15:06.744 --> 00:15:08.222 מעורבבות זו בזו. 00:15:08.222 --> 00:15:10.362 אז אנחנו שוב יכולים לתת למחשב כמה רמזים, 00:15:10.362 --> 00:15:13.338 ולהגיד, אוקיי, נסה למצוא תכנית שמפרידה 00:15:13.338 --> 00:15:15.945 את צד ימין מצד שמאל עד כמה שניתן 00:15:15.945 --> 00:15:18.067 על ידי שימוש באלגוריתם הלמידה העמוקה הזה. 00:15:18.067 --> 00:15:21.009 ואחרי שנתנו לו את הרמז הזה-- אה, אוקיי, הוא הצליח. 00:15:21.009 --> 00:15:23.891 הוא הצליח למצוא דרך לחשוב על האובייקטים האלה 00:15:23.891 --> 00:15:26.271 שהפרידו את זה יחד. NOTE Paragraph 00:15:26.271 --> 00:15:28.709 אז אתם מבינים את הרעיון פה. 00:15:28.709 --> 00:15:36.906 זה לא מקרה שבו האדם מוחלף על ידי המחשב, 00:15:36.906 --> 00:15:39.546 אלא שהם עובדים יחד. 00:15:39.546 --> 00:15:43.096 מה שאנחנו עושים כאן הוא להחליף משהו שהיה לוקח לצוות 00:15:43.096 --> 00:15:45.098 של חמישה או שישה אנשים בערך שבע שנים 00:15:45.098 --> 00:15:47.703 ומחליפים אותו במשהו שלוקח 15 דקות 00:15:47.703 --> 00:15:50.208 לאדם אחד שפועל לבד. NOTE Paragraph 00:15:50.208 --> 00:15:54.158 אז התהליך הזה לוקח בערך ארבע או חמש חזרות. 00:15:54.158 --> 00:15:56.017 אתם רואים עכשיו שיש לנו 62 אחוז 00:15:56.017 --> 00:15:58.976 מ-1.5 מיליון התמונות שלנו מסווגות נכונה. 00:15:58.976 --> 00:16:01.448 בנקודה זו, אנחנו יכולים להתחיל די במהירות 00:16:01.448 --> 00:16:02.745 לקחת חלקם גדולים במלואם, 00:16:02.745 --> 00:16:05.664 לעבור עליהם ולוודא שאין טעויות. 00:16:05.664 --> 00:16:09.616 היכן שישנן טעויות, אנו יכולים ליידע את המחשב עליהן. 00:16:09.616 --> 00:16:12.661 ועל ידי שימוש בסוג זה של תהליך עבור כל אחת מהקבוצות השונות, 00:16:12.661 --> 00:16:15.148 אנחנו עכשיו מגיעים ל-80 אחוזי הצלחה 00:16:15.148 --> 00:16:17.563 בסיווג מיליון וחצי התמונות. 00:16:17.563 --> 00:16:19.641 ובנקודה זו, זהו רק מקרה 00:16:19.641 --> 00:16:23.220 של מציאת המספר הקטן שלא מסווג כראוי, 00:16:23.220 --> 00:16:26.108 ולנסות להבין למה. 00:16:26.108 --> 00:16:27.851 על ידי שימוש בגישה זו, 00:16:27.851 --> 00:16:31.972 תוך 15 דקות אנו מגיעים ל-97 אחוזי סיווג. NOTE Paragraph 00:16:31.972 --> 00:16:36.572 אז סוג כזה של טכניקה יכול לאפשר לנו לתקן בעיה גדולה, 00:16:36.578 --> 00:16:39.614 שהיא שיש חוסר במומחיות רפואית בעולם. 00:16:39.614 --> 00:16:43.103 פורום הכלכלה העולמי אומר שיש בין 10X ו-20X 00:16:43.103 --> 00:16:45.727 של מחסור ברופאים בעולם המתפתח, 00:16:45.727 --> 00:16:47.395 ושזה ייקח בערך 300 שנה 00:16:47.395 --> 00:16:50.734 לאמן מספיק אנשים לתקן את הבעיה הזו. 00:16:50.734 --> 00:16:53.619 אז דמיינו אם היינו יכולים לעזור להגביר את היעילות שלהם 00:16:53.619 --> 00:16:56.458 על ידי שימוש בגישת הלמידה העמוקה הזו? NOTE Paragraph 00:16:56.458 --> 00:16:58.690 אז אני מאוד מתרגש מהאפשרויות. 00:16:58.690 --> 00:17:01.279 אני גם מאוד מודאג מהבעיות. 00:17:01.279 --> 00:17:04.403 הבעיה כאן היא שכל איזור בכחול על המפה 00:17:04.403 --> 00:17:08.172 הוא מקום שבו שירותים הם מעל ל-80 אחוז מהתעסוקה. 00:17:08.172 --> 00:17:09.959 מה זה שירותים? 00:17:09.959 --> 00:17:11.473 אלו שירותים. 00:17:11.473 --> 00:17:15.627 אלו הם גם בדיוק הדברים שמחשבים בדיוק למדו איך לעשות. 00:17:15.627 --> 00:17:19.431 אז 80 אחוז מהתעסוקה העולמית בעולם המפותח 00:17:19.431 --> 00:17:21.963 הם דברים שמחשבים בדיוק למדו איך לעשות. 00:17:21.963 --> 00:17:23.403 מה זה אומר? 00:17:23.403 --> 00:17:25.986 ובכן, זה יהיה בסדר. הן יוחלפו בעבודות אחרות. 00:17:25.986 --> 00:17:28.693 למשל, יהיו יותר עבודות עבור מדעני נתונים. 00:17:28.693 --> 00:17:29.510 ובכן, לא באמת. 00:17:29.510 --> 00:17:32.628 לא לוקח למדענים זמן רב לבנות את הדברים הללו. 00:17:32.628 --> 00:17:35.880 למשל, ארבעת האלגוריתמים האלה נבנו כולם על ידי אותו אדם. 00:17:35.880 --> 00:17:38.318 אז אם אתם חושבים, הו, כל זה כבר קרה בעבר, 00:17:38.318 --> 00:17:42.138 ראינו את התוצאות בעבר כאשר דברים חדשים הגיעו 00:17:42.138 --> 00:17:44.378 והם מוחלפים בעבודות חדשות, 00:17:44.378 --> 00:17:46.489 אבל מה העבודות החדשות הללו הולכות להיות? 00:17:46.489 --> 00:17:48.860 זה מאוד קשה בשבילנו להעריך זאת, 00:17:48.860 --> 00:17:51.103 בגלל שהביצועים האנושיים גדלים בקצב ההדרגתי הזה, 00:17:51.103 --> 00:17:53.672 אבל יש לנו עכשיו מערכת, למידה עמוקה, 00:17:53.672 --> 00:17:56.884 שאנחנו יודעים שממש גדלה ביכולות שלה באופן אקספוננציאלי. 00:17:56.884 --> 00:17:58.501 ואנחנו כאן. 00:17:58.501 --> 00:18:00.566 אז כרגע, אנחנו רואים את הדברים שסביבנו 00:18:00.566 --> 00:18:03.237 ואומרים, "הו, מחשבים הם עדיין די טיפשים." נכון? 00:18:03.237 --> 00:18:06.063 אבל תוך חמש שנים, מחשבים יהיו מחוץ לטבלה הזו. 00:18:06.063 --> 00:18:10.329 אז אנחנו צריכים להתחיל לחשוב על היכולת הזו כבר עכשיו. NOTE Paragraph 00:18:10.329 --> 00:18:12.167 ראינו את זה קורה בעבר, כמובן. 00:18:12.167 --> 00:18:13.966 במהפכה התעשייתית, 00:18:13.966 --> 00:18:16.817 ראינו שינוי משמעותי ביכולות הודות למנועים. 00:18:17.667 --> 00:18:20.805 העניין הוא שאחרי זמן מה, העניינים השתטחו. 00:18:20.805 --> 00:18:22.507 הייתה הפרעה חברתית, 00:18:22.507 --> 00:18:25.946 אבל ברגע שהשתמשו במנועים על מנת לייצר חשמל בכל המצבים, 00:18:25.946 --> 00:18:28.300 דברים התחילו להירגע. 00:18:28.300 --> 00:18:29.773 מהפיכת הלמידה החישובית 00:18:29.773 --> 00:18:32.682 הולכת להיות שונה מאוד מהמהפיכה התעשייתית, 00:18:32.682 --> 00:18:35.632 כיוון שמהפיכת הלמידה החישובית, היא לעולם לא נרגעת. 00:18:35.632 --> 00:18:38.614 ככל שמחשבים יהיו יותר טובים בפעילוית אינטלקטואליות, 00:18:38.614 --> 00:18:42.862 כך הם יכולים לבנות מחשבים טובים יותר שיהיו טובים יותר ביכולות אינטלקטואליות, 00:18:42.862 --> 00:18:44.770 אז זה הולך להיות סוג של שינוי 00:18:44.770 --> 00:18:47.248 שהעולם למעשה לא חווה מעולם, 00:18:47.248 --> 00:18:50.554 אז ההבנה הקודמת שלכם של מה אפשרי, היא שונה. NOTE Paragraph 00:18:50.974 --> 00:18:52.754 זה כבר מכה בנו. 00:18:52.754 --> 00:18:56.384 ב-25 השנים האחרונות, כשפריון ההון הולך וגדל, 00:18:56.400 --> 00:19:00.588 פריון העבודה נשאר שטוח, למעשה אפילו מעט ירד. NOTE Paragraph 00:19:01.408 --> 00:19:04.149 אז אני רוצה שאנחנו נתחיל לנהל את הדיון הזה כעת. 00:19:04.149 --> 00:19:07.176 אני יודע שהרבה פעמים כשאני מספר לאנשים על המצב הזה, 00:19:07.176 --> 00:19:08.666 אנשים יכולים לבטל אותי. 00:19:08.666 --> 00:19:10.339 ובכן, מחשבים לא יכולים ממש לחשוב, 00:19:10.339 --> 00:19:13.367 הם לא מביעים רגשות, הם לא מבינים שירה, 00:19:13.367 --> 00:19:15.888 אנחנו לא ממש מבינים איך הם עובדים. 00:19:15.888 --> 00:19:17.374 אז מה? 00:19:17.374 --> 00:19:19.178 מחשבים כרגע יכולים לעשות את הדברים 00:19:19.178 --> 00:19:21.897 שבני אדם מקבלים תשלום לעשות במשך רוב חייהם, 00:19:21.897 --> 00:19:23.628 אז עכשיו הזמן להתחיל לחשוב 00:19:23.628 --> 00:19:28.015 על איך אנחנו הולכים להתאים את המבנים החברתיים והכלכליים שלנו 00:19:28.015 --> 00:19:29.855 כך שיהיו מודעים למציאות החדשה הזו. 00:19:29.855 --> 00:19:31.388 תודה. 00:19:31.388 --> 00:19:32.190 (מחיאות כפיים)