WEBVTT

00:00:00.880 --> 00:00:04.893
פעם, אם רצית לגרום למחשב לעשות משהו חדש

00:00:04.893 --> 00:00:06.509
היית צריך לתכנת אותו.

00:00:06.509 --> 00:00:09.423
כעת, תכנות, למי מכם 
שלא עשו זאת בעצמם,

NOTE Paragraph

00:00:09.423 --> 00:00:12.918
דורש לפרוש בפירוט מייגע

00:00:12.918 --> 00:00:16.070
כל צעד וצעד שאתה רוצה שהמחשב יעשה

00:00:16.070 --> 00:00:18.157
על מנת להשיג את המטרה שלך.

00:00:18.157 --> 00:00:22.479
כעת, אם אתה רוצה לעשות משהו 
שאתה לא יודע איך לעשות בעצמך,

00:00:22.479 --> 00:00:24.325
אז זה הולך להיות אתגר רציני.

00:00:24.325 --> 00:00:27.888
אז זה היה האתגר שעמד בפני
האיש הזה, ארתור סמואל.

NOTE Paragraph

00:00:27.888 --> 00:00:31.991
ב-1956, הוא רצה לגרום למחשב הזה

00:00:31.991 --> 00:00:34.208
להיות מסוגל להביס אותו בדמקה.

00:00:34.208 --> 00:00:36.008
איך אתה יכול לכתוב תוכנה,

00:00:36.008 --> 00:00:40.098
לפרוש בפירוט מייגע,
איך להיות יותר טוב ממך בדמקה?

00:00:40.098 --> 00:00:41.714
אז הוא הגה רעיון:

00:00:41.714 --> 00:00:45.946
הוא נתן למחשב לשחק 
נגד עצמו אלפי פעמים

00:00:45.946 --> 00:00:48.100
וללמוד איך לשחק דמקה.

00:00:48.100 --> 00:00:51.494
ואכן זה עבד, ולמעשה עד 1962,

00:00:51.494 --> 00:00:54.124
המחשב הזה ניצח את האלוף של קונטיקט.

00:00:55.484 --> 00:00:58.221
אז ארתור סמואל היה אבי הלמידה החישובית.

NOTE Paragraph

00:00:58.221 --> 00:00:59.931
ואני חב לו חוב ענק.

00:00:59.931 --> 00:01:02.509
בגלל שאני עוסק בלמידה חישובית.

00:01:02.509 --> 00:01:04.229
הייתי הנשיא של קאגל,

00:01:04.229 --> 00:01:07.649
קהילה שמונה מעל 200,000 אנשים 
שעוסקים בלמידה חישובית.

00:01:07.649 --> 00:01:10.107
קאגל מארגנת תחרויות

00:01:10.107 --> 00:01:13.605
לנסות ולגרום להם לפתור 
בעיות שלא נפתרו עד כה,

00:01:13.605 --> 00:01:17.043
וזו הייתה הצלחה מאות פעמים.

00:01:17.043 --> 00:01:19.900
אז מתצפית מנקודת יתרון זו, 
הצלחתי לגלות

00:01:19.900 --> 00:01:23.700
הרבה על מה שלמידה חישובית 
יכולה לעשות בעבר, לעשות היום,

00:01:23.712 --> 00:01:25.273
ומה היא יכולה לעשות בעתיד.

00:01:25.273 --> 00:01:30.272
אולי ההצלחה הגדולה הראשונה של 
למידה חישובית באופן מסחרי הייתה גוגל.

00:01:30.272 --> 00:01:33.480
גוגל הראתה שזה אפשרי למצוא מידע

00:01:33.480 --> 00:01:35.739
על ידי שימוש באלגוריתם ממוחשב,

00:01:35.739 --> 00:01:38.264
והאלגוריתם הזה 
מבוסס על למידה חישובית.

00:01:38.264 --> 00:01:42.123
מאז, היו הרבה הצלחות מסחריות 
של למידה ממוחשבת.

00:01:42.123 --> 00:01:44.309
חברות כמו אמזון ונטפליקס

00:01:44.309 --> 00:01:47.496
משתמשות בלמידה חישובית
כדי להציע מוצרים שאולי תרצה לקנות,

00:01:47.496 --> 00:01:49.206
סרטים שאולי תרצה לראות.

00:01:49.206 --> 00:01:51.346
לפעמים, זה כמעט מפחיד.

00:01:51.346 --> 00:01:53.413
חברות כמו לינקדאין ופייסבוק

00:01:53.413 --> 00:01:56.101
לפעמים אומרות לך מי 
עשויים להיות החברים שלך

00:01:56.101 --> 00:01:58.228
ואין לך מושג איך הן עשו את זה,

00:01:58.228 --> 00:02:01.195
וזה בגלל שהן משתמשות בכוחה
של הלמידה החישובית.

00:02:01.195 --> 00:02:04.152
אלו הם אלגוריתמים שלמדו
איך לעשות זאת מנתונים

00:02:04.152 --> 00:02:07.399
במקום להיות מתוכנתות לעשות 
זאת באופן ידני.

NOTE Paragraph

00:02:07.399 --> 00:02:09.877
כך גם IBM הצליחה

00:02:09.877 --> 00:02:13.739
לגרום לווטסון להביס
את שני אלופי העולם ב"ג'פרדי",

00:02:13.739 --> 00:02:16.964
ולענות על שאלות עדינות ומורכבות 
להפליא כמו זאת:

00:02:16.964 --> 00:02:19.799
["ה'אריה של נמרוד' העתיק נעלם מהמוזיאון
הלאומי של העיר הזאת ב-2003 (יחד עם עוד הרבה דברים)"]

00:02:19.799 --> 00:02:23.034
זו גם הסיבה בגללה אנו עכשיו
רואים את המכוניות הראשונות שנוהגות לבד.

00:02:23.034 --> 00:02:25.856
אם אתם רוצים להיות מסוגלים 
להבחין בין, למשל,

00:02:25.856 --> 00:02:28.488
עץ והולך רגל, ובכן,
זה די חשוב.

00:02:28.488 --> 00:02:31.075
אנחנו לא יודעים איך לכתוב 
את התוכנות הללו באופן ידני,

00:02:31.075 --> 00:02:34.072
אך עם למידה חישובית,
זה אפשרי כעת.

00:02:34.072 --> 00:02:36.680
ולמעשה, המכונית הזו נסעה מעל 
מיליון מיילים

00:02:36.680 --> 00:02:40.186
ללא אף תאונה בכבישים רגילים.

NOTE Paragraph

00:02:40.196 --> 00:02:44.110
אז אנחנו יודעים שמחשבים יכולים ללמוד,

00:02:44.110 --> 00:02:46.010
ומחשבים יכולים ללמוד לעשות דברים

00:02:46.010 --> 00:02:48.848
שאנחנו למעשה לפעמים 
לא יודעים לעשות בעצמנו,

00:02:48.848 --> 00:02:51.733
או אולי יכולים לעשות אותם יותר טוב מאיתנו.

00:02:51.733 --> 00:02:55.928
אחת מהדוגמאות המדהימות ביותר
שראיתי ללמידה חישובית

00:02:55.928 --> 00:02:58.320
קרתה בפרוייקט שהובלתי בקאגל

00:02:58.320 --> 00:03:01.911
שבו צוות שהובל על ידי
בחור בשם ג'פרי הינטון

00:03:01.911 --> 00:03:03.463
מאוניברסיטת טורונטו

00:03:03.463 --> 00:03:06.140
זכה בתחרות על
פיתוח תרופות אוטומטי.

00:03:06.140 --> 00:03:08.987
כעת, מה שמדהים פה זה לא רק שהם ניצחו

00:03:08.987 --> 00:03:13.000
את כל האלגוריתמים שפותחו על ידי מרק
או קהילת האקדמיה העולמית,

00:03:13.000 --> 00:03:18.061
אלא שלאף אחד בצוות לא היה רקע
בכימיה, ביולוגיה או מדעי החיים,

00:03:18.061 --> 00:03:20.230
והם עשו זאת בשבועיים.

00:03:20.230 --> 00:03:21.611
איך הם עשו זאת?

00:03:22.421 --> 00:03:25.342
הם השתמשו באלגוריתם 
יוצא דופן שנקרא למידה עמוקה.

00:03:25.342 --> 00:03:28.291
זה היה כל כך חשוב 
שההצלחה סוקרה

00:03:28.291 --> 00:03:31.412
בניו יורק טיימס במאמר בעמוד הראשי
כמה שבועות לאחר מכן.

00:03:31.412 --> 00:03:34.147
זה ג'פרי הינטון
כאן משמאל.

00:03:34.147 --> 00:03:38.488
למידה עמוקה הוא אלגוריתם
ששואב השראה מהמוח האנושי,

00:03:38.488 --> 00:03:40.300
וכתוצאה מכך הוא אלגוריתם

00:03:40.300 --> 00:03:44.141
שאין לו מגבלות תיאורטיות
על מה שהוא מסוגל לעשות.

00:03:44.141 --> 00:03:46.964
ככל שנותנים לו יותר נתונים וזמן חישוב,

00:03:46.964 --> 00:03:48.276
כך הוא משתפר.

NOTE Paragraph

00:03:48.276 --> 00:03:50.615
הניו יורק טיימס גם 
הראה במאמר הזה

00:03:50.615 --> 00:03:52.857
תוצאה מדהימה נוספת 
של למידה חישובית

00:03:52.857 --> 00:03:55.569
שאני הולך להראות לכם כעת.

00:03:55.569 --> 00:04:00.510
הם מראים שמחשבים יכולים
להקשיב ולהבין.

NOTE Paragraph

00:04:00.510 --> 00:04:03.221
(וידאו) ריצ'רד ראשיד: עכשיו, הצעד האחרון

00:04:03.221 --> 00:04:06.246
שאני רוצה להיות מסוגל לבצע בתהליך הזה

00:04:06.246 --> 00:04:10.961
הוא למעשה לדבר אליכם בסינית.

00:04:10.961 --> 00:04:13.596
עכשיו המפתח פה,

00:04:13.596 --> 00:04:18.598
הוא שהצלחנו לקחת כמות גדולה
של מידע מהרבה דוברי סינית

00:04:18.598 --> 00:04:21.128
ולייצר מערכת של טקסט-לדיבור

00:04:21.128 --> 00:04:25.801
שלוקחת טקסט בסינית
והופכת אותו לשפה סינית,

00:04:25.801 --> 00:04:29.929
ואז לקחנו כשעה של הקול שלי

00:04:29.929 --> 00:04:31.820
והשתמשנו בזה כדי להתאים

00:04:31.820 --> 00:04:36.364
את המערכת הסטנדרטית של טקסט-לדיבור
כך שהיא תישמע כמוני.

00:04:36.364 --> 00:04:38.904
שוב, התוצאה לא מושלמת.

00:04:38.904 --> 00:04:41.552
יש למעשה די הרבה שגיאות.

00:04:41.552 --> 00:04:44.036
(בסינית)

00:04:44.036 --> 00:04:47.403
(מחיאות כפיים)

00:04:49.446 --> 00:04:53.022
יש הרבה עבודה לעשות בתחום הזה.

00:04:53.022 --> 00:04:56.667
(סינית)

00:04:56.667 --> 00:05:00.100
(מחיאות כפיים)

NOTE Paragraph

00:05:01.345 --> 00:05:04.744
(ג'רמי הווארד:) ובכן, זה היה בכנס
למידה חישובית בסין.

00:05:04.744 --> 00:05:07.114
זה די נדיר, למעשה, בכנסים אקדמאים

00:05:07.114 --> 00:05:09.011
לשמוע מחיאות כפיים ספונטניות,

00:05:09.011 --> 00:05:12.687
למרות שכמובן לפעמים 
בכנסים של TEDx, הרגישו חופשי.

00:05:12.687 --> 00:05:15.482
כל מה שראיתם שם קרה עם למידה עמוקה.

00:05:15.482 --> 00:05:17.007
(מחיאות כפיים)
תודה.

00:05:17.007 --> 00:05:19.289
התמלול לאנגלית היה למידה עמוקה.

00:05:19.289 --> 00:05:22.701
התרגום לסינית והטקסט 
מימין למעלה- למידה עמוקה.

00:05:22.701 --> 00:05:26.008
והבניה של הקול היתה למידה עמוקה גם כן.

NOTE Paragraph

00:05:26.008 --> 00:05:29.242
אז למידה עמוקה היא דבר מדהים.

00:05:29.242 --> 00:05:32.341
זה אלגוריתם יחיד שיכול לעשות כמעט הכל.

00:05:32.341 --> 00:05:35.452
וגיליתי ששנה קודם לכן, 
הוא גם למד לראות.

00:05:35.452 --> 00:05:37.628
בתחרות לא מוכרת בגרמניה

00:05:37.628 --> 00:05:40.225
בשם הבוחן הגרמני לביצועי זיהוי שלטי תנועה

00:05:40.225 --> 00:05:43.618
למידה עמוקה למדה לזהות 
שלטי תנועה כמו זה

00:05:43.618 --> 00:05:45.712
היא לא רק זיהתה את השלטים

00:05:45.712 --> 00:05:47.470
יותר טוב מכל אלגוריתם אחר,

00:05:47.470 --> 00:05:50.189
לוח התוצאות ממש הראה שהיא
יותר טובה מאנשים,

00:05:50.189 --> 00:05:52.041
בערך פי 2 יותר טוב מאנשים.

00:05:52.041 --> 00:05:54.037
אז עד 2011, היתה לנו את הדוגמה הראשונה

00:05:54.037 --> 00:05:57.442
למחשבים שיכולים לראות יותר טוב מאנשים.

00:05:57.442 --> 00:05:59.491
מאז, הרבה התרחש.

00:05:59.491 --> 00:06:03.005
ב-2012, גוגל הכריזה שהיא
נתנה לאלגוריתם למידה עמוקה

00:06:03.005 --> 00:06:04.420
לצפות בסרטוני יוטיוב

00:06:04.420 --> 00:06:07.857
והם עבדו על הנתונים על 16,000
מחשבים למשך חודש,

00:06:07.857 --> 00:06:12.218
והמחשב למד באופן עצמאי על 
מושגים כמו אנשים וחתולים

00:06:12.218 --> 00:06:14.027
רק מצפייה בסרטונים.

00:06:14.027 --> 00:06:16.379
זה מאוד דומה לדרך בה אנשים לומדים.

00:06:16.379 --> 00:06:19.119
בני אדם לא לומדים על ידי כך 
שאומרים להם מה הם רואים,

00:06:19.119 --> 00:06:22.450
אלא על ידי למידה עצמאית
של מהם אותם דברים.

00:06:22.450 --> 00:06:25.819
גם ב-2012, ג'פרי הינטון,
שראינו קודם,

00:06:25.819 --> 00:06:28.677
ניצח בתחרות אימג'נט המאוד פופולרית,

00:06:28.677 --> 00:06:32.818
שביקשה לנסות לגלות על 
1.5 מיליון תמונות

00:06:32.818 --> 00:06:34.256
תמונות של מה הן.

00:06:34.256 --> 00:06:37.789
נכון ל-2014, ירדנו 
לשיעור שגיאות של 6%

00:06:37.789 --> 00:06:39.242
בזיהוי תמונה.

00:06:39.242 --> 00:06:41.268
זה יותר טוב מאנשים, שוב.

NOTE Paragraph

00:06:41.268 --> 00:06:45.037
אז מכונות באמת עושות עבודה מצויינת בכך,

00:06:45.037 --> 00:06:47.306
וזה עכשיו נכנס לשימוש בתעשייה.

00:06:47.306 --> 00:06:50.348
למשל, גוגל הכריזה בשנה שעברה

00:06:50.348 --> 00:06:54.933
שהם מיפו כל מיקום ומיקום בצרפת תוך שעתיים,

00:06:54.933 --> 00:06:58.380
והדרך בה הם עשו זאת היתה
הזנת תמונות רחוב

00:06:58.380 --> 00:07:02.699
לאלגוריתם למידה עמוקה
שיזהה ויקרא מספרי רחובות.

00:07:02.699 --> 00:07:04.919
דמיינו כמה זמן זה היה לוקח בעבר:

00:07:04.919 --> 00:07:08.274
עשרות אנשים, שנים רבות.

00:07:08.274 --> 00:07:10.185
זה גם קורה בסין.

00:07:10.185 --> 00:07:14.221
באידו הוא סוג של 
הגוגל הסיני, אני מניח.

00:07:14.221 --> 00:07:16.504
ומה שרואים כאן בשמאל למעלה

00:07:16.504 --> 00:07:20.478
הוא דוגמה לתמונה שאני העליתי
למערכת הלמידה העמוקה של באידו,

00:07:20.478 --> 00:07:24.247
ומתחת אפשר לראות שהמערכת הבינה מה התמונה

00:07:24.247 --> 00:07:26.483
ומצאה תמונות דומות.

00:07:26.483 --> 00:07:29.219
לתמונות הדומות למעשה יש רקעים דומים,

00:07:29.219 --> 00:07:30.877
כיווני פרצופים דומים,

00:07:30.877 --> 00:07:32.665
אפילו כמה עם הלשון בחוץ.

00:07:32.665 --> 00:07:35.695
זה לא להסתכל על טקסט של דף אינטרנט.

00:07:35.695 --> 00:07:37.107
כל מה שאני העליתי היה תמונה.

00:07:37.107 --> 00:07:41.128
אז כעת יש לנו מחשבים שבאמת
מבינים מה הם רואים

00:07:41.128 --> 00:07:42.752
ולכן יכולים לחפש במאגרי מידע

00:07:42.752 --> 00:07:46.306
של מאות מיליוני תמונות בזמן אמת.

NOTE Paragraph

00:07:46.306 --> 00:07:49.536
אז מה זה אומר
עכשיו שמחשבים יכולים לראות?

00:07:49.536 --> 00:07:51.553
ובכן, זה לא רק 
שמחשבים יכולים לראות.

00:07:51.553 --> 00:07:53.622
למעשה, למידה עמוקה 
עשתה יותר מכך.

00:07:53.622 --> 00:07:56.570
משפטים מורכבים עם ניואנסים, כמו זה

00:07:56.570 --> 00:07:59.394
הם כעת מובנים בעזרת 
אלגוריתמים של למידה עמוקה.

00:07:59.394 --> 00:08:00.697
כמו שאתם רואים פה,

00:08:00.697 --> 00:08:03.465
המערכת הזו שמבוססת בסטנפורד
שמראה את הנקודה האדומה למעלה

00:08:03.465 --> 00:08:07.384
הבינה שהמשפט הזה מבטא רגש שלילי.

00:08:07.384 --> 00:08:10.790
למידה עמוקה היא כעת למעשה
כמעט ברמה של בן אדם

00:08:10.802 --> 00:08:15.923
בלהבין על מה משפטים מדברים
ומה הם אומרים על אותם דברים.

00:08:15.923 --> 00:08:18.651
בנוסף, עשו שימוש בלמידה עמוקה
לקריאת סינית,

00:08:18.651 --> 00:08:21.807
שוב, בערך ברמה של דובר סינית מלידה.

00:08:21.807 --> 00:08:23.975
האלגוריתם הזה שפותח בשוויץ

00:08:23.975 --> 00:08:27.331
על ידי אנשים שאף אחד 
מהם לא דובר או מבין סינית.

00:08:27.331 --> 00:08:29.382
כמו שאמרתי, שימוש בלמידה עמוקה

00:08:29.382 --> 00:08:31.601
היא בערך המערכת הכי טובה
בעולם לשם כך,

00:08:31.601 --> 00:08:36.718
אפילו בהשוואה
להבנה אנושית.

NOTE Paragraph

00:08:36.718 --> 00:08:39.682
זוהי מערכת אותה אנו בונים בחברה שלי

00:08:39.682 --> 00:08:41.728
שמראה איך מחברים את כל הדברים האלה.

00:08:41.728 --> 00:08:44.189
אלו תמונות להן לא מצורף טקסט,

00:08:44.189 --> 00:08:46.541
וכשאני מקליד את המשפטים האלה כאן,

00:08:46.541 --> 00:08:49.510
בזמן אמת זה מבין את התמונות האלו

00:08:49.510 --> 00:08:51.189
ומבין על מה הן

00:08:51.189 --> 00:08:54.352
ומבין שהתמונות דומות לטקסט שאני כותב.

00:08:54.352 --> 00:08:57.108
אז אתם רואים, זה למעשה
מבין את המשפטים שלי

00:08:57.108 --> 00:08:59.332
וממש מבין את התמונות הללו.

00:08:59.332 --> 00:09:01.891
אני יודע שראיתם משהו דומה בגוגל,

00:09:01.891 --> 00:09:04.666
שבו אפשר להקליד דברים
וזה מראה לך תמונות,

00:09:04.666 --> 00:09:08.090
אבל למעשה מה שזה עושה זה
לחפש בדף האינטרנט אחר טקסט.

00:09:08.090 --> 00:09:11.091
זה מאוד שונה מאשר ממש להבין את התמונות.

00:09:11.091 --> 00:09:13.843
זה משהו שמחשבים 
היו מסוגלים לעשות

00:09:13.843 --> 00:09:17.091
בפעם הראשונה רק בחודשים האחרונים.

NOTE Paragraph

00:09:17.091 --> 00:09:21.182
אז אנו רואים עכשיו שמחשבים
יכולים לא רק לראות אלא גם לקרוא,

00:09:21.182 --> 00:09:24.947
וכמובן, הראינו שהם יכולים
להבין את מה שהם שומעים.

00:09:24.947 --> 00:09:28.389
אולי זה לא מפתיע כעת 
שאני עומד לספר לכם שהם יכולים לכתוב.

00:09:28.389 --> 00:09:33.172
הנה טקסט שייצרתי
על ידי אלגוריתם למידה עמוקה אתמול.

00:09:33.172 --> 00:09:37.096
והנה טקסט שאלגוריתם
מסטנפורד ייצר.

00:09:37.096 --> 00:09:38.860
כל אחד מהמשפטים הללו נוצר

00:09:38.860 --> 00:09:43.109
על יגי אלגוריתם למידה עמוקה
על מנת לתאר כל אחת מהתמונות האלו.

00:09:43.109 --> 00:09:47.581
האלגוריתם הזה לא ראה לפני כן מעולם
איש בחולצה שחורה שמנגן בגיטרה.

00:09:47.581 --> 00:09:49.801
הוא ראה אדם בעבר,
הוא ראה שחור בעבר,

00:09:49.801 --> 00:09:51.400
הוא ראה גיטרה בעבר,

00:09:51.400 --> 00:09:55.694
אך הוא ייצר באופן עצמאי
את התיאור החדש של התמונה.

00:09:55.694 --> 00:09:59.196
אנחנו עדיין לא בדיוק ברמה אנושית כאן,
אך אנחנו קרובים.

00:09:59.196 --> 00:10:03.264
במבחנים, בני אדם מעדיפים 
את הכותרת המיוצרת על ידי מחשב

00:10:03.264 --> 00:10:04.791
אחת לכל ארבע פעמים.

00:10:04.791 --> 00:10:06.855
עכשיו המערכת הזו היא רק בת שבועיים,

00:10:06.855 --> 00:10:08.701
אז סביר שמתישהו בשנה הבאה,

00:10:08.701 --> 00:10:11.502
האלגוריתם הממוחשב יעבור בהרבה
את היכולות האנושיות

00:10:11.502 --> 00:10:13.364
בקצב שבו דברים מתקדמים.

00:10:13.364 --> 00:10:16.413
אז מחשבים גם יכולים לכתוב.

NOTE Paragraph

00:10:16.413 --> 00:10:19.888
אם לוקחים את כל זה יחד
זה מוביל לאפשרויות מרגשות.

00:10:19.888 --> 00:10:21.380
למשל, ברפואה,

00:10:21.380 --> 00:10:23.905
צוות בבוסטון הכריז שהם גילו

00:10:23.905 --> 00:10:26.854
עשרות מאפיינים רלוונטיים קלינית

00:10:26.854 --> 00:10:31.120
של גידולים, שיכולים לעזור לרופאים
לקבל פרוגנוזה של הסרטן.

00:10:32.220 --> 00:10:34.516
באופן דומה, בסטנפורד,

00:10:34.516 --> 00:10:38.179
קבוצה הכריזה כי, 
לאחר שהסתכלו על רקמות בהגדלה,

00:10:38.179 --> 00:10:40.560
הם פיתחו מערכת
מבוססת למידה חישובית

00:10:40.560 --> 00:10:43.142
שהיא למעשה טובה יותר 
מפתולוגים אנושיים

00:10:43.142 --> 00:10:47.519
בחיזוי סיכויי הישרדות 
עבור הסובלים מסרטן.

00:10:47.519 --> 00:10:50.764
בשני המקרים האלה, לא רק
שהתחזיות היו יותר מדוייקות,

00:10:50.764 --> 00:10:53.266
אלא שהן גם הפיקו מדע חדש בעל תובנות.

00:10:53.276 --> 00:10:54.781
במקרה של הרדיולוגיה,

00:10:54.781 --> 00:10:57.876
היו אינדיקטורים קליניים חדשים
שבני אדם יכולים להבין.

00:10:57.876 --> 00:10:59.668
במקרה הזה של הפתולוגיה,

00:10:59.668 --> 00:11:04.168
המערכת הממוחשבת גילתה למעשה
שהתאים שסביב הסרטן

00:11:04.168 --> 00:11:07.508
הם חשובים כמו תאי הסרטן עצמם

00:11:07.508 --> 00:11:09.240
לאבחנה.

00:11:09.240 --> 00:11:14.621
זה ההיפך ממה שפתולוגים 
למדו במשך עשורים.

00:11:14.621 --> 00:11:17.913
בכל אחד משני המקרים הללו,
אלו היו מערכות שפותחו

00:11:17.913 --> 00:11:21.534
על ידי שילוב של מומחים רפואיים 
ומומחי למידה חישובית,

00:11:21.534 --> 00:11:24.275
אך החל מהשנה שעברה, 
אנחנו מעבר גם לכך.

00:11:24.275 --> 00:11:27.824
הנה דוגמה לזיהוי איזורים סרטניים

00:11:27.824 --> 00:11:30.354
ברקמה אנושית תחת מיקרוסקופ.

00:11:30.354 --> 00:11:34.967
המערכת שאתם רואים כאן יכולה
לזהות את אותם איזורים באופו יותר מדוייק,

00:11:34.967 --> 00:11:37.742
או בערך מדוייק באותה מידה,
כמו פתולוג אנושי,

00:11:37.742 --> 00:11:41.134
אך נבנתה אך ורק על ידי
למידה עמוקה, ללא מומחיות רפואית

00:11:41.134 --> 00:11:43.660
על ידי אנשים שאין להם רקע בתחום כלל.

00:11:44.730 --> 00:11:47.285
באופן דומה, כאן, הסגמנטציה של הנוירון.

00:11:47.285 --> 00:11:50.953
אנו יכולים כעת לחלק נוירונים לסגמנטים
כמעט באופן מדוייק כמו בני אדם,

00:11:50.953 --> 00:11:53.670
אך המערכת הזו פותחה 
על ידי למידה עמוקה

00:11:53.670 --> 00:11:56.921
ואנשים ללא רקע ברפואה.

NOTE Paragraph

00:11:56.921 --> 00:12:00.148
אז אני, כמישהו ללא רקע ברפואה,

00:12:00.148 --> 00:12:03.875
נראה שאני מספיק מצוייד
להקים חברה רפואית חדשה.

00:12:03.875 --> 00:12:06.021
וזה מה שעשיתי.

00:12:06.021 --> 00:12:07.761
הייתי די מבועת מכך,

00:12:07.761 --> 00:12:10.650
אבל התיאוריה הציעה
שזה צריך להיות אפשרי

00:12:10.650 --> 00:12:16.142
לעשות רפואה שימושית
בשימוש בטכניקות אנליזת מידע בלבד.

00:12:16.142 --> 00:12:18.622
ולמרבה המזל, המשוב היה פנטסנטי,

00:12:18.622 --> 00:12:20.978
לא רק מהתקשורת
אלא גם מהקהילה הרפואית,

00:12:20.978 --> 00:12:23.322
שהיו מאוד תומכים.

00:12:23.322 --> 00:12:27.471
התאוריה היא שאנחנו יכולים
לקחת את חלק הביניים של התהליך הרפואי

00:12:27.471 --> 00:12:30.364
ולהפוך אותו לאנליזת מידע ככל הניתן,

00:12:30.364 --> 00:12:33.429
ולאפשר לרופאים לעשות את 
מה שהם הכי טובים בו.

00:12:33.429 --> 00:12:35.031
אני רוצה לתת לכם דוגמה.

00:12:35.031 --> 00:12:39.975
כיום זה לוקח 15 דקות
לייצר מבחן דיאגנוסטי חדש

00:12:39.975 --> 00:12:41.929
ואני אראה לכם זאת בזמן אמת עכשיו,

00:12:41.929 --> 00:12:45.416
אבל דחסתי את זה ל-3 דקות 
על ידי הוצאת כמה חלקים.

00:12:45.416 --> 00:12:48.477
במקום להראות לכם יצירת 
מבחן דיאגנוסטי רפואי חדש,

00:12:48.477 --> 00:12:51.846
אני הולך להראות לכם
מבחן דיאגנוסטי של תמונות של מכוניות,

00:12:51.846 --> 00:12:54.068
בגלל שזה משהו שכולנו יכולים להבין.

NOTE Paragraph

00:12:54.068 --> 00:12:57.269
אז הנה אנחנו מתחילים עם
בערך 1.5 מיליון תמונות של מכוניות,

00:12:57.269 --> 00:13:00.475
ואני רוצה ליצור משהו 
שיכול לפצל אותם לזוית

00:13:00.475 --> 00:13:02.698
שבה התמונה צולמה.

00:13:02.698 --> 00:13:06.586
אז התמונות האלה הן לגמרי לא מתוייגות,
אז אני צריך להתחיל מאפס.

00:13:06.586 --> 00:13:08.451
בעזרת אלגוריתם הלמידה העמוקה שלנו,

00:13:08.451 --> 00:13:12.158
הוא יכול לזהות אוטומטית
איזורים של מבנה בתמונות אלו.

00:13:12.158 --> 00:13:15.778
אז הדבר הנחמד הוא שהאדם
והמחשב יכולים לעבוד עתה יחד.

00:13:15.778 --> 00:13:17.956
אז האדם, כמו שאתם רואים כאן,

00:13:17.956 --> 00:13:20.631
אומר למחשב על איזורי עניין

00:13:20.631 --> 00:13:25.281
שהוא רוצה שהמחשב ינסה
להשתמש בהם לשיפור האלגוריתם.

00:13:25.281 --> 00:13:29.577
כעת, מערכות הלמידה העמוקה הללו 
הן למעשה בחלל בעל 16,000 מימדים,

00:13:29.577 --> 00:13:33.009
אז אתם רואים כאן שהמחשב
מסובב זאת דרך המרחב הזה,

00:13:33.009 --> 00:13:35.001
ומנסה למצוא איזורים חדשים של מבנה.

00:13:35.001 --> 00:13:36.776
וכשהוא מצליח,

00:13:36.776 --> 00:13:40.471
האדם שנוהג בו יכול לציין את
האיזורים שמעניינים.

00:13:40.471 --> 00:13:43.208
אז הנה, המחשב מצא בהצלחה איזורים,

00:13:43.208 --> 00:13:45.770
לדוגמה, זוויות.

00:13:45.770 --> 00:13:47.376
אז כשאנחנו מתקדמים בתהליך הזה,

00:13:47.376 --> 00:13:49.716
אנחנו בהדרגה אומרים 
למחשב עוד ועוד

00:13:49.716 --> 00:13:52.144
אודות סוגי המבנים שאנחנו מחפשים.

00:13:52.144 --> 00:13:53.916
אתם יכולים לדמיין זאת במבחן דיאגנוסטי

00:13:53.916 --> 00:13:57.266
זה יהיה פתולוג שמזהה 
איזורי מחלה, לדוגמה,

00:13:57.266 --> 00:14:02.292
או רדיולוג שמצביע על קשריות
שיכולות להיות בעייתיות.

00:14:02.292 --> 00:14:04.851
ולפעמים זה יכול להיות קשה לאלגוריתם.

00:14:04.851 --> 00:14:06.815
במקרה הזה, הוא די התבלבל.

00:14:06.815 --> 00:14:09.365
החלקים הקדמיים והאחוריים 
של המכוניות מעורבבים.

00:14:09.365 --> 00:14:11.437
אז כאן עלינו להיות טיפה יותר זהירים,

00:14:11.437 --> 00:14:14.669
ולבחור באופן ידני את החלקים הקדמיים
בניגוד לאלו האחוריים,

00:14:14.669 --> 00:14:20.175
ואז להגיד למחשב שזו סוג של קבוצה

00:14:20.175 --> 00:14:21.523
שאנחנו מעונינים בה.

NOTE Paragraph

00:14:21.523 --> 00:14:24.200
אז אנחנו עושים זאת למשך זמן מה,
מדלגים על קצת,

00:14:24.200 --> 00:14:26.446
ואז אנחנו מאמנים את אלגוריתם
הלמידה החישובית

00:14:26.446 --> 00:14:28.420
בהתבסס על אותם 200 דברים,

00:14:28.420 --> 00:14:30.445
ומקווים שהוא השתפר בהרבה.

00:14:30.445 --> 00:14:33.518
אתם רואים, הוא התחיל להדהות
כמה מהתמונות האלו,

00:14:33.518 --> 00:14:38.226
ומראה לנו שהוא כבר מזהה
איך להבין כמה מאלה בעצמו.

00:14:38.226 --> 00:14:41.128
אז אנחנו יכולים להשתמש בקונספט הזה 
של תמונות דומות,

00:14:41.128 --> 00:14:43.222
ועל ידי שימוש בתמונות דומות,
אתם יכולים עכשיו לראות,

00:14:43.222 --> 00:14:47.241
שהמחשב בנקודה זו מסוגל
למצוא רק את החזית של מכוניות.

00:14:47.241 --> 00:14:50.189
אז בנקודה זו, 
האדם יכול לומר למחשב,

00:14:50.189 --> 00:14:52.482
אוקיי, כן, עשית עבודה טובה.

NOTE Paragraph

00:14:53.652 --> 00:14:55.837
לפעמים, כמובן, אפילו בנקודה זו

00:14:55.837 --> 00:14:59.511
זה עדיין קשה להפריד בין קבוצות.

00:14:59.511 --> 00:15:03.395
במקרה הזה, אפילו אחרי שאנחנו נותנים למחשב
לנסות לסובב זאת למשך זמן מה,

00:15:03.399 --> 00:15:06.744
אנחנו עדיין מוצאים שהתמונות 
של הצדדים השמאלייים והימניים

00:15:06.744 --> 00:15:08.222
מעורבבות זו בזו.

00:15:08.222 --> 00:15:10.362
אז אנחנו שוב יכולים לתת
למחשב כמה רמזים,

00:15:10.362 --> 00:15:13.338
ולהגיד, אוקיי, נסה למצוא 
תכנית שמפרידה

00:15:13.338 --> 00:15:15.945
את צד ימין מצד שמאל עד כמה שניתן

00:15:15.945 --> 00:15:18.067
על ידי שימוש באלגוריתם הלמידה העמוקה הזה.

00:15:18.067 --> 00:15:21.009
ואחרי שנתנו לו את הרמז הזה--
אה, אוקיי, הוא הצליח.

00:15:21.009 --> 00:15:23.891
הוא הצליח למצוא דרך
לחשוב על האובייקטים האלה

00:15:23.891 --> 00:15:26.271
שהפרידו את זה יחד.

NOTE Paragraph

00:15:26.271 --> 00:15:28.709
אז אתם מבינים את הרעיון פה.

00:15:28.709 --> 00:15:36.906
זה לא מקרה שבו האדם מוחלף על ידי המחשב,

00:15:36.906 --> 00:15:39.546
אלא שהם עובדים יחד.

00:15:39.546 --> 00:15:43.096
מה שאנחנו עושים כאן הוא להחליף
משהו שהיה לוקח לצוות

00:15:43.096 --> 00:15:45.098
של חמישה או שישה אנשים
בערך שבע שנים

00:15:45.098 --> 00:15:47.703
ומחליפים אותו במשהו שלוקח 15 דקות

00:15:47.703 --> 00:15:50.208
לאדם אחד שפועל לבד.

NOTE Paragraph

00:15:50.208 --> 00:15:54.158
אז התהליך הזה לוקח בערך 
ארבע או חמש חזרות.

00:15:54.158 --> 00:15:56.017
אתם רואים עכשיו שיש לנו 62 אחוז

00:15:56.017 --> 00:15:58.976
מ-1.5 מיליון התמונות שלנו
מסווגות נכונה.

00:15:58.976 --> 00:16:01.448
בנקודה זו, אנחנו יכולים
להתחיל די במהירות

00:16:01.448 --> 00:16:02.745
לקחת חלקם גדולים במלואם,

00:16:02.745 --> 00:16:05.664
לעבור עליהם ולוודא שאין טעויות.

00:16:05.664 --> 00:16:09.616
היכן שישנן טעויות, אנו יכולים
ליידע את המחשב עליהן.

00:16:09.616 --> 00:16:12.661
ועל ידי שימוש בסוג זה של תהליך
עבור כל אחת מהקבוצות השונות,

00:16:12.661 --> 00:16:15.148
אנחנו עכשיו מגיעים ל-80 אחוזי הצלחה

00:16:15.148 --> 00:16:17.563
בסיווג מיליון וחצי התמונות.

00:16:17.563 --> 00:16:19.641
ובנקודה זו, זהו רק מקרה

00:16:19.641 --> 00:16:23.220
של מציאת המספר הקטן 
שלא מסווג כראוי,

00:16:23.220 --> 00:16:26.108
ולנסות להבין למה.

00:16:26.108 --> 00:16:27.851
על ידי שימוש בגישה זו,

00:16:27.851 --> 00:16:31.972
תוך 15 דקות אנו מגיעים 
ל-97 אחוזי סיווג.

NOTE Paragraph

00:16:31.972 --> 00:16:36.572
אז סוג כזה של טכניקה
יכול לאפשר לנו לתקן בעיה גדולה,

00:16:36.578 --> 00:16:39.614
שהיא שיש חוסר במומחיות רפואית בעולם.

00:16:39.614 --> 00:16:43.103
פורום הכלכלה העולמי אומר
שיש בין 10X ו-20X

00:16:43.103 --> 00:16:45.727
של מחסור ברופאים בעולם המתפתח,

00:16:45.727 --> 00:16:47.395
ושזה ייקח בערך 300 שנה

00:16:47.395 --> 00:16:50.734
לאמן מספיק אנשים לתקן את הבעיה הזו.

00:16:50.734 --> 00:16:53.619
אז דמיינו אם היינו יכולים
לעזור להגביר את היעילות שלהם

00:16:53.619 --> 00:16:56.458
על ידי שימוש בגישת הלמידה העמוקה הזו?

NOTE Paragraph

00:16:56.458 --> 00:16:58.690
אז אני מאוד מתרגש מהאפשרויות.

00:16:58.690 --> 00:17:01.279
אני גם מאוד מודאג מהבעיות.

00:17:01.279 --> 00:17:04.403
הבעיה כאן היא שכל איזור בכחול על המפה

00:17:04.403 --> 00:17:08.172
הוא מקום שבו שירותים
הם מעל ל-80 אחוז מהתעסוקה.

00:17:08.172 --> 00:17:09.959
מה זה שירותים?

00:17:09.959 --> 00:17:11.473
אלו שירותים.

00:17:11.473 --> 00:17:15.627
אלו הם גם בדיוק הדברים שמחשבים
בדיוק למדו איך לעשות.

00:17:15.627 --> 00:17:19.431
אז 80 אחוז מהתעסוקה העולמית
בעולם המפותח

00:17:19.431 --> 00:17:21.963
הם דברים שמחשבים בדיוק למדו איך לעשות.

00:17:21.963 --> 00:17:23.403
מה זה אומר?

00:17:23.403 --> 00:17:25.986
ובכן, זה יהיה בסדר.
הן יוחלפו בעבודות אחרות.

00:17:25.986 --> 00:17:28.693
למשל, יהיו יותר עבודות
עבור מדעני נתונים.

00:17:28.693 --> 00:17:29.510
ובכן, לא באמת.

00:17:29.510 --> 00:17:32.628
לא לוקח למדענים זמן רב
לבנות את הדברים הללו.

00:17:32.628 --> 00:17:35.880
למשל, ארבעת האלגוריתמים האלה
נבנו כולם על ידי אותו אדם.

00:17:35.880 --> 00:17:38.318
אז אם אתם חושבים, הו, 
כל זה כבר קרה בעבר,

00:17:38.318 --> 00:17:42.138
ראינו את התוצאות בעבר
כאשר דברים חדשים הגיעו

00:17:42.138 --> 00:17:44.378
והם מוחלפים בעבודות חדשות,

00:17:44.378 --> 00:17:46.489
אבל מה העבודות החדשות הללו הולכות להיות?

00:17:46.489 --> 00:17:48.860
זה מאוד קשה בשבילנו להעריך זאת,

00:17:48.860 --> 00:17:51.103
בגלל שהביצועים האנושיים
גדלים בקצב ההדרגתי הזה,

00:17:51.103 --> 00:17:53.672
אבל יש לנו עכשיו מערכת, למידה עמוקה,

00:17:53.672 --> 00:17:56.884
שאנחנו יודעים שממש גדלה
ביכולות שלה באופן אקספוננציאלי.

00:17:56.884 --> 00:17:58.501
ואנחנו כאן.

00:17:58.501 --> 00:18:00.566
אז כרגע, אנחנו רואים את הדברים שסביבנו

00:18:00.566 --> 00:18:03.237
ואומרים, "הו, מחשבים
הם עדיין די טיפשים." נכון?

00:18:03.237 --> 00:18:06.063
אבל תוך חמש שנים, 
מחשבים יהיו מחוץ לטבלה הזו.

00:18:06.063 --> 00:18:10.329
אז אנחנו צריכים להתחיל לחשוב
על היכולת הזו כבר עכשיו.

NOTE Paragraph

00:18:10.329 --> 00:18:12.167
ראינו את זה קורה בעבר, כמובן.

00:18:12.167 --> 00:18:13.966
במהפכה התעשייתית,

00:18:13.966 --> 00:18:16.817
ראינו שינוי משמעותי ביכולות
הודות למנועים.

00:18:17.667 --> 00:18:20.805
העניין הוא שאחרי זמן מה, 
העניינים השתטחו.

00:18:20.805 --> 00:18:22.507
הייתה הפרעה חברתית,

00:18:22.507 --> 00:18:25.946
אבל ברגע שהשתמשו במנועים על מנת 
לייצר חשמל בכל המצבים,

00:18:25.946 --> 00:18:28.300
דברים התחילו להירגע.

00:18:28.300 --> 00:18:29.773
מהפיכת הלמידה החישובית

00:18:29.773 --> 00:18:32.682
הולכת להיות שונה מאוד
מהמהפיכה התעשייתית,

00:18:32.682 --> 00:18:35.632
כיוון שמהפיכת הלמידה החישובית,
היא לעולם לא נרגעת.

00:18:35.632 --> 00:18:38.614
ככל שמחשבים יהיו יותר טובים 
בפעילוית אינטלקטואליות,

00:18:38.614 --> 00:18:42.862
כך הם יכולים לבנות מחשבים טובים יותר
שיהיו טובים יותר ביכולות אינטלקטואליות,

00:18:42.862 --> 00:18:44.770
אז זה הולך להיות סוג של שינוי

00:18:44.770 --> 00:18:47.248
שהעולם למעשה לא חווה מעולם,

00:18:47.248 --> 00:18:50.554
אז ההבנה הקודמת שלכם
של מה אפשרי, היא שונה.

NOTE Paragraph

00:18:50.974 --> 00:18:52.754
זה כבר מכה בנו.

00:18:52.754 --> 00:18:56.384
ב-25 השנים האחרונות,
כשפריון ההון הולך וגדל,

00:18:56.400 --> 00:19:00.588
פריון העבודה נשאר שטוח,
למעשה אפילו מעט ירד.

NOTE Paragraph

00:19:01.408 --> 00:19:04.149
אז אני רוצה שאנחנו נתחיל
לנהל את הדיון הזה כעת.

00:19:04.149 --> 00:19:07.176
אני יודע שהרבה פעמים כשאני
מספר לאנשים על המצב הזה,

00:19:07.176 --> 00:19:08.666
אנשים יכולים לבטל אותי.

00:19:08.666 --> 00:19:10.339
ובכן, מחשבים לא יכולים ממש לחשוב,

00:19:10.339 --> 00:19:13.367
הם לא מביעים רגשות,
הם לא מבינים שירה,

00:19:13.367 --> 00:19:15.888
אנחנו לא ממש מבינים איך הם עובדים.

00:19:15.888 --> 00:19:17.374
אז מה?

00:19:17.374 --> 00:19:19.178
מחשבים כרגע יכולים לעשות את הדברים

00:19:19.178 --> 00:19:21.897
שבני אדם מקבלים תשלום
לעשות במשך רוב חייהם,

00:19:21.897 --> 00:19:23.628
אז עכשיו הזמן להתחיל לחשוב

00:19:23.628 --> 00:19:28.015
על איך אנחנו הולכים להתאים את 
המבנים החברתיים והכלכליים שלנו

00:19:28.015 --> 00:19:29.855
כך שיהיו מודעים למציאות החדשה הזו.

00:19:29.855 --> 00:19:31.388
תודה.

00:19:31.388 --> 00:19:32.190
(מחיאות כפיים)