1
00:00:00,880 --> 00:00:04,893
פעם, אם רצית לגרום למחשב לעשות משהו חדש

2
00:00:04,893 --> 00:00:06,509
היית צריך לתכנת אותו.

3
00:00:06,509 --> 00:00:09,423
כעת, תכנות, למי מכם 
שלא עשו זאת בעצמם,

4
00:00:09,423 --> 00:00:12,918
דורש לפרוש בפירוט מייגע

5
00:00:12,918 --> 00:00:16,070
כל צעד וצעד שאתה רוצה שהמחשב יעשה

6
00:00:16,070 --> 00:00:18,157
על מנת להשיג את המטרה שלך.

7
00:00:18,157 --> 00:00:22,479
כעת, אם אתה רוצה לעשות משהו 
שאתה לא יודע איך לעשות בעצמך,

8
00:00:22,479 --> 00:00:24,325
אז זה הולך להיות אתגר רציני.

9
00:00:24,325 --> 00:00:27,888
אז זה היה האתגר שעמד בפני
האיש הזה, ארתור סמואל.

10
00:00:27,888 --> 00:00:31,991
ב-1956, הוא רצה לגרום למחשב הזה

11
00:00:31,991 --> 00:00:34,208
להיות מסוגל להביס אותו בדמקה.

12
00:00:34,208 --> 00:00:36,008
איך אתה יכול לכתוב תוכנה,

13
00:00:36,008 --> 00:00:40,098
לפרוש בפירוט מייגע,
איך להיות יותר טוב ממך בדמקה?

14
00:00:40,098 --> 00:00:41,714
אז הוא הגה רעיון:

15
00:00:41,714 --> 00:00:45,946
הוא נתן למחשב לשחק 
נגד עצמו אלפי פעמים

16
00:00:45,946 --> 00:00:48,100
וללמוד איך לשחק דמקה.

17
00:00:48,100 --> 00:00:51,494
ואכן זה עבד, ולמעשה עד 1962,

18
00:00:51,494 --> 00:00:54,124
המחשב הזה ניצח את האלוף של קונטיקט.

19
00:00:55,484 --> 00:00:58,221
אז ארתור סמואל היה אבי הלמידה החישובית.

20
00:00:58,221 --> 00:00:59,931
ואני חב לו חוב ענק.

21
00:00:59,931 --> 00:01:02,509
בגלל שאני עוסק בלמידה חישובית.

22
00:01:02,509 --> 00:01:04,229
הייתי הנשיא של קאגל,

23
00:01:04,229 --> 00:01:07,649
קהילה שמונה מעל 200,000 אנשים 
שעוסקים בלמידה חישובית.

24
00:01:07,649 --> 00:01:10,107
קאגל מארגנת תחרויות

25
00:01:10,107 --> 00:01:13,605
לנסות ולגרום להם לפתור 
בעיות שלא נפתרו עד כה,

26
00:01:13,605 --> 00:01:17,043
וזו הייתה הצלחה מאות פעמים.

27
00:01:17,043 --> 00:01:19,900
אז מתצפית מנקודת יתרון זו, 
הצלחתי לגלות

28
00:01:19,900 --> 00:01:23,700
הרבה על מה שלמידה חישובית 
יכולה לעשות בעבר, לעשות היום,

29
00:01:23,712 --> 00:01:25,273
ומה היא יכולה לעשות בעתיד.

30
00:01:25,273 --> 00:01:30,272
אולי ההצלחה הגדולה הראשונה של 
למידה חישובית באופן מסחרי הייתה גוגל.

31
00:01:30,272 --> 00:01:33,480
גוגל הראתה שזה אפשרי למצוא מידע

32
00:01:33,480 --> 00:01:35,739
על ידי שימוש באלגוריתם ממוחשב,

33
00:01:35,739 --> 00:01:38,264
והאלגוריתם הזה 
מבוסס על למידה חישובית.

34
00:01:38,264 --> 00:01:42,123
מאז, היו הרבה הצלחות מסחריות 
של למידה ממוחשבת.

35
00:01:42,123 --> 00:01:44,309
חברות כמו אמזון ונטפליקס

36
00:01:44,309 --> 00:01:47,496
משתמשות בלמידה חישובית
כדי להציע מוצרים שאולי תרצה לקנות,

37
00:01:47,496 --> 00:01:49,206
סרטים שאולי תרצה לראות.

38
00:01:49,206 --> 00:01:51,346
לפעמים, זה כמעט מפחיד.

39
00:01:51,346 --> 00:01:53,413
חברות כמו לינקדאין ופייסבוק

40
00:01:53,413 --> 00:01:56,101
לפעמים אומרות לך מי 
עשויים להיות החברים שלך

41
00:01:56,101 --> 00:01:58,228
ואין לך מושג איך הן עשו את זה,

42
00:01:58,228 --> 00:02:01,195
וזה בגלל שהן משתמשות בכוחה
של הלמידה החישובית.

43
00:02:01,195 --> 00:02:04,152
אלו הם אלגוריתמים שלמדו
איך לעשות זאת מנתונים

44
00:02:04,152 --> 00:02:07,399
במקום להיות מתוכנתות לעשות 
זאת באופן ידני.

45
00:02:07,399 --> 00:02:09,877
כך גם IBM הצליחה

46
00:02:09,877 --> 00:02:13,739
לגרום לווטסון להביס
את שני אלופי העולם ב"ג'פרדי",

47
00:02:13,739 --> 00:02:16,964
ולענות על שאלות עדינות ומורכבות 
להפליא כמו זאת:

48
00:02:16,964 --> 00:02:19,799
["ה'אריה של נמרוד' העתיק נעלם מהמוזיאון
הלאומי של העיר הזאת ב-2003 (יחד עם עוד הרבה דברים)"]

49
00:02:19,799 --> 00:02:23,034
זו גם הסיבה בגללה אנו עכשיו
רואים את המכוניות הראשונות שנוהגות לבד.

50
00:02:23,034 --> 00:02:25,856
אם אתם רוצים להיות מסוגלים 
להבחין בין, למשל,

51
00:02:25,856 --> 00:02:28,488
עץ והולך רגל, ובכן,
זה די חשוב.

52
00:02:28,488 --> 00:02:31,075
אנחנו לא יודעים איך לכתוב 
את התוכנות הללו באופן ידני,

53
00:02:31,075 --> 00:02:34,072
אך עם למידה חישובית,
זה אפשרי כעת.

54
00:02:34,072 --> 00:02:36,680
ולמעשה, המכונית הזו נסעה מעל 
מיליון מיילים

55
00:02:36,680 --> 00:02:40,186
ללא אף תאונה בכבישים רגילים.

56
00:02:40,196 --> 00:02:44,110
אז אנחנו יודעים שמחשבים יכולים ללמוד,

57
00:02:44,110 --> 00:02:46,010
ומחשבים יכולים ללמוד לעשות דברים

58
00:02:46,010 --> 00:02:48,848
שאנחנו למעשה לפעמים 
לא יודעים לעשות בעצמנו,

59
00:02:48,848 --> 00:02:51,733
או אולי יכולים לעשות אותם יותר טוב מאיתנו.

60
00:02:51,733 --> 00:02:55,928
אחת מהדוגמאות המדהימות ביותר
שראיתי ללמידה חישובית

61
00:02:55,928 --> 00:02:58,320
קרתה בפרוייקט שהובלתי בקאגל

62
00:02:58,320 --> 00:03:01,911
שבו צוות שהובל על ידי
בחור בשם ג'פרי הינטון

63
00:03:01,911 --> 00:03:03,463
מאוניברסיטת טורונטו

64
00:03:03,463 --> 00:03:06,140
זכה בתחרות על
פיתוח תרופות אוטומטי.

65
00:03:06,140 --> 00:03:08,987
כעת, מה שמדהים פה זה לא רק שהם ניצחו

66
00:03:08,987 --> 00:03:13,000
את כל האלגוריתמים שפותחו על ידי מרק
או קהילת האקדמיה העולמית,

67
00:03:13,000 --> 00:03:18,061
אלא שלאף אחד בצוות לא היה רקע
בכימיה, ביולוגיה או מדעי החיים,

68
00:03:18,061 --> 00:03:20,230
והם עשו זאת בשבועיים.

69
00:03:20,230 --> 00:03:21,611
איך הם עשו זאת?

70
00:03:22,421 --> 00:03:25,342
הם השתמשו באלגוריתם 
יוצא דופן שנקרא למידה עמוקה.

71
00:03:25,342 --> 00:03:28,291
זה היה כל כך חשוב 
שההצלחה סוקרה

72
00:03:28,291 --> 00:03:31,412
בניו יורק טיימס במאמר בעמוד הראשי
כמה שבועות לאחר מכן.

73
00:03:31,412 --> 00:03:34,147
זה ג'פרי הינטון
כאן משמאל.

74
00:03:34,147 --> 00:03:38,488
למידה עמוקה הוא אלגוריתם
ששואב השראה מהמוח האנושי,

75
00:03:38,488 --> 00:03:40,300
וכתוצאה מכך הוא אלגוריתם

76
00:03:40,300 --> 00:03:44,141
שאין לו מגבלות תיאורטיות
על מה שהוא מסוגל לעשות.

77
00:03:44,141 --> 00:03:46,964
ככל שנותנים לו יותר נתונים וזמן חישוב,

78
00:03:46,964 --> 00:03:48,276
כך הוא משתפר.

79
00:03:48,276 --> 00:03:50,615
הניו יורק טיימס גם 
הראה במאמר הזה

80
00:03:50,615 --> 00:03:52,857
תוצאה מדהימה נוספת 
של למידה חישובית

81
00:03:52,857 --> 00:03:55,569
שאני הולך להראות לכם כעת.

82
00:03:55,569 --> 00:04:00,510
הם מראים שמחשבים יכולים
להקשיב ולהבין.

83
00:04:00,510 --> 00:04:03,221
(וידאו) ריצ'רד ראשיד: עכשיו, הצעד האחרון

84
00:04:03,221 --> 00:04:06,246
שאני רוצה להיות מסוגל לבצע בתהליך הזה

85
00:04:06,246 --> 00:04:10,961
הוא למעשה לדבר אליכם בסינית.

86
00:04:10,961 --> 00:04:13,596
עכשיו המפתח פה,

87
00:04:13,596 --> 00:04:18,598
הוא שהצלחנו לקחת כמות גדולה
של מידע מהרבה דוברי סינית

88
00:04:18,598 --> 00:04:21,128
ולייצר מערכת של טקסט-לדיבור

89
00:04:21,128 --> 00:04:25,801
שלוקחת טקסט בסינית
והופכת אותו לשפה סינית,

90
00:04:25,801 --> 00:04:29,929
ואז לקחנו כשעה של הקול שלי

91
00:04:29,929 --> 00:04:31,820
והשתמשנו בזה כדי להתאים

92
00:04:31,820 --> 00:04:36,364
את המערכת הסטנדרטית של טקסט-לדיבור
כך שהיא תישמע כמוני.

93
00:04:36,364 --> 00:04:38,904
שוב, התוצאה לא מושלמת.

94
00:04:38,904 --> 00:04:41,552
יש למעשה די הרבה שגיאות.

95
00:04:41,552 --> 00:04:44,036
(בסינית)

96
00:04:44,036 --> 00:04:47,403
(מחיאות כפיים)

97
00:04:49,446 --> 00:04:53,022
יש הרבה עבודה לעשות בתחום הזה.

98
00:04:53,022 --> 00:04:56,667
(סינית)

99
00:04:56,667 --> 00:05:00,100
(מחיאות כפיים)

100
00:05:01,345 --> 00:05:04,744
(ג'רמי הווארד:) ובכן, זה היה בכנס
למידה חישובית בסין.

101
00:05:04,744 --> 00:05:07,114
זה די נדיר, למעשה, בכנסים אקדמאים

102
00:05:07,114 --> 00:05:09,011
לשמוע מחיאות כפיים ספונטניות,

103
00:05:09,011 --> 00:05:12,687
למרות שכמובן לפעמים 
בכנסים של TEDx, הרגישו חופשי.

104
00:05:12,687 --> 00:05:15,482
כל מה שראיתם שם קרה עם למידה עמוקה.

105
00:05:15,482 --> 00:05:17,007
(מחיאות כפיים)
תודה.

106
00:05:17,007 --> 00:05:19,289
התמלול לאנגלית היה למידה עמוקה.

107
00:05:19,289 --> 00:05:22,701
התרגום לסינית והטקסט 
מימין למעלה- למידה עמוקה.

108
00:05:22,701 --> 00:05:26,008
והבניה של הקול היתה למידה עמוקה גם כן.

109
00:05:26,008 --> 00:05:29,242
אז למידה עמוקה היא דבר מדהים.

110
00:05:29,242 --> 00:05:32,341
זה אלגוריתם יחיד שיכול לעשות כמעט הכל.

111
00:05:32,341 --> 00:05:35,452
וגיליתי ששנה קודם לכן, 
הוא גם למד לראות.

112
00:05:35,452 --> 00:05:37,628
בתחרות לא מוכרת בגרמניה

113
00:05:37,628 --> 00:05:40,225
בשם הבוחן הגרמני לביצועי זיהוי שלטי תנועה

114
00:05:40,225 --> 00:05:43,618
למידה עמוקה למדה לזהות 
שלטי תנועה כמו זה

115
00:05:43,618 --> 00:05:45,712
היא לא רק זיהתה את השלטים

116
00:05:45,712 --> 00:05:47,470
יותר טוב מכל אלגוריתם אחר,

117
00:05:47,470 --> 00:05:50,189
לוח התוצאות ממש הראה שהיא
יותר טובה מאנשים,

118
00:05:50,189 --> 00:05:52,041
בערך פי 2 יותר טוב מאנשים.

119
00:05:52,041 --> 00:05:54,037
אז עד 2011, היתה לנו את הדוגמה הראשונה

120
00:05:54,037 --> 00:05:57,442
למחשבים שיכולים לראות יותר טוב מאנשים.

121
00:05:57,442 --> 00:05:59,491
מאז, הרבה התרחש.

122
00:05:59,491 --> 00:06:03,005
ב-2012, גוגל הכריזה שהיא
נתנה לאלגוריתם למידה עמוקה

123
00:06:03,005 --> 00:06:04,420
לצפות בסרטוני יוטיוב

124
00:06:04,420 --> 00:06:07,857
והם עבדו על הנתונים על 16,000
מחשבים למשך חודש,

125
00:06:07,857 --> 00:06:12,218
והמחשב למד באופן עצמאי על 
מושגים כמו אנשים וחתולים

126
00:06:12,218 --> 00:06:14,027
רק מצפייה בסרטונים.

127
00:06:14,027 --> 00:06:16,379
זה מאוד דומה לדרך בה אנשים לומדים.

128
00:06:16,379 --> 00:06:19,119
בני אדם לא לומדים על ידי כך 
שאומרים להם מה הם רואים,

129
00:06:19,119 --> 00:06:22,450
אלא על ידי למידה עצמאית
של מהם אותם דברים.

130
00:06:22,450 --> 00:06:25,819
גם ב-2012, ג'פרי הינטון,
שראינו קודם,

131
00:06:25,819 --> 00:06:28,677
ניצח בתחרות אימג'נט המאוד פופולרית,

132
00:06:28,677 --> 00:06:32,818
שביקשה לנסות לגלות על 
1.5 מיליון תמונות

133
00:06:32,818 --> 00:06:34,256
תמונות של מה הן.

134
00:06:34,256 --> 00:06:37,789
נכון ל-2014, ירדנו 
לשיעור שגיאות של 6%

135
00:06:37,789 --> 00:06:39,242
בזיהוי תמונה.

136
00:06:39,242 --> 00:06:41,268
זה יותר טוב מאנשים, שוב.

137
00:06:41,268 --> 00:06:45,037
אז מכונות באמת עושות עבודה מצויינת בכך,

138
00:06:45,037 --> 00:06:47,306
וזה עכשיו נכנס לשימוש בתעשייה.

139
00:06:47,306 --> 00:06:50,348
למשל, גוגל הכריזה בשנה שעברה

140
00:06:50,348 --> 00:06:54,933
שהם מיפו כל מיקום ומיקום בצרפת תוך שעתיים,

141
00:06:54,933 --> 00:06:58,380
והדרך בה הם עשו זאת היתה
הזנת תמונות רחוב

142
00:06:58,380 --> 00:07:02,699
לאלגוריתם למידה עמוקה
שיזהה ויקרא מספרי רחובות.

143
00:07:02,699 --> 00:07:04,919
דמיינו כמה זמן זה היה לוקח בעבר:

144
00:07:04,919 --> 00:07:08,274
עשרות אנשים, שנים רבות.

145
00:07:08,274 --> 00:07:10,185
זה גם קורה בסין.

146
00:07:10,185 --> 00:07:14,221
באידו הוא סוג של 
הגוגל הסיני, אני מניח.

147
00:07:14,221 --> 00:07:16,504
ומה שרואים כאן בשמאל למעלה

148
00:07:16,504 --> 00:07:20,478
הוא דוגמה לתמונה שאני העליתי
למערכת הלמידה העמוקה של באידו,

149
00:07:20,478 --> 00:07:24,247
ומתחת אפשר לראות שהמערכת הבינה מה התמונה

150
00:07:24,247 --> 00:07:26,483
ומצאה תמונות דומות.

151
00:07:26,483 --> 00:07:29,219
לתמונות הדומות למעשה יש רקעים דומים,

152
00:07:29,219 --> 00:07:30,877
כיווני פרצופים דומים,

153
00:07:30,877 --> 00:07:32,665
אפילו כמה עם הלשון בחוץ.

154
00:07:32,665 --> 00:07:35,695
זה לא להסתכל על טקסט של דף אינטרנט.

155
00:07:35,695 --> 00:07:37,107
כל מה שאני העליתי היה תמונה.

156
00:07:37,107 --> 00:07:41,128
אז כעת יש לנו מחשבים שבאמת
מבינים מה הם רואים

157
00:07:41,128 --> 00:07:42,752
ולכן יכולים לחפש במאגרי מידע

158
00:07:42,752 --> 00:07:46,306
של מאות מיליוני תמונות בזמן אמת.

159
00:07:46,306 --> 00:07:49,536
אז מה זה אומר
עכשיו שמחשבים יכולים לראות?

160
00:07:49,536 --> 00:07:51,553
ובכן, זה לא רק 
שמחשבים יכולים לראות.

161
00:07:51,553 --> 00:07:53,622
למעשה, למידה עמוקה 
עשתה יותר מכך.

162
00:07:53,622 --> 00:07:56,570
משפטים מורכבים עם ניואנסים, כמו זה

163
00:07:56,570 --> 00:07:59,394
הם כעת מובנים בעזרת 
אלגוריתמים של למידה עמוקה.

164
00:07:59,394 --> 00:08:00,697
כמו שאתם רואים פה,

165
00:08:00,697 --> 00:08:03,465
המערכת הזו שמבוססת בסטנפורד
שמראה את הנקודה האדומה למעלה

166
00:08:03,465 --> 00:08:07,384
הבינה שהמשפט הזה מבטא רגש שלילי.

167
00:08:07,384 --> 00:08:10,790
למידה עמוקה היא כעת למעשה
כמעט ברמה של בן אדם

168
00:08:10,802 --> 00:08:15,923
בלהבין על מה משפטים מדברים
ומה הם אומרים על אותם דברים.

169
00:08:15,923 --> 00:08:18,651
בנוסף, עשו שימוש בלמידה עמוקה
לקריאת סינית,

170
00:08:18,651 --> 00:08:21,807
שוב, בערך ברמה של דובר סינית מלידה.

171
00:08:21,807 --> 00:08:23,975
האלגוריתם הזה שפותח בשוויץ

172
00:08:23,975 --> 00:08:27,331
על ידי אנשים שאף אחד 
מהם לא דובר או מבין סינית.

173
00:08:27,331 --> 00:08:29,382
כמו שאמרתי, שימוש בלמידה עמוקה

174
00:08:29,382 --> 00:08:31,601
היא בערך המערכת הכי טובה
בעולם לשם כך,

175
00:08:31,601 --> 00:08:36,718
אפילו בהשוואה
להבנה אנושית.

176
00:08:36,718 --> 00:08:39,682
זוהי מערכת אותה אנו בונים בחברה שלי

177
00:08:39,682 --> 00:08:41,728
שמראה איך מחברים את כל הדברים האלה.

178
00:08:41,728 --> 00:08:44,189
אלו תמונות להן לא מצורף טקסט,

179
00:08:44,189 --> 00:08:46,541
וכשאני מקליד את המשפטים האלה כאן,

180
00:08:46,541 --> 00:08:49,510
בזמן אמת זה מבין את התמונות האלו

181
00:08:49,510 --> 00:08:51,189
ומבין על מה הן

182
00:08:51,189 --> 00:08:54,352
ומבין שהתמונות דומות לטקסט שאני כותב.

183
00:08:54,352 --> 00:08:57,108
אז אתם רואים, זה למעשה
מבין את המשפטים שלי

184
00:08:57,108 --> 00:08:59,332
וממש מבין את התמונות הללו.

185
00:08:59,332 --> 00:09:01,891
אני יודע שראיתם משהו דומה בגוגל,

186
00:09:01,891 --> 00:09:04,666
שבו אפשר להקליד דברים
וזה מראה לך תמונות,

187
00:09:04,666 --> 00:09:08,090
אבל למעשה מה שזה עושה זה
לחפש בדף האינטרנט אחר טקסט.

188
00:09:08,090 --> 00:09:11,091
זה מאוד שונה מאשר ממש להבין את התמונות.

189
00:09:11,091 --> 00:09:13,843
זה משהו שמחשבים 
היו מסוגלים לעשות

190
00:09:13,843 --> 00:09:17,091
בפעם הראשונה רק בחודשים האחרונים.

191
00:09:17,091 --> 00:09:21,182
אז אנו רואים עכשיו שמחשבים
יכולים לא רק לראות אלא גם לקרוא,

192
00:09:21,182 --> 00:09:24,947
וכמובן, הראינו שהם יכולים
להבין את מה שהם שומעים.

193
00:09:24,947 --> 00:09:28,389
אולי זה לא מפתיע כעת 
שאני עומד לספר לכם שהם יכולים לכתוב.

194
00:09:28,389 --> 00:09:33,172
הנה טקסט שייצרתי
על ידי אלגוריתם למידה עמוקה אתמול.

195
00:09:33,172 --> 00:09:37,096
והנה טקסט שאלגוריתם
מסטנפורד ייצר.

196
00:09:37,096 --> 00:09:38,860
כל אחד מהמשפטים הללו נוצר

197
00:09:38,860 --> 00:09:43,109
על יגי אלגוריתם למידה עמוקה
על מנת לתאר כל אחת מהתמונות האלו.

198
00:09:43,109 --> 00:09:47,581
האלגוריתם הזה לא ראה לפני כן מעולם
איש בחולצה שחורה שמנגן בגיטרה.

199
00:09:47,581 --> 00:09:49,801
הוא ראה אדם בעבר,
הוא ראה שחור בעבר,

200
00:09:49,801 --> 00:09:51,400
הוא ראה גיטרה בעבר,

201
00:09:51,400 --> 00:09:55,694
אך הוא ייצר באופן עצמאי
את התיאור החדש של התמונה.

202
00:09:55,694 --> 00:09:59,196
אנחנו עדיין לא בדיוק ברמה אנושית כאן,
אך אנחנו קרובים.

203
00:09:59,196 --> 00:10:03,264
במבחנים, בני אדם מעדיפים 
את הכותרת המיוצרת על ידי מחשב

204
00:10:03,264 --> 00:10:04,791
אחת לכל ארבע פעמים.

205
00:10:04,791 --> 00:10:06,855
עכשיו המערכת הזו היא רק בת שבועיים,

206
00:10:06,855 --> 00:10:08,701
אז סביר שמתישהו בשנה הבאה,

207
00:10:08,701 --> 00:10:11,502
האלגוריתם הממוחשב יעבור בהרבה
את היכולות האנושיות

208
00:10:11,502 --> 00:10:13,364
בקצב שבו דברים מתקדמים.

209
00:10:13,364 --> 00:10:16,413
אז מחשבים גם יכולים לכתוב.

210
00:10:16,413 --> 00:10:19,888
אם לוקחים את כל זה יחד
זה מוביל לאפשרויות מרגשות.

211
00:10:19,888 --> 00:10:21,380
למשל, ברפואה,

212
00:10:21,380 --> 00:10:23,905
צוות בבוסטון הכריז שהם גילו

213
00:10:23,905 --> 00:10:26,854
עשרות מאפיינים רלוונטיים קלינית

214
00:10:26,854 --> 00:10:31,120
של גידולים, שיכולים לעזור לרופאים
לקבל פרוגנוזה של הסרטן.

215
00:10:32,220 --> 00:10:34,516
באופן דומה, בסטנפורד,

216
00:10:34,516 --> 00:10:38,179
קבוצה הכריזה כי, 
לאחר שהסתכלו על רקמות בהגדלה,

217
00:10:38,179 --> 00:10:40,560
הם פיתחו מערכת
מבוססת למידה חישובית

218
00:10:40,560 --> 00:10:43,142
שהיא למעשה טובה יותר 
מפתולוגים אנושיים

219
00:10:43,142 --> 00:10:47,519
בחיזוי סיכויי הישרדות 
עבור הסובלים מסרטן.

220
00:10:47,519 --> 00:10:50,764
בשני המקרים האלה, לא רק
שהתחזיות היו יותר מדוייקות,

221
00:10:50,764 --> 00:10:53,266
אלא שהן גם הפיקו מדע חדש בעל תובנות.

222
00:10:53,276 --> 00:10:54,781
במקרה של הרדיולוגיה,

223
00:10:54,781 --> 00:10:57,876
היו אינדיקטורים קליניים חדשים
שבני אדם יכולים להבין.

224
00:10:57,876 --> 00:10:59,668
במקרה הזה של הפתולוגיה,

225
00:10:59,668 --> 00:11:04,168
המערכת הממוחשבת גילתה למעשה
שהתאים שסביב הסרטן

226
00:11:04,168 --> 00:11:07,508
הם חשובים כמו תאי הסרטן עצמם

227
00:11:07,508 --> 00:11:09,240
לאבחנה.

228
00:11:09,240 --> 00:11:14,621
זה ההיפך ממה שפתולוגים 
למדו במשך עשורים.

229
00:11:14,621 --> 00:11:17,913
בכל אחד משני המקרים הללו,
אלו היו מערכות שפותחו

230
00:11:17,913 --> 00:11:21,534
על ידי שילוב של מומחים רפואיים 
ומומחי למידה חישובית,

231
00:11:21,534 --> 00:11:24,275
אך החל מהשנה שעברה, 
אנחנו מעבר גם לכך.

232
00:11:24,275 --> 00:11:27,824
הנה דוגמה לזיהוי איזורים סרטניים

233
00:11:27,824 --> 00:11:30,354
ברקמה אנושית תחת מיקרוסקופ.

234
00:11:30,354 --> 00:11:34,967
המערכת שאתם רואים כאן יכולה
לזהות את אותם איזורים באופו יותר מדוייק,

235
00:11:34,967 --> 00:11:37,742
או בערך מדוייק באותה מידה,
כמו פתולוג אנושי,

236
00:11:37,742 --> 00:11:41,134
אך נבנתה אך ורק על ידי
למידה עמוקה, ללא מומחיות רפואית

237
00:11:41,134 --> 00:11:43,660
על ידי אנשים שאין להם רקע בתחום כלל.

238
00:11:44,730 --> 00:11:47,285
באופן דומה, כאן, הסגמנטציה של הנוירון.

239
00:11:47,285 --> 00:11:50,953
אנו יכולים כעת לחלק נוירונים לסגמנטים
כמעט באופן מדוייק כמו בני אדם,

240
00:11:50,953 --> 00:11:53,670
אך המערכת הזו פותחה 
על ידי למידה עמוקה

241
00:11:53,670 --> 00:11:56,921
ואנשים ללא רקע ברפואה.

242
00:11:56,921 --> 00:12:00,148
אז אני, כמישהו ללא רקע ברפואה,

243
00:12:00,148 --> 00:12:03,875
נראה שאני מספיק מצוייד
להקים חברה רפואית חדשה.

244
00:12:03,875 --> 00:12:06,021
וזה מה שעשיתי.

245
00:12:06,021 --> 00:12:07,761
הייתי די מבועת מכך,

246
00:12:07,761 --> 00:12:10,650
אבל התיאוריה הציעה
שזה צריך להיות אפשרי

247
00:12:10,650 --> 00:12:16,142
לעשות רפואה שימושית
בשימוש בטכניקות אנליזת מידע בלבד.

248
00:12:16,142 --> 00:12:18,622
ולמרבה המזל, המשוב היה פנטסנטי,

249
00:12:18,622 --> 00:12:20,978
לא רק מהתקשורת
אלא גם מהקהילה הרפואית,

250
00:12:20,978 --> 00:12:23,322
שהיו מאוד תומכים.

251
00:12:23,322 --> 00:12:27,471
התאוריה היא שאנחנו יכולים
לקחת את חלק הביניים של התהליך הרפואי

252
00:12:27,471 --> 00:12:30,364
ולהפוך אותו לאנליזת מידע ככל הניתן,

253
00:12:30,364 --> 00:12:33,429
ולאפשר לרופאים לעשות את 
מה שהם הכי טובים בו.

254
00:12:33,429 --> 00:12:35,031
אני רוצה לתת לכם דוגמה.

255
00:12:35,031 --> 00:12:39,975
כיום זה לוקח 15 דקות
לייצר מבחן דיאגנוסטי חדש

256
00:12:39,975 --> 00:12:41,929
ואני אראה לכם זאת בזמן אמת עכשיו,

257
00:12:41,929 --> 00:12:45,416
אבל דחסתי את זה ל-3 דקות 
על ידי הוצאת כמה חלקים.

258
00:12:45,416 --> 00:12:48,477
במקום להראות לכם יצירת 
מבחן דיאגנוסטי רפואי חדש,

259
00:12:48,477 --> 00:12:51,846
אני הולך להראות לכם
מבחן דיאגנוסטי של תמונות של מכוניות,

260
00:12:51,846 --> 00:12:54,068
בגלל שזה משהו שכולנו יכולים להבין.

261
00:12:54,068 --> 00:12:57,269
אז הנה אנחנו מתחילים עם
בערך 1.5 מיליון תמונות של מכוניות,

262
00:12:57,269 --> 00:13:00,475
ואני רוצה ליצור משהו 
שיכול לפצל אותם לזוית

263
00:13:00,475 --> 00:13:02,698
שבה התמונה צולמה.

264
00:13:02,698 --> 00:13:06,586
אז התמונות האלה הן לגמרי לא מתוייגות,
אז אני צריך להתחיל מאפס.

265
00:13:06,586 --> 00:13:08,451
בעזרת אלגוריתם הלמידה העמוקה שלנו,

266
00:13:08,451 --> 00:13:12,158
הוא יכול לזהות אוטומטית
איזורים של מבנה בתמונות אלו.

267
00:13:12,158 --> 00:13:15,778
אז הדבר הנחמד הוא שהאדם
והמחשב יכולים לעבוד עתה יחד.

268
00:13:15,778 --> 00:13:17,956
אז האדם, כמו שאתם רואים כאן,

269
00:13:17,956 --> 00:13:20,631
אומר למחשב על איזורי עניין

270
00:13:20,631 --> 00:13:25,281
שהוא רוצה שהמחשב ינסה
להשתמש בהם לשיפור האלגוריתם.

271
00:13:25,281 --> 00:13:29,577
כעת, מערכות הלמידה העמוקה הללו 
הן למעשה בחלל בעל 16,000 מימדים,

272
00:13:29,577 --> 00:13:33,009
אז אתם רואים כאן שהמחשב
מסובב זאת דרך המרחב הזה,

273
00:13:33,009 --> 00:13:35,001
ומנסה למצוא איזורים חדשים של מבנה.

274
00:13:35,001 --> 00:13:36,776
וכשהוא מצליח,

275
00:13:36,776 --> 00:13:40,471
האדם שנוהג בו יכול לציין את
האיזורים שמעניינים.

276
00:13:40,471 --> 00:13:43,208
אז הנה, המחשב מצא בהצלחה איזורים,

277
00:13:43,208 --> 00:13:45,770
לדוגמה, זוויות.

278
00:13:45,770 --> 00:13:47,376
אז כשאנחנו מתקדמים בתהליך הזה,

279
00:13:47,376 --> 00:13:49,716
אנחנו בהדרגה אומרים 
למחשב עוד ועוד

280
00:13:49,716 --> 00:13:52,144
אודות סוגי המבנים שאנחנו מחפשים.

281
00:13:52,144 --> 00:13:53,916
אתם יכולים לדמיין זאת במבחן דיאגנוסטי

282
00:13:53,916 --> 00:13:57,266
זה יהיה פתולוג שמזהה 
איזורי מחלה, לדוגמה,

283
00:13:57,266 --> 00:14:02,292
או רדיולוג שמצביע על קשריות
שיכולות להיות בעייתיות.

284
00:14:02,292 --> 00:14:04,851
ולפעמים זה יכול להיות קשה לאלגוריתם.

285
00:14:04,851 --> 00:14:06,815
במקרה הזה, הוא די התבלבל.

286
00:14:06,815 --> 00:14:09,365
החלקים הקדמיים והאחוריים 
של המכוניות מעורבבים.

287
00:14:09,365 --> 00:14:11,437
אז כאן עלינו להיות טיפה יותר זהירים,

288
00:14:11,437 --> 00:14:14,669
ולבחור באופן ידני את החלקים הקדמיים
בניגוד לאלו האחוריים,

289
00:14:14,669 --> 00:14:20,175
ואז להגיד למחשב שזו סוג של קבוצה

290
00:14:20,175 --> 00:14:21,523
שאנחנו מעונינים בה.

291
00:14:21,523 --> 00:14:24,200
אז אנחנו עושים זאת למשך זמן מה,
מדלגים על קצת,

292
00:14:24,200 --> 00:14:26,446
ואז אנחנו מאמנים את אלגוריתם
הלמידה החישובית

293
00:14:26,446 --> 00:14:28,420
בהתבסס על אותם 200 דברים,

294
00:14:28,420 --> 00:14:30,445
ומקווים שהוא השתפר בהרבה.

295
00:14:30,445 --> 00:14:33,518
אתם רואים, הוא התחיל להדהות
כמה מהתמונות האלו,

296
00:14:33,518 --> 00:14:38,226
ומראה לנו שהוא כבר מזהה
איך להבין כמה מאלה בעצמו.

297
00:14:38,226 --> 00:14:41,128
אז אנחנו יכולים להשתמש בקונספט הזה 
של תמונות דומות,

298
00:14:41,128 --> 00:14:43,222
ועל ידי שימוש בתמונות דומות,
אתם יכולים עכשיו לראות,

299
00:14:43,222 --> 00:14:47,241
שהמחשב בנקודה זו מסוגל
למצוא רק את החזית של מכוניות.

300
00:14:47,241 --> 00:14:50,189
אז בנקודה זו, 
האדם יכול לומר למחשב,

301
00:14:50,189 --> 00:14:52,482
אוקיי, כן, עשית עבודה טובה.

302
00:14:53,652 --> 00:14:55,837
לפעמים, כמובן, אפילו בנקודה זו

303
00:14:55,837 --> 00:14:59,511
זה עדיין קשה להפריד בין קבוצות.

304
00:14:59,511 --> 00:15:03,395
במקרה הזה, אפילו אחרי שאנחנו נותנים למחשב
לנסות לסובב זאת למשך זמן מה,

305
00:15:03,399 --> 00:15:06,744
אנחנו עדיין מוצאים שהתמונות 
של הצדדים השמאלייים והימניים

306
00:15:06,744 --> 00:15:08,222
מעורבבות זו בזו.

307
00:15:08,222 --> 00:15:10,362
אז אנחנו שוב יכולים לתת
למחשב כמה רמזים,

308
00:15:10,362 --> 00:15:13,338
ולהגיד, אוקיי, נסה למצוא 
תכנית שמפרידה

309
00:15:13,338 --> 00:15:15,945
את צד ימין מצד שמאל עד כמה שניתן

310
00:15:15,945 --> 00:15:18,067
על ידי שימוש באלגוריתם הלמידה העמוקה הזה.

311
00:15:18,067 --> 00:15:21,009
ואחרי שנתנו לו את הרמז הזה--
אה, אוקיי, הוא הצליח.

312
00:15:21,009 --> 00:15:23,891
הוא הצליח למצוא דרך
לחשוב על האובייקטים האלה

313
00:15:23,891 --> 00:15:26,271
שהפרידו את זה יחד.

314
00:15:26,271 --> 00:15:28,709
אז אתם מבינים את הרעיון פה.

315
00:15:28,709 --> 00:15:36,906
זה לא מקרה שבו האדם מוחלף על ידי המחשב,

316
00:15:36,906 --> 00:15:39,546
אלא שהם עובדים יחד.

317
00:15:39,546 --> 00:15:43,096
מה שאנחנו עושים כאן הוא להחליף
משהו שהיה לוקח לצוות

318
00:15:43,096 --> 00:15:45,098
של חמישה או שישה אנשים
בערך שבע שנים

319
00:15:45,098 --> 00:15:47,703
ומחליפים אותו במשהו שלוקח 15 דקות

320
00:15:47,703 --> 00:15:50,208
לאדם אחד שפועל לבד.

321
00:15:50,208 --> 00:15:54,158
אז התהליך הזה לוקח בערך 
ארבע או חמש חזרות.

322
00:15:54,158 --> 00:15:56,017
אתם רואים עכשיו שיש לנו 62 אחוז

323
00:15:56,017 --> 00:15:58,976
מ-1.5 מיליון התמונות שלנו
מסווגות נכונה.

324
00:15:58,976 --> 00:16:01,448
בנקודה זו, אנחנו יכולים
להתחיל די במהירות

325
00:16:01,448 --> 00:16:02,745
לקחת חלקם גדולים במלואם,

326
00:16:02,745 --> 00:16:05,664
לעבור עליהם ולוודא שאין טעויות.

327
00:16:05,664 --> 00:16:09,616
היכן שישנן טעויות, אנו יכולים
ליידע את המחשב עליהן.

328
00:16:09,616 --> 00:16:12,661
ועל ידי שימוש בסוג זה של תהליך
עבור כל אחת מהקבוצות השונות,

329
00:16:12,661 --> 00:16:15,148
אנחנו עכשיו מגיעים ל-80 אחוזי הצלחה

330
00:16:15,148 --> 00:16:17,563
בסיווג מיליון וחצי התמונות.

331
00:16:17,563 --> 00:16:19,641
ובנקודה זו, זהו רק מקרה

332
00:16:19,641 --> 00:16:23,220
של מציאת המספר הקטן 
שלא מסווג כראוי,

333
00:16:23,220 --> 00:16:26,108
ולנסות להבין למה.

334
00:16:26,108 --> 00:16:27,851
על ידי שימוש בגישה זו,

335
00:16:27,851 --> 00:16:31,972
תוך 15 דקות אנו מגיעים 
ל-97 אחוזי סיווג.

336
00:16:31,972 --> 00:16:36,572
אז סוג כזה של טכניקה
יכול לאפשר לנו לתקן בעיה גדולה,

337
00:16:36,578 --> 00:16:39,614
שהיא שיש חוסר במומחיות רפואית בעולם.

338
00:16:39,614 --> 00:16:43,103
פורום הכלכלה העולמי אומר
שיש בין 10X ו-20X

339
00:16:43,103 --> 00:16:45,727
של מחסור ברופאים בעולם המתפתח,

340
00:16:45,727 --> 00:16:47,395
ושזה ייקח בערך 300 שנה

341
00:16:47,395 --> 00:16:50,734
לאמן מספיק אנשים לתקן את הבעיה הזו.

342
00:16:50,734 --> 00:16:53,619
אז דמיינו אם היינו יכולים
לעזור להגביר את היעילות שלהם

343
00:16:53,619 --> 00:16:56,458
על ידי שימוש בגישת הלמידה העמוקה הזו?

344
00:16:56,458 --> 00:16:58,690
אז אני מאוד מתרגש מהאפשרויות.

345
00:16:58,690 --> 00:17:01,279
אני גם מאוד מודאג מהבעיות.

346
00:17:01,279 --> 00:17:04,403
הבעיה כאן היא שכל איזור בכחול על המפה

347
00:17:04,403 --> 00:17:08,172
הוא מקום שבו שירותים
הם מעל ל-80 אחוז מהתעסוקה.

348
00:17:08,172 --> 00:17:09,959
מה זה שירותים?

349
00:17:09,959 --> 00:17:11,473
אלו שירותים.

350
00:17:11,473 --> 00:17:15,627
אלו הם גם בדיוק הדברים שמחשבים
בדיוק למדו איך לעשות.

351
00:17:15,627 --> 00:17:19,431
אז 80 אחוז מהתעסוקה העולמית
בעולם המפותח

352
00:17:19,431 --> 00:17:21,963
הם דברים שמחשבים בדיוק למדו איך לעשות.

353
00:17:21,963 --> 00:17:23,403
מה זה אומר?

354
00:17:23,403 --> 00:17:25,986
ובכן, זה יהיה בסדר.
הן יוחלפו בעבודות אחרות.

355
00:17:25,986 --> 00:17:28,693
למשל, יהיו יותר עבודות
עבור מדעני נתונים.

356
00:17:28,693 --> 00:17:29,510
ובכן, לא באמת.

357
00:17:29,510 --> 00:17:32,628
לא לוקח למדענים זמן רב
לבנות את הדברים הללו.

358
00:17:32,628 --> 00:17:35,880
למשל, ארבעת האלגוריתמים האלה
נבנו כולם על ידי אותו אדם.

359
00:17:35,880 --> 00:17:38,318
אז אם אתם חושבים, הו, 
כל זה כבר קרה בעבר,

360
00:17:38,318 --> 00:17:42,138
ראינו את התוצאות בעבר
כאשר דברים חדשים הגיעו

361
00:17:42,138 --> 00:17:44,378
והם מוחלפים בעבודות חדשות,

362
00:17:44,378 --> 00:17:46,489
אבל מה העבודות החדשות הללו הולכות להיות?

363
00:17:46,489 --> 00:17:48,860
זה מאוד קשה בשבילנו להעריך זאת,

364
00:17:48,860 --> 00:17:51,103
בגלל שהביצועים האנושיים
גדלים בקצב ההדרגתי הזה,

365
00:17:51,103 --> 00:17:53,672
אבל יש לנו עכשיו מערכת, למידה עמוקה,

366
00:17:53,672 --> 00:17:56,884
שאנחנו יודעים שממש גדלה
ביכולות שלה באופן אקספוננציאלי.

367
00:17:56,884 --> 00:17:58,501
ואנחנו כאן.

368
00:17:58,501 --> 00:18:00,566
אז כרגע, אנחנו רואים את הדברים שסביבנו

369
00:18:00,566 --> 00:18:03,237
ואומרים, "הו, מחשבים
הם עדיין די טיפשים." נכון?

370
00:18:03,237 --> 00:18:06,063
אבל תוך חמש שנים, 
מחשבים יהיו מחוץ לטבלה הזו.

371
00:18:06,063 --> 00:18:10,329
אז אנחנו צריכים להתחיל לחשוב
על היכולת הזו כבר עכשיו.

372
00:18:10,329 --> 00:18:12,167
ראינו את זה קורה בעבר, כמובן.

373
00:18:12,167 --> 00:18:13,966
במהפכה התעשייתית,

374
00:18:13,966 --> 00:18:16,817
ראינו שינוי משמעותי ביכולות
הודות למנועים.

375
00:18:17,667 --> 00:18:20,805
העניין הוא שאחרי זמן מה, 
העניינים השתטחו.

376
00:18:20,805 --> 00:18:22,507
הייתה הפרעה חברתית,

377
00:18:22,507 --> 00:18:25,946
אבל ברגע שהשתמשו במנועים על מנת 
לייצר חשמל בכל המצבים,

378
00:18:25,946 --> 00:18:28,300
דברים התחילו להירגע.

379
00:18:28,300 --> 00:18:29,773
מהפיכת הלמידה החישובית

380
00:18:29,773 --> 00:18:32,682
הולכת להיות שונה מאוד
מהמהפיכה התעשייתית,

381
00:18:32,682 --> 00:18:35,632
כיוון שמהפיכת הלמידה החישובית,
היא לעולם לא נרגעת.

382
00:18:35,632 --> 00:18:38,614
ככל שמחשבים יהיו יותר טובים 
בפעילוית אינטלקטואליות,

383
00:18:38,614 --> 00:18:42,862
כך הם יכולים לבנות מחשבים טובים יותר
שיהיו טובים יותר ביכולות אינטלקטואליות,

384
00:18:42,862 --> 00:18:44,770
אז זה הולך להיות סוג של שינוי

385
00:18:44,770 --> 00:18:47,248
שהעולם למעשה לא חווה מעולם,

386
00:18:47,248 --> 00:18:50,554
אז ההבנה הקודמת שלכם
של מה אפשרי, היא שונה.

387
00:18:50,974 --> 00:18:52,754
זה כבר מכה בנו.

388
00:18:52,754 --> 00:18:56,384
ב-25 השנים האחרונות,
כשפריון ההון הולך וגדל,

389
00:18:56,400 --> 00:19:00,588
פריון העבודה נשאר שטוח,
למעשה אפילו מעט ירד.

390
00:19:01,408 --> 00:19:04,149
אז אני רוצה שאנחנו נתחיל
לנהל את הדיון הזה כעת.

391
00:19:04,149 --> 00:19:07,176
אני יודע שהרבה פעמים כשאני
מספר לאנשים על המצב הזה,

392
00:19:07,176 --> 00:19:08,666
אנשים יכולים לבטל אותי.

393
00:19:08,666 --> 00:19:10,339
ובכן, מחשבים לא יכולים ממש לחשוב,

394
00:19:10,339 --> 00:19:13,367
הם לא מביעים רגשות,
הם לא מבינים שירה,

395
00:19:13,367 --> 00:19:15,888
אנחנו לא ממש מבינים איך הם עובדים.

396
00:19:15,888 --> 00:19:17,374
אז מה?

397
00:19:17,374 --> 00:19:19,178
מחשבים כרגע יכולים לעשות את הדברים

398
00:19:19,178 --> 00:19:21,897
שבני אדם מקבלים תשלום
לעשות במשך רוב חייהם,

399
00:19:21,897 --> 00:19:23,628
אז עכשיו הזמן להתחיל לחשוב

400
00:19:23,628 --> 00:19:28,015
על איך אנחנו הולכים להתאים את 
המבנים החברתיים והכלכליים שלנו

401
00:19:28,015 --> 00:19:29,855
כך שיהיו מודעים למציאות החדשה הזו.

402
00:19:29,855 --> 00:19:31,388
תודה.

403
00:19:31,388 --> 00:19:32,190
(מחיאות כפיים)