1
00:00:00,880 --> 00:00:04,893
เคยเป็นว่าถ้าอยากได้คอมพ์ มาทำอะไรที่ใหม่ๆ

2
00:00:04,893 --> 00:00:06,447
คุณก็ต้องโปรแกรมมัน

3
00:00:06,447 --> 00:00:09,858
ครับ การทำโปรแกรม 
สำหรับคนที่ยังไม่เคยทำเอง

4
00:00:09,858 --> 00:00:13,360
ก็ต้องวางแผนรายละเอียด
อย่างเลือดตาแทบกระเด็น

5
00:00:13,360 --> 00:00:16,727
ในทุกขั้นตอน ที่คุณต้องการให้คอมพิวเตอร์ทำ

6
00:00:16,727 --> 00:00:19,089
เพื่อให้บรรลุเป้าหมายของคุณ

7
00:00:19,089 --> 00:00:22,585
ถ้าต้องการทำสิ่งที่คุณเองไม่รู้วิธีทำแล้ว

8
00:00:22,585 --> 00:00:24,648
ก็จะเป็นเรื่องท้าทายที่ยิ่งใหญ่ ที่ชายชื่อ

9
00:00:24,648 --> 00:00:28,131
อาร์เธอร์ แซมวล ก็เผชิญมาแล้วในอดีต

10
00:00:28,131 --> 00:00:32,208
ปี 1956 เขาอยากจะให้คอมพิวเตอร์เครื่องนี้

11
00:00:32,208 --> 00:00:34,548
เอาชนะเขาได้ ในเกมหมากฮอส

12
00:00:34,548 --> 00:00:36,588
จะเขียนโปรแกรมโดยวางรายละเอียด

13
00:00:36,588 --> 00:00:40,394
อย่างเลือดตาแทบกระเด็น 
ให้เหนือกว่าคุณในเกม ได้อย่างไร

14
00:00:40,394 --> 00:00:42,116
ดังนั้น เขาจึงเกิดความคิดใหม่ขึ้นมา

15
00:00:42,116 --> 00:00:45,840
เขาให้คอมพ์เล่นแข่งกับตัวเอง หลายพันครั้ง

16
00:00:45,840 --> 00:00:48,364
และให้มันเรียนรู้ ที่จะเล่นเกมหมากฮอส

17
00:00:48,364 --> 00:00:51,544
และมันก็ได้ผลจริง ๆ และตอนปี 1962

18
00:00:51,544 --> 00:00:55,561
คอมพ์เครื่องนี้ เล่นชนะแชมป์รัฐคอนเนตทิคัต

19
00:00:55,561 --> 00:00:58,534
อาร์เธอร์ แซมวล ถือว่าเป็นบิดา
ของการเรียนรู้ของเครื่อง

20
00:00:58,534 --> 00:01:00,251
ผมเป็นหนี้เขาอย่างใหญ่หลวง เพราะ

21
00:01:00,251 --> 00:01:03,014
ผมเป็นผู้ปฏิบัติงาน ด้านเครื่องเรียนรู้นี้

22
00:01:03,014 --> 00:01:04,479
อดีตผมเป็นประธานกลุ่มแค็กเกิล

23
00:01:04,479 --> 00:01:07,867
เป็นกลุ่มคนกว่า 2 แสนคนที่ทำงานด้านนี้

24
00:01:07,867 --> 00:01:09,925
แค็กเกิลจัดการแข่งขัน เพื่อพยายามให้

25
00:01:09,925 --> 00:01:13,633
เครื่องเหล่านั้นแก้ปัญหาที่แก้ไม่ได้มาก่อน

26
00:01:13,633 --> 00:01:17,470
และก็ประสบผลสำเร็จมาแล้วหลายร้อยครั้ง

27
00:01:17,470 --> 00:01:19,940
ดังนั้น จากมุมมองที่กว้างขวางนี้
ผมจึงได้ค้นพบ

28
00:01:19,940 --> 00:01:23,890
เรื่องการเรียนรู้ของเครื่องอีกมากมาย 
ที่พวกมันทำได้


29
00:01:23,890 --> 00:01:26,252
ในอดีต ปัจจุบัน และอนาคต 
ส่วนความสำเร็จเชิงพาณิชย์

30
00:01:26,252 --> 00:01:30,675
ที่ยิ่งใหญ่ครั้งแรกของเรื่องนี้ อาจคือ

31
00:01:30,675 --> 00:01:33,784
กูเกิลที่ให้เห็นว่าเป็นไปได้ที่จะค้นข้อมูล

32
00:01:33,784 --> 00:01:35,536
โดยใช้วิธีการทางคอมพิวเตอร์

33
00:01:35,536 --> 00:01:38,437
ซึ่งมีพื้นฐานมาจาก การเรียนรู้ของเครื่อง

34
00:01:38,437 --> 00:01:42,323
แต่นั้นมา มีความสำเร็จเชิงพาณิชย์อีกมาก

35
00:01:42,323 --> 00:01:44,160
บริษัท อย่างเช่น แอมะซอน และ เน็ตฟลิกส์

36
00:01:44,160 --> 00:01:47,876
ใช้การเรียนรู้ของเครื่อง เพื่อแนะนำสินค้า

37
00:01:47,876 --> 00:01:49,896
ที่คุณอาจอยากซื้อ ภาพยนตร์ที่อาจอยากดู

38
00:01:49,896 --> 00:01:51,703
บางครั้ง ก็เกือบทำให้ขนลุก

39
00:01:51,703 --> 00:01:53,657
บริษัทอย่างเช่น ลิงด์อิน และเฟสบุก

40
00:01:53,657 --> 00:01:56,251
บางครั้งจะบอกว่า ใครอาจเป็นเพื่อนของคุณ

41
00:01:56,251 --> 00:01:58,228
และคุณก็คิดไม่ออกเลยว่า มันทำได้อย่างไร

42
00:01:58,228 --> 00:02:01,195
นี่ก็เพราะ มันใช้พลังการเรียนรู้ของเครื่อง

43
00:02:01,195 --> 00:02:04,152
เป็นวิธีการทางคอมพ์ ที่เรียนรู้วิธีทำได้

44
00:02:04,152 --> 00:02:07,399
จากข้อมูล แทนโปรแกรม ที่ต้องใช้มือทำ

45
00:02:07,399 --> 00:02:09,877
สิ่งนี่ยังทำให้ IBM สำเร็จในการทำให้

46
00:02:09,877 --> 00:02:13,739
วัทสัน ชนะแชมป์โลกสองคนใน "เจเพอะดี" โชว์

47
00:02:13,739 --> 00:02:16,964
โดยตอบคำถามที่ลึกลับซับซ้อนเหลือเชื่อ เช่น

48
00:02:16,964 --> 00:02:19,799
["ของโบราณ 'สิงโตแห่งนิมรัต' 
หายไปจากพิพิธภัณฑ์ในปี 2003]

49
00:02:19,799 --> 00:02:23,034
ยังให้เราเห็นในขณะนี้ รถพวกแรกที่ขับได้เอง

50
00:02:23,034 --> 00:02:25,856
ถ้าคุณต้องการจะบอกความแตกต่างระหว่าง เช่น

51
00:02:25,856 --> 00:02:28,488
ต้นไม้กับคนเดินถนน ครับ นั่นมันสำคัญมาก

52
00:02:28,488 --> 00:02:31,075
เราไม่รู้วิธีเขียนโปรแกรมเหล่านั้น ด้วยมือ

53
00:02:31,075 --> 00:02:34,072
แต่จากการเรียนรู้ของเครื่อง มันเป็นไปได้

54
00:02:34,072 --> 00:02:36,680
ความจริงแล้ว รถคันนี้ขับมาแล้วกว่าล้านไมล์

55
00:02:36,680 --> 00:02:40,186
โดยไม่เกิดอุบัติเหตุ บนถนนปกติ

56
00:02:40,196 --> 00:02:44,110
ขณะนี้เราจึงรู้ว่า เครื่องคอมพ์เรียนรู้ได้

57
00:02:44,110 --> 00:02:46,010
คอมพิวเตอร์เรียนรู้ ที่จะทำสิ่งต่างๆที่

58
00:02:46,010 --> 00:02:48,848
บางครั้งเราไม่รู้จริงๆ ว่าจะทำเองอย่างไร

59
00:02:48,848 --> 00:02:51,733
หรือบางทีมันอาจจะทำได้ ดีกว่าเราเสียอีก

60
00:02:51,733 --> 00:02:55,928
ตัวอย่างหนึ่งที่น่าทึ่งที่สุด ที่ผมเคยเห็น

61
00:02:55,928 --> 00:02:58,320
เกิดขึ้นในโครงการที่ผมทำ ที่แคกเกิล

62
00:02:58,320 --> 00:03:01,911
ในทีมงานที่นำโดยหนุ่มชื่อ เจฟฟรี ฮินตัน

63
00:03:01,911 --> 00:03:03,463
จากมหาวิทยาลัยโทรอนโต

64
00:03:03,463 --> 00:03:06,140
เขาชนะการแข่งขัน การค้นพบยาโดยอัตโนมัติ

65
00:03:06,140 --> 00:03:08,987
ความพิเศษคือ ไม่ใช่เพียงเอาชนะวิธีทั้งหมด

66
00:03:08,987 --> 00:03:13,000
ที่พัฒนาโดย เมอร์ค, กลุ่มวิชาการนาๆชาติ

67
00:03:13,000 --> 00:03:18,061
แต่ไม่มีใครในทีมมีพื้นทางเคมี 
หรือชีววิทยาศาสตร์

68
00:03:18,061 --> 00:03:20,230
และพวกเขาทำให้ชนะได้ ในสองสัปดาห์

69
00:03:20,230 --> 00:03:21,611
พวกเขาทำได้อย่างไรหรือ

70
00:03:22,421 --> 00:03:25,342
เขาใช้วิธีคอมพ์ที่เรียกว่า การเรียนรู้ลึก
(deep learning)

71
00:03:25,342 --> 00:03:28,291
เรื่องนี้สำคัญมากจนกระทั่ง 
ความสำเร็จนี้ได้พิมพ์ในหน้าหนึ่ง

72
00:03:28,291 --> 00:03:31,412
ของนิวยอร์คไทม์ 2-3 อาทิตย์ต่อมา

73
00:03:31,412 --> 00:03:34,147
นี่คือ เจฟฟรี่ ฮินตัน ตรงนี้ด้านซ้ายมือ

74
00:03:34,147 --> 00:03:38,488
การเรียนรู้ลึก เป็นวิธีการทางคอมพ์ที่นำ

75
00:03:38,488 --> 00:03:40,300
วิธีทำงานของสมองคนมา ผลคือ เป็นวิธีที่

76
00:03:40,300 --> 00:03:44,141
ไม่มีข้อจำกัดทางทฤษฎีว่า มันทำอะไรได้บ้าง

77
00:03:44,141 --> 00:03:46,964
ยิ่งให้ข้อมูลมัน ยิ่งให้เวลาคำนวณมากขึ้น

78
00:03:46,964 --> 00:03:48,276
มันก็จะทำงานได้ดียิ่งขึ้น

79
00:03:48,276 --> 00:03:50,615
นิวยอร์คไทม์ ยังแสดงให้เห็นในบทความนี้

80
00:03:50,615 --> 00:03:52,857
ถึงผลลัพท์พิเศษอีกอย่างของ การเรียนรู้ลึก

81
00:03:52,857 --> 00:03:55,569
ซึ่งผมจะแสดงให้คุณดู เดี๋ยวนี้

82
00:03:55,569 --> 00:04:00,510
มันแสดงว่า คอมพ์ฟังรู้เรื่องและเข้าใจได้

83
00:04:00,510 --> 00:04:03,221
(วิดีโอ) ริชาร์ด ราชิด: ครับ ขั้นสุดท้าย

84
00:04:03,221 --> 00:04:06,246
ที่ผมอยากจะทำให้ได้ ในกระบวนการนี้

85
00:04:06,246 --> 00:04:10,961
คือ พูดกับคุณจริงๆ เป็นภาษาจีน

86
00:04:10,961 --> 00:04:13,596
ครับ สิ่งสำคัญในเรื่องนี้ก็คือ เราสามารถ

87
00:04:13,596 --> 00:04:18,598
เอาข้อมูลจำนวนมากมาได้ จากคนพูดจีนหลายๆคน

88
00:04:18,598 --> 00:04:21,128
และทำ "ระบบเนื้อหา-คำพูด" ออกมา, ระบบนี้จะ

89
00:04:21,128 --> 00:04:25,801
เอาข้อความภาษาจีนมา เปลี่ยนให้เป็นภาษาจีน

90
00:04:25,801 --> 00:04:29,929
แล้วก็เอาเสียงของผมเอง ราวหนึ่ง ช.ม

91
00:04:29,929 --> 00:04:31,820
แล้วใช้เสียงมาปรับระบบเนื้อหา-คำพูด

92
00:04:31,820 --> 00:04:36,364
เพื่อที่จะให้มีเสียงเหมือนผม

93
00:04:36,364 --> 00:04:38,904
อีกนั่นแหละ ผลที่ได้ไม่ดีเลิศนัก

94
00:04:38,904 --> 00:04:41,552
จริงๆแล้ว มีข้อผิดพลาดหลายอย่าง

95
00:04:41,552 --> 00:04:44,036
(ภาษาจีน)

96
00:04:44,036 --> 00:04:47,403
(เสียงปรบมือ)

97
00:04:49,446 --> 00:04:53,022
ยังมีสิ่งที่ต้องทำอีกมาก ในเรื่องนี้

98
00:04:53,022 --> 00:04:56,667
(ภาษาจีน)

99
00:04:56,667 --> 00:05:00,100
(เสียงปรบมือ)

100
00:05:01,345 --> 00:05:04,744
เจเรมี่ เฮาวาร์ด: นั่นเป็นการประชุมที่จีน

101
00:05:04,744 --> 00:05:07,114
จริงๆ ไม่บ่อยนัก ในการประชุมทางวิชาการ

102
00:05:07,114 --> 00:05:09,011
ที่จะได้ยินคนปรบมือเอง พร้อมเพรียงกัน

103
00:05:09,011 --> 00:05:12,687
แต่แน่ว่า บางครั้งในการประชุม TEDx
จงทำตามใจชอบ

104
00:05:12,687 --> 00:05:15,482
ทุกสิ่งที่เห็นที่นั่นเกิดจากการเรียนรู้ลึก

105
00:05:15,482 --> 00:05:17,007
(เสียงปรบมือและหัวเราะ) 
ขอบคุณครับ

106
00:05:17,007 --> 00:05:19,289
การถอดเป็นภาษาอังกฤษทำโดยการเรียนรู้ลึก

107
00:05:19,289 --> 00:05:22,701
ซึ่งแปลเป็นภาษาจีนและข้อความด้านบนขวา

108
00:05:22,701 --> 00:05:26,008
การสร้างเสียงก็เป็นการเรียนรู้ลีก เช่นกัน

109
00:05:26,008 --> 00:05:29,242
การเรียนรู้ลึกจึงเป็นสิ่งพิเศษ

110
00:05:29,242 --> 00:05:32,341
เป็นวิธีเดียวทางคอมพ์ที่ทำได้เกือบทุกอย่าง

111
00:05:32,341 --> 00:05:35,452
ผมพบปีที่แล้วว่า มันเรียนที่จะเห็นได้ด้วย

112
00:05:35,452 --> 00:05:37,628
ในการแข่งขันที่ไม่ค่อยรู้จัก 
ในเยอรมนี ชื่อ

113
00:05:37,628 --> 00:05:40,225
เยอรมันแทร็ฟฟิกซายน์เรคอกนิชั่นเบนช์มาร์ก

114
00:05:40,225 --> 00:05:43,618
การเรียนรู้ลึก เรียนรู้จำสัญญาณจราจรนี้

115
00:05:43,618 --> 00:05:45,712
ไม่เพียงแค่ รู้จำสัญญาณจราจรได้ดีกว่า

116
00:05:45,712 --> 00:05:47,470
วิธีการอื่นๆทางคอมพิวเตอร์ เท่านั้น

117
00:05:47,470 --> 00:05:50,189
ป้ายคะแนนนแสดงว่า จริง ๆ แล้ว

118
00:05:50,189 --> 00:05:52,041
มันดีกว่าคนประมาณสองเท่า

119
00:05:52,041 --> 00:05:54,037
ดังนั้น โดยปี 2011 เราจึงมีตัวอย่างแรก

120
00:05:54,037 --> 00:05:57,442
ของคอมพิวเตอร์ ที่สามารถมองเห็นได้ดีกว่าคน

121
00:05:57,442 --> 00:05:59,491
ตั้งแต่นั้นมา สิ่งต่างๆมากมายได้เกิดขึ้น

122
00:05:59,491 --> 00:06:03,005
ปี 2012 กูเกิลแจ้งว่า ได้ให้การเรียนรู้ลึก

123
00:06:03,005 --> 00:06:04,420
ดูยูทูบวิดีโอ ขบเคี้ยวข้อมูล

124
00:06:04,420 --> 00:06:07,857
จากคอมพิวเตอร์ 16,000 เครื่องอยู่ 1 เดือน

125
00:06:07,857 --> 00:06:12,218
และคอมพ์ก็เรียนรู้ได้เองถึงแนวความคิด

126
00:06:12,218 --> 00:06:14,027
เช่น คนกับแมว เพียงดูแค่วิดีโอเท่านั้น

127
00:06:14,027 --> 00:06:16,379
สิ่งนี้เหมือนวิธีที่มนุษย์เรียนรู้อย่างมาก

128
00:06:16,379 --> 00:06:19,119
มนุษย์ไม่ได้เรียนโดยให้คนอื่นบอกว่า 
เขาเห็นอะไร

129
00:06:19,119 --> 00:06:22,450
แต่โดยเรียนด้วยตนเองว่า ของเหล่านี้คืออะไร

130
00:06:22,450 --> 00:06:25,819
ปี 2012 เจฟฟรี่ ฮินตัน ที่เราเห็นตอนต้น

131
00:06:25,819 --> 00:06:28,677
ยังชนะการแข่ง อิมเมจเน็ด ที่มีชื่อมาก ซึ่ง

132
00:06:28,677 --> 00:06:32,818
พยายามหาวิธีคิด จากภาพล้านห้าแสนภาพ

133
00:06:32,818 --> 00:06:34,256
ว่า ภาพเหล่านี้เป็นภาพอะไร

134
00:06:34,256 --> 00:06:37,789
ถึงปี 2014 นี้ เราลดอัตราผิดจนเหลือ 6%

135
00:06:37,789 --> 00:06:39,242
ในการรู้จำภาพได้

136
00:06:39,242 --> 00:06:41,268
นี่ก็ดีกว่าคนอีกเหมือนกัน

137
00:06:41,268 --> 00:06:45,037
เครื่องจึงทำงานได้ดีพิเศษจริง ในเรื่องนี้

138
00:06:45,037 --> 00:06:47,306
และขณะนี้ก็กำลังมีการนำไปใช้ ในอุตสาหกรรม

139
00:06:47,306 --> 00:06:50,348
เช่น กูเกิลประกาศเมื่อปีที่แล้ว ว่า

140
00:06:50,348 --> 00:06:54,933
ได้ทำแผนที่ทุกๆตำแหน่งในฝรั่งเศสใน 2 ช.ม

141
00:06:54,933 --> 00:06:58,380
และวิธีที่พวกเขาทำนั้น คือ ใส่ภาพถนนเข้าไป

142
00:06:58,380 --> 00:07:02,699
ในการเรียนรู้ลึก เพื่อให้รู้จำและอ่านเลขถนน

143
00:07:02,699 --> 00:07:04,919
ลองจินตนาการดู แต่ก่อนจะใช้เวลานานแค่ไหน

144
00:07:04,919 --> 00:07:08,274
ใช้คนมากมายหลายคน หลายปี

145
00:07:08,274 --> 00:07:10,185
เรื่องนี้ก็กำลังเกิดขึ้นในจีนด้วย

146
00:07:10,185 --> 00:07:14,221
ไบดู เป็นเหมือนกับกูเกลของจีน และ

147
00:07:14,221 --> 00:07:16,504
ที่คุณเห็น ตรงด้านบนซ้ายมือ คือ ตัวอย่าง

148
00:07:16,504 --> 00:07:20,478
รูปที่ผมใส่เข้าไป ในระบบเรียนรู้ลึกของไบดู

149
00:07:20,478 --> 00:07:24,247
ตรงข้างล่าง คุณจะเห็นได้ว่า ระบบเข้าใจได้

150
00:07:24,247 --> 00:07:26,483
ว่าเป็นภาพอะไร และค้นพบภาพที่เหมือนกัน

151
00:07:26,483 --> 00:07:29,219
ซึ่งจริงๆแล้ว คือมีแบ็กกราวเหมือนกัน

152
00:07:29,219 --> 00:07:30,877
หันหน้าไปทิศทางเดียวกัน

153
00:07:30,877 --> 00:07:32,665
แม้กระทั่ง บางรูปที่แลบลิ้นออกมา

154
00:07:32,665 --> 00:07:35,695
นี่ไม่ใช่มองที่ เนื้อหาเว็บเพจอย่างแน่นอน

155
00:07:35,695 --> 00:07:37,107
ผมส่งเพียงแต่รูป ๆ เดียวเท่านั้น

156
00:07:37,107 --> 00:07:41,128
ขณะนี้มีคอมพ์ ที่เข้าใจสิ่งที่มันเห็นจริงๆ

157
00:07:41,128 --> 00:07:42,752
จึงสามารถค้นหาฐานข้อมูลได้

158
00:07:42,752 --> 00:07:46,306
เป็นหลายร้อยล้านภาพ ในเวลาสั้นๆ

159
00:07:46,306 --> 00:07:49,536
อะไรจะเกิดขึ้น เมื่อมีคอมพ์ที่มองเห็นได้

160
00:07:49,536 --> 00:07:51,553
แต่ไม่ใช่แค่มองเห็นได้เท่านั้น

161
00:07:51,553 --> 00:07:53,622
จริงๆแล้ว การเรียนรู้ลึก ทำได้มากกว่านั้น

162
00:07:53,622 --> 00:07:56,570
ประโยคที่ต่างกันน้อยมาก ซับซ้อน อย่างนี้

163
00:07:56,570 --> 00:07:59,394
ขณะนี้เข้าใจได้แล้ว ด้วยวิธีการเรียนรู้ลึก

164
00:07:59,394 --> 00:08:00,697
อย่างที่คุณเห็นตรงนี้

165
00:08:00,697 --> 00:08:03,465
ระบบฐานสแตนฟอร์ดนี้ แสดงจุดสีแดงด้านบนสุด

166
00:08:03,465 --> 00:08:07,384
คิดออกว่า ประโยคนี้แสดงอารมณ์เชิงลบ


167
00:08:07,384 --> 00:08:10,790
จริงๆการเรียนรู้ลึก ใกล้สมรรถภาพมนุษย์แล้ว

168
00:08:10,802 --> 00:08:15,923
เข้าใจได้ว่า ประโยคบอกเรื่องอะไร
และมีความหมายอะไร

169
00:08:15,923 --> 00:08:18,651
การเรียนรู้ลึก ยังนำไปใช้เพื่ออ่านภาษาจีน

170
00:08:18,651 --> 00:08:21,807
อีกนั่นแหละ ประมาณระดับคนจีนพื้นเมือง

171
00:08:21,807 --> 00:08:23,975
วิธีการทางคอมพ์นี้ ได้พัฒนาออกมาจากสวิสฯ

172
00:08:23,975 --> 00:08:27,331
โดยคนที่ไม่มีใครพูดหรือเข้าใจภาษาจีนเลย

173
00:08:27,331 --> 00:08:29,382
อย่างที่ผมบอก การใช้การเรียนรู้ลึก

174
00:08:29,382 --> 00:08:31,601
เกือบเป็นระบบที่ดีที่สุดในโลก สำหรับงานนี้

175
00:08:31,601 --> 00:08:36,718
แม้เมื่อเปรียบกับความเข้าใจของคนพื้นบ้าน

176
00:08:36,718 --> 00:08:39,682
นี่เป็นระบบที่เราประกอบขึ้นมา 
ที่บริษัทของผม

177
00:08:39,682 --> 00:08:41,728
ซึ่งให้เห็นการเอาสิ่งทั้งหลายเข้ามารวมกัน

178
00:08:41,728 --> 00:08:44,189
พวกนี้ให้เห็นภาพ ที่ไม่มีข้อความกำกับ

179
00:08:44,189 --> 00:08:46,541
และขณะที่ผมพิมพ์ประโยคอยู่ตรงนี้

180
00:08:46,541 --> 00:08:49,510
ในเวลาสั้นๆ มันก็เข้าใจรูปเหล่านี้

181
00:08:49,510 --> 00:08:51,189
และคิดออกได้ว่า มันเป็นเรื่องอะไร

182
00:08:51,189 --> 00:08:54,352
และไปหาภาพ ที่เหมือนกับข้อความที่ผมเขียน

183
00:08:54,352 --> 00:08:57,108
จึงเห็นได้ เป็นความเข้าใจประโยคของผมจริงๆ

184
00:08:57,108 --> 00:08:59,332
เป็นความเข้าใจภาพเหล่านี้จริง

185
00:08:59,332 --> 00:09:01,891
ผมรู้ว่า คุณเคยเห็นแบบนี้ในกูเกิลแล้ว

186
00:09:01,891 --> 00:09:04,666
ที่คุณพิมพ์ข้อความ แล้วมันจะแสดงภาพออกมา

187
00:09:04,666 --> 00:09:08,090
แต่จริงๆสิ่งที่มันทำคือ หาข้อความในเว็บเพจ

188
00:09:08,090 --> 00:09:11,091
เรื่องนี้ต่างกันมาก กับการเข้าใจภาพพวกนั้น

189
00:09:11,091 --> 00:09:13,843
นี่เป็นสิ่งที่คอมพ์สามารถทำได้

190
00:09:13,843 --> 00:09:17,091
เป็นครั้งแรก ในไม่กี่เดือนที่ผ่านมานี้

191
00:09:17,091 --> 00:09:21,182
ขณะนี้จึงเห็นได้ว่า คอมพ์ไม่ได้แค่เห็น แต่

192
00:09:21,182 --> 00:09:24,947
อ่านได้ด้วย และเราก็ให้เห็นว่า 
มันก็เข้าใจสิ่งที่มันได้ยิน

193
00:09:24,947 --> 00:09:28,389
อาจไม่น่าแปลกใจ ถ้าจะบอกว่า มันก็เขียนได้

194
00:09:28,389 --> 00:09:33,172
ประโยคนี้ผมสร้างเมื่อวาน ใช้การเรียนรู้ลึก

195
00:09:33,172 --> 00:09:37,096
ข้อความนี้ สร้างโดยวิธีคอมพ์ของสแตนฟอร์ด

196
00:09:37,096 --> 00:09:38,860
แต่ละประโยคสร้างขึ้น

197
00:09:38,860 --> 00:09:43,109
โดยวิธีการเรียนรู้ลึก เพื่ออธิบายภาพนั้นๆ

198
00:09:43,109 --> 00:09:47,581
แต่ก่อนวิธีการคอมพ์ ไม่เคยเห็นชายเสื้อดำ
กำลังเล่นกีต้าร์

199
00:09:47,581 --> 00:09:49,801
แต่มันเคยเห็นผู้ชาย เคยเห็นสีดำ

200
00:09:49,801 --> 00:09:51,400
เคยเห็นกีต้าร์ แต่ด้วยตัวมันเอง

201
00:09:51,400 --> 00:09:55,694
ได้สร้างการอธิบายภาพนี้ในแนวใหม่

202
00:09:55,694 --> 00:09:59,196
ยังคงไม่เหมือนมนุษย์ทีเดียว แต่ก็ใกล้แล้ว

203
00:09:59,196 --> 00:10:03,264
ในการทดสอบ มนุษย์ชอบคำบรรยายสร้างโดยคอมพ์

204
00:10:03,264 --> 00:10:04,791
หนึ่งในสี่ครั้ง

205
00:10:04,791 --> 00:10:06,855
ปัจจุบัน ระบบนี้มีอายุแค่ 2 สัปดาห์

206
00:10:06,855 --> 00:10:08,701
ดังนั้น บางที ภายในปีหน้า

207
00:10:08,701 --> 00:10:11,502
วิธีทางคอมพ์ อาจไปไกลเกินหน้าการปฏิบัติงาน

208
00:10:11,502 --> 00:10:13,364
ของมนุษย์ ที่อัตราที่กำลังเป็นอยู่นี้

209
00:10:13,364 --> 00:10:16,413
คอมพิวเตอร์ จึงสามารถเขียนได้ด้วย

210
00:10:16,413 --> 00:10:19,888
รวมๆแล้ว ก็จะเห็นโอกาสทีน่าตื่นเต้นมาก

211
00:10:19,888 --> 00:10:21,380
ตัวอย่างเช่น ในทางการแพทย์

212
00:10:21,380 --> 00:10:23,905
ทีมงานในบอสตัน ประกาศว่าพวกเขาได้ค้นพบ

213
00:10:23,905 --> 00:10:26,854
ลักษณะต่าง ๆ มากมาย
ที่เกี่ยวข้องกับการรักษา

214
00:10:26,854 --> 00:10:31,120
เนื้องอก ที่ช่วยแพทย์ทายอาการมะเร็ง

215
00:10:32,220 --> 00:10:34,516
และที่เหมือนกันอย่างมาก ที่สแตนฟอร์ด

216
00:10:34,516 --> 00:10:38,179
กลุ่มที่นั่นประกาศว่า 
โดยดูเนื้อเยื่อขยายแล้ว

217
00:10:38,179 --> 00:10:40,560
ได้พัฒนาระบบจากการเรียนรู้ของเครื่องขึ้นมา

218
00:10:40,560 --> 00:10:43,142
ซึ่งจริงๆ ดีกว่าแพทย์พยาธิวิทยา 
ในการทำนาย

219
00:10:43,142 --> 00:10:47,519
อัตราการรอดชีวิต ของคนไข้โรคมะเร็ง

220
00:10:47,519 --> 00:10:50,764
ทั้งสองกรณี ไม่เพียงการคาดเดาถูกต้องกว่า

221
00:10:50,764 --> 00:10:53,266
แต่ยังทำให้เกิดความเข้าใจใหม่
ทางวิทยาศาสตร์

222
00:10:53,276 --> 00:10:54,781
คือทางรังสีวิทยา มีการพบ

223
00:10:54,781 --> 00:10:57,876
ตัวบ่งชี้ทางการรักษาแบบใหม่ ที่คนเข้าใจได้

224
00:10:57,876 --> 00:10:59,668
ส่วนทางพยาธิวิทยานี้ จริงๆแล้ว

225
00:10:59,668 --> 00:11:04,168
ระบบคอมพ์ได้ค้นพบว่า เซลล์รอบๆมะเร็ง

226
00:11:04,168 --> 00:11:07,508
สำคัญเท่าๆกับเซลล์มะเร็งเอง

227
00:11:07,508 --> 00:11:09,260
ในการวินิจฉัย นี้ตรงข้ามกับ

228
00:11:09,260 --> 00:11:14,621
สิ่งที่พยาธิแพทย์ ได้รับสอนมาหลายทศวรรษ

229
00:11:14,621 --> 00:11:17,913
ในทั้งสองกรณี ระบบพัฒนาขึ้นโดย

230
00:11:17,913 --> 00:11:21,534
ผู้เชี่ยวชาญทางแพทย์ร่วมกับ
ผู้เชี่ยวชาญการเรียนรู้ของเครื่อง

231
00:11:21,534 --> 00:11:24,275
แต่เริ่มแต่ปีที่แล้ว เราได้ไปไกลกว่านั้น

232
00:11:24,275 --> 00:11:27,824
นี่เป็นตัวอย่าง ของการระบุพื้นที่ของมะเร็ง

233
00:11:27,824 --> 00:11:30,354
ในเนื้อเยื่อมนุษย์ จากกล้องจุลทรรศน์

234
00:11:30,354 --> 00:11:34,967
ระบบที่แสดงอยู่นี้ 
ระบุพื้นที่ได้แม่นยำกว่า

235
00:11:34,967 --> 00:11:37,742
หรือเกือบจะเท่ากับพยาธิแพทย์ แต่ทั้งหมดนี้

236
00:11:37,742 --> 00:11:41,134
สร้างด้วยการเรียนรู้ลึก 
โดยคนที่ไม่มีความเชี่ยวชาญ

237
00:11:41,134 --> 00:11:43,660
หรือพื้นเพทางการแพทย์เลย

238
00:11:44,730 --> 00:11:47,285
นี่ก็เหมือนกัน การแบ่งส่วนประสาท, ขณะนี้

239
00:11:47,285 --> 00:11:50,953
เราแยกเซลล์ประสาทได้ แม่นยำเทียมเท่ามนุษย์

240
00:11:50,953 --> 00:11:53,670
แต่ระบบนี้พัฒนาขึ้น ด้วยการเรียนรู้ลึก

241
00:11:53,670 --> 00:11:56,921
โดยคนที่ไม่มีพื้นฐานด้านการแพทย์

242
00:11:56,921 --> 00:12:00,148
ดังนั้นผมเอง ผู้ไม่มีพื้นฐานด้านการแพทย์

243
00:12:00,148 --> 00:12:03,875
ก็เหมือนมีคุณสมบัติพร้อม ที่จะเริ่มบริษัท

244
00:12:03,875 --> 00:12:06,021
ทางการแพทย์ใหม่ขึ้นมา ซึ่งผมก็ได้ทำแล้ว

245
00:12:06,021 --> 00:12:07,761
ผมรู้สึกหวาดหวั่นบ้างที่จะทำ

246
00:12:07,761 --> 00:12:10,650
แต่ตามทฤษฎีแล้ว ดูจะแนะว่า น่าจะเป็นไปได้

247
00:12:10,650 --> 00:12:16,142
ที่จะทำการแพทย์ที่มีประโยชน์มาก โดยใช้แค่
เทคนิควิเคราะห์ข้อมูลนี้

248
00:12:16,142 --> 00:12:18,622

และผมโชคดี ที่ได้การตอบรับที่ดีเยี่ยม

249
00:12:18,622 --> 00:12:20,978
จากทั้งสื่อและกลุ่มทางการแพทย์

250
00:12:20,978 --> 00:12:23,322
ที่ให้การสนับสนุนมาอย่างมาก

251
00:12:23,322 --> 00:12:27,471
ทฤษฎีคือ เราสามารถเอาส่วนกลาง
ของกระบวนการทางแพทย์

252
00:12:27,471 --> 00:12:30,364
กลับมันเป็นวิเคราะห์ข้อมูล มากเท่าที่ทำได้

253
00:12:30,364 --> 00:12:33,429
ทิ้งให้แพทย์ทำ ในสิ่งที่เขาทำได้ดีที่สุด

254
00:12:33,429 --> 00:12:35,031
ผมอยากจะยกตัวอย่างหนึ่ง ปัจจุบัน

255
00:12:35,031 --> 00:12:39,975
เราใช้เพียง 15 นาที เพื่อ
สร้างการทดสอบวินิจฉัยโรคขึ้นมาใหม่

256
00:12:39,975 --> 00:12:41,929
ผมจะแสดงให้ดูตามเวลาจริง แต่ผม

257
00:12:41,929 --> 00:12:45,416
บีบมันลงเหลือสามนาที โดยตัดบางชิ้นออกไป

258
00:12:45,416 --> 00:12:48,477
แทนที่จะแสดง การสร้างการทดสอบวินิจฉัยโรค

259
00:12:48,477 --> 00:12:51,846
ผมจะแสดง การทดสอบการวินิจฉัยภาพรถแทน

260
00:12:51,846 --> 00:12:54,068
เพราะว่า มันเป็นสิ่งที่เราทุกคนเข้าใจได้

261
00:12:54,068 --> 00:12:57,269
ตรงนี้ เราจึงจะเริ่มด้วยภาพรถ 1.5 ล้านคัน

262
00:12:57,269 --> 00:13:00,475
และผมอยากจะสร้างอะไรบางอย่าง 
ที่จะแยกมันออก

263
00:13:00,475 --> 00:13:02,698
เป็นมุมมองของภาพที่ถ่าย ภาพพวกนี้

264
00:13:02,698 --> 00:13:06,586
ไม่ได้มีป้ายบอกเลย 
ผมจึงต้องเริ่มจากไม่มีอะไร

265
00:13:06,586 --> 00:13:08,451
แต่ด้วยวิธีการคอมพ์การเรียนรู้ลึกของเรา

266
00:13:08,451 --> 00:13:12,158
มันจะระบุพื้นที่โครงสร้างในภาพได้อัตโนมัติ

267
00:13:12,158 --> 00:13:15,778
ส่วนดีคือ คนและคอมพ์ทำงานด้วยกันได้

268
00:13:15,778 --> 00:13:17,956
มนุษย์ อย่างที่เห็นตรงนี้ จะบอกคอมพ์ถึง

269
00:13:17,956 --> 00:13:20,631
พื้นที่ที่น่าสนใจ ที่ต้องการให้คอมพ์

270
00:13:20,631 --> 00:13:25,281
พยายามใช้ เพื่อจะได้ปรับปรุงวิธีการของมัน

271
00:13:25,281 --> 00:13:29,577
ระบบการเรียนรู้ลึกนี้ แท้จริงอยู่ในปริภูมิ

272
00:13:29,577 --> 00:13:33,009
16000 มิติ จึงเห็นคอมพ์หมุนไปตาม

273
00:13:33,009 --> 00:13:35,001
ปริภูมินั้น พยายามหาพื้นที่โครงสร้างใหม่

274
00:13:35,001 --> 00:13:36,782
เมื่อมันทำได้สำเร็จตามนั้น แล้วคนที่

275
00:13:36,782 --> 00:13:40,786
ขับมันอยู่ ก็จะชี้พื้นที่ที่น่าสนใจ

276
00:13:40,786 --> 00:13:43,208
ตรงนี้ คอมพ์พบพื้นที่ได้สำเร็จ

277
00:13:43,208 --> 00:13:45,770
ตัวอย่างเช่น มุมมองต่าง ๆ

278
00:13:45,770 --> 00:13:47,376
ดังนั้น ขณะที่เราผ่านกระบวนการนี้

279
00:13:47,376 --> 00:13:49,716
เราก็ค่อยๆบอกคอมพ์เพิ่มขึ้นเรื่อยๆ

280
00:13:49,716 --> 00:13:52,144
เกี่ยวกับแบบโครงสร้าง ที่เราต้องการค้นหา

281
00:13:52,144 --> 00:13:53,916
คุณคงจินตนาการได้ เช่น การทดสอบวินิจฉัย

282
00:13:53,916 --> 00:13:57,266
ก็จะเป็นพยาธิแพทย์ ที่จะระบุบริเวณผิดปกติ

283
00:13:57,266 --> 00:14:02,292
หรือรังสีแพทย์ ชี้บอกตุ่มที่น่าจะเป็นปัญหา

284
00:14:02,292 --> 00:14:04,851
บางที ก็ยากเหมือนกันสำหรับวิธีทางคอมพ์นี้

285
00:14:04,851 --> 00:14:06,815
ในกรณีนี้ มันคล้ายกับจะสับสน

286
00:14:06,815 --> 00:14:09,365
ด้านหน้าและด้านหลังของรถนั้น ปนเปกันไปหมด

287
00:14:09,365 --> 00:14:11,437
ตรงนี้ เราจึงต้องระวังมากขึ้นอีกหน่อย

288
00:14:11,437 --> 00:14:14,669
ใช้มือเลือก ส่วนใดเป็นหน้า ส่วนใดเป็นหลัง

289
00:14:14,669 --> 00:14:20,175
แล้วบอกคอมพ์นั้นว่า นี่เป็นแบบของกลุ่ม

290
00:14:20,175 --> 00:14:21,523
ที่เราสนใจอยู่

291
00:14:21,523 --> 00:14:24,200
เราต้องทำอย่างนี้ไปเรื่อย ๆ แต่เราจะข้ามไป

292
00:14:24,200 --> 00:14:26,446
แล้วเราก็จะฝึกเครื่องเรียนรู้

293
00:14:26,446 --> 00:14:28,420
อาศัยสิ่งของจำนวนมากมายเหล่านี้

294
00:14:28,420 --> 00:14:30,445
เราหวังว่า มันดีขึ้นมากแล้ว คุณจะเห็นได้

295
00:14:30,445 --> 00:14:33,518
ตอนนี้ มันได้เริ่มทำให้บางภาพค่อยๆหายไป

296
00:14:33,518 --> 00:14:38,226
มันรู้จำวิธีเข้าใจเรื่องนี้ด้วยตัวเองบ้างแล้ว

297
00:14:38,226 --> 00:14:41,128
แล้วเราจึงใช้ความรู้เรื่องภาพเหมือนนี้

298
00:14:41,128 --> 00:14:43,222
และการใช้ภาพเหมือนนั้น ตอนนี้จะเห็นได้

299
00:14:43,222 --> 00:14:47,241
ณ.จุดนี้คอมพ์ สามารถหารถส่วนหน้าทั้งหมด

300
00:14:47,241 --> 00:14:50,189
ดังนั้น ที่จุดนี้ คนจะบอกคอมพ์นั้นได้ว่า

301
00:14:50,189 --> 00:14:52,482
ตกลง ใช่แล้ว เธอทำงานเรื่องนี้ได้ดีแล้ว

302
00:14:53,652 --> 00:14:55,837
บางครั้ง แน่นอนครับ แม้กระทั่ง ที่จุดนี้

303
00:14:55,837 --> 00:14:59,511
ก็ยังคงยาก ที่จะแยกออกมาเป็นกลุ่มๆ

304
00:14:59,511 --> 00:15:03,395
กรณีนี้ แม้หลังจากให้คอมพ์หมุนไปสักครู่

305
00:15:03,399 --> 00:15:06,744
เราก็ยังคงพบว่า ด้านซ้ายและขวาของภาพ

306
00:15:06,744 --> 00:15:08,222
ก็ปนเปกันไปหมด

307
00:15:08,222 --> 00:15:10,362
ดังนั้นเราจึงให้คำแนะนำแก่คอมพ์อีก

308
00:15:10,362 --> 00:15:13,338
เราบอกว่า ใช่ พยายามหาการฉายภาพ ที่จะแยก

309
00:15:13,338 --> 00:15:15,945
ด้านซ้าย/ขวาออกจากกัน ให้มากเท่าที่จะทำได้

310
00:15:15,945 --> 00:15:18,067
โดยใช้วิธีการเรียนรู้ลึกทางคอมพ์

311
00:15:18,067 --> 00:15:21,009
เมื่อให้คำแนะนำนั้นแล้ว ก็ประสบความสำเร็จ

312
00:15:21,009 --> 00:15:23,891
มันก็หาวิธีคิด เกี่ยวกับวัตถุพวกนี้ได้

313
00:15:23,891 --> 00:15:26,271
นั่นคือ วิธีแยกสิ่งเหล่านี้

314
00:15:26,271 --> 00:15:28,709
คุณคงจะพอเข้าใจเรื่องนี้

315
00:15:28,709 --> 00:15:36,906
เรื่องนี้ ไม่ใช่มนุษย์ถูกแทนที่ด้วยคอมพ์

316
00:15:36,906 --> 00:15:39,546
แต่เป็นเรื่องที่ พวกเขาทำงานอยู่ด้วยกัน

317
00:15:39,546 --> 00:15:43,096
สิ่งที่เราทำจะใช้แทนสิ่งที่เคยใช้ทีมงาน

318
00:15:43,096 --> 00:15:45,098
ห้าหรือหกคน นานประมาณเจ็ดปี

319
00:15:45,098 --> 00:15:47,703
แล้วเอาสิ่งที่ทำได้ใน 15 นาที มาแทน

320
00:15:47,703 --> 00:15:50,208
โดยมีคนหนึ่งคน ปฏิบัติงานคนเดียว

321
00:15:50,208 --> 00:15:54,158
กระบวนการนี้ ใช้การวนซํ้าราว 4 - 5 ครั้ง

322
00:15:54,158 --> 00:15:56,017
คุณเห็นได้ว่า ตอนนี้เราได้ 62% ของภาพ

323
00:15:56,017 --> 00:15:58,976
1.5 ล้านภาพ แยกประเภทแล้วอย่างถูกต้อง

324
00:15:58,976 --> 00:16:01,448
ณ. จุดนี้ เราเริ่มจะคว้ามาได้อย่างรวดเร็ว

325
00:16:01,448 --> 00:16:02,745
ที่เป็นส่วนใหญ่ๆทั้งหมด

326
00:16:02,745 --> 00:16:05,664
ตรวจเช็คตลอด เพื่อให้แน่ใจว่าไม่มีอะไรผิด

327
00:16:05,664 --> 00:16:09,616
หากมี เราก็ให้คอมพ์รู้ข้อผิดพลาดเหล่านั้น

328
00:16:09,616 --> 00:16:12,661
การใช้กระบวนการนี้ ในแต่ละกลุ่มที่ต่างกัน

329
00:16:12,661 --> 00:16:15,148
ปัจจุบันนี้ เรามีอัตราความสำเร็จ ถึง 80%

330
00:16:15,148 --> 00:16:17,563
ในการแยกประเภทภาพ 1.5 ล้านภาพนั้น

331
00:16:17,563 --> 00:16:19,641
ณ. จุดนี้ เหลือแต่งานที่ต้องหา

332
00:16:19,641 --> 00:16:23,220
ภาพจำนวนเล็กน้อย ที่ถูกแบ่งประเภทผิด

333
00:16:23,220 --> 00:16:26,108
และต้องพยายามเข้าใจว่า เป็นเพราะเหตุใด

334
00:16:26,108 --> 00:16:27,851
และการใช้วิธีดังกล่าวนั้น

335
00:16:27,851 --> 00:16:31,972
เพียง 15 นาที เราก็ได้อัตราการแบ่งถึง 97% 
ถูกต้อง

336
00:16:31,972 --> 00:16:36,572
เทคนิคแบบนี้ จะช่วยแก้ไขปัญหาสำคัญ

337
00:16:36,578 --> 00:16:39,614
คือ การขาดผู้เชี่ยวชาญทางการแพทย์ในโลก

338
00:16:39,614 --> 00:16:43,103
การประชุมเศรษฐกิจโลก บอกว่า มีการขาดแพทย์

339
00:16:43,103 --> 00:16:45,727
อยู่ระหว่าง 10 และ 20 เท่า ในโลกกำลังพัฒนา

340
00:16:45,727 --> 00:16:47,840
และจะใช้เวลาราว 300 ปี

341
00:16:47,840 --> 00:16:50,734
เพื่อฝึกคนให้ได้พอ ที่จะแก้ปัญหานั้น

342
00:16:50,734 --> 00:16:53,619
คิดดู ถ้าเราช่วยเพิ่มประสิทธิภาพพวกเขาได้

343
00:16:53,619 --> 00:16:56,458
โดยใช้วิธีการเรียนรู้ลึกเหล่านี้

344
00:16:56,458 --> 00:16:58,690
ผมจึงตื่นเต้นมาก เกี่ยวกับโอกาสเหล่านี้

345
00:16:58,690 --> 00:17:01,279
แต่ผมก็ยังห่วงใยในปัญหาที่จะตามมาด้วย

346
00:17:01,279 --> 00:17:04,403
ปัญหาตรงนี้คือ ทุกบริเวณสีนํ้าเงินบนแผนที่

347
00:17:04,403 --> 00:17:08,172
เป็นการจ้างงานแบบบริการถึง 80%


348
00:17:08,172 --> 00:17:09,959
แล้วยอาชีพบริการคืออะไร

349
00:17:09,959 --> 00:17:11,473
เหล่านี้คืองานบริการ เป็นสิ่งที่

350
00:17:11,473 --> 00:17:15,627
ตรงเผงกับสิ่งที่คอมพ์เพิ่งจะเรียนรู้วิธีทำ

351
00:17:15,627 --> 00:17:19,431
ดังนั้น 80% ของการจ้างงานในโลกที่พัฒนาแล้ว

352
00:17:19,431 --> 00:17:21,963
จึงเป็นสิ่งที่คอมพ์ เพิ่งจะเรียนรู้วิธีทำ

353
00:17:21,963 --> 00:17:23,403
อะไรจะเกิดขึ้น

354
00:17:23,403 --> 00:17:25,986
ผลจะโอเค คือจะมีงานอื่น ๆ เกิดขึ้นมาแทน

355
00:17:25,986 --> 00:17:28,693
จะมีงานสำหรับนักวิทยาศาสตร์ข้อมูลเพิ่มขึ้น

356
00:17:28,693 --> 00:17:29,510
แต่...ก็ไม่เชิง

357
00:17:29,510 --> 00:17:32,628
พวกเขาไม่ต้องใช้เวลานานนัก ทำงานเหล่านี้

358
00:17:32,628 --> 00:17:35,880
เช่น วิธีคอมพ์ 4 วิธีนี้ 
สร้างได้โดยคนๆเดียว

359
00:17:35,880 --> 00:17:38,318
แต่ถ้าคิดว่า ทั้งหมดก็เคยเกิดขึ้นมาก่อนนี่

360
00:17:38,318 --> 00:17:42,126
เราได้เห็นผลจากอดีต เมื่อเกิดสิ่งใหม่ๆมา

361
00:17:42,126 --> 00:17:44,378
คือเกิดงานใหม่ๆ มาแทนงานเก่า

362
00:17:44,378 --> 00:17:46,494
แล้วงานใหม่ๆเหล่านี้ จะเป็นงานอะไร

363
00:17:46,494 --> 00:17:48,365
มันยากมากที่เราจะประมาณการณ์เรื่องนี้ได้

364
00:17:48,365 --> 00:17:51,104
เพราะการทำงานของคน โตได้ในอัตราทีละน้อยนี้

365
00:17:51,104 --> 00:17:53,666
แต่ปัจจุบันเรามีระบบ คือการเรียนรู้ลึก

366
00:17:53,666 --> 00:17:56,893
ซึ่งจริง ๆ สมรรถภาพโตได้อย่างมากและรวดเร็ว

367
00:17:56,893 --> 00:17:58,498
และตอนนี้เราอยู่ที่จุดนั้นแล้ว

368
00:17:58,498 --> 00:18:00,559
ดังนั้น ปัจจุบัน เราจึงเห็นสิ่งรอบๆตัวเรา

369
00:18:00,559 --> 00:18:03,235
และก็บอกว่า "คอมพ์ยังคงทึ่ม" ใช่มั๊ยครับ

370
00:18:03,235 --> 00:18:06,664
แต่ในเวลา 5 ปี คอมพ์จะออกนอกแผนภูมินี้ไป

371
00:18:06,664 --> 00:18:10,529
เราจึงจำเป็นต้องเริ่มคิดถึงสมรรถภาพ
ของคอมพ์ เสียแต่เดี๋ยวนี้

372
00:18:10,529 --> 00:18:12,579
เราได้เห็นมาก่อนครั้งหนึ่งแล้ว

373
00:18:12,579 --> 00:18:13,966
ในการปฏิวัติอุตสาหกรรม

374
00:18:13,966 --> 00:18:16,817
เห็นการเปลี่ยนไปขั้นหนึ่ง ในเรื่องสมรรถภาพ

375
00:18:17,667 --> 00:18:20,805
เครื่องยนต์ แต่ไม่นานก็รักษาระดับได้

376
00:18:20,805 --> 00:18:22,507
ถึงมีการแตกแยกทางสังคม

377
00:18:22,507 --> 00:18:25,946
แต่เมื่อใช้เครื่องยนต์เพื่อสร้างพลังงาน

378
00:18:25,946 --> 00:18:28,300
ในทุกสถานการณ์ ความยุ่งยากก็สงบลง

379
00:18:28,300 --> 00:18:29,773
ส่วนการปฏิวัติเพราะการเรียนรู้ของเครื่อง

380
00:18:29,773 --> 00:18:32,682
จะต่างไปจาก การปฏิวัติอุตสาหกรรมอย่างมาก

381
00:18:32,682 --> 00:18:35,632
เพราะปฏิวัติการเรียนรู้ของเครื่อง จะไม่

382
00:18:35,632 --> 00:18:38,614
ปักหลักกับที่ ยิ่งคอมพ์ทำงานชาญฉลาดขึ้น

383
00:18:38,614 --> 00:18:42,862
มันก็ยิ่งสร้างคอมพ์ที่สมรรภภาพฉลาดยิ่งขึ้น

384
00:18:42,862 --> 00:18:44,770
เรื่องนี้ จึงจะเป็นการเปลี่ยนแปลงชนิดที่

385
00:18:44,770 --> 00:18:47,248
แท้จริงแล้ว โลกไม่เคยประสบมาก่อน ดังนั้น

386
00:18:47,248 --> 00:18:50,554
ความเข้าใจก่อนๆในเรื่องที่เป็นไปได้ 
จึงต่างไป

387
00:18:50,974 --> 00:18:52,754
เรื่องนี้กำลังส่งผลกระทบกับเราแล้ว

388
00:18:52,754 --> 00:18:56,384
25 ปีที่ผ่านมา ขณะที่ประสิทธิภาพการลงทุน
ได้เพิ่มขึ้น

389
00:18:56,400 --> 00:19:00,588
ประสิทธิภาพทางแรงงานกลับราบเรียบ 
กระทั่งตํ่าลงเล็กน้อย

390
00:19:01,408 --> 00:19:04,149
ผมจึงอยากให้เรา มาเริ่มอภิปรายเรื่องนี้กัน

391
00:19:04,149 --> 00:19:07,176
ผมรู้ เมื่อผมบอกคนบ่อยๆ เรื่องสถานการณ์นี้

392
00:19:07,176 --> 00:19:08,666
ผู้คนก็จะไม่ค่อยยอมรับฟัง

393
00:19:08,666 --> 00:19:10,339
จริงอยู่ คอมพ์คิดไม่เป็น

394
00:19:10,339 --> 00:19:13,367
คอมพ์ไม่แสดงอารมณ์ มันไม่เข้าใจกวีนิพนธ์

395
00:19:13,367 --> 00:19:15,888
จริงๆแล้ว เราไม่เข้าใจว่า มันทำงานอย่างไร

396
00:19:15,888 --> 00:19:17,374
แล้วยังไงครับ?

397
00:19:17,374 --> 00:19:19,178
คอมพ์ปัจจุบันนี้ สามารถทำสิ่งที่

398
00:19:19,178 --> 00:19:21,897
มีการจ้างมนุษย์ให้ใช้เวลาส่วนมากทำ

399
00:19:21,897 --> 00:19:23,628
ขณะนี้ จึงถึงเวลาแล้ว ที่จะเริ่มคิด

400
00:19:23,628 --> 00:19:28,015
วิธีที่เราจะปรับโครงสร้างสังคมและเศรษฐกิจ

401
00:19:28,015 --> 00:19:29,855
โดยคำนึงถึง ความเป็นจริงใหม่นี้

402
00:19:29,855 --> 00:19:31,388
ขอบคุณครับ

403
00:19:31,388 --> 00:19:32,190
(เสียงปรบมือ)