1 00:00:00,880 --> 00:00:04,893 เคยเป็นว่าถ้าอยากได้คอมพ์ มาทำอะไรที่ใหม่ๆ 2 00:00:04,893 --> 00:00:06,447 คุณก็ต้องโปรแกรมมัน 3 00:00:06,447 --> 00:00:09,858 ครับ การทำโปรแกรม สำหรับคนที่ยังไม่เคยทำเอง 4 00:00:09,858 --> 00:00:13,360 ก็ต้องวางแผนรายละเอียด อย่างเลือดตาแทบกระเด็น 5 00:00:13,360 --> 00:00:16,727 ในทุกขั้นตอน ที่คุณต้องการให้คอมพิวเตอร์ทำ 6 00:00:16,727 --> 00:00:19,089 เพื่อให้บรรลุเป้าหมายของคุณ 7 00:00:19,089 --> 00:00:22,585 ถ้าต้องการทำสิ่งที่คุณเองไม่รู้วิธีทำแล้ว 8 00:00:22,585 --> 00:00:24,648 ก็จะเป็นเรื่องท้าทายที่ยิ่งใหญ่ ที่ชายชื่อ 9 00:00:24,648 --> 00:00:28,131 อาร์เธอร์ แซมวล ก็เผชิญมาแล้วในอดีต 10 00:00:28,131 --> 00:00:32,208 ปี 1956 เขาอยากจะให้คอมพิวเตอร์เครื่องนี้ 11 00:00:32,208 --> 00:00:34,548 เอาชนะเขาได้ ในเกมหมากฮอส 12 00:00:34,548 --> 00:00:36,588 จะเขียนโปรแกรมโดยวางรายละเอียด 13 00:00:36,588 --> 00:00:40,394 อย่างเลือดตาแทบกระเด็น ให้เหนือกว่าคุณในเกม ได้อย่างไร 14 00:00:40,394 --> 00:00:42,116 ดังนั้น เขาจึงเกิดความคิดใหม่ขึ้นมา 15 00:00:42,116 --> 00:00:45,840 เขาให้คอมพ์เล่นแข่งกับตัวเอง หลายพันครั้ง 16 00:00:45,840 --> 00:00:48,364 และให้มันเรียนรู้ ที่จะเล่นเกมหมากฮอส 17 00:00:48,364 --> 00:00:51,544 และมันก็ได้ผลจริง ๆ และตอนปี 1962 18 00:00:51,544 --> 00:00:55,561 คอมพ์เครื่องนี้ เล่นชนะแชมป์รัฐคอนเนตทิคัต 19 00:00:55,561 --> 00:00:58,534 อาร์เธอร์ แซมวล ถือว่าเป็นบิดา ของการเรียนรู้ของเครื่อง 20 00:00:58,534 --> 00:01:00,251 ผมเป็นหนี้เขาอย่างใหญ่หลวง เพราะ 21 00:01:00,251 --> 00:01:03,014 ผมเป็นผู้ปฏิบัติงาน ด้านเครื่องเรียนรู้นี้ 22 00:01:03,014 --> 00:01:04,479 อดีตผมเป็นประธานกลุ่มแค็กเกิล 23 00:01:04,479 --> 00:01:07,867 เป็นกลุ่มคนกว่า 2 แสนคนที่ทำงานด้านนี้ 24 00:01:07,867 --> 00:01:09,925 แค็กเกิลจัดการแข่งขัน เพื่อพยายามให้ 25 00:01:09,925 --> 00:01:13,633 เครื่องเหล่านั้นแก้ปัญหาที่แก้ไม่ได้มาก่อน 26 00:01:13,633 --> 00:01:17,470 และก็ประสบผลสำเร็จมาแล้วหลายร้อยครั้ง 27 00:01:17,470 --> 00:01:19,940 ดังนั้น จากมุมมองที่กว้างขวางนี้ ผมจึงได้ค้นพบ 28 00:01:19,940 --> 00:01:23,890 เรื่องการเรียนรู้ของเครื่องอีกมากมาย ที่พวกมันทำได้ 29 00:01:23,890 --> 00:01:26,252 ในอดีต ปัจจุบัน และอนาคต ส่วนความสำเร็จเชิงพาณิชย์ 30 00:01:26,252 --> 00:01:30,675 ที่ยิ่งใหญ่ครั้งแรกของเรื่องนี้ อาจคือ 31 00:01:30,675 --> 00:01:33,784 กูเกิลที่ให้เห็นว่าเป็นไปได้ที่จะค้นข้อมูล 32 00:01:33,784 --> 00:01:35,536 โดยใช้วิธีการทางคอมพิวเตอร์ 33 00:01:35,536 --> 00:01:38,437 ซึ่งมีพื้นฐานมาจาก การเรียนรู้ของเครื่อง 34 00:01:38,437 --> 00:01:42,323 แต่นั้นมา มีความสำเร็จเชิงพาณิชย์อีกมาก 35 00:01:42,323 --> 00:01:44,160 บริษัท อย่างเช่น แอมะซอน และ เน็ตฟลิกส์ 36 00:01:44,160 --> 00:01:47,876 ใช้การเรียนรู้ของเครื่อง เพื่อแนะนำสินค้า 37 00:01:47,876 --> 00:01:49,896 ที่คุณอาจอยากซื้อ ภาพยนตร์ที่อาจอยากดู 38 00:01:49,896 --> 00:01:51,703 บางครั้ง ก็เกือบทำให้ขนลุก 39 00:01:51,703 --> 00:01:53,657 บริษัทอย่างเช่น ลิงด์อิน และเฟสบุก 40 00:01:53,657 --> 00:01:56,251 บางครั้งจะบอกว่า ใครอาจเป็นเพื่อนของคุณ 41 00:01:56,251 --> 00:01:58,228 และคุณก็คิดไม่ออกเลยว่า มันทำได้อย่างไร 42 00:01:58,228 --> 00:02:01,195 นี่ก็เพราะ มันใช้พลังการเรียนรู้ของเครื่อง 43 00:02:01,195 --> 00:02:04,152 เป็นวิธีการทางคอมพ์ ที่เรียนรู้วิธีทำได้ 44 00:02:04,152 --> 00:02:07,399 จากข้อมูล แทนโปรแกรม ที่ต้องใช้มือทำ 45 00:02:07,399 --> 00:02:09,877 สิ่งนี่ยังทำให้ IBM สำเร็จในการทำให้ 46 00:02:09,877 --> 00:02:13,739 วัทสัน ชนะแชมป์โลกสองคนใน "เจเพอะดี" โชว์ 47 00:02:13,739 --> 00:02:16,964 โดยตอบคำถามที่ลึกลับซับซ้อนเหลือเชื่อ เช่น 48 00:02:16,964 --> 00:02:19,799 ["ของโบราณ 'สิงโตแห่งนิมรัต' หายไปจากพิพิธภัณฑ์ในปี 2003] 49 00:02:19,799 --> 00:02:23,034 ยังให้เราเห็นในขณะนี้ รถพวกแรกที่ขับได้เอง 50 00:02:23,034 --> 00:02:25,856 ถ้าคุณต้องการจะบอกความแตกต่างระหว่าง เช่น 51 00:02:25,856 --> 00:02:28,488 ต้นไม้กับคนเดินถนน ครับ นั่นมันสำคัญมาก 52 00:02:28,488 --> 00:02:31,075 เราไม่รู้วิธีเขียนโปรแกรมเหล่านั้น ด้วยมือ 53 00:02:31,075 --> 00:02:34,072 แต่จากการเรียนรู้ของเครื่อง มันเป็นไปได้ 54 00:02:34,072 --> 00:02:36,680 ความจริงแล้ว รถคันนี้ขับมาแล้วกว่าล้านไมล์ 55 00:02:36,680 --> 00:02:40,186 โดยไม่เกิดอุบัติเหตุ บนถนนปกติ 56 00:02:40,196 --> 00:02:44,110 ขณะนี้เราจึงรู้ว่า เครื่องคอมพ์เรียนรู้ได้ 57 00:02:44,110 --> 00:02:46,010 คอมพิวเตอร์เรียนรู้ ที่จะทำสิ่งต่างๆที่ 58 00:02:46,010 --> 00:02:48,848 บางครั้งเราไม่รู้จริงๆ ว่าจะทำเองอย่างไร 59 00:02:48,848 --> 00:02:51,733 หรือบางทีมันอาจจะทำได้ ดีกว่าเราเสียอีก 60 00:02:51,733 --> 00:02:55,928 ตัวอย่างหนึ่งที่น่าทึ่งที่สุด ที่ผมเคยเห็น 61 00:02:55,928 --> 00:02:58,320 เกิดขึ้นในโครงการที่ผมทำ ที่แคกเกิล 62 00:02:58,320 --> 00:03:01,911 ในทีมงานที่นำโดยหนุ่มชื่อ เจฟฟรี ฮินตัน 63 00:03:01,911 --> 00:03:03,463 จากมหาวิทยาลัยโทรอนโต 64 00:03:03,463 --> 00:03:06,140 เขาชนะการแข่งขัน การค้นพบยาโดยอัตโนมัติ 65 00:03:06,140 --> 00:03:08,987 ความพิเศษคือ ไม่ใช่เพียงเอาชนะวิธีทั้งหมด 66 00:03:08,987 --> 00:03:13,000 ที่พัฒนาโดย เมอร์ค, กลุ่มวิชาการนาๆชาติ 67 00:03:13,000 --> 00:03:18,061 แต่ไม่มีใครในทีมมีพื้นทางเคมี หรือชีววิทยาศาสตร์ 68 00:03:18,061 --> 00:03:20,230 และพวกเขาทำให้ชนะได้ ในสองสัปดาห์ 69 00:03:20,230 --> 00:03:21,611 พวกเขาทำได้อย่างไรหรือ 70 00:03:22,421 --> 00:03:25,342 เขาใช้วิธีคอมพ์ที่เรียกว่า การเรียนรู้ลึก (deep learning) 71 00:03:25,342 --> 00:03:28,291 เรื่องนี้สำคัญมากจนกระทั่ง ความสำเร็จนี้ได้พิมพ์ในหน้าหนึ่ง 72 00:03:28,291 --> 00:03:31,412 ของนิวยอร์คไทม์ 2-3 อาทิตย์ต่อมา 73 00:03:31,412 --> 00:03:34,147 นี่คือ เจฟฟรี่ ฮินตัน ตรงนี้ด้านซ้ายมือ 74 00:03:34,147 --> 00:03:38,488 การเรียนรู้ลึก เป็นวิธีการทางคอมพ์ที่นำ 75 00:03:38,488 --> 00:03:40,300 วิธีทำงานของสมองคนมา ผลคือ เป็นวิธีที่ 76 00:03:40,300 --> 00:03:44,141 ไม่มีข้อจำกัดทางทฤษฎีว่า มันทำอะไรได้บ้าง 77 00:03:44,141 --> 00:03:46,964 ยิ่งให้ข้อมูลมัน ยิ่งให้เวลาคำนวณมากขึ้น 78 00:03:46,964 --> 00:03:48,276 มันก็จะทำงานได้ดียิ่งขึ้น 79 00:03:48,276 --> 00:03:50,615 นิวยอร์คไทม์ ยังแสดงให้เห็นในบทความนี้ 80 00:03:50,615 --> 00:03:52,857 ถึงผลลัพท์พิเศษอีกอย่างของ การเรียนรู้ลึก 81 00:03:52,857 --> 00:03:55,569 ซึ่งผมจะแสดงให้คุณดู เดี๋ยวนี้ 82 00:03:55,569 --> 00:04:00,510 มันแสดงว่า คอมพ์ฟังรู้เรื่องและเข้าใจได้ 83 00:04:00,510 --> 00:04:03,221 (วิดีโอ) ริชาร์ด ราชิด: ครับ ขั้นสุดท้าย 84 00:04:03,221 --> 00:04:06,246 ที่ผมอยากจะทำให้ได้ ในกระบวนการนี้ 85 00:04:06,246 --> 00:04:10,961 คือ พูดกับคุณจริงๆ เป็นภาษาจีน 86 00:04:10,961 --> 00:04:13,596 ครับ สิ่งสำคัญในเรื่องนี้ก็คือ เราสามารถ 87 00:04:13,596 --> 00:04:18,598 เอาข้อมูลจำนวนมากมาได้ จากคนพูดจีนหลายๆคน 88 00:04:18,598 --> 00:04:21,128 และทำ "ระบบเนื้อหา-คำพูด" ออกมา, ระบบนี้จะ 89 00:04:21,128 --> 00:04:25,801 เอาข้อความภาษาจีนมา เปลี่ยนให้เป็นภาษาจีน 90 00:04:25,801 --> 00:04:29,929 แล้วก็เอาเสียงของผมเอง ราวหนึ่ง ช.ม 91 00:04:29,929 --> 00:04:31,820 แล้วใช้เสียงมาปรับระบบเนื้อหา-คำพูด 92 00:04:31,820 --> 00:04:36,364 เพื่อที่จะให้มีเสียงเหมือนผม 93 00:04:36,364 --> 00:04:38,904 อีกนั่นแหละ ผลที่ได้ไม่ดีเลิศนัก 94 00:04:38,904 --> 00:04:41,552 จริงๆแล้ว มีข้อผิดพลาดหลายอย่าง 95 00:04:41,552 --> 00:04:44,036 (ภาษาจีน) 96 00:04:44,036 --> 00:04:47,403 (เสียงปรบมือ) 97 00:04:49,446 --> 00:04:53,022 ยังมีสิ่งที่ต้องทำอีกมาก ในเรื่องนี้ 98 00:04:53,022 --> 00:04:56,667 (ภาษาจีน) 99 00:04:56,667 --> 00:05:00,100 (เสียงปรบมือ) 100 00:05:01,345 --> 00:05:04,744 เจเรมี่ เฮาวาร์ด: นั่นเป็นการประชุมที่จีน 101 00:05:04,744 --> 00:05:07,114 จริงๆ ไม่บ่อยนัก ในการประชุมทางวิชาการ 102 00:05:07,114 --> 00:05:09,011 ที่จะได้ยินคนปรบมือเอง พร้อมเพรียงกัน 103 00:05:09,011 --> 00:05:12,687 แต่แน่ว่า บางครั้งในการประชุม TEDx จงทำตามใจชอบ 104 00:05:12,687 --> 00:05:15,482 ทุกสิ่งที่เห็นที่นั่นเกิดจากการเรียนรู้ลึก 105 00:05:15,482 --> 00:05:17,007 (เสียงปรบมือและหัวเราะ) ขอบคุณครับ 106 00:05:17,007 --> 00:05:19,289 การถอดเป็นภาษาอังกฤษทำโดยการเรียนรู้ลึก 107 00:05:19,289 --> 00:05:22,701 ซึ่งแปลเป็นภาษาจีนและข้อความด้านบนขวา 108 00:05:22,701 --> 00:05:26,008 การสร้างเสียงก็เป็นการเรียนรู้ลีก เช่นกัน 109 00:05:26,008 --> 00:05:29,242 การเรียนรู้ลึกจึงเป็นสิ่งพิเศษ 110 00:05:29,242 --> 00:05:32,341 เป็นวิธีเดียวทางคอมพ์ที่ทำได้เกือบทุกอย่าง 111 00:05:32,341 --> 00:05:35,452 ผมพบปีที่แล้วว่า มันเรียนที่จะเห็นได้ด้วย 112 00:05:35,452 --> 00:05:37,628 ในการแข่งขันที่ไม่ค่อยรู้จัก ในเยอรมนี ชื่อ 113 00:05:37,628 --> 00:05:40,225 เยอรมันแทร็ฟฟิกซายน์เรคอกนิชั่นเบนช์มาร์ก 114 00:05:40,225 --> 00:05:43,618 การเรียนรู้ลึก เรียนรู้จำสัญญาณจราจรนี้ 115 00:05:43,618 --> 00:05:45,712 ไม่เพียงแค่ รู้จำสัญญาณจราจรได้ดีกว่า 116 00:05:45,712 --> 00:05:47,470 วิธีการอื่นๆทางคอมพิวเตอร์ เท่านั้น 117 00:05:47,470 --> 00:05:50,189 ป้ายคะแนนนแสดงว่า จริง ๆ แล้ว 118 00:05:50,189 --> 00:05:52,041 มันดีกว่าคนประมาณสองเท่า 119 00:05:52,041 --> 00:05:54,037 ดังนั้น โดยปี 2011 เราจึงมีตัวอย่างแรก 120 00:05:54,037 --> 00:05:57,442 ของคอมพิวเตอร์ ที่สามารถมองเห็นได้ดีกว่าคน 121 00:05:57,442 --> 00:05:59,491 ตั้งแต่นั้นมา สิ่งต่างๆมากมายได้เกิดขึ้น 122 00:05:59,491 --> 00:06:03,005 ปี 2012 กูเกิลแจ้งว่า ได้ให้การเรียนรู้ลึก 123 00:06:03,005 --> 00:06:04,420 ดูยูทูบวิดีโอ ขบเคี้ยวข้อมูล 124 00:06:04,420 --> 00:06:07,857 จากคอมพิวเตอร์ 16,000 เครื่องอยู่ 1 เดือน 125 00:06:07,857 --> 00:06:12,218 และคอมพ์ก็เรียนรู้ได้เองถึงแนวความคิด 126 00:06:12,218 --> 00:06:14,027 เช่น คนกับแมว เพียงดูแค่วิดีโอเท่านั้น 127 00:06:14,027 --> 00:06:16,379 สิ่งนี้เหมือนวิธีที่มนุษย์เรียนรู้อย่างมาก 128 00:06:16,379 --> 00:06:19,119 มนุษย์ไม่ได้เรียนโดยให้คนอื่นบอกว่า เขาเห็นอะไร 129 00:06:19,119 --> 00:06:22,450 แต่โดยเรียนด้วยตนเองว่า ของเหล่านี้คืออะไร 130 00:06:22,450 --> 00:06:25,819 ปี 2012 เจฟฟรี่ ฮินตัน ที่เราเห็นตอนต้น 131 00:06:25,819 --> 00:06:28,677 ยังชนะการแข่ง อิมเมจเน็ด ที่มีชื่อมาก ซึ่ง 132 00:06:28,677 --> 00:06:32,818 พยายามหาวิธีคิด จากภาพล้านห้าแสนภาพ 133 00:06:32,818 --> 00:06:34,256 ว่า ภาพเหล่านี้เป็นภาพอะไร 134 00:06:34,256 --> 00:06:37,789 ถึงปี 2014 นี้ เราลดอัตราผิดจนเหลือ 6% 135 00:06:37,789 --> 00:06:39,242 ในการรู้จำภาพได้ 136 00:06:39,242 --> 00:06:41,268 นี่ก็ดีกว่าคนอีกเหมือนกัน 137 00:06:41,268 --> 00:06:45,037 เครื่องจึงทำงานได้ดีพิเศษจริง ในเรื่องนี้ 138 00:06:45,037 --> 00:06:47,306 และขณะนี้ก็กำลังมีการนำไปใช้ ในอุตสาหกรรม 139 00:06:47,306 --> 00:06:50,348 เช่น กูเกิลประกาศเมื่อปีที่แล้ว ว่า 140 00:06:50,348 --> 00:06:54,933 ได้ทำแผนที่ทุกๆตำแหน่งในฝรั่งเศสใน 2 ช.ม 141 00:06:54,933 --> 00:06:58,380 และวิธีที่พวกเขาทำนั้น คือ ใส่ภาพถนนเข้าไป 142 00:06:58,380 --> 00:07:02,699 ในการเรียนรู้ลึก เพื่อให้รู้จำและอ่านเลขถนน 143 00:07:02,699 --> 00:07:04,919 ลองจินตนาการดู แต่ก่อนจะใช้เวลานานแค่ไหน 144 00:07:04,919 --> 00:07:08,274 ใช้คนมากมายหลายคน หลายปี 145 00:07:08,274 --> 00:07:10,185 เรื่องนี้ก็กำลังเกิดขึ้นในจีนด้วย 146 00:07:10,185 --> 00:07:14,221 ไบดู เป็นเหมือนกับกูเกลของจีน และ 147 00:07:14,221 --> 00:07:16,504 ที่คุณเห็น ตรงด้านบนซ้ายมือ คือ ตัวอย่าง 148 00:07:16,504 --> 00:07:20,478 รูปที่ผมใส่เข้าไป ในระบบเรียนรู้ลึกของไบดู 149 00:07:20,478 --> 00:07:24,247 ตรงข้างล่าง คุณจะเห็นได้ว่า ระบบเข้าใจได้ 150 00:07:24,247 --> 00:07:26,483 ว่าเป็นภาพอะไร และค้นพบภาพที่เหมือนกัน 151 00:07:26,483 --> 00:07:29,219 ซึ่งจริงๆแล้ว คือมีแบ็กกราวเหมือนกัน 152 00:07:29,219 --> 00:07:30,877 หันหน้าไปทิศทางเดียวกัน 153 00:07:30,877 --> 00:07:32,665 แม้กระทั่ง บางรูปที่แลบลิ้นออกมา 154 00:07:32,665 --> 00:07:35,695 นี่ไม่ใช่มองที่ เนื้อหาเว็บเพจอย่างแน่นอน 155 00:07:35,695 --> 00:07:37,107 ผมส่งเพียงแต่รูป ๆ เดียวเท่านั้น 156 00:07:37,107 --> 00:07:41,128 ขณะนี้มีคอมพ์ ที่เข้าใจสิ่งที่มันเห็นจริงๆ 157 00:07:41,128 --> 00:07:42,752 จึงสามารถค้นหาฐานข้อมูลได้ 158 00:07:42,752 --> 00:07:46,306 เป็นหลายร้อยล้านภาพ ในเวลาสั้นๆ 159 00:07:46,306 --> 00:07:49,536 อะไรจะเกิดขึ้น เมื่อมีคอมพ์ที่มองเห็นได้ 160 00:07:49,536 --> 00:07:51,553 แต่ไม่ใช่แค่มองเห็นได้เท่านั้น 161 00:07:51,553 --> 00:07:53,622 จริงๆแล้ว การเรียนรู้ลึก ทำได้มากกว่านั้น 162 00:07:53,622 --> 00:07:56,570 ประโยคที่ต่างกันน้อยมาก ซับซ้อน อย่างนี้ 163 00:07:56,570 --> 00:07:59,394 ขณะนี้เข้าใจได้แล้ว ด้วยวิธีการเรียนรู้ลึก 164 00:07:59,394 --> 00:08:00,697 อย่างที่คุณเห็นตรงนี้ 165 00:08:00,697 --> 00:08:03,465 ระบบฐานสแตนฟอร์ดนี้ แสดงจุดสีแดงด้านบนสุด 166 00:08:03,465 --> 00:08:07,384 คิดออกว่า ประโยคนี้แสดงอารมณ์เชิงลบ 167 00:08:07,384 --> 00:08:10,790 จริงๆการเรียนรู้ลึก ใกล้สมรรถภาพมนุษย์แล้ว 168 00:08:10,802 --> 00:08:15,923 เข้าใจได้ว่า ประโยคบอกเรื่องอะไร และมีความหมายอะไร 169 00:08:15,923 --> 00:08:18,651 การเรียนรู้ลึก ยังนำไปใช้เพื่ออ่านภาษาจีน 170 00:08:18,651 --> 00:08:21,807 อีกนั่นแหละ ประมาณระดับคนจีนพื้นเมือง 171 00:08:21,807 --> 00:08:23,975 วิธีการทางคอมพ์นี้ ได้พัฒนาออกมาจากสวิสฯ 172 00:08:23,975 --> 00:08:27,331 โดยคนที่ไม่มีใครพูดหรือเข้าใจภาษาจีนเลย 173 00:08:27,331 --> 00:08:29,382 อย่างที่ผมบอก การใช้การเรียนรู้ลึก 174 00:08:29,382 --> 00:08:31,601 เกือบเป็นระบบที่ดีที่สุดในโลก สำหรับงานนี้ 175 00:08:31,601 --> 00:08:36,718 แม้เมื่อเปรียบกับความเข้าใจของคนพื้นบ้าน 176 00:08:36,718 --> 00:08:39,682 นี่เป็นระบบที่เราประกอบขึ้นมา ที่บริษัทของผม 177 00:08:39,682 --> 00:08:41,728 ซึ่งให้เห็นการเอาสิ่งทั้งหลายเข้ามารวมกัน 178 00:08:41,728 --> 00:08:44,189 พวกนี้ให้เห็นภาพ ที่ไม่มีข้อความกำกับ 179 00:08:44,189 --> 00:08:46,541 และขณะที่ผมพิมพ์ประโยคอยู่ตรงนี้ 180 00:08:46,541 --> 00:08:49,510 ในเวลาสั้นๆ มันก็เข้าใจรูปเหล่านี้ 181 00:08:49,510 --> 00:08:51,189 และคิดออกได้ว่า มันเป็นเรื่องอะไร 182 00:08:51,189 --> 00:08:54,352 และไปหาภาพ ที่เหมือนกับข้อความที่ผมเขียน 183 00:08:54,352 --> 00:08:57,108 จึงเห็นได้ เป็นความเข้าใจประโยคของผมจริงๆ 184 00:08:57,108 --> 00:08:59,332 เป็นความเข้าใจภาพเหล่านี้จริง 185 00:08:59,332 --> 00:09:01,891 ผมรู้ว่า คุณเคยเห็นแบบนี้ในกูเกิลแล้ว 186 00:09:01,891 --> 00:09:04,666 ที่คุณพิมพ์ข้อความ แล้วมันจะแสดงภาพออกมา 187 00:09:04,666 --> 00:09:08,090 แต่จริงๆสิ่งที่มันทำคือ หาข้อความในเว็บเพจ 188 00:09:08,090 --> 00:09:11,091 เรื่องนี้ต่างกันมาก กับการเข้าใจภาพพวกนั้น 189 00:09:11,091 --> 00:09:13,843 นี่เป็นสิ่งที่คอมพ์สามารถทำได้ 190 00:09:13,843 --> 00:09:17,091 เป็นครั้งแรก ในไม่กี่เดือนที่ผ่านมานี้ 191 00:09:17,091 --> 00:09:21,182 ขณะนี้จึงเห็นได้ว่า คอมพ์ไม่ได้แค่เห็น แต่ 192 00:09:21,182 --> 00:09:24,947 อ่านได้ด้วย และเราก็ให้เห็นว่า มันก็เข้าใจสิ่งที่มันได้ยิน 193 00:09:24,947 --> 00:09:28,389 อาจไม่น่าแปลกใจ ถ้าจะบอกว่า มันก็เขียนได้ 194 00:09:28,389 --> 00:09:33,172 ประโยคนี้ผมสร้างเมื่อวาน ใช้การเรียนรู้ลึก 195 00:09:33,172 --> 00:09:37,096 ข้อความนี้ สร้างโดยวิธีคอมพ์ของสแตนฟอร์ด 196 00:09:37,096 --> 00:09:38,860 แต่ละประโยคสร้างขึ้น 197 00:09:38,860 --> 00:09:43,109 โดยวิธีการเรียนรู้ลึก เพื่ออธิบายภาพนั้นๆ 198 00:09:43,109 --> 00:09:47,581 แต่ก่อนวิธีการคอมพ์ ไม่เคยเห็นชายเสื้อดำ กำลังเล่นกีต้าร์ 199 00:09:47,581 --> 00:09:49,801 แต่มันเคยเห็นผู้ชาย เคยเห็นสีดำ 200 00:09:49,801 --> 00:09:51,400 เคยเห็นกีต้าร์ แต่ด้วยตัวมันเอง 201 00:09:51,400 --> 00:09:55,694 ได้สร้างการอธิบายภาพนี้ในแนวใหม่ 202 00:09:55,694 --> 00:09:59,196 ยังคงไม่เหมือนมนุษย์ทีเดียว แต่ก็ใกล้แล้ว 203 00:09:59,196 --> 00:10:03,264 ในการทดสอบ มนุษย์ชอบคำบรรยายสร้างโดยคอมพ์ 204 00:10:03,264 --> 00:10:04,791 หนึ่งในสี่ครั้ง 205 00:10:04,791 --> 00:10:06,855 ปัจจุบัน ระบบนี้มีอายุแค่ 2 สัปดาห์ 206 00:10:06,855 --> 00:10:08,701 ดังนั้น บางที ภายในปีหน้า 207 00:10:08,701 --> 00:10:11,502 วิธีทางคอมพ์ อาจไปไกลเกินหน้าการปฏิบัติงาน 208 00:10:11,502 --> 00:10:13,364 ของมนุษย์ ที่อัตราที่กำลังเป็นอยู่นี้ 209 00:10:13,364 --> 00:10:16,413 คอมพิวเตอร์ จึงสามารถเขียนได้ด้วย 210 00:10:16,413 --> 00:10:19,888 รวมๆแล้ว ก็จะเห็นโอกาสทีน่าตื่นเต้นมาก 211 00:10:19,888 --> 00:10:21,380 ตัวอย่างเช่น ในทางการแพทย์ 212 00:10:21,380 --> 00:10:23,905 ทีมงานในบอสตัน ประกาศว่าพวกเขาได้ค้นพบ 213 00:10:23,905 --> 00:10:26,854 ลักษณะต่าง ๆ มากมาย ที่เกี่ยวข้องกับการรักษา 214 00:10:26,854 --> 00:10:31,120 เนื้องอก ที่ช่วยแพทย์ทายอาการมะเร็ง 215 00:10:32,220 --> 00:10:34,516 และที่เหมือนกันอย่างมาก ที่สแตนฟอร์ด 216 00:10:34,516 --> 00:10:38,179 กลุ่มที่นั่นประกาศว่า โดยดูเนื้อเยื่อขยายแล้ว 217 00:10:38,179 --> 00:10:40,560 ได้พัฒนาระบบจากการเรียนรู้ของเครื่องขึ้นมา 218 00:10:40,560 --> 00:10:43,142 ซึ่งจริงๆ ดีกว่าแพทย์พยาธิวิทยา ในการทำนาย 219 00:10:43,142 --> 00:10:47,519 อัตราการรอดชีวิต ของคนไข้โรคมะเร็ง 220 00:10:47,519 --> 00:10:50,764 ทั้งสองกรณี ไม่เพียงการคาดเดาถูกต้องกว่า 221 00:10:50,764 --> 00:10:53,266 แต่ยังทำให้เกิดความเข้าใจใหม่ ทางวิทยาศาสตร์ 222 00:10:53,276 --> 00:10:54,781 คือทางรังสีวิทยา มีการพบ 223 00:10:54,781 --> 00:10:57,876 ตัวบ่งชี้ทางการรักษาแบบใหม่ ที่คนเข้าใจได้ 224 00:10:57,876 --> 00:10:59,668 ส่วนทางพยาธิวิทยานี้ จริงๆแล้ว 225 00:10:59,668 --> 00:11:04,168 ระบบคอมพ์ได้ค้นพบว่า เซลล์รอบๆมะเร็ง 226 00:11:04,168 --> 00:11:07,508 สำคัญเท่าๆกับเซลล์มะเร็งเอง 227 00:11:07,508 --> 00:11:09,260 ในการวินิจฉัย นี้ตรงข้ามกับ 228 00:11:09,260 --> 00:11:14,621 สิ่งที่พยาธิแพทย์ ได้รับสอนมาหลายทศวรรษ 229 00:11:14,621 --> 00:11:17,913 ในทั้งสองกรณี ระบบพัฒนาขึ้นโดย 230 00:11:17,913 --> 00:11:21,534 ผู้เชี่ยวชาญทางแพทย์ร่วมกับ ผู้เชี่ยวชาญการเรียนรู้ของเครื่อง 231 00:11:21,534 --> 00:11:24,275 แต่เริ่มแต่ปีที่แล้ว เราได้ไปไกลกว่านั้น 232 00:11:24,275 --> 00:11:27,824 นี่เป็นตัวอย่าง ของการระบุพื้นที่ของมะเร็ง 233 00:11:27,824 --> 00:11:30,354 ในเนื้อเยื่อมนุษย์ จากกล้องจุลทรรศน์ 234 00:11:30,354 --> 00:11:34,967 ระบบที่แสดงอยู่นี้ ระบุพื้นที่ได้แม่นยำกว่า 235 00:11:34,967 --> 00:11:37,742 หรือเกือบจะเท่ากับพยาธิแพทย์ แต่ทั้งหมดนี้ 236 00:11:37,742 --> 00:11:41,134 สร้างด้วยการเรียนรู้ลึก โดยคนที่ไม่มีความเชี่ยวชาญ 237 00:11:41,134 --> 00:11:43,660 หรือพื้นเพทางการแพทย์เลย 238 00:11:44,730 --> 00:11:47,285 นี่ก็เหมือนกัน การแบ่งส่วนประสาท, ขณะนี้ 239 00:11:47,285 --> 00:11:50,953 เราแยกเซลล์ประสาทได้ แม่นยำเทียมเท่ามนุษย์ 240 00:11:50,953 --> 00:11:53,670 แต่ระบบนี้พัฒนาขึ้น ด้วยการเรียนรู้ลึก 241 00:11:53,670 --> 00:11:56,921 โดยคนที่ไม่มีพื้นฐานด้านการแพทย์ 242 00:11:56,921 --> 00:12:00,148 ดังนั้นผมเอง ผู้ไม่มีพื้นฐานด้านการแพทย์ 243 00:12:00,148 --> 00:12:03,875 ก็เหมือนมีคุณสมบัติพร้อม ที่จะเริ่มบริษัท 244 00:12:03,875 --> 00:12:06,021 ทางการแพทย์ใหม่ขึ้นมา ซึ่งผมก็ได้ทำแล้ว 245 00:12:06,021 --> 00:12:07,761 ผมรู้สึกหวาดหวั่นบ้างที่จะทำ 246 00:12:07,761 --> 00:12:10,650 แต่ตามทฤษฎีแล้ว ดูจะแนะว่า น่าจะเป็นไปได้ 247 00:12:10,650 --> 00:12:16,142 ที่จะทำการแพทย์ที่มีประโยชน์มาก โดยใช้แค่ เทคนิควิเคราะห์ข้อมูลนี้ 248 00:12:16,142 --> 00:12:18,622 และผมโชคดี ที่ได้การตอบรับที่ดีเยี่ยม 249 00:12:18,622 --> 00:12:20,978 จากทั้งสื่อและกลุ่มทางการแพทย์ 250 00:12:20,978 --> 00:12:23,322 ที่ให้การสนับสนุนมาอย่างมาก 251 00:12:23,322 --> 00:12:27,471 ทฤษฎีคือ เราสามารถเอาส่วนกลาง ของกระบวนการทางแพทย์ 252 00:12:27,471 --> 00:12:30,364 กลับมันเป็นวิเคราะห์ข้อมูล มากเท่าที่ทำได้ 253 00:12:30,364 --> 00:12:33,429 ทิ้งให้แพทย์ทำ ในสิ่งที่เขาทำได้ดีที่สุด 254 00:12:33,429 --> 00:12:35,031 ผมอยากจะยกตัวอย่างหนึ่ง ปัจจุบัน 255 00:12:35,031 --> 00:12:39,975 เราใช้เพียง 15 นาที เพื่อ สร้างการทดสอบวินิจฉัยโรคขึ้นมาใหม่ 256 00:12:39,975 --> 00:12:41,929 ผมจะแสดงให้ดูตามเวลาจริง แต่ผม 257 00:12:41,929 --> 00:12:45,416 บีบมันลงเหลือสามนาที โดยตัดบางชิ้นออกไป 258 00:12:45,416 --> 00:12:48,477 แทนที่จะแสดง การสร้างการทดสอบวินิจฉัยโรค 259 00:12:48,477 --> 00:12:51,846 ผมจะแสดง การทดสอบการวินิจฉัยภาพรถแทน 260 00:12:51,846 --> 00:12:54,068 เพราะว่า มันเป็นสิ่งที่เราทุกคนเข้าใจได้ 261 00:12:54,068 --> 00:12:57,269 ตรงนี้ เราจึงจะเริ่มด้วยภาพรถ 1.5 ล้านคัน 262 00:12:57,269 --> 00:13:00,475 และผมอยากจะสร้างอะไรบางอย่าง ที่จะแยกมันออก 263 00:13:00,475 --> 00:13:02,698 เป็นมุมมองของภาพที่ถ่าย ภาพพวกนี้ 264 00:13:02,698 --> 00:13:06,586 ไม่ได้มีป้ายบอกเลย ผมจึงต้องเริ่มจากไม่มีอะไร 265 00:13:06,586 --> 00:13:08,451 แต่ด้วยวิธีการคอมพ์การเรียนรู้ลึกของเรา 266 00:13:08,451 --> 00:13:12,158 มันจะระบุพื้นที่โครงสร้างในภาพได้อัตโนมัติ 267 00:13:12,158 --> 00:13:15,778 ส่วนดีคือ คนและคอมพ์ทำงานด้วยกันได้ 268 00:13:15,778 --> 00:13:17,956 มนุษย์ อย่างที่เห็นตรงนี้ จะบอกคอมพ์ถึง 269 00:13:17,956 --> 00:13:20,631 พื้นที่ที่น่าสนใจ ที่ต้องการให้คอมพ์ 270 00:13:20,631 --> 00:13:25,281 พยายามใช้ เพื่อจะได้ปรับปรุงวิธีการของมัน 271 00:13:25,281 --> 00:13:29,577 ระบบการเรียนรู้ลึกนี้ แท้จริงอยู่ในปริภูมิ 272 00:13:29,577 --> 00:13:33,009 16000 มิติ จึงเห็นคอมพ์หมุนไปตาม 273 00:13:33,009 --> 00:13:35,001 ปริภูมินั้น พยายามหาพื้นที่โครงสร้างใหม่ 274 00:13:35,001 --> 00:13:36,782 เมื่อมันทำได้สำเร็จตามนั้น แล้วคนที่ 275 00:13:36,782 --> 00:13:40,786 ขับมันอยู่ ก็จะชี้พื้นที่ที่น่าสนใจ 276 00:13:40,786 --> 00:13:43,208 ตรงนี้ คอมพ์พบพื้นที่ได้สำเร็จ 277 00:13:43,208 --> 00:13:45,770 ตัวอย่างเช่น มุมมองต่าง ๆ 278 00:13:45,770 --> 00:13:47,376 ดังนั้น ขณะที่เราผ่านกระบวนการนี้ 279 00:13:47,376 --> 00:13:49,716 เราก็ค่อยๆบอกคอมพ์เพิ่มขึ้นเรื่อยๆ 280 00:13:49,716 --> 00:13:52,144 เกี่ยวกับแบบโครงสร้าง ที่เราต้องการค้นหา 281 00:13:52,144 --> 00:13:53,916 คุณคงจินตนาการได้ เช่น การทดสอบวินิจฉัย 282 00:13:53,916 --> 00:13:57,266 ก็จะเป็นพยาธิแพทย์ ที่จะระบุบริเวณผิดปกติ 283 00:13:57,266 --> 00:14:02,292 หรือรังสีแพทย์ ชี้บอกตุ่มที่น่าจะเป็นปัญหา 284 00:14:02,292 --> 00:14:04,851 บางที ก็ยากเหมือนกันสำหรับวิธีทางคอมพ์นี้ 285 00:14:04,851 --> 00:14:06,815 ในกรณีนี้ มันคล้ายกับจะสับสน 286 00:14:06,815 --> 00:14:09,365 ด้านหน้าและด้านหลังของรถนั้น ปนเปกันไปหมด 287 00:14:09,365 --> 00:14:11,437 ตรงนี้ เราจึงต้องระวังมากขึ้นอีกหน่อย 288 00:14:11,437 --> 00:14:14,669 ใช้มือเลือก ส่วนใดเป็นหน้า ส่วนใดเป็นหลัง 289 00:14:14,669 --> 00:14:20,175 แล้วบอกคอมพ์นั้นว่า นี่เป็นแบบของกลุ่ม 290 00:14:20,175 --> 00:14:21,523 ที่เราสนใจอยู่ 291 00:14:21,523 --> 00:14:24,200 เราต้องทำอย่างนี้ไปเรื่อย ๆ แต่เราจะข้ามไป 292 00:14:24,200 --> 00:14:26,446 แล้วเราก็จะฝึกเครื่องเรียนรู้ 293 00:14:26,446 --> 00:14:28,420 อาศัยสิ่งของจำนวนมากมายเหล่านี้ 294 00:14:28,420 --> 00:14:30,445 เราหวังว่า มันดีขึ้นมากแล้ว คุณจะเห็นได้ 295 00:14:30,445 --> 00:14:33,518 ตอนนี้ มันได้เริ่มทำให้บางภาพค่อยๆหายไป 296 00:14:33,518 --> 00:14:38,226 มันรู้จำวิธีเข้าใจเรื่องนี้ด้วยตัวเองบ้างแล้ว 297 00:14:38,226 --> 00:14:41,128 แล้วเราจึงใช้ความรู้เรื่องภาพเหมือนนี้ 298 00:14:41,128 --> 00:14:43,222 และการใช้ภาพเหมือนนั้น ตอนนี้จะเห็นได้ 299 00:14:43,222 --> 00:14:47,241 ณ.จุดนี้คอมพ์ สามารถหารถส่วนหน้าทั้งหมด 300 00:14:47,241 --> 00:14:50,189 ดังนั้น ที่จุดนี้ คนจะบอกคอมพ์นั้นได้ว่า 301 00:14:50,189 --> 00:14:52,482 ตกลง ใช่แล้ว เธอทำงานเรื่องนี้ได้ดีแล้ว 302 00:14:53,652 --> 00:14:55,837 บางครั้ง แน่นอนครับ แม้กระทั่ง ที่จุดนี้ 303 00:14:55,837 --> 00:14:59,511 ก็ยังคงยาก ที่จะแยกออกมาเป็นกลุ่มๆ 304 00:14:59,511 --> 00:15:03,395 กรณีนี้ แม้หลังจากให้คอมพ์หมุนไปสักครู่ 305 00:15:03,399 --> 00:15:06,744 เราก็ยังคงพบว่า ด้านซ้ายและขวาของภาพ 306 00:15:06,744 --> 00:15:08,222 ก็ปนเปกันไปหมด 307 00:15:08,222 --> 00:15:10,362 ดังนั้นเราจึงให้คำแนะนำแก่คอมพ์อีก 308 00:15:10,362 --> 00:15:13,338 เราบอกว่า ใช่ พยายามหาการฉายภาพ ที่จะแยก 309 00:15:13,338 --> 00:15:15,945 ด้านซ้าย/ขวาออกจากกัน ให้มากเท่าที่จะทำได้ 310 00:15:15,945 --> 00:15:18,067 โดยใช้วิธีการเรียนรู้ลึกทางคอมพ์ 311 00:15:18,067 --> 00:15:21,009 เมื่อให้คำแนะนำนั้นแล้ว ก็ประสบความสำเร็จ 312 00:15:21,009 --> 00:15:23,891 มันก็หาวิธีคิด เกี่ยวกับวัตถุพวกนี้ได้ 313 00:15:23,891 --> 00:15:26,271 นั่นคือ วิธีแยกสิ่งเหล่านี้ 314 00:15:26,271 --> 00:15:28,709 คุณคงจะพอเข้าใจเรื่องนี้ 315 00:15:28,709 --> 00:15:36,906 เรื่องนี้ ไม่ใช่มนุษย์ถูกแทนที่ด้วยคอมพ์ 316 00:15:36,906 --> 00:15:39,546 แต่เป็นเรื่องที่ พวกเขาทำงานอยู่ด้วยกัน 317 00:15:39,546 --> 00:15:43,096 สิ่งที่เราทำจะใช้แทนสิ่งที่เคยใช้ทีมงาน 318 00:15:43,096 --> 00:15:45,098 ห้าหรือหกคน นานประมาณเจ็ดปี 319 00:15:45,098 --> 00:15:47,703 แล้วเอาสิ่งที่ทำได้ใน 15 นาที มาแทน 320 00:15:47,703 --> 00:15:50,208 โดยมีคนหนึ่งคน ปฏิบัติงานคนเดียว 321 00:15:50,208 --> 00:15:54,158 กระบวนการนี้ ใช้การวนซํ้าราว 4 - 5 ครั้ง 322 00:15:54,158 --> 00:15:56,017 คุณเห็นได้ว่า ตอนนี้เราได้ 62% ของภาพ 323 00:15:56,017 --> 00:15:58,976 1.5 ล้านภาพ แยกประเภทแล้วอย่างถูกต้อง 324 00:15:58,976 --> 00:16:01,448 ณ. จุดนี้ เราเริ่มจะคว้ามาได้อย่างรวดเร็ว 325 00:16:01,448 --> 00:16:02,745 ที่เป็นส่วนใหญ่ๆทั้งหมด 326 00:16:02,745 --> 00:16:05,664 ตรวจเช็คตลอด เพื่อให้แน่ใจว่าไม่มีอะไรผิด 327 00:16:05,664 --> 00:16:09,616 หากมี เราก็ให้คอมพ์รู้ข้อผิดพลาดเหล่านั้น 328 00:16:09,616 --> 00:16:12,661 การใช้กระบวนการนี้ ในแต่ละกลุ่มที่ต่างกัน 329 00:16:12,661 --> 00:16:15,148 ปัจจุบันนี้ เรามีอัตราความสำเร็จ ถึง 80% 330 00:16:15,148 --> 00:16:17,563 ในการแยกประเภทภาพ 1.5 ล้านภาพนั้น 331 00:16:17,563 --> 00:16:19,641 ณ. จุดนี้ เหลือแต่งานที่ต้องหา 332 00:16:19,641 --> 00:16:23,220 ภาพจำนวนเล็กน้อย ที่ถูกแบ่งประเภทผิด 333 00:16:23,220 --> 00:16:26,108 และต้องพยายามเข้าใจว่า เป็นเพราะเหตุใด 334 00:16:26,108 --> 00:16:27,851 และการใช้วิธีดังกล่าวนั้น 335 00:16:27,851 --> 00:16:31,972 เพียง 15 นาที เราก็ได้อัตราการแบ่งถึง 97% ถูกต้อง 336 00:16:31,972 --> 00:16:36,572 เทคนิคแบบนี้ จะช่วยแก้ไขปัญหาสำคัญ 337 00:16:36,578 --> 00:16:39,614 คือ การขาดผู้เชี่ยวชาญทางการแพทย์ในโลก 338 00:16:39,614 --> 00:16:43,103 การประชุมเศรษฐกิจโลก บอกว่า มีการขาดแพทย์ 339 00:16:43,103 --> 00:16:45,727 อยู่ระหว่าง 10 และ 20 เท่า ในโลกกำลังพัฒนา 340 00:16:45,727 --> 00:16:47,840 และจะใช้เวลาราว 300 ปี 341 00:16:47,840 --> 00:16:50,734 เพื่อฝึกคนให้ได้พอ ที่จะแก้ปัญหานั้น 342 00:16:50,734 --> 00:16:53,619 คิดดู ถ้าเราช่วยเพิ่มประสิทธิภาพพวกเขาได้ 343 00:16:53,619 --> 00:16:56,458 โดยใช้วิธีการเรียนรู้ลึกเหล่านี้ 344 00:16:56,458 --> 00:16:58,690 ผมจึงตื่นเต้นมาก เกี่ยวกับโอกาสเหล่านี้ 345 00:16:58,690 --> 00:17:01,279 แต่ผมก็ยังห่วงใยในปัญหาที่จะตามมาด้วย 346 00:17:01,279 --> 00:17:04,403 ปัญหาตรงนี้คือ ทุกบริเวณสีนํ้าเงินบนแผนที่ 347 00:17:04,403 --> 00:17:08,172 เป็นการจ้างงานแบบบริการถึง 80% 348 00:17:08,172 --> 00:17:09,959 แล้วยอาชีพบริการคืออะไร 349 00:17:09,959 --> 00:17:11,473 เหล่านี้คืองานบริการ เป็นสิ่งที่ 350 00:17:11,473 --> 00:17:15,627 ตรงเผงกับสิ่งที่คอมพ์เพิ่งจะเรียนรู้วิธีทำ 351 00:17:15,627 --> 00:17:19,431 ดังนั้น 80% ของการจ้างงานในโลกที่พัฒนาแล้ว 352 00:17:19,431 --> 00:17:21,963 จึงเป็นสิ่งที่คอมพ์ เพิ่งจะเรียนรู้วิธีทำ 353 00:17:21,963 --> 00:17:23,403 อะไรจะเกิดขึ้น 354 00:17:23,403 --> 00:17:25,986 ผลจะโอเค คือจะมีงานอื่น ๆ เกิดขึ้นมาแทน 355 00:17:25,986 --> 00:17:28,693 จะมีงานสำหรับนักวิทยาศาสตร์ข้อมูลเพิ่มขึ้น 356 00:17:28,693 --> 00:17:29,510 แต่...ก็ไม่เชิง 357 00:17:29,510 --> 00:17:32,628 พวกเขาไม่ต้องใช้เวลานานนัก ทำงานเหล่านี้ 358 00:17:32,628 --> 00:17:35,880 เช่น วิธีคอมพ์ 4 วิธีนี้ สร้างได้โดยคนๆเดียว 359 00:17:35,880 --> 00:17:38,318 แต่ถ้าคิดว่า ทั้งหมดก็เคยเกิดขึ้นมาก่อนนี่ 360 00:17:38,318 --> 00:17:42,126 เราได้เห็นผลจากอดีต เมื่อเกิดสิ่งใหม่ๆมา 361 00:17:42,126 --> 00:17:44,378 คือเกิดงานใหม่ๆ มาแทนงานเก่า 362 00:17:44,378 --> 00:17:46,494 แล้วงานใหม่ๆเหล่านี้ จะเป็นงานอะไร 363 00:17:46,494 --> 00:17:48,365 มันยากมากที่เราจะประมาณการณ์เรื่องนี้ได้ 364 00:17:48,365 --> 00:17:51,104 เพราะการทำงานของคน โตได้ในอัตราทีละน้อยนี้ 365 00:17:51,104 --> 00:17:53,666 แต่ปัจจุบันเรามีระบบ คือการเรียนรู้ลึก 366 00:17:53,666 --> 00:17:56,893 ซึ่งจริง ๆ สมรรถภาพโตได้อย่างมากและรวดเร็ว 367 00:17:56,893 --> 00:17:58,498 และตอนนี้เราอยู่ที่จุดนั้นแล้ว 368 00:17:58,498 --> 00:18:00,559 ดังนั้น ปัจจุบัน เราจึงเห็นสิ่งรอบๆตัวเรา 369 00:18:00,559 --> 00:18:03,235 และก็บอกว่า "คอมพ์ยังคงทึ่ม" ใช่มั๊ยครับ 370 00:18:03,235 --> 00:18:06,664 แต่ในเวลา 5 ปี คอมพ์จะออกนอกแผนภูมินี้ไป 371 00:18:06,664 --> 00:18:10,529 เราจึงจำเป็นต้องเริ่มคิดถึงสมรรถภาพ ของคอมพ์ เสียแต่เดี๋ยวนี้ 372 00:18:10,529 --> 00:18:12,579 เราได้เห็นมาก่อนครั้งหนึ่งแล้ว 373 00:18:12,579 --> 00:18:13,966 ในการปฏิวัติอุตสาหกรรม 374 00:18:13,966 --> 00:18:16,817 เห็นการเปลี่ยนไปขั้นหนึ่ง ในเรื่องสมรรถภาพ 375 00:18:17,667 --> 00:18:20,805 เครื่องยนต์ แต่ไม่นานก็รักษาระดับได้ 376 00:18:20,805 --> 00:18:22,507 ถึงมีการแตกแยกทางสังคม 377 00:18:22,507 --> 00:18:25,946 แต่เมื่อใช้เครื่องยนต์เพื่อสร้างพลังงาน 378 00:18:25,946 --> 00:18:28,300 ในทุกสถานการณ์ ความยุ่งยากก็สงบลง 379 00:18:28,300 --> 00:18:29,773 ส่วนการปฏิวัติเพราะการเรียนรู้ของเครื่อง 380 00:18:29,773 --> 00:18:32,682 จะต่างไปจาก การปฏิวัติอุตสาหกรรมอย่างมาก 381 00:18:32,682 --> 00:18:35,632 เพราะปฏิวัติการเรียนรู้ของเครื่อง จะไม่ 382 00:18:35,632 --> 00:18:38,614 ปักหลักกับที่ ยิ่งคอมพ์ทำงานชาญฉลาดขึ้น 383 00:18:38,614 --> 00:18:42,862 มันก็ยิ่งสร้างคอมพ์ที่สมรรภภาพฉลาดยิ่งขึ้น 384 00:18:42,862 --> 00:18:44,770 เรื่องนี้ จึงจะเป็นการเปลี่ยนแปลงชนิดที่ 385 00:18:44,770 --> 00:18:47,248 แท้จริงแล้ว โลกไม่เคยประสบมาก่อน ดังนั้น 386 00:18:47,248 --> 00:18:50,554 ความเข้าใจก่อนๆในเรื่องที่เป็นไปได้ จึงต่างไป 387 00:18:50,974 --> 00:18:52,754 เรื่องนี้กำลังส่งผลกระทบกับเราแล้ว 388 00:18:52,754 --> 00:18:56,384 25 ปีที่ผ่านมา ขณะที่ประสิทธิภาพการลงทุน ได้เพิ่มขึ้น 389 00:18:56,400 --> 00:19:00,588 ประสิทธิภาพทางแรงงานกลับราบเรียบ กระทั่งตํ่าลงเล็กน้อย 390 00:19:01,408 --> 00:19:04,149 ผมจึงอยากให้เรา มาเริ่มอภิปรายเรื่องนี้กัน 391 00:19:04,149 --> 00:19:07,176 ผมรู้ เมื่อผมบอกคนบ่อยๆ เรื่องสถานการณ์นี้ 392 00:19:07,176 --> 00:19:08,666 ผู้คนก็จะไม่ค่อยยอมรับฟัง 393 00:19:08,666 --> 00:19:10,339 จริงอยู่ คอมพ์คิดไม่เป็น 394 00:19:10,339 --> 00:19:13,367 คอมพ์ไม่แสดงอารมณ์ มันไม่เข้าใจกวีนิพนธ์ 395 00:19:13,367 --> 00:19:15,888 จริงๆแล้ว เราไม่เข้าใจว่า มันทำงานอย่างไร 396 00:19:15,888 --> 00:19:17,374 แล้วยังไงครับ? 397 00:19:17,374 --> 00:19:19,178 คอมพ์ปัจจุบันนี้ สามารถทำสิ่งที่ 398 00:19:19,178 --> 00:19:21,897 มีการจ้างมนุษย์ให้ใช้เวลาส่วนมากทำ 399 00:19:21,897 --> 00:19:23,628 ขณะนี้ จึงถึงเวลาแล้ว ที่จะเริ่มคิด 400 00:19:23,628 --> 00:19:28,015 วิธีที่เราจะปรับโครงสร้างสังคมและเศรษฐกิจ 401 00:19:28,015 --> 00:19:29,855 โดยคำนึงถึง ความเป็นจริงใหม่นี้ 402 00:19:29,855 --> 00:19:31,388 ขอบคุณครับ 403 00:19:31,388 --> 00:19:32,190 (เสียงปรบมือ)