WEBVTT 00:00:00.880 --> 00:00:04.893 เคยเป็นว่าถ้าอยากได้คอมพ์ มาทำอะไรที่ใหม่ๆ 00:00:04.893 --> 00:00:06.447 คุณก็ต้องโปรแกรมมัน 00:00:06.447 --> 00:00:09.858 ครับ การทำโปรแกรม สำหรับคนที่ยังไม่เคยทำเอง 00:00:09.858 --> 00:00:13.360 ก็ต้องวางแผนรายละเอียด อย่างเลือดตาแทบกระเด็น 00:00:13.360 --> 00:00:16.727 ในทุกขั้นตอน ที่คุณต้องการให้คอมพิวเตอร์ทำ 00:00:16.727 --> 00:00:19.089 เพื่อให้บรรลุเป้าหมายของคุณ 00:00:19.089 --> 00:00:22.585 ถ้าต้องการทำสิ่งที่คุณเองไม่รู้วิธีทำแล้ว 00:00:22.585 --> 00:00:24.648 ก็จะเป็นเรื่องท้าทายที่ยิ่งใหญ่ ที่ชายชื่อ NOTE Paragraph 00:00:24.648 --> 00:00:28.131 อาร์เธอร์ แซมวล ก็เผชิญมาแล้วในอดีต 00:00:28.131 --> 00:00:32.208 ปี 1956 เขาอยากจะให้คอมพิวเตอร์เครื่องนี้ 00:00:32.208 --> 00:00:34.548 เอาชนะเขาได้ ในเกมหมากฮอส 00:00:34.548 --> 00:00:36.588 จะเขียนโปรแกรมโดยวางรายละเอียด 00:00:36.588 --> 00:00:40.394 อย่างเลือดตาแทบกระเด็น ให้เหนือกว่าคุณในเกม ได้อย่างไร 00:00:40.394 --> 00:00:42.116 ดังนั้น เขาจึงเกิดความคิดใหม่ขึ้นมา 00:00:42.116 --> 00:00:45.840 เขาให้คอมพ์เล่นแข่งกับตัวเอง หลายพันครั้ง 00:00:45.840 --> 00:00:48.364 และให้มันเรียนรู้ ที่จะเล่นเกมหมากฮอส 00:00:48.364 --> 00:00:51.544 และมันก็ได้ผลจริง ๆ และตอนปี 1962 00:00:51.544 --> 00:00:55.561 คอมพ์เครื่องนี้ เล่นชนะแชมป์รัฐคอนเนตทิคัต NOTE Paragraph 00:00:55.561 --> 00:00:58.534 อาร์เธอร์ แซมวล ถือว่าเป็นบิดา ของการเรียนรู้ของเครื่อง 00:00:58.534 --> 00:01:00.251 ผมเป็นหนี้เขาอย่างใหญ่หลวง เพราะ 00:01:00.251 --> 00:01:03.014 ผมเป็นผู้ปฏิบัติงาน ด้านเครื่องเรียนรู้นี้ 00:01:03.014 --> 00:01:04.479 อดีตผมเป็นประธานกลุ่มแค็กเกิล 00:01:04.479 --> 00:01:07.867 เป็นกลุ่มคนกว่า 2 แสนคนที่ทำงานด้านนี้ 00:01:07.867 --> 00:01:09.925 แค็กเกิลจัดการแข่งขัน เพื่อพยายามให้ 00:01:09.925 --> 00:01:13.633 เครื่องเหล่านั้นแก้ปัญหาที่แก้ไม่ได้มาก่อน 00:01:13.633 --> 00:01:17.470 และก็ประสบผลสำเร็จมาแล้วหลายร้อยครั้ง 00:01:17.470 --> 00:01:19.940 ดังนั้น จากมุมมองที่กว้างขวางนี้ ผมจึงได้ค้นพบ 00:01:19.940 --> 00:01:23.890 เรื่องการเรียนรู้ของเครื่องอีกมากมาย ที่พวกมันทำได้ 00:01:23.890 --> 00:01:26.252 ในอดีต ปัจจุบัน และอนาคต ส่วนความสำเร็จเชิงพาณิชย์ 00:01:26.252 --> 00:01:30.675 ที่ยิ่งใหญ่ครั้งแรกของเรื่องนี้ อาจคือ 00:01:30.675 --> 00:01:33.784 กูเกิลที่ให้เห็นว่าเป็นไปได้ที่จะค้นข้อมูล 00:01:33.784 --> 00:01:35.536 โดยใช้วิธีการทางคอมพิวเตอร์ 00:01:35.536 --> 00:01:38.437 ซึ่งมีพื้นฐานมาจาก การเรียนรู้ของเครื่อง 00:01:38.437 --> 00:01:42.323 แต่นั้นมา มีความสำเร็จเชิงพาณิชย์อีกมาก 00:01:42.323 --> 00:01:44.160 บริษัท อย่างเช่น แอมะซอน และ เน็ตฟลิกส์ 00:01:44.160 --> 00:01:47.876 ใช้การเรียนรู้ของเครื่อง เพื่อแนะนำสินค้า 00:01:47.876 --> 00:01:49.896 ที่คุณอาจอยากซื้อ ภาพยนตร์ที่อาจอยากดู 00:01:49.896 --> 00:01:51.703 บางครั้ง ก็เกือบทำให้ขนลุก 00:01:51.703 --> 00:01:53.657 บริษัทอย่างเช่น ลิงด์อิน และเฟสบุก 00:01:53.657 --> 00:01:56.251 บางครั้งจะบอกว่า ใครอาจเป็นเพื่อนของคุณ 00:01:56.251 --> 00:01:58.228 และคุณก็คิดไม่ออกเลยว่า มันทำได้อย่างไร 00:01:58.228 --> 00:02:01.195 นี่ก็เพราะ มันใช้พลังการเรียนรู้ของเครื่อง 00:02:01.195 --> 00:02:04.152 เป็นวิธีการทางคอมพ์ ที่เรียนรู้วิธีทำได้ 00:02:04.152 --> 00:02:07.399 จากข้อมูล แทนโปรแกรม ที่ต้องใช้มือทำ NOTE Paragraph 00:02:07.399 --> 00:02:09.877 สิ่งนี่ยังทำให้ IBM สำเร็จในการทำให้ 00:02:09.877 --> 00:02:13.739 วัทสัน ชนะแชมป์โลกสองคนใน "เจเพอะดี" โชว์ 00:02:13.739 --> 00:02:16.964 โดยตอบคำถามที่ลึกลับซับซ้อนเหลือเชื่อ เช่น 00:02:16.964 --> 00:02:19.799 ["ของโบราณ 'สิงโตแห่งนิมรัต' หายไปจากพิพิธภัณฑ์ในปี 2003] 00:02:19.799 --> 00:02:23.034 ยังให้เราเห็นในขณะนี้ รถพวกแรกที่ขับได้เอง 00:02:23.034 --> 00:02:25.856 ถ้าคุณต้องการจะบอกความแตกต่างระหว่าง เช่น 00:02:25.856 --> 00:02:28.488 ต้นไม้กับคนเดินถนน ครับ นั่นมันสำคัญมาก 00:02:28.488 --> 00:02:31.075 เราไม่รู้วิธีเขียนโปรแกรมเหล่านั้น ด้วยมือ 00:02:31.075 --> 00:02:34.072 แต่จากการเรียนรู้ของเครื่อง มันเป็นไปได้ 00:02:34.072 --> 00:02:36.680 ความจริงแล้ว รถคันนี้ขับมาแล้วกว่าล้านไมล์ 00:02:36.680 --> 00:02:40.186 โดยไม่เกิดอุบัติเหตุ บนถนนปกติ NOTE Paragraph 00:02:40.196 --> 00:02:44.110 ขณะนี้เราจึงรู้ว่า เครื่องคอมพ์เรียนรู้ได้ 00:02:44.110 --> 00:02:46.010 คอมพิวเตอร์เรียนรู้ ที่จะทำสิ่งต่างๆที่ 00:02:46.010 --> 00:02:48.848 บางครั้งเราไม่รู้จริงๆ ว่าจะทำเองอย่างไร 00:02:48.848 --> 00:02:51.733 หรือบางทีมันอาจจะทำได้ ดีกว่าเราเสียอีก 00:02:51.733 --> 00:02:55.928 ตัวอย่างหนึ่งที่น่าทึ่งที่สุด ที่ผมเคยเห็น 00:02:55.928 --> 00:02:58.320 เกิดขึ้นในโครงการที่ผมทำ ที่แคกเกิล 00:02:58.320 --> 00:03:01.911 ในทีมงานที่นำโดยหนุ่มชื่อ เจฟฟรี ฮินตัน 00:03:01.911 --> 00:03:03.463 จากมหาวิทยาลัยโทรอนโต 00:03:03.463 --> 00:03:06.140 เขาชนะการแข่งขัน การค้นพบยาโดยอัตโนมัติ 00:03:06.140 --> 00:03:08.987 ความพิเศษคือ ไม่ใช่เพียงเอาชนะวิธีทั้งหมด 00:03:08.987 --> 00:03:13.000 ที่พัฒนาโดย เมอร์ค, กลุ่มวิชาการนาๆชาติ 00:03:13.000 --> 00:03:18.061 แต่ไม่มีใครในทีมมีพื้นทางเคมี หรือชีววิทยาศาสตร์ 00:03:18.061 --> 00:03:20.230 และพวกเขาทำให้ชนะได้ ในสองสัปดาห์ 00:03:20.230 --> 00:03:21.611 พวกเขาทำได้อย่างไรหรือ 00:03:22.421 --> 00:03:25.342 เขาใช้วิธีคอมพ์ที่เรียกว่า การเรียนรู้ลึก (deep learning) 00:03:25.342 --> 00:03:28.291 เรื่องนี้สำคัญมากจนกระทั่ง ความสำเร็จนี้ได้พิมพ์ในหน้าหนึ่ง 00:03:28.291 --> 00:03:31.412 ของนิวยอร์คไทม์ 2-3 อาทิตย์ต่อมา 00:03:31.412 --> 00:03:34.147 นี่คือ เจฟฟรี่ ฮินตัน ตรงนี้ด้านซ้ายมือ 00:03:34.147 --> 00:03:38.488 การเรียนรู้ลึก เป็นวิธีการทางคอมพ์ที่นำ 00:03:38.488 --> 00:03:40.300 วิธีทำงานของสมองคนมา ผลคือ เป็นวิธีที่ 00:03:40.300 --> 00:03:44.141 ไม่มีข้อจำกัดทางทฤษฎีว่า มันทำอะไรได้บ้าง 00:03:44.141 --> 00:03:46.964 ยิ่งให้ข้อมูลมัน ยิ่งให้เวลาคำนวณมากขึ้น 00:03:46.964 --> 00:03:48.276 มันก็จะทำงานได้ดียิ่งขึ้น NOTE Paragraph 00:03:48.276 --> 00:03:50.615 นิวยอร์คไทม์ ยังแสดงให้เห็นในบทความนี้ 00:03:50.615 --> 00:03:52.857 ถึงผลลัพท์พิเศษอีกอย่างของ การเรียนรู้ลึก 00:03:52.857 --> 00:03:55.569 ซึ่งผมจะแสดงให้คุณดู เดี๋ยวนี้ 00:03:55.569 --> 00:04:00.510 มันแสดงว่า คอมพ์ฟังรู้เรื่องและเข้าใจได้ NOTE Paragraph 00:04:00.510 --> 00:04:03.221 (วิดีโอ) ริชาร์ด ราชิด: ครับ ขั้นสุดท้าย 00:04:03.221 --> 00:04:06.246 ที่ผมอยากจะทำให้ได้ ในกระบวนการนี้ 00:04:06.246 --> 00:04:10.961 คือ พูดกับคุณจริงๆ เป็นภาษาจีน 00:04:10.961 --> 00:04:13.596 ครับ สิ่งสำคัญในเรื่องนี้ก็คือ เราสามารถ 00:04:13.596 --> 00:04:18.598 เอาข้อมูลจำนวนมากมาได้ จากคนพูดจีนหลายๆคน 00:04:18.598 --> 00:04:21.128 และทำ "ระบบเนื้อหา-คำพูด" ออกมา, ระบบนี้จะ 00:04:21.128 --> 00:04:25.801 เอาข้อความภาษาจีนมา เปลี่ยนให้เป็นภาษาจีน 00:04:25.801 --> 00:04:29.929 แล้วก็เอาเสียงของผมเอง ราวหนึ่ง ช.ม 00:04:29.929 --> 00:04:31.820 แล้วใช้เสียงมาปรับระบบเนื้อหา-คำพูด 00:04:31.820 --> 00:04:36.364 เพื่อที่จะให้มีเสียงเหมือนผม 00:04:36.364 --> 00:04:38.904 อีกนั่นแหละ ผลที่ได้ไม่ดีเลิศนัก 00:04:38.904 --> 00:04:41.552 จริงๆแล้ว มีข้อผิดพลาดหลายอย่าง 00:04:41.552 --> 00:04:44.036 (ภาษาจีน) 00:04:44.036 --> 00:04:47.403 (เสียงปรบมือ) 00:04:49.446 --> 00:04:53.022 ยังมีสิ่งที่ต้องทำอีกมาก ในเรื่องนี้ 00:04:53.022 --> 00:04:56.667 (ภาษาจีน) 00:04:56.667 --> 00:05:00.100 (เสียงปรบมือ) NOTE Paragraph 00:05:01.345 --> 00:05:04.744 เจเรมี่ เฮาวาร์ด: นั่นเป็นการประชุมที่จีน 00:05:04.744 --> 00:05:07.114 จริงๆ ไม่บ่อยนัก ในการประชุมทางวิชาการ 00:05:07.114 --> 00:05:09.011 ที่จะได้ยินคนปรบมือเอง พร้อมเพรียงกัน 00:05:09.011 --> 00:05:12.687 แต่แน่ว่า บางครั้งในการประชุม TEDx จงทำตามใจชอบ 00:05:12.687 --> 00:05:15.482 ทุกสิ่งที่เห็นที่นั่นเกิดจากการเรียนรู้ลึก 00:05:15.482 --> 00:05:17.007 (เสียงปรบมือและหัวเราะ) ขอบคุณครับ 00:05:17.007 --> 00:05:19.289 การถอดเป็นภาษาอังกฤษทำโดยการเรียนรู้ลึก 00:05:19.289 --> 00:05:22.701 ซึ่งแปลเป็นภาษาจีนและข้อความด้านบนขวา 00:05:22.701 --> 00:05:26.008 การสร้างเสียงก็เป็นการเรียนรู้ลีก เช่นกัน NOTE Paragraph 00:05:26.008 --> 00:05:29.242 การเรียนรู้ลึกจึงเป็นสิ่งพิเศษ 00:05:29.242 --> 00:05:32.341 เป็นวิธีเดียวทางคอมพ์ที่ทำได้เกือบทุกอย่าง 00:05:32.341 --> 00:05:35.452 ผมพบปีที่แล้วว่า มันเรียนที่จะเห็นได้ด้วย 00:05:35.452 --> 00:05:37.628 ในการแข่งขันที่ไม่ค่อยรู้จัก ในเยอรมนี ชื่อ 00:05:37.628 --> 00:05:40.225 เยอรมันแทร็ฟฟิกซายน์เรคอกนิชั่นเบนช์มาร์ก 00:05:40.225 --> 00:05:43.618 การเรียนรู้ลึก เรียนรู้จำสัญญาณจราจรนี้ 00:05:43.618 --> 00:05:45.712 ไม่เพียงแค่ รู้จำสัญญาณจราจรได้ดีกว่า 00:05:45.712 --> 00:05:47.470 วิธีการอื่นๆทางคอมพิวเตอร์ เท่านั้น 00:05:47.470 --> 00:05:50.189 ป้ายคะแนนนแสดงว่า จริง ๆ แล้ว 00:05:50.189 --> 00:05:52.041 มันดีกว่าคนประมาณสองเท่า 00:05:52.041 --> 00:05:54.037 ดังนั้น โดยปี 2011 เราจึงมีตัวอย่างแรก 00:05:54.037 --> 00:05:57.442 ของคอมพิวเตอร์ ที่สามารถมองเห็นได้ดีกว่าคน 00:05:57.442 --> 00:05:59.491 ตั้งแต่นั้นมา สิ่งต่างๆมากมายได้เกิดขึ้น 00:05:59.491 --> 00:06:03.005 ปี 2012 กูเกิลแจ้งว่า ได้ให้การเรียนรู้ลึก 00:06:03.005 --> 00:06:04.420 ดูยูทูบวิดีโอ ขบเคี้ยวข้อมูล 00:06:04.420 --> 00:06:07.857 จากคอมพิวเตอร์ 16,000 เครื่องอยู่ 1 เดือน 00:06:07.857 --> 00:06:12.218 และคอมพ์ก็เรียนรู้ได้เองถึงแนวความคิด 00:06:12.218 --> 00:06:14.027 เช่น คนกับแมว เพียงดูแค่วิดีโอเท่านั้น 00:06:14.027 --> 00:06:16.379 สิ่งนี้เหมือนวิธีที่มนุษย์เรียนรู้อย่างมาก 00:06:16.379 --> 00:06:19.119 มนุษย์ไม่ได้เรียนโดยให้คนอื่นบอกว่า เขาเห็นอะไร 00:06:19.119 --> 00:06:22.450 แต่โดยเรียนด้วยตนเองว่า ของเหล่านี้คืออะไร 00:06:22.450 --> 00:06:25.819 ปี 2012 เจฟฟรี่ ฮินตัน ที่เราเห็นตอนต้น 00:06:25.819 --> 00:06:28.677 ยังชนะการแข่ง อิมเมจเน็ด ที่มีชื่อมาก ซึ่ง 00:06:28.677 --> 00:06:32.818 พยายามหาวิธีคิด จากภาพล้านห้าแสนภาพ 00:06:32.818 --> 00:06:34.256 ว่า ภาพเหล่านี้เป็นภาพอะไร 00:06:34.256 --> 00:06:37.789 ถึงปี 2014 นี้ เราลดอัตราผิดจนเหลือ 6% 00:06:37.789 --> 00:06:39.242 ในการรู้จำภาพได้ 00:06:39.242 --> 00:06:41.268 นี่ก็ดีกว่าคนอีกเหมือนกัน NOTE Paragraph 00:06:41.268 --> 00:06:45.037 เครื่องจึงทำงานได้ดีพิเศษจริง ในเรื่องนี้ 00:06:45.037 --> 00:06:47.306 และขณะนี้ก็กำลังมีการนำไปใช้ ในอุตสาหกรรม 00:06:47.306 --> 00:06:50.348 เช่น กูเกิลประกาศเมื่อปีที่แล้ว ว่า 00:06:50.348 --> 00:06:54.933 ได้ทำแผนที่ทุกๆตำแหน่งในฝรั่งเศสใน 2 ช.ม 00:06:54.933 --> 00:06:58.380 และวิธีที่พวกเขาทำนั้น คือ ใส่ภาพถนนเข้าไป 00:06:58.380 --> 00:07:02.699 ในการเรียนรู้ลึก เพื่อให้รู้จำและอ่านเลขถนน 00:07:02.699 --> 00:07:04.919 ลองจินตนาการดู แต่ก่อนจะใช้เวลานานแค่ไหน 00:07:04.919 --> 00:07:08.274 ใช้คนมากมายหลายคน หลายปี 00:07:08.274 --> 00:07:10.185 เรื่องนี้ก็กำลังเกิดขึ้นในจีนด้วย 00:07:10.185 --> 00:07:14.221 ไบดู เป็นเหมือนกับกูเกลของจีน และ 00:07:14.221 --> 00:07:16.504 ที่คุณเห็น ตรงด้านบนซ้ายมือ คือ ตัวอย่าง 00:07:16.504 --> 00:07:20.478 รูปที่ผมใส่เข้าไป ในระบบเรียนรู้ลึกของไบดู 00:07:20.478 --> 00:07:24.247 ตรงข้างล่าง คุณจะเห็นได้ว่า ระบบเข้าใจได้ 00:07:24.247 --> 00:07:26.483 ว่าเป็นภาพอะไร และค้นพบภาพที่เหมือนกัน 00:07:26.483 --> 00:07:29.219 ซึ่งจริงๆแล้ว คือมีแบ็กกราวเหมือนกัน 00:07:29.219 --> 00:07:30.877 หันหน้าไปทิศทางเดียวกัน 00:07:30.877 --> 00:07:32.665 แม้กระทั่ง บางรูปที่แลบลิ้นออกมา 00:07:32.665 --> 00:07:35.695 นี่ไม่ใช่มองที่ เนื้อหาเว็บเพจอย่างแน่นอน 00:07:35.695 --> 00:07:37.107 ผมส่งเพียงแต่รูป ๆ เดียวเท่านั้น 00:07:37.107 --> 00:07:41.128 ขณะนี้มีคอมพ์ ที่เข้าใจสิ่งที่มันเห็นจริงๆ 00:07:41.128 --> 00:07:42.752 จึงสามารถค้นหาฐานข้อมูลได้ 00:07:42.752 --> 00:07:46.306 เป็นหลายร้อยล้านภาพ ในเวลาสั้นๆ NOTE Paragraph 00:07:46.306 --> 00:07:49.536 อะไรจะเกิดขึ้น เมื่อมีคอมพ์ที่มองเห็นได้ 00:07:49.536 --> 00:07:51.553 แต่ไม่ใช่แค่มองเห็นได้เท่านั้น 00:07:51.553 --> 00:07:53.622 จริงๆแล้ว การเรียนรู้ลึก ทำได้มากกว่านั้น 00:07:53.622 --> 00:07:56.570 ประโยคที่ต่างกันน้อยมาก ซับซ้อน อย่างนี้ 00:07:56.570 --> 00:07:59.394 ขณะนี้เข้าใจได้แล้ว ด้วยวิธีการเรียนรู้ลึก 00:07:59.394 --> 00:08:00.697 อย่างที่คุณเห็นตรงนี้ 00:08:00.697 --> 00:08:03.465 ระบบฐานสแตนฟอร์ดนี้ แสดงจุดสีแดงด้านบนสุด 00:08:03.465 --> 00:08:07.384 คิดออกว่า ประโยคนี้แสดงอารมณ์เชิงลบ 00:08:07.384 --> 00:08:10.790 จริงๆการเรียนรู้ลึก ใกล้สมรรถภาพมนุษย์แล้ว 00:08:10.802 --> 00:08:15.923 เข้าใจได้ว่า ประโยคบอกเรื่องอะไร และมีความหมายอะไร 00:08:15.923 --> 00:08:18.651 การเรียนรู้ลึก ยังนำไปใช้เพื่ออ่านภาษาจีน 00:08:18.651 --> 00:08:21.807 อีกนั่นแหละ ประมาณระดับคนจีนพื้นเมือง 00:08:21.807 --> 00:08:23.975 วิธีการทางคอมพ์นี้ ได้พัฒนาออกมาจากสวิสฯ 00:08:23.975 --> 00:08:27.331 โดยคนที่ไม่มีใครพูดหรือเข้าใจภาษาจีนเลย 00:08:27.331 --> 00:08:29.382 อย่างที่ผมบอก การใช้การเรียนรู้ลึก 00:08:29.382 --> 00:08:31.601 เกือบเป็นระบบที่ดีที่สุดในโลก สำหรับงานนี้ 00:08:31.601 --> 00:08:36.718 แม้เมื่อเปรียบกับความเข้าใจของคนพื้นบ้าน NOTE Paragraph 00:08:36.718 --> 00:08:39.682 นี่เป็นระบบที่เราประกอบขึ้นมา ที่บริษัทของผม 00:08:39.682 --> 00:08:41.728 ซึ่งให้เห็นการเอาสิ่งทั้งหลายเข้ามารวมกัน 00:08:41.728 --> 00:08:44.189 พวกนี้ให้เห็นภาพ ที่ไม่มีข้อความกำกับ 00:08:44.189 --> 00:08:46.541 และขณะที่ผมพิมพ์ประโยคอยู่ตรงนี้ 00:08:46.541 --> 00:08:49.510 ในเวลาสั้นๆ มันก็เข้าใจรูปเหล่านี้ 00:08:49.510 --> 00:08:51.189 และคิดออกได้ว่า มันเป็นเรื่องอะไร 00:08:51.189 --> 00:08:54.352 และไปหาภาพ ที่เหมือนกับข้อความที่ผมเขียน 00:08:54.352 --> 00:08:57.108 จึงเห็นได้ เป็นความเข้าใจประโยคของผมจริงๆ 00:08:57.108 --> 00:08:59.332 เป็นความเข้าใจภาพเหล่านี้จริง 00:08:59.332 --> 00:09:01.891 ผมรู้ว่า คุณเคยเห็นแบบนี้ในกูเกิลแล้ว 00:09:01.891 --> 00:09:04.666 ที่คุณพิมพ์ข้อความ แล้วมันจะแสดงภาพออกมา 00:09:04.666 --> 00:09:08.090 แต่จริงๆสิ่งที่มันทำคือ หาข้อความในเว็บเพจ 00:09:08.090 --> 00:09:11.091 เรื่องนี้ต่างกันมาก กับการเข้าใจภาพพวกนั้น 00:09:11.091 --> 00:09:13.843 นี่เป็นสิ่งที่คอมพ์สามารถทำได้ 00:09:13.843 --> 00:09:17.091 เป็นครั้งแรก ในไม่กี่เดือนที่ผ่านมานี้ NOTE Paragraph 00:09:17.091 --> 00:09:21.182 ขณะนี้จึงเห็นได้ว่า คอมพ์ไม่ได้แค่เห็น แต่ 00:09:21.182 --> 00:09:24.947 อ่านได้ด้วย และเราก็ให้เห็นว่า มันก็เข้าใจสิ่งที่มันได้ยิน 00:09:24.947 --> 00:09:28.389 อาจไม่น่าแปลกใจ ถ้าจะบอกว่า มันก็เขียนได้ 00:09:28.389 --> 00:09:33.172 ประโยคนี้ผมสร้างเมื่อวาน ใช้การเรียนรู้ลึก 00:09:33.172 --> 00:09:37.096 ข้อความนี้ สร้างโดยวิธีคอมพ์ของสแตนฟอร์ด 00:09:37.096 --> 00:09:38.860 แต่ละประโยคสร้างขึ้น 00:09:38.860 --> 00:09:43.109 โดยวิธีการเรียนรู้ลึก เพื่ออธิบายภาพนั้นๆ 00:09:43.109 --> 00:09:47.581 แต่ก่อนวิธีการคอมพ์ ไม่เคยเห็นชายเสื้อดำ กำลังเล่นกีต้าร์ 00:09:47.581 --> 00:09:49.801 แต่มันเคยเห็นผู้ชาย เคยเห็นสีดำ 00:09:49.801 --> 00:09:51.400 เคยเห็นกีต้าร์ แต่ด้วยตัวมันเอง 00:09:51.400 --> 00:09:55.694 ได้สร้างการอธิบายภาพนี้ในแนวใหม่ 00:09:55.694 --> 00:09:59.196 ยังคงไม่เหมือนมนุษย์ทีเดียว แต่ก็ใกล้แล้ว 00:09:59.196 --> 00:10:03.264 ในการทดสอบ มนุษย์ชอบคำบรรยายสร้างโดยคอมพ์ 00:10:03.264 --> 00:10:04.791 หนึ่งในสี่ครั้ง 00:10:04.791 --> 00:10:06.855 ปัจจุบัน ระบบนี้มีอายุแค่ 2 สัปดาห์ 00:10:06.855 --> 00:10:08.701 ดังนั้น บางที ภายในปีหน้า 00:10:08.701 --> 00:10:11.502 วิธีทางคอมพ์ อาจไปไกลเกินหน้าการปฏิบัติงาน 00:10:11.502 --> 00:10:13.364 ของมนุษย์ ที่อัตราที่กำลังเป็นอยู่นี้ 00:10:13.364 --> 00:10:16.413 คอมพิวเตอร์ จึงสามารถเขียนได้ด้วย NOTE Paragraph 00:10:16.413 --> 00:10:19.888 รวมๆแล้ว ก็จะเห็นโอกาสทีน่าตื่นเต้นมาก 00:10:19.888 --> 00:10:21.380 ตัวอย่างเช่น ในทางการแพทย์ 00:10:21.380 --> 00:10:23.905 ทีมงานในบอสตัน ประกาศว่าพวกเขาได้ค้นพบ 00:10:23.905 --> 00:10:26.854 ลักษณะต่าง ๆ มากมาย ที่เกี่ยวข้องกับการรักษา 00:10:26.854 --> 00:10:31.120 เนื้องอก ที่ช่วยแพทย์ทายอาการมะเร็ง 00:10:32.220 --> 00:10:34.516 และที่เหมือนกันอย่างมาก ที่สแตนฟอร์ด 00:10:34.516 --> 00:10:38.179 กลุ่มที่นั่นประกาศว่า โดยดูเนื้อเยื่อขยายแล้ว 00:10:38.179 --> 00:10:40.560 ได้พัฒนาระบบจากการเรียนรู้ของเครื่องขึ้นมา 00:10:40.560 --> 00:10:43.142 ซึ่งจริงๆ ดีกว่าแพทย์พยาธิวิทยา ในการทำนาย 00:10:43.142 --> 00:10:47.519 อัตราการรอดชีวิต ของคนไข้โรคมะเร็ง 00:10:47.519 --> 00:10:50.764 ทั้งสองกรณี ไม่เพียงการคาดเดาถูกต้องกว่า 00:10:50.764 --> 00:10:53.266 แต่ยังทำให้เกิดความเข้าใจใหม่ ทางวิทยาศาสตร์ 00:10:53.276 --> 00:10:54.781 คือทางรังสีวิทยา มีการพบ 00:10:54.781 --> 00:10:57.876 ตัวบ่งชี้ทางการรักษาแบบใหม่ ที่คนเข้าใจได้ 00:10:57.876 --> 00:10:59.668 ส่วนทางพยาธิวิทยานี้ จริงๆแล้ว 00:10:59.668 --> 00:11:04.168 ระบบคอมพ์ได้ค้นพบว่า เซลล์รอบๆมะเร็ง 00:11:04.168 --> 00:11:07.508 สำคัญเท่าๆกับเซลล์มะเร็งเอง 00:11:07.508 --> 00:11:09.260 ในการวินิจฉัย นี้ตรงข้ามกับ 00:11:09.260 --> 00:11:14.621 สิ่งที่พยาธิแพทย์ ได้รับสอนมาหลายทศวรรษ 00:11:14.621 --> 00:11:17.913 ในทั้งสองกรณี ระบบพัฒนาขึ้นโดย 00:11:17.913 --> 00:11:21.534 ผู้เชี่ยวชาญทางแพทย์ร่วมกับ ผู้เชี่ยวชาญการเรียนรู้ของเครื่อง 00:11:21.534 --> 00:11:24.275 แต่เริ่มแต่ปีที่แล้ว เราได้ไปไกลกว่านั้น 00:11:24.275 --> 00:11:27.824 นี่เป็นตัวอย่าง ของการระบุพื้นที่ของมะเร็ง 00:11:27.824 --> 00:11:30.354 ในเนื้อเยื่อมนุษย์ จากกล้องจุลทรรศน์ 00:11:30.354 --> 00:11:34.967 ระบบที่แสดงอยู่นี้ ระบุพื้นที่ได้แม่นยำกว่า 00:11:34.967 --> 00:11:37.742 หรือเกือบจะเท่ากับพยาธิแพทย์ แต่ทั้งหมดนี้ 00:11:37.742 --> 00:11:41.134 สร้างด้วยการเรียนรู้ลึก โดยคนที่ไม่มีความเชี่ยวชาญ 00:11:41.134 --> 00:11:43.660 หรือพื้นเพทางการแพทย์เลย 00:11:44.730 --> 00:11:47.285 นี่ก็เหมือนกัน การแบ่งส่วนประสาท, ขณะนี้ 00:11:47.285 --> 00:11:50.953 เราแยกเซลล์ประสาทได้ แม่นยำเทียมเท่ามนุษย์ 00:11:50.953 --> 00:11:53.670 แต่ระบบนี้พัฒนาขึ้น ด้วยการเรียนรู้ลึก 00:11:53.670 --> 00:11:56.921 โดยคนที่ไม่มีพื้นฐานด้านการแพทย์ NOTE Paragraph 00:11:56.921 --> 00:12:00.148 ดังนั้นผมเอง ผู้ไม่มีพื้นฐานด้านการแพทย์ 00:12:00.148 --> 00:12:03.875 ก็เหมือนมีคุณสมบัติพร้อม ที่จะเริ่มบริษัท 00:12:03.875 --> 00:12:06.021 ทางการแพทย์ใหม่ขึ้นมา ซึ่งผมก็ได้ทำแล้ว 00:12:06.021 --> 00:12:07.761 ผมรู้สึกหวาดหวั่นบ้างที่จะทำ 00:12:07.761 --> 00:12:10.650 แต่ตามทฤษฎีแล้ว ดูจะแนะว่า น่าจะเป็นไปได้ 00:12:10.650 --> 00:12:16.142 ที่จะทำการแพทย์ที่มีประโยชน์มาก โดยใช้แค่ เทคนิควิเคราะห์ข้อมูลนี้ 00:12:16.142 --> 00:12:18.622 และผมโชคดี ที่ได้การตอบรับที่ดีเยี่ยม 00:12:18.622 --> 00:12:20.978 จากทั้งสื่อและกลุ่มทางการแพทย์ 00:12:20.978 --> 00:12:23.322 ที่ให้การสนับสนุนมาอย่างมาก 00:12:23.322 --> 00:12:27.471 ทฤษฎีคือ เราสามารถเอาส่วนกลาง ของกระบวนการทางแพทย์ 00:12:27.471 --> 00:12:30.364 กลับมันเป็นวิเคราะห์ข้อมูล มากเท่าที่ทำได้ 00:12:30.364 --> 00:12:33.429 ทิ้งให้แพทย์ทำ ในสิ่งที่เขาทำได้ดีที่สุด 00:12:33.429 --> 00:12:35.031 ผมอยากจะยกตัวอย่างหนึ่ง ปัจจุบัน 00:12:35.031 --> 00:12:39.975 เราใช้เพียง 15 นาที เพื่อ สร้างการทดสอบวินิจฉัยโรคขึ้นมาใหม่ 00:12:39.975 --> 00:12:41.929 ผมจะแสดงให้ดูตามเวลาจริง แต่ผม 00:12:41.929 --> 00:12:45.416 บีบมันลงเหลือสามนาที โดยตัดบางชิ้นออกไป 00:12:45.416 --> 00:12:48.477 แทนที่จะแสดง การสร้างการทดสอบวินิจฉัยโรค 00:12:48.477 --> 00:12:51.846 ผมจะแสดง การทดสอบการวินิจฉัยภาพรถแทน 00:12:51.846 --> 00:12:54.068 เพราะว่า มันเป็นสิ่งที่เราทุกคนเข้าใจได้ NOTE Paragraph 00:12:54.068 --> 00:12:57.269 ตรงนี้ เราจึงจะเริ่มด้วยภาพรถ 1.5 ล้านคัน 00:12:57.269 --> 00:13:00.475 และผมอยากจะสร้างอะไรบางอย่าง ที่จะแยกมันออก 00:13:00.475 --> 00:13:02.698 เป็นมุมมองของภาพที่ถ่าย ภาพพวกนี้ 00:13:02.698 --> 00:13:06.586 ไม่ได้มีป้ายบอกเลย ผมจึงต้องเริ่มจากไม่มีอะไร 00:13:06.586 --> 00:13:08.451 แต่ด้วยวิธีการคอมพ์การเรียนรู้ลึกของเรา 00:13:08.451 --> 00:13:12.158 มันจะระบุพื้นที่โครงสร้างในภาพได้อัตโนมัติ 00:13:12.158 --> 00:13:15.778 ส่วนดีคือ คนและคอมพ์ทำงานด้วยกันได้ 00:13:15.778 --> 00:13:17.956 มนุษย์ อย่างที่เห็นตรงนี้ จะบอกคอมพ์ถึง 00:13:17.956 --> 00:13:20.631 พื้นที่ที่น่าสนใจ ที่ต้องการให้คอมพ์ 00:13:20.631 --> 00:13:25.281 พยายามใช้ เพื่อจะได้ปรับปรุงวิธีการของมัน 00:13:25.281 --> 00:13:29.577 ระบบการเรียนรู้ลึกนี้ แท้จริงอยู่ในปริภูมิ 00:13:29.577 --> 00:13:33.009 16000 มิติ จึงเห็นคอมพ์หมุนไปตาม 00:13:33.009 --> 00:13:35.001 ปริภูมินั้น พยายามหาพื้นที่โครงสร้างใหม่ 00:13:35.001 --> 00:13:36.782 เมื่อมันทำได้สำเร็จตามนั้น แล้วคนที่ 00:13:36.782 --> 00:13:40.786 ขับมันอยู่ ก็จะชี้พื้นที่ที่น่าสนใจ 00:13:40.786 --> 00:13:43.208 ตรงนี้ คอมพ์พบพื้นที่ได้สำเร็จ 00:13:43.208 --> 00:13:45.770 ตัวอย่างเช่น มุมมองต่าง ๆ 00:13:45.770 --> 00:13:47.376 ดังนั้น ขณะที่เราผ่านกระบวนการนี้ 00:13:47.376 --> 00:13:49.716 เราก็ค่อยๆบอกคอมพ์เพิ่มขึ้นเรื่อยๆ 00:13:49.716 --> 00:13:52.144 เกี่ยวกับแบบโครงสร้าง ที่เราต้องการค้นหา 00:13:52.144 --> 00:13:53.916 คุณคงจินตนาการได้ เช่น การทดสอบวินิจฉัย 00:13:53.916 --> 00:13:57.266 ก็จะเป็นพยาธิแพทย์ ที่จะระบุบริเวณผิดปกติ 00:13:57.266 --> 00:14:02.292 หรือรังสีแพทย์ ชี้บอกตุ่มที่น่าจะเป็นปัญหา 00:14:02.292 --> 00:14:04.851 บางที ก็ยากเหมือนกันสำหรับวิธีทางคอมพ์นี้ 00:14:04.851 --> 00:14:06.815 ในกรณีนี้ มันคล้ายกับจะสับสน 00:14:06.815 --> 00:14:09.365 ด้านหน้าและด้านหลังของรถนั้น ปนเปกันไปหมด 00:14:09.365 --> 00:14:11.437 ตรงนี้ เราจึงต้องระวังมากขึ้นอีกหน่อย 00:14:11.437 --> 00:14:14.669 ใช้มือเลือก ส่วนใดเป็นหน้า ส่วนใดเป็นหลัง 00:14:14.669 --> 00:14:20.175 แล้วบอกคอมพ์นั้นว่า นี่เป็นแบบของกลุ่ม 00:14:20.175 --> 00:14:21.523 ที่เราสนใจอยู่ NOTE Paragraph 00:14:21.523 --> 00:14:24.200 เราต้องทำอย่างนี้ไปเรื่อย ๆ แต่เราจะข้ามไป 00:14:24.200 --> 00:14:26.446 แล้วเราก็จะฝึกเครื่องเรียนรู้ 00:14:26.446 --> 00:14:28.420 อาศัยสิ่งของจำนวนมากมายเหล่านี้ 00:14:28.420 --> 00:14:30.445 เราหวังว่า มันดีขึ้นมากแล้ว คุณจะเห็นได้ 00:14:30.445 --> 00:14:33.518 ตอนนี้ มันได้เริ่มทำให้บางภาพค่อยๆหายไป 00:14:33.518 --> 00:14:38.226 มันรู้จำวิธีเข้าใจเรื่องนี้ด้วยตัวเองบ้างแล้ว 00:14:38.226 --> 00:14:41.128 แล้วเราจึงใช้ความรู้เรื่องภาพเหมือนนี้ 00:14:41.128 --> 00:14:43.222 และการใช้ภาพเหมือนนั้น ตอนนี้จะเห็นได้ 00:14:43.222 --> 00:14:47.241 ณ.จุดนี้คอมพ์ สามารถหารถส่วนหน้าทั้งหมด 00:14:47.241 --> 00:14:50.189 ดังนั้น ที่จุดนี้ คนจะบอกคอมพ์นั้นได้ว่า 00:14:50.189 --> 00:14:52.482 ตกลง ใช่แล้ว เธอทำงานเรื่องนี้ได้ดีแล้ว NOTE Paragraph 00:14:53.652 --> 00:14:55.837 บางครั้ง แน่นอนครับ แม้กระทั่ง ที่จุดนี้ 00:14:55.837 --> 00:14:59.511 ก็ยังคงยาก ที่จะแยกออกมาเป็นกลุ่มๆ 00:14:59.511 --> 00:15:03.395 กรณีนี้ แม้หลังจากให้คอมพ์หมุนไปสักครู่ 00:15:03.399 --> 00:15:06.744 เราก็ยังคงพบว่า ด้านซ้ายและขวาของภาพ 00:15:06.744 --> 00:15:08.222 ก็ปนเปกันไปหมด 00:15:08.222 --> 00:15:10.362 ดังนั้นเราจึงให้คำแนะนำแก่คอมพ์อีก 00:15:10.362 --> 00:15:13.338 เราบอกว่า ใช่ พยายามหาการฉายภาพ ที่จะแยก 00:15:13.338 --> 00:15:15.945 ด้านซ้าย/ขวาออกจากกัน ให้มากเท่าที่จะทำได้ 00:15:15.945 --> 00:15:18.067 โดยใช้วิธีการเรียนรู้ลึกทางคอมพ์ 00:15:18.067 --> 00:15:21.009 เมื่อให้คำแนะนำนั้นแล้ว ก็ประสบความสำเร็จ 00:15:21.009 --> 00:15:23.891 มันก็หาวิธีคิด เกี่ยวกับวัตถุพวกนี้ได้ 00:15:23.891 --> 00:15:26.271 นั่นคือ วิธีแยกสิ่งเหล่านี้ NOTE Paragraph 00:15:26.271 --> 00:15:28.709 คุณคงจะพอเข้าใจเรื่องนี้ 00:15:28.709 --> 00:15:36.906 เรื่องนี้ ไม่ใช่มนุษย์ถูกแทนที่ด้วยคอมพ์ 00:15:36.906 --> 00:15:39.546 แต่เป็นเรื่องที่ พวกเขาทำงานอยู่ด้วยกัน 00:15:39.546 --> 00:15:43.096 สิ่งที่เราทำจะใช้แทนสิ่งที่เคยใช้ทีมงาน 00:15:43.096 --> 00:15:45.098 ห้าหรือหกคน นานประมาณเจ็ดปี 00:15:45.098 --> 00:15:47.703 แล้วเอาสิ่งที่ทำได้ใน 15 นาที มาแทน 00:15:47.703 --> 00:15:50.208 โดยมีคนหนึ่งคน ปฏิบัติงานคนเดียว NOTE Paragraph 00:15:50.208 --> 00:15:54.158 กระบวนการนี้ ใช้การวนซํ้าราว 4 - 5 ครั้ง 00:15:54.158 --> 00:15:56.017 คุณเห็นได้ว่า ตอนนี้เราได้ 62% ของภาพ 00:15:56.017 --> 00:15:58.976 1.5 ล้านภาพ แยกประเภทแล้วอย่างถูกต้อง 00:15:58.976 --> 00:16:01.448 ณ. จุดนี้ เราเริ่มจะคว้ามาได้อย่างรวดเร็ว 00:16:01.448 --> 00:16:02.745 ที่เป็นส่วนใหญ่ๆทั้งหมด 00:16:02.745 --> 00:16:05.664 ตรวจเช็คตลอด เพื่อให้แน่ใจว่าไม่มีอะไรผิด 00:16:05.664 --> 00:16:09.616 หากมี เราก็ให้คอมพ์รู้ข้อผิดพลาดเหล่านั้น 00:16:09.616 --> 00:16:12.661 การใช้กระบวนการนี้ ในแต่ละกลุ่มที่ต่างกัน 00:16:12.661 --> 00:16:15.148 ปัจจุบันนี้ เรามีอัตราความสำเร็จ ถึง 80% 00:16:15.148 --> 00:16:17.563 ในการแยกประเภทภาพ 1.5 ล้านภาพนั้น 00:16:17.563 --> 00:16:19.641 ณ. จุดนี้ เหลือแต่งานที่ต้องหา 00:16:19.641 --> 00:16:23.220 ภาพจำนวนเล็กน้อย ที่ถูกแบ่งประเภทผิด 00:16:23.220 --> 00:16:26.108 และต้องพยายามเข้าใจว่า เป็นเพราะเหตุใด 00:16:26.108 --> 00:16:27.851 และการใช้วิธีดังกล่าวนั้น 00:16:27.851 --> 00:16:31.972 เพียง 15 นาที เราก็ได้อัตราการแบ่งถึง 97% ถูกต้อง NOTE Paragraph 00:16:31.972 --> 00:16:36.572 เทคนิคแบบนี้ จะช่วยแก้ไขปัญหาสำคัญ 00:16:36.578 --> 00:16:39.614 คือ การขาดผู้เชี่ยวชาญทางการแพทย์ในโลก 00:16:39.614 --> 00:16:43.103 การประชุมเศรษฐกิจโลก บอกว่า มีการขาดแพทย์ 00:16:43.103 --> 00:16:45.727 อยู่ระหว่าง 10 และ 20 เท่า ในโลกกำลังพัฒนา 00:16:45.727 --> 00:16:47.840 และจะใช้เวลาราว 300 ปี 00:16:47.840 --> 00:16:50.734 เพื่อฝึกคนให้ได้พอ ที่จะแก้ปัญหานั้น 00:16:50.734 --> 00:16:53.619 คิดดู ถ้าเราช่วยเพิ่มประสิทธิภาพพวกเขาได้ 00:16:53.619 --> 00:16:56.458 โดยใช้วิธีการเรียนรู้ลึกเหล่านี้ NOTE Paragraph 00:16:56.458 --> 00:16:58.690 ผมจึงตื่นเต้นมาก เกี่ยวกับโอกาสเหล่านี้ 00:16:58.690 --> 00:17:01.279 แต่ผมก็ยังห่วงใยในปัญหาที่จะตามมาด้วย 00:17:01.279 --> 00:17:04.403 ปัญหาตรงนี้คือ ทุกบริเวณสีนํ้าเงินบนแผนที่ 00:17:04.403 --> 00:17:08.172 เป็นการจ้างงานแบบบริการถึง 80% 00:17:08.172 --> 00:17:09.959 แล้วยอาชีพบริการคืออะไร 00:17:09.959 --> 00:17:11.473 เหล่านี้คืองานบริการ เป็นสิ่งที่ 00:17:11.473 --> 00:17:15.627 ตรงเผงกับสิ่งที่คอมพ์เพิ่งจะเรียนรู้วิธีทำ 00:17:15.627 --> 00:17:19.431 ดังนั้น 80% ของการจ้างงานในโลกที่พัฒนาแล้ว 00:17:19.431 --> 00:17:21.963 จึงเป็นสิ่งที่คอมพ์ เพิ่งจะเรียนรู้วิธีทำ 00:17:21.963 --> 00:17:23.403 อะไรจะเกิดขึ้น 00:17:23.403 --> 00:17:25.986 ผลจะโอเค คือจะมีงานอื่น ๆ เกิดขึ้นมาแทน 00:17:25.986 --> 00:17:28.693 จะมีงานสำหรับนักวิทยาศาสตร์ข้อมูลเพิ่มขึ้น 00:17:28.693 --> 00:17:29.510 แต่...ก็ไม่เชิง 00:17:29.510 --> 00:17:32.628 พวกเขาไม่ต้องใช้เวลานานนัก ทำงานเหล่านี้ 00:17:32.628 --> 00:17:35.880 เช่น วิธีคอมพ์ 4 วิธีนี้ สร้างได้โดยคนๆเดียว 00:17:35.880 --> 00:17:38.318 แต่ถ้าคิดว่า ทั้งหมดก็เคยเกิดขึ้นมาก่อนนี่ 00:17:38.318 --> 00:17:42.126 เราได้เห็นผลจากอดีต เมื่อเกิดสิ่งใหม่ๆมา 00:17:42.126 --> 00:17:44.378 คือเกิดงานใหม่ๆ มาแทนงานเก่า 00:17:44.378 --> 00:17:46.494 แล้วงานใหม่ๆเหล่านี้ จะเป็นงานอะไร 00:17:46.494 --> 00:17:48.365 มันยากมากที่เราจะประมาณการณ์เรื่องนี้ได้ 00:17:48.365 --> 00:17:51.104 เพราะการทำงานของคน โตได้ในอัตราทีละน้อยนี้ 00:17:51.104 --> 00:17:53.666 แต่ปัจจุบันเรามีระบบ คือการเรียนรู้ลึก 00:17:53.666 --> 00:17:56.893 ซึ่งจริง ๆ สมรรถภาพโตได้อย่างมากและรวดเร็ว 00:17:56.893 --> 00:17:58.498 และตอนนี้เราอยู่ที่จุดนั้นแล้ว 00:17:58.498 --> 00:18:00.559 ดังนั้น ปัจจุบัน เราจึงเห็นสิ่งรอบๆตัวเรา 00:18:00.559 --> 00:18:03.235 และก็บอกว่า "คอมพ์ยังคงทึ่ม" ใช่มั๊ยครับ 00:18:03.235 --> 00:18:06.664 แต่ในเวลา 5 ปี คอมพ์จะออกนอกแผนภูมินี้ไป 00:18:06.664 --> 00:18:10.529 เราจึงจำเป็นต้องเริ่มคิดถึงสมรรถภาพ ของคอมพ์ เสียแต่เดี๋ยวนี้ NOTE Paragraph 00:18:10.529 --> 00:18:12.579 เราได้เห็นมาก่อนครั้งหนึ่งแล้ว 00:18:12.579 --> 00:18:13.966 ในการปฏิวัติอุตสาหกรรม 00:18:13.966 --> 00:18:16.817 เห็นการเปลี่ยนไปขั้นหนึ่ง ในเรื่องสมรรถภาพ 00:18:17.667 --> 00:18:20.805 เครื่องยนต์ แต่ไม่นานก็รักษาระดับได้ 00:18:20.805 --> 00:18:22.507 ถึงมีการแตกแยกทางสังคม 00:18:22.507 --> 00:18:25.946 แต่เมื่อใช้เครื่องยนต์เพื่อสร้างพลังงาน 00:18:25.946 --> 00:18:28.300 ในทุกสถานการณ์ ความยุ่งยากก็สงบลง 00:18:28.300 --> 00:18:29.773 ส่วนการปฏิวัติเพราะการเรียนรู้ของเครื่อง 00:18:29.773 --> 00:18:32.682 จะต่างไปจาก การปฏิวัติอุตสาหกรรมอย่างมาก 00:18:32.682 --> 00:18:35.632 เพราะปฏิวัติการเรียนรู้ของเครื่อง จะไม่ 00:18:35.632 --> 00:18:38.614 ปักหลักกับที่ ยิ่งคอมพ์ทำงานชาญฉลาดขึ้น 00:18:38.614 --> 00:18:42.862 มันก็ยิ่งสร้างคอมพ์ที่สมรรภภาพฉลาดยิ่งขึ้น 00:18:42.862 --> 00:18:44.770 เรื่องนี้ จึงจะเป็นการเปลี่ยนแปลงชนิดที่ 00:18:44.770 --> 00:18:47.248 แท้จริงแล้ว โลกไม่เคยประสบมาก่อน ดังนั้น 00:18:47.248 --> 00:18:50.554 ความเข้าใจก่อนๆในเรื่องที่เป็นไปได้ จึงต่างไป NOTE Paragraph 00:18:50.974 --> 00:18:52.754 เรื่องนี้กำลังส่งผลกระทบกับเราแล้ว 00:18:52.754 --> 00:18:56.384 25 ปีที่ผ่านมา ขณะที่ประสิทธิภาพการลงทุน ได้เพิ่มขึ้น 00:18:56.400 --> 00:19:00.588 ประสิทธิภาพทางแรงงานกลับราบเรียบ กระทั่งตํ่าลงเล็กน้อย NOTE Paragraph 00:19:01.408 --> 00:19:04.149 ผมจึงอยากให้เรา มาเริ่มอภิปรายเรื่องนี้กัน 00:19:04.149 --> 00:19:07.176 ผมรู้ เมื่อผมบอกคนบ่อยๆ เรื่องสถานการณ์นี้ 00:19:07.176 --> 00:19:08.666 ผู้คนก็จะไม่ค่อยยอมรับฟัง 00:19:08.666 --> 00:19:10.339 จริงอยู่ คอมพ์คิดไม่เป็น 00:19:10.339 --> 00:19:13.367 คอมพ์ไม่แสดงอารมณ์ มันไม่เข้าใจกวีนิพนธ์ 00:19:13.367 --> 00:19:15.888 จริงๆแล้ว เราไม่เข้าใจว่า มันทำงานอย่างไร 00:19:15.888 --> 00:19:17.374 แล้วยังไงครับ? 00:19:17.374 --> 00:19:19.178 คอมพ์ปัจจุบันนี้ สามารถทำสิ่งที่ 00:19:19.178 --> 00:19:21.897 มีการจ้างมนุษย์ให้ใช้เวลาส่วนมากทำ 00:19:21.897 --> 00:19:23.628 ขณะนี้ จึงถึงเวลาแล้ว ที่จะเริ่มคิด 00:19:23.628 --> 00:19:28.015 วิธีที่เราจะปรับโครงสร้างสังคมและเศรษฐกิจ 00:19:28.015 --> 00:19:29.855 โดยคำนึงถึง ความเป็นจริงใหม่นี้ 00:19:29.855 --> 00:19:31.388 ขอบคุณครับ 00:19:31.388 --> 00:19:32.190 (เสียงปรบมือ)