WEBVTT 00:00:00.000 --> 00:00:02.000 เอเรส ลีเบอร์แมน เอเด็น: ทุกท่านคงคุ้นๆ 00:00:02.000 --> 00:00:05.000 กับคำกล่าวที่ว่ารูปภาพสื่อคำพูดนับพันใช่ไหมครับ 00:00:07.000 --> 00:00:09.000 แต่สำหรับพวกเราที่ฮาร์วาร์ด 00:00:09.000 --> 00:00:12.000 กลับสงสัยว่ามันเป็นอย่างนั้นจริงรึเปล่า 00:00:12.000 --> 00:00:14.000 (หัวเราะ) 00:00:14.000 --> 00:00:18.000 พวกเราเลยรวมทีมกลุ่มผู้เชี่ยวชาญ 00:00:18.000 --> 00:00:20.000 จากฮาร์วาร์ด เอ็มไอที 00:00:20.000 --> 00:00:23.000 พจนานุกรมอเมริกันเฮอริเทจ สารานุกรมบริตานิกา 00:00:23.000 --> 00:00:25.000 รวมไปถึงผู้สนับสนุนที่พวกเราภูมิใจ 00:00:25.000 --> 00:00:28.000 กูเกิล 00:00:28.000 --> 00:00:30.000 หลังจากที่ทีมเราพินิจพิเคราะห์ 00:00:30.000 --> 00:00:32.000 มาประมาณ 4 ปี 00:00:32.000 --> 00:00:37.000 ทุกท่านครับ พวกเราได้ข้อสรุปมาว่า 00:00:37.000 --> 00:00:40.000 รูปภาพหนึ่งๆ ไม่ได้สื่อคำพูดออกมาแค่หลักพันหรอกครับ 00:00:40.000 --> 00:00:42.000 เพราะพวกเราเจอบางรูป 00:00:42.000 --> 00:00:47.000 ที่สื่อคำพูดออกมาได้เป็น 5 แสนล้านคำเลยล่ะครับ NOTE Paragraph 00:00:47.000 --> 00:00:49.000 ฌ็อง แบพติสต์ มิเชล: เพื่อแสดงให้ทุกท่านเห็นถึงที่มาของข้อสรุปนี้ 00:00:49.000 --> 00:00:51.000 อีเรสกับผมเลยได้ลองหาวิธี 00:00:51.000 --> 00:00:53.000 ที่จะศึกษาภาพรวมของวัฒนธรรม 00:00:53.000 --> 00:00:56.000 และประวัติศาสตร์มนุษยชาติที่เปลี่ยนแปลงไปตามกาลเวลา 00:00:56.000 --> 00:00:58.000 มีหนังสือไม่น้อยที่เขียนเกี่ยวกับเรื่องนี้ 00:00:58.000 --> 00:01:00.000 พวกเราเลยเชื่อว่า วิธีที่ดีที่สุดที่จะศึกษาจากหนังสือเป็นล้านเหล่านี้ 00:01:00.000 --> 00:01:02.000 ก็คืออ่านมันทั้งหมด 00:01:02.000 --> 00:01:05.000 ซึ่งถ้าหากมีหน่วยวัดว่าเครื่องมือนี้เจ๋งแค่ไหน 00:01:05.000 --> 00:01:08.000 แน่นอนว่ามันคงจะต้องอยู่ในระดับที่เจ๋งมากแน่ๆ 00:01:08.000 --> 00:01:10.000 ปัญหาอยู่ที่มันมีแกน x ถ่วงอยู่ 00:01:10.000 --> 00:01:12.000 ซึ่งเป็นแกนที่วัดการนำไปใช้จริง 00:01:12.000 --> 00:01:14.000 จะเห็นได้ว่ามันอยู่ต่ำมากครับ NOTE Paragraph 00:01:14.000 --> 00:01:17.000 (ปรบมือ) NOTE Paragraph 00:01:17.000 --> 00:01:20.000 ผู้คนจึงมักจะใช้ตัวเลือกอื่น 00:01:20.000 --> 00:01:22.000 เช่น คัดเฉพาะข้อมูลบางแหล่งและอ่านมันอย่างระมัดระวัง 00:01:22.000 --> 00:01:24.000 เป็นวิธีที่อยู่ในระดับนำไปใช้ได้จริงที่สูงมาก แต่ยังไม่เจ๋งพอ 00:01:24.000 --> 00:01:27.000 สิ่งที่คุณต้องการจริงๆคือ 00:01:27.000 --> 00:01:30.000 ทางเลือกที่่เจ๋งและนำไปใช้ได้จริง 00:01:30.000 --> 00:01:33.000 ซึ่งบังเอิญมากที่บริษัทตรงฝั่งแม่น้ำที่ชื่อ "กูเกิล" 00:01:33.000 --> 00:01:35.000 ได้ริเริ่มโครงการทำหนังสือให้เป็นรูปแบบดิจิทัลเมื่อไม่กี่ปีมานี้ 00:01:35.000 --> 00:01:37.000 ถือเป็นการเปิดทางให้กับทางเลือกอย่างว่า 00:01:37.000 --> 00:01:39.000 พวกเขาทำหนังสือให้เป็นรูปแบบดิจิทัลหลายล้านเล่มแล้ว 00:01:39.000 --> 00:01:42.000 หมายความว่า เราสามารถใช้วิธีอย่างเดียวกับที่ใช้กับคอมพิวเตอร์ 00:01:42.000 --> 00:01:44.000 กดคลิ๊กที่ปลายนิ้วเพื่ออ่านหนังสือทั้งหมด 00:01:44.000 --> 00:01:47.000 วิธีนี้จัดว่านำใช้ได้จริงและเจ๋งมากๆด้วย NOTE Paragraph 00:01:48.000 --> 00:01:50.000 ELA: ทีนี้ขอผมเล่าหน่อยว่าหนังสือทั้งหลายมาจากไหน 00:01:50.000 --> 00:01:53.000 กาลครั้งหนึ่งก่อนที่พวกเราจะจำความได้ ก็มีคนเป็นนักเขียนไม่น้อยเลยทีเดียว 00:01:53.000 --> 00:01:56.000 พวกเขาใช้ความเพียรพยายามสูงมากกว่าจะเขียนหนังสือออกมาเป็นเล่มๆ 00:01:56.000 --> 00:01:58.000 ทีนี้พอวิทยาการการพิมพ์เริ่มก้าวหน้า 00:01:58.000 --> 00:02:00.000 ในไม่กี่ร้อยปีที่ผ่านมาก็ทำให้ขั้นตอนการทำหนังสือง่ายขึ้น 00:02:00.000 --> 00:02:03.000 แต่นั้นมาก็ทำให้นักเขียนจากทั่วสารทิศ 00:02:03.000 --> 00:02:05.000 สามารถเขียนหนังสือและตีพิมพ์ 00:02:05.000 --> 00:02:07.000 ในแต่ละสถานที่ทั่วทุกมุมโลกได้ 00:02:07.000 --> 00:02:09.000 จนถึงวันนี้ หากหนังสือพวกนั้นยังไม่หายไปจากประวัติศาสตร์ 00:02:09.000 --> 00:02:11.000 มันจะยังคงวางอยู่ในห้องสมุดแห่งใดแแห่งหนึ่ง 00:02:11.000 --> 00:02:14.000 ซึ่งกูเกิลได้ดำเนินการยืมหนังสือเหล่านั้นมาจากห้องสมุด 00:02:14.000 --> 00:02:16.000 เพื่อมาสแกนให้อยู่ในรูปแบบดิจิทัล 00:02:16.000 --> 00:02:18.000 ซึ่งจนถึงวันนี้เสร็จไปกว่า 15 ล้านเล่มแล้ว NOTE Paragraph 00:02:18.000 --> 00:02:21.000 โดยทีมงานได้จัดทำหนังสือให้อยู่ในรูปแบบที่ดีมาก 00:02:21.000 --> 00:02:23.000 ทำให้พวกเรามีข้อมูล รายละเอียดต่างๆ 00:02:23.000 --> 00:02:26.000 เช่น ข้อมูลจำพวกสถานที่หรือวันเวลาที่ตีพิมพ์ 00:02:26.000 --> 00:02:28.000 ข้อมูลผู้แต่ง 00:02:28.000 --> 00:02:31.000 จากนั้นก็ตรวจสอบมันอย่างละเอียด 00:02:31.000 --> 00:02:35.000 ทำให้มันสมบูรณ์ที่สุด 00:02:35.000 --> 00:02:37.000 และพวกเราก็ได้ผลงาน 00:02:37.000 --> 00:02:40.000 หนังสือห้าล้านกว่่าเล่ม 00:02:40.000 --> 00:02:43.000 หรือคำห้าแสนกว่าล้านคำ 00:02:43.000 --> 00:02:45.000 ตัวอักษรที่เรียงกันเหล่านี้ 00:02:45.000 --> 00:02:48.000 ยาวกว่าจีโนมของมนุษย์เราเป็นพันๆเท่า 00:02:48.000 --> 00:02:50.000 ตัวหนังสือเหล่านี้เมื่อเรียงกันแล้ว 00:02:50.000 --> 00:02:52.000 อาจยาวถึงระยะทางไปกลับจากโลกถึงดวงจันทร์ 00:02:52.000 --> 00:02:54.000 ประมาณ 10 รอบได้ 00:02:54.000 --> 00:02:58.000 นี่คือเสี้ยวหนึ่งของวัฒนธรรมมนุษย์เรา 00:02:58.000 --> 00:03:00.000 แน่นอนว่าขณะที่พวกเราเจอ 00:03:00.000 --> 00:03:03.000 สถานการณ์ที่ดูเกินจริงขนาดนี้ 00:03:03.000 --> 00:03:05.000 (หัวเราะ) 00:03:05.000 --> 00:03:08.000 เป็นสิ่งที่นักวิจัยที่มีความนับถือในตัวเอง 00:03:08.000 --> 00:03:11.000 เลือกที่จะทำ 00:03:11.000 --> 00:03:13.000 พวกเราเหมือนการ์ตูนล้อเลียน 00:03:13.000 --> 00:03:15.000 และพูดว่า "ถอยไป 00:03:15.000 --> 00:03:17.000 พวกเราจะใช้วิทยาศาสตร์มาพิสูจน์" NOTE Paragraph 00:03:17.000 --> 00:03:19.000 (หัวเราะ) NOTE Paragraph 00:03:19.000 --> 00:03:21.000 JM: ต่อมา พวกเราคิดกันว่า 00:03:21.000 --> 00:03:23.000 เอาล่ะ พวกเราแยกเรื่องข้อมูล 00:03:23.000 --> 00:03:25.000 ให้กับทีมทดลองทางวิทยาศาสตร์ดูแลไปก่อน 00:03:25.000 --> 00:03:27.000 และพวกเราก็วางแผนว่า ข้อมูลจำพวกไหนที่เราควรจะนำออกสู่สาธารณะ? 00:03:27.000 --> 00:03:29.000 แน่นอนว่า เราอยากจะทำให้ทุกๆคนเข้าถึง 00:03:29.000 --> 00:03:31.000 เนื้อหาในหนังสือทั้งหมด 00:03:31.000 --> 00:03:33.000 แต่กูเกิล โดยเฉพาะจอน ออร์วอนท์ 00:03:33.000 --> 00:03:35.000 ทำให้พวกเราเรียนรู้ว่า 00:03:35.000 --> 00:03:38.000 ในหนังสือห้าล้านเล่ม หมายถึง นักเขียนห้าล้านคน 00:03:38.000 --> 00:03:41.000 หรือก็คือโจทก์ที่สามารถฟ้องเราได้ห้าล้านคนเช่นกัน 00:03:41.000 --> 00:03:43.000 ดังนั้นถึงแม้ว่าสิ่งนี้จะเจ๋งมากถึงมากที่สุด 00:03:43.000 --> 00:03:46.000 แต่มันก็ไม่น่าใช้มากถึงมากที่สุดอยู่ดี 00:03:46.000 --> 00:03:48.000 (หัวเราะ) NOTE Paragraph 00:03:48.000 --> 00:03:50.000 ด้วยเหตุนี้ พวกเราเลยกลับมาคิดทบทวน 00:03:50.000 --> 00:03:53.000 แล้วริเริ่มโครงการที่เน้นเรื่องการใช้งาน แต่ลดความเจ๋งลงไปหน่อย 00:03:53.000 --> 00:03:55.000 พวกเราคิดว่า แทนที่จะปล่อยตัวหนังสือทั้งหมดออกไป 00:03:55.000 --> 00:03:57.000 ก็ปล่อยเฉพาะสถิติของเนื้อหาที่อยู่หนังสือเหล่านั้น 00:03:57.000 --> 00:03:59.000 ตัวอย่างเช่น "ความ สุข แวว วับ" 00:03:59.000 --> 00:04:01.000 4 คำนี้ พวกเราขอเรียกมันว่า "4 gram" นะครับ 00:04:01.000 --> 00:04:03.000 พวกเราสามารถบอกคุณได้ว่า คำ 4 gram นี้ปรากฏในหนังสือที่ตีพิมพ์ 00:04:03.000 --> 00:04:05.000 ระหว่างปี ค.ศ. 1801, 1802, 1802 จนถึงปีค.ศ 2008 00:04:05.000 --> 00:04:07.000 ทั้งหมดกี่ครั้ง 00:04:07.000 --> 00:04:09.000 พวกเราสามารถทำความเข้าใจคำๆนั้น 00:04:09.000 --> 00:04:11.000 จากความถี่ที่ถูกหยิบยกมาใช้ตั้งแต่อดีตจนถึงปัจจุบัน 00:04:11.000 --> 00:04:14.000 พวกเราทำแบบนี้กับคำและวลีทุกๆคำที่ปรากฏอยู่ในหนังสือ 00:04:14.000 --> 00:04:17.000 ซึ่งทำให้เราได้ตารางที่ยาวประมาณสองพันล้านบรรทัด 00:04:17.000 --> 00:04:19.000 สิ่งเหล่านี้แสดงถึงความเปลี่ยนแปลงทางวัฒนธรรมของมนุษย์ NOTE Paragraph 00:04:19.000 --> 00:04:21.000 ELA: สำหรับสองพันล้านบรรทัดเหล่านั้น 00:04:21.000 --> 00:04:23.000 เราขอเรียกมันว่าสองพันล้าน n-gram นะครับ 00:04:23.000 --> 00:04:25.000 มันบอกอะไรเราบ้าง? 00:04:25.000 --> 00:04:27.000 เอาล่ะ n-gram ของวลีหนึ่งๆสามารถวัดกระแสทางวัฒนธรรมได้ 00:04:27.000 --> 00:04:29.000 ขอผมลองยกตัวอย่างให้เห็นภาพนะครับ 00:04:29.000 --> 00:04:31.000 สมมติว่าผมกำลังประสบความสำเร็จ 00:04:31.000 --> 00:04:33.000 ในวันต่อมาผมอยากเล่าให้่คุณฟังว่าผมทำได้ดีแค่ไหน 00:04:33.000 --> 00:04:36.000 ผมจะต้องพูดว่า "Yesterday, I throve" 00:04:36.000 --> 00:04:39.000 หรือพูดว่า "Yesterday, I thrived" 00:04:39.000 --> 00:04:42.000 ทีนี้ผมควรจะใช้คำไหนดีล่ะ? 00:04:42.000 --> 00:04:44.000 จะรู้ได้อย่างไร? NOTE Paragraph 00:04:44.000 --> 00:04:46.000 ถ้าเป็นเมื่อหกเดือนที่แล้ว 00:04:46.000 --> 00:04:48.000 หากต้องการทราบข้อมูลเชิงลึกทางด้านนี้ 00:04:48.000 --> 00:04:50.000 คุณอาจจะต้องสอบถามผู้เชี่ยวชาญ 00:04:50.000 --> 00:04:52.000 ซึ่งก็คือ นักจิตวิทยาที่ทรงผมสวยงามท่านนี้นี่เอง 00:04:52.000 --> 00:04:54.000 คุณอาจถามว่า 00:04:54.000 --> 00:04:57.000 "คุณสตีฟครับ คุณเป็นผู้เชี่ยวชาญทางด้านกริยา 3 ช่อง 00:04:57.000 --> 00:04:59.000 บอกผมหน่อยว่าควรใช้คำไหน?" 00:04:59.000 --> 00:05:01.000 และเขาอาจจะบอกคุณว่า "อืม คนส่วนใหญ่ใช้ thrived" 00:05:01.000 --> 00:05:04.000 แต่บางคนก็ใช้ throve" 00:05:04.000 --> 00:05:06.000 และคุณก็อาจรู้อยู่แล้วว่า 00:05:06.000 --> 00:05:09.000 หากคุณย้อนกลับไปเมื่อ 200 ปีที่แล้ว 00:05:09.000 --> 00:05:12.000 และถามรัฐบุรุษอีกท่านที่ทรงผมสวยไม่แพ้กัน 00:05:12.000 --> 00:05:15.000 (หัวเราะ) 00:05:15.000 --> 00:05:17.000 "คุณทอมครับ ผมควรใช้คำไหนดี?" 00:05:17.000 --> 00:05:19.000 เขาอาจจะบอกว่า "อืม ในยุคที่ผมอยู่ ส่วนใหญ่ใช้ throve 00:05:19.000 --> 00:05:22.000 บางคนใช้ thrived" 00:05:22.000 --> 00:05:24.000 ทีนี้สิ่งที่ผมจะนำเสนอให้ทุกท่านเห็นก็คือข้อมูลดิบ 00:05:24.000 --> 00:05:28.000 กราฟสองเส้นที่เป็นสถิติจากตารางสองพันล้านบรรทัด 00:05:28.000 --> 00:05:30.000 สิ่งที่คุณเห็นก็คือความถี่ของการใช้คำว่า 00:05:30.000 --> 00:05:33.000 "thrived" และ "throve" ที่ผ่านมาปีต่อปี 00:05:34.000 --> 00:05:36.000 ซึ่งนี่เป็นเพียงสอง 00:05:36.000 --> 00:05:39.000 ในสองพันล้านบรรทัด 00:05:39.000 --> 00:05:41.000 หมายความว่าข้อมูลทั้งหมด 00:05:41.000 --> 00:05:44.000 ก็จะเจ๋งกว่าในสไลด์นี้อีกเป็นพันล้่านเท่า NOTE Paragraph 00:05:44.000 --> 00:05:46.000 (หัวเราะ) NOTE Paragraph 00:05:46.000 --> 00:05:50.000 (ปรบมือ) NOTE Paragraph 00:05:50.000 --> 00:05:52.000 JM: ตอนนี้ก็จะมีรูปภาพหลายรูปที่สื่อคำกว่าห้าแสนล้านคำ 00:05:52.000 --> 00:05:54.000 เช่น คำนี้ 00:05:54.000 --> 00:05:56.000 หากคุณพูดถึงไข้หวัดใหญ่ 00:05:56.000 --> 00:05:58.000 จากจุดสูงสุดในรูปนี้คุณจะสรุปได้ว่า 00:05:58.000 --> 00:06:01.000 การระบาดได้คร่าชีวิตผู้คนทั่วทุกมุมโลก NOTE Paragraph 00:06:01.000 --> 00:06:04.000 ELA: เผื่อคุณยังไม่เชื่อนะครับ 00:06:04.000 --> 00:06:06.000 ระดับน้ำทะเลกำลังสูงขึ้น 00:06:06.000 --> 00:06:09.000 เช่นเดียวกับก๊่าซคาร์บอนไดออกไซต์และอุณหภูมิของโลก NOTE Paragraph 00:06:09.000 --> 00:06:12.000 JM: คุณอาจอยากดู n-gram นี้ประกอบ 00:06:12.000 --> 00:06:15.000 เพื่อบอก "นิตเช่" ว่าพระเจ้ายังไม่ตาย 00:06:15.000 --> 00:06:18.000 ถึงแม้คุณจะคิดว่าเขาควรมีนักประชาสัมพันธ์ที่ดีกว่านี้ NOTE Paragraph 00:06:18.000 --> 00:06:20.000 (หัวเราะ) NOTE Paragraph 00:06:20.000 --> 00:06:23.000 ELA: ทุกท่านสามารถได้แนวคิดสรุปได้จากข้อมูลเหล่านี้ 00:06:23.000 --> 00:06:25.000 เช่น ขอผมเล่าประวัติศาสตร์ 00:06:25.000 --> 00:06:27.000 ของปี ค.ศ. 1950 ก่อน 00:06:27.000 --> 00:06:29.000 ปีนี้เป็นปีประวัติศาสตร์ที่คนพูดถึงมากที่สุด 00:06:29.000 --> 00:06:31.000 ทั้งที่ก่อนหน้านั้นไม่มีใครพูดถึงปี ค.ศ.1950 นี้เลย 00:06:31.000 --> 00:06:33.000 ตั้งแต่ปี 1700, 1800, 1900 00:06:33.000 --> 00:06:36.000 ไม่มีเลย 00:06:37.000 --> 00:06:39.000 ย้อนไปยังปี 1930-1940 00:06:39.000 --> 00:06:41.000 ก็ยังไม่เป็นที่กล่าวถึงเช่นกัน 00:06:41.000 --> 00:06:43.000 จนกระทั่งในช่วงกลางศตวรรษ 1940 00:06:43.000 --> 00:06:45.000 ทุกคนเริ่มเอ่ยถึงปีนี้ 00:06:45.000 --> 00:06:47.000 ผู้คนเริ่มตระหนักว่าปี 1950 กำลังจะมา 00:06:47.000 --> 00:06:49.000 และมันจะยิ่งใหญ่มาก 00:06:49.000 --> 00:06:52.000 (หัวเราะ) 00:06:52.000 --> 00:06:55.000 แต่ไม่มีอะไรทำให้ผู้คนสนใจปี 1950 00:06:55.000 --> 00:06:58.000 เหมือนปี 1950 00:06:58.000 --> 00:07:01.000 (หัวเราะ) 00:07:01.000 --> 00:07:03.000 ตั้งแต่นั้นมาผู้คนเริ่มหมกหมุ่น 00:07:03.000 --> 00:07:05.000 พวกเขาไม่หยุดเอ่ยถึง 00:07:05.000 --> 00:07:08.000 สิ่งที่เกิดขึ้นทั้งหมดในปี 1950 00:07:08.000 --> 00:07:11.000 แผนทั้งหมดที่พวกเขาจะทำในปี 1950 00:07:11.000 --> 00:07:16.000 ความฝันทั้งหมดที่พวกเขาอยากทำให้สำเร็จในปี 1950 00:07:16.000 --> 00:07:18.000 จริงๆแล้ว ปี 1950 น่าสนใจมาก 00:07:18.000 --> 00:07:20.000 หลังจากปีนั้น 00:07:20.000 --> 00:07:23.000 ผู้คนก็พูดถึงแต่สิ่งอัศจรรย์ที่เกิดขึ้น 00:07:23.000 --> 00:07:25.000 ในปี 51 52 53 00:07:25.000 --> 00:07:27.000 และสุดท้ายปี 1954 00:07:27.000 --> 00:07:29.000 อยู่ๆก็มีใครซักคนตื่นขึ้นมาและตระหนักว่า 00:07:29.000 --> 00:07:33.000 เหตุการณ์ 1950 ได้ผ่านพ้นไปแล้ว 00:07:33.000 --> 00:07:35.000 (หัวเราะ) 00:07:35.000 --> 00:07:37.000 และฟองสบู่่ก็แตก ณ ปีนั้นเอง NOTE Paragraph 00:07:37.000 --> 00:07:39.000 (หัวเราะ) NOTE Paragraph 00:07:39.000 --> 00:07:41.000 และเรื่องราวของปี 1950 00:07:41.000 --> 00:07:43.000 ก็เป็นเรื่องราวที่ได้รับการบันทึกเพิ่มเข้าไปทุกๆปี 00:07:43.000 --> 00:07:46.000 แม้จะมีหักมุมเล็กน้อย แต่ตารางก็ดูดีทีเดียว 00:07:46.000 --> 00:07:49.000 และเพราะพวกเรามีกราฟที่สวยแบบนี้ เราถึงสามารถคำนวนเรื่องราวได้ 00:07:49.000 --> 00:07:51.000 เราบอกได้ว่า "ฟองสบู่แตกเร็วแค่ไหน?" 00:07:51.000 --> 00:07:54.000 กลายเป็นว่าพวกเราสามารถวัดมันได้อย่างแม่นยำ 00:07:54.000 --> 00:07:57.000 แก้ปัญหาได้ตรงจุด สร้างกราฟขึ้นมา 00:07:57.000 --> 00:07:59.000 และผลลัพธ์ก็คือ 00:07:59.000 --> 00:08:02.000 พวกเราเรียนรู้ว่ายิ่งนานวันฟองสบู่ 00:08:02.000 --> 00:08:04.000 ก็ยิ่งแตกเร็วขึ้น 00:08:04.000 --> 00:08:09.000 พวกเราหยุดสนใจในประเด็นต่างๆเร็วกว่าเมื่อก่อน NOTE Paragraph 00:08:09.000 --> 00:08:11.000 JM: ต่อมา ผมขอแนะนำเรื่องการงานซักหน่อย 00:08:11.000 --> 00:08:13.000 สำหรับคนที่อยากมีชื่อเสียงนะครับ 00:08:13.000 --> 00:08:15.000 ผมได้แนวคิดนี้มาจากข้อมูลของนักการเมือง นักเขียน นักแสดงและอาชีพอื่นๆ 00:08:15.000 --> 00:08:17.000 ที่มีชื่อเสียงทั้ง 25 ท่านนี้นะครับ 00:08:17.000 --> 00:08:20.000 หากคุณอยากดังตอนอายุน้อย คุณควรจะเป็นนักแสดง 00:08:20.000 --> 00:08:22.000 เพราะความดังจะเพิ่มขึ้นช่วงปลายอายุ 20 00:08:22.000 --> 00:08:24.000 เพราะคุณยังหนุ่มยังสาวอยู่ 00:08:24.000 --> 00:08:26.000 หากคุณรออีกหน่อย คุณก็ยังเป็นนักเขียนได้ 00:08:26.000 --> 00:08:28.000 เพราะคุณสามารถไต่เต้าไปได้อีกเยอะ 00:08:28.000 --> 00:08:30.000 อย่างคุณ มาร์ค ทเวน ดังมากเลยครับ 00:08:30.000 --> 00:08:32.000 แต่่หากคุณอยากไต่เต้าไปถึงจุดสูงสุด 00:08:32.000 --> 00:08:34.000 คุณควรจะยืดเวลานานอีกซักช่วงหนึ่ง 00:08:34.000 --> 00:08:36.000 เพื่อก้าวไปเป็นนักการเมือง 00:08:36.000 --> 00:08:38.000 ฉะนั้น คุณก็จะมีชื่อเสียงมากในช่วงปลายอายุ 50 00:08:38.000 --> 00:08:40.000 และจะโด่งดังมากหลังจากนั้น 00:08:40.000 --> 00:08:43.000 เช่นเดียวกับนักวิทยาศาสตร์ที่มีแนวโน้มจะมีชื่อเสียงตอนอายุมากแล้ว 00:08:43.000 --> 00:08:45.000 ส่วนนักชีววิทยา นักฟิสิกส์ 00:08:45.000 --> 00:08:47.000 แนวโน้มที่จะโด่งดังเทียบเท่ากับนักแสดง 00:08:47.000 --> 00:08:50.000 หนึ่งในอาชีพที่ไม่ควรทำก็คือ นักคณิตศาสตร์ 00:08:50.000 --> 00:08:52.000 (หัวเราะ) 00:08:52.000 --> 00:08:54.000 คุณอาจจะมุ่งมั่น 00:08:54.000 --> 00:08:57.000 และคิดในใจว่า "ฉันจะทำให้ดีที่สุดตอนอายุ 20 ต้นๆ" 00:08:57.000 --> 00:08:59.000 แต่เชื่อเถอะ ไม่มีใครสนใจหรอก NOTE Paragraph 00:08:59.000 --> 00:09:02.000 (หัวเราะ) NOTE Paragraph 00:09:02.000 --> 00:09:04.000 ELA: ในข้อมูลของเรา 00:09:04.000 --> 00:09:06.000 ยังมี n-gram ที่น่าสนใจกว่านั้น 00:09:06.000 --> 00:09:08.000 เช่น กรณีของ มาร์ค ชาร์กาล 00:09:08.000 --> 00:09:10.000 นักศิลปะที่เกิดในปี 1887 00:09:10.000 --> 00:09:13.000 ดูเผินๆเขาก็เหมือนกับคนดังทั่วๆไป 00:09:13.000 --> 00:09:17.000 เขาโด่งดังขึ้นมาเรื่อยๆเลยครับ 00:09:17.000 --> 00:09:19.000 ยกเว้นในเยอรมัน 00:09:19.000 --> 00:09:21.000 หากคุณดูข้อมูลในเยอรมัน คุณจะสังเกตเห็นอะไรบางอย่าง 00:09:21.000 --> 00:09:23.000 บางอย่างที่คุณไม่เคยเห็น 00:09:23.000 --> 00:09:25.000 นั่นคือ เขาโด่งดัังมาก 00:09:25.000 --> 00:09:27.000 แล้วความโด่งดังก็ฮวบตกลงอย่างรวดเร็ว 00:09:27.000 --> 00:09:30.000 โดยจุดต่ำสุดอยู่ระหว่างปี 1933 ถึง 1945 00:09:30.000 --> 00:09:33.000 และหลังจากนั้นก็กลับขึ้นมาใหม่ 00:09:33.000 --> 00:09:35.000 และสิ่งที่พวกเราพบก็คือ 00:09:35.000 --> 00:09:38.000 จริงๆแล้ว มาร์ค ชาร์กาล เป็นนักศิลปะชาวยิว 00:09:38.000 --> 00:09:40.000 ในนาซีเยอรมัน NOTE Paragraph 00:09:40.000 --> 00:09:42.000 ความผิดปกติเหล่านี้ 00:09:42.000 --> 00:09:44.000 ค่อนข้างเห็นได้ชัด 00:09:44.000 --> 00:09:47.000 พวกเราไม่จำเป็นต้องรู้มาก่อนว่าใครถูกเซ็นเซอร์ 00:09:47.000 --> 00:09:49.000 เราสามารถสรุปได้จาก 00:09:49.000 --> 00:09:51.000 ความผิดปกติพื้นฐานเหล่านี้ 00:09:51.000 --> 00:09:53.000 ซึ่งก็เป็นวิธีที่ง่ายมาก 00:09:53.000 --> 00:09:55.000 เอาล่ะครับ ความคาดหวังที่เป็นเหตุเป็นผล 00:09:55.000 --> 00:09:57.000 ก็คือชื่อเสียงของใครบางคนในช่วงเวลาหนึ่งๆ 00:09:57.000 --> 00:09:59.000 ไม่ควรจะต่างจากช่วงก่อนหน้าหรือ 00:09:59.000 --> 00:10:01.000 หลังจากนั้นมาก 00:10:01.000 --> 00:10:03.000 และนั่นเป็นสิ่งที่พวกเราหวังไว้ 00:10:03.000 --> 00:10:06.000 และเราได้ลองเปรียบเทียบคนที่พวกเราเฝ้าสังเกตการณ์ 00:10:06.000 --> 00:10:08.000 ลองแยกแยะข้อมูลอย่างละเอียด 00:10:08.000 --> 00:10:10.000 เพื่อยกประเด็นที่เราเรียกว่า "ดัชนีความต่าง" 00:10:10.000 --> 00:10:13.000 เมื่อไหร่ที่ดัชนีตัวนั้นอยู่ต่ำมากๆ 00:10:13.000 --> 00:10:15.000 หมายความว่าคุณอาจถูกเซ็นเซอร์ไว้ 00:10:15.000 --> 00:10:18.000 และเมื่อไหร่ที่มันสูงเกิน หมายถึงคุณอาจได้รับการประชาสัมพันธ์ NOTE Paragraph 00:10:19.000 --> 00:10:21.000 JM: จนถึงขณะนี้เชื่อว่่าคุณอาจรู้แล้ว 00:10:21.000 --> 00:10:24.000 การกระจายอยู่ของดัชนีความต่างของประชากร 00:10:24.000 --> 00:10:26.000 ตัวอย่างเช่น ในนี้ 00:10:26.000 --> 00:10:28.000 ดัชนีนี้เป็นความต่างของผู้คน 5,000 คน 00:10:28.000 --> 00:10:30.000 ที่หยิบยกมาจากหนังสืออังกฤษที่ไม่ได้ถูกเซ็นเซอร์ใดๆ 00:10:30.000 --> 00:10:32.000 จะอยู่ในแบบที่เกาะกลุ่มเหนียวแน่นตรงกลาง 00:10:32.000 --> 00:10:34.000 สิ่งที่ึคุณคาดหวังไว้จะเป็นสิ่งที่คุณสังเกตการณ์ 00:10:34.000 --> 00:10:36.000 นี่เป็นการกระจายตัวในหนังสือเยอรมัน 00:10:36.000 --> 00:10:38.000 ต่างกันมาก มันโอนเอียงไปทางซ้าย 00:10:38.000 --> 00:10:41.000 ผู้คนเอ่ยถึงมันน้้อยกว่าที่เป็นอยู่ประมาณ 2 เท่า 00:10:41.000 --> 00:10:43.000 แต่ที่สำคัญกว่านั้นคือ การกระจายออกเป็นวงกว้าง 00:10:43.000 --> 00:10:46.000 มีผู้คนจำนวนไม่น้อยที่ประจำอยู่ฝั่งซ้ายมือ 00:10:46.000 --> 00:10:49.000 ถูกพูดถึงน้อยกว่าที่ควรจะเป็นกว่าสิบเท่า 00:10:49.000 --> 00:10:51.000 แต่ผู้คนทางฝั่งขวามือ 00:10:51.000 --> 00:10:53.000 มีแนวโน้มจะได้ประโยชน์จากการประชาสัมพันธ์ 00:10:53.000 --> 00:10:56.000 ภาพนี้เป็นรูปแบบเซ็นเซอร์มาตรฐานในสถิติเรา NOTE Paragraph 00:10:56.000 --> 00:10:58.000 ELA: ฉะนั้นวัฒนธรรมศาสตร์ 00:10:58.000 --> 00:11:00.000 ก็คือชื่อที่เราใช้เรียกวิธีนี้ 00:11:00.000 --> 00:11:02.000 คล้ายๆกับจีโนมศาสตร์ 00:11:02.000 --> 00:11:04.000 ต่างกันแค่จีโนมศาสตร์เป็นมุมมองของศาสตร์ชีววิทยา 00:11:04.000 --> 00:11:07.000 ในโลกที่เป็นผลจากพื้นฐานของจีโนมมนุษย์ 00:11:07.000 --> 00:11:09.000 วัฒนธรรมศาสตร์ก็คล้ายๆกัน 00:11:09.000 --> 00:11:12.000 มันเป็นโปรแกรมวิเคราะห์ชุดข้อมูลขนาดใหญ่ 00:11:12.000 --> 00:11:14.000 ที่ใช้ศึกษาวัฒนธรรมมนุษย์ 00:11:14.000 --> 00:11:16.000 แทนที่จะเป็นมุมมองทางฝั่งจีโนม 00:11:16.000 --> 00:11:19.000 แต่เป็นมุมมองจากข้อมูลบันทึกประวัติศาสตร์ดิจิทัล 00:11:19.000 --> 00:11:21.000 วัฒนธรรมศาสตร์ดีตรงที่ 00:11:21.000 --> 00:11:23.000 ทุกๆคนสามารถลงมือทำได้เอง 00:11:23.000 --> 00:11:25.000 ทำไมทุกคนถึงทำได้น่ะหรือ? 00:11:25.000 --> 00:11:27.000 ก็เพราะชายสามคนนี้ 00:11:27.000 --> 00:11:30.000 "จอน ออร์วอนท์" "แมต เกรย์" และ "วิลล์ บร๊อคแมน" จากกูเกิล 00:11:30.000 --> 00:11:32.000 ได้เล็งเห็นประโยชน์ของตัวช่วย Ngram Viewer 00:11:32.000 --> 00:11:34.000 และพวกเขาเห็นตรงกันว่า "มันสนุกสุดยอด 00:11:34.000 --> 00:11:37.000 พวกเราต้องทำให้ทุกคนได้ลองใช้บ้าง" 00:11:37.000 --> 00:11:39.000 จากนั้นมาสองอาทิตย์ ก่อนที่จะทำรายงานเสร็จ 00:11:39.000 --> 00:11:42.000 พวกเขาเขียนเว็ป Ngram Viewer ในแบบที่ใครก็เข้าใช้ได้ 00:11:42.000 --> 00:11:45.000 ฉะนั้นคุณสามารถพิมพ์คำหรือวลีใดๆก็ได้ที่คุณสนใจ 00:11:45.000 --> 00:11:47.000 และสำรวจ N-gram ของมันได้ทันที 00:11:47.000 --> 00:11:49.000 และสามารถเปิดตัวอย่างของหนังสือทั้งหลาย 00:11:49.000 --> 00:11:51.000 ที่มี n-gram ปรากฏอยู่ NOTE Paragraph 00:11:51.000 --> 00:11:53.000 JM: ฟังค์ชั่นนี้ถูกใช้เป็นล้านครั้งในวันเปิดตัว 00:11:53.000 --> 00:11:55.000 และตัวอย่างนี้ถือเป็นหนึ่งในจำนวนคำค้นที่ดีที่สุด 00:11:55.000 --> 00:11:58.000 ผู้คนอยากทำตัวเองให้ดีที่สุด เริ่มต้นจากสิ่งดีที่สุด 00:11:58.000 --> 00:12:01.000 แต่สำหรับศตวรรษที่ 18 กลับไม่มีใครสนใจคำๆนี้เท่าไหร่ 00:12:01.000 --> 00:12:04.000 พวกเขาไม่ได้อยาก "Best" ที่สุด พวกเขาอยาก "Beft" ที่สุด 00:12:04.000 --> 00:12:07.000 สิ่งที่เกิดขึ้นก็คือ แน่นอนว่ามันเป็นเพียงแค่ความผิดเล็กๆน้อยๆ 00:12:07.000 --> 00:12:09.000 ไม่ใช่ความอยากโดดเด่น 00:12:09.000 --> 00:12:12.000 เป็นแค่การเขียนตัว S อีกแบบที่คล้ายกับตัว F 00:12:12.000 --> 00:12:15.000 แต่สำหรับตอนนี้ กูเกิลยังไม่หยิบยกตัวนี้ขึ้นมาจริงจัง 00:12:15.000 --> 00:12:18.000 แต่พวกเราได้รายงานเรื่องนี้ในบทความที่พวกเราเขียนขึ้น 00:12:18.000 --> 00:12:20.000 เพื่อเตือนตัวเองเท่านั้น 00:12:20.000 --> 00:12:22.000 ถึงแม้ว่ามันจะสนุกมากก็ตาม 00:12:22.000 --> 00:12:24.000 แต่ตอนที่คุณแปลกราฟเหล่านี้ออกมา คุณต้องระวังให้มาก 00:12:24.000 --> 00:12:27.000 และใช้วิทยาศาสตร์เป็นพื้นฐาน NOTE Paragraph 00:12:27.000 --> 00:12:30.000 ELA: ผู้คนใช้สิ่งนี้เล่นสนุกในรูปแบบต่างๆ 00:12:30.000 --> 00:12:37.000 (หัวเราะ) 00:12:37.000 --> 00:12:39.000 จริงๆแล้วพวกเราแทบไม่ต้องพูดเลย 00:12:39.000 --> 00:12:42.000 แค่โชว์สไลด์เหล่านี้แล้วอยู่กันเงียบๆ 00:12:42.000 --> 00:12:45.000 คนๆนี้สนใจเรื่องประวัติศาสตร์ของความไม่พอใจ 00:12:45.000 --> 00:12:48.000 ความไม่พอใจมีหลากหลายประเภท 00:12:48.000 --> 00:12:51.000 หากคุณเดินสะดุด จะอุทานออกมาเป็น "อา" สระ "า" ตัวเดียว 00:12:51.000 --> 00:12:53.000 แต่ถ้าโลกกำลังจะถูกเอเลี่ยนโวกอนทำลาย 00:12:53.000 --> 00:12:55.000 เพื่อเว้นความห่างระหว่างดวงดาว 00:12:55.000 --> 00:12:57.000 คุณจะอุทานเป็น "อาาาาาาาา" สระ "า" 8 ตัว 00:12:57.000 --> 00:12:59.000 คนๆนี้ศึกษาเกี่ยวกับ "อา" ทั้งหลาย 00:12:59.000 --> 00:13:01.000 ตั้งแต่ "า" หนึ่งตัวจนถึงแปดตัว 00:13:01.000 --> 00:13:03.000 ได้ความว่า 00:13:03.000 --> 00:13:05.000 "อา" ที่ความถี่ที่น้อยกว่า 00:13:05.000 --> 00:13:08.000 จะเป็นเหตุการณ์ที่กดดันกว่า 00:13:08.000 --> 00:13:11.000 ยกเว้นในช่วงต้นศตวรรษ 1980 00:13:11.000 --> 00:13:13.000 พวกเราคิดว่าเรแกนจะต้องมีเอี่ยวกับข้อมูลนี้แน่ๆ NOTE Paragraph 00:13:13.000 --> 00:13:15.000 (หัวเราะ) NOTE Paragraph 00:13:15.000 --> 00:13:18.000 JM: มีการใช้ข้อมูลนี้ไม่น้อยทีเดียว 00:13:18.000 --> 00:13:21.000 สรุปแล้วตอนนี้ประวัติศาสตร์ได้บันทึกอยู่ในโลกดิจิทัลแล้ว 00:13:21.000 --> 00:13:23.000 กูเกิลได้เริ่มทำหนังสือเป็นดิจิทัลประมาณ 15 ล้านเล่ม 00:13:23.000 --> 00:13:25.000 ซึ่งเป็นเพียง 12 เปอร์เซนต์ของหนังสือทั้งหมดที่เคยตีพิมพ์ 00:13:25.000 --> 00:13:28.000 เป็นเพียงเสี้ยวหนึ่งของวัฒนธรรมมนุษย์เท่านั้น 00:13:28.000 --> 00:13:31.000 ในวัฒนธรรมเรายังมีอีกมากมายกว่านี้ ไหนจะมีหนังสือที่เขียนด้วยลายมืออีก ไหนจะหนังสือพิมพ์ 00:13:31.000 --> 00:13:33.000 หรือพวกที่ไม่ได้อยู่ในรูปแบบตัวหนังสือ เช่น ศิลปะและรูปภาพต่างๆ 00:13:33.000 --> 00:13:35.000 สิ่งเหล่านี้จะเกิดขึ้นบนคอมพิวเตอร์ของพวกเรา 00:13:35.000 --> 00:13:37.000 คอมพิวเตอร์จากทั่วทุกมุมโลก 00:13:37.000 --> 00:13:40.000 และเมื่อมันเกิดขึ้นแล้ว มันจะเปลี่ยนแปลงรูปแบบที่เราเคย 00:13:40.000 --> 00:13:42.000 ทำความเข้าใจวัฒนธรรมมนุษย์ในอดีต ปัจจุบัน และอนาคต NOTE Paragraph 00:13:42.000 --> 00:13:44.000 ขอบคุณมากครับ NOTE Paragraph 00:13:44.000 --> 00:13:47.000 (ปรบมือ)