1 00:00:06,070 --> 00:00:07,120 สวัสดี ผมชื่อ จอห์น 2 00:00:07,510 --> 00:00:10,140 ผมเป็นหัวหน้าทีมค้นคว้าและวิจัย เครื่องจักรที่กูเกิล 3 00:00:12,130 --> 00:00:14,230 ผมคิดว่ามันเป็นแรงบันดาลใจอย่างน่าอัศจรรย์ 4 00:00:14,230 --> 00:00:16,214 ให้ผู้คนทั่วโลก 5 00:00:16,215 --> 00:00:19,160 หันมาใช้เครื่องมือค้นหาเพื่อ ถามคำถามที่เล็กน้อย 6 00:00:19,160 --> 00:00:20,930 และถามคำถามที่สำคัญอย่างเหลือเชื่อ 7 00:00:20,930 --> 00:00:23,450 ดังนั้นมันจึงเป็นความรับผิดชอบที่ยิ่งใหญ่ ที่จะให้ 8 00:00:23,450 --> 00:00:24,864 คำตอบที่ดีที่สุดกับพวกเขา 9 00:00:26,710 --> 00:00:30,610 สวัสดี ฉันชื่อ อัคชาญา ฉันทำงานอยู่ในเครื่องมือค้นหาบิง 10 00:00:30,910 --> 00:00:33,190 มีหลายครั้งที่เราจะเริ่มมองหา 11 00:00:33,190 --> 00:00:35,800 ปัญญาประดิษฐ์และเครื่องจักรกล 12 00:00:35,830 --> 00:00:39,010 แต่เราต้องระบุว่าผู้ใช้จะนำไปใช้งานอย่างไร 13 00:00:39,140 --> 00:00:42,390 เพราะในช่วงสุดท้ายของวัน เราต้องการสร้างผลกระทบต่อสังคม 14 00:00:43,780 --> 00:00:45,400 มาลองถามคำถามง่ายๆกัน 15 00:00:45,820 --> 00:00:48,070 การเดินทางไปดาวอังคารใช้เวลานานเท่าไหร่? 16 00:00:49,330 --> 00:00:50,950 ผลลัพธ์เหล่านี้มาจากไหน 17 00:00:51,370 --> 00:00:54,100 และทำไมรายการนี้ถึงอยู่ก่อนหน้าอันอื่น? 18 00:00:55,700 --> 00:00:58,150 โอเค เรามาดูกันว่าเครื่องมือค้นหา 19 00:00:58,150 --> 00:00:59,860 เปลี่ยนคำขอของคุณเป็นผลลัพธ์ได้อย่างไร 20 00:01:00,690 --> 00:01:03,360 สิ่งแรกที่คุณต้องรู้คือเมื่อคุณค้นหา 21 00:01:03,430 --> 00:01:06,480 เครื่องมือค้นหาไม่ได้ออกไปที่ World Wide Web 22 00:01:06,480 --> 00:01:08,010 เพื่อทำการค้นหาให้คุณตามเวลาปัจจุบัน 23 00:01:08,140 --> 00:01:10,610 และนั่นเป็นเพราะมีเว็บไซต์กว่าพันล้านเว็บ 24 00:01:10,610 --> 00:01:14,140 บนอินเทอร์เน็ตและอีกหลายร้อยเว็บไซต์กำลัง ถูกสร้างขึ้นทุกนาที 25 00:01:14,140 --> 00:01:16,210 ดังนั้นหากเครื่องมือค้นหาต้องค้นหาผ่าน 26 00:01:16,240 --> 00:01:18,690 ทุกเว๊บไซต์เพื่อค้นหาสิ่งที่คุณต้องการ 27 00:01:18,690 --> 00:01:20,120 มันจะใช้เวลาตลอดกาล 28 00:01:20,500 --> 00:01:21,940 ดังนั้นเพื่อให้การค้นหาของคุณเร็วขึ้น 29 00:01:21,970 --> 00:01:24,940 เครื่องมือค้นหาจึงทำการสแกนเว็บล่วงหน้า อย่างต่อเนื่อง 30 00:01:25,420 --> 00:01:28,560 เพื่อบันทึกข้อมูลที่อาจช่วยในการค้นหา ของคุณในภายหลัง 31 00:01:28,930 --> 00:01:31,270 ด้วยวิธีนี้เมื่อคุณค้นหาการ เดินทางไปดาวอังคาร 32 00:01:31,630 --> 00:01:33,700 เครื่องมือค้นหามีสิ่งที่ต้องการแล้ว 33 00:01:33,700 --> 00:01:35,728 เพื่อให้คำตอบคุณได้ในทันที 34 00:01:36,250 --> 00:01:37,540 นี่คือวิธีการทำงานของมัน 35 00:01:37,900 --> 00:01:42,010 อินเทอร์เน็ตเป็นสายใยที่เชื่อมต่อ ระหว่างเพจโดยไฮเปอร์ลิงก์ 36 00:01:42,400 --> 00:01:44,680 เครื่องมือค้นหากำลังเรียกใช้ โปรแกรมที่เรียกว่า 37 00:01:44,680 --> 00:01:47,380 แมงมุมที่เดินผ่านหน้าเว็บเพจเหล่านี้ อย่างต่อเนื่อง 38 00:01:47,380 --> 00:01:49,040 เพื่อรวบรวมข้อมูลเกี่ยวกับพวกมัน 39 00:01:49,780 --> 00:01:51,550 ทุกครั้งที่พบไฮเปอร์ลิงก์ 40 00:01:52,090 --> 00:01:55,000 มันจะติดตามไปจนกว่าจะเยี่ยมชมครบทุกเพจ 41 00:01:55,030 --> 00:01:57,240 มันสามารถค้นหาได้จากอินเทอร์เน็ตทั้งหมด 42 00:01:57,335 --> 00:01:59,170 สำหรับแต่ละเพจที่แมงมุมไปเยี่ยมชม 43 00:01:59,200 --> 00:02:02,320 มันจะบันทึกข้อมูลที่อาจจำเป็น สำหรับการค้นหา 44 00:02:02,500 --> 00:02:05,650 โดยเพิ่มลงไปในฐานข้อมูลพิเศษ ที่เรียกว่าดัชนีการค้นหา 45 00:02:07,166 --> 00:02:09,530 ทีนี้กลับมาที่การค้นหาก่อนหน้า 46 00:02:09,590 --> 00:02:11,990 และมาดูกันว่าเครื่องมือค้นหา 47 00:02:11,990 --> 00:02:13,333 ทำให้เกิดผลลัพธ์ได้อย่างไร 48 00:02:13,640 --> 00:02:16,460 เมื่อคุณถามว่าใช้เวลานานเท่าไร ในการเดินทางไปดาวอังคาร 49 00:02:16,640 --> 00:02:18,860 เครื่องมือค้นหาจะมองหาคำในแต่ละคำเหล่านั้น 50 00:02:18,920 --> 00:02:21,410 ในดัชนีการค้นหาเพื่อรับรายการ 51 00:02:21,410 --> 00:02:24,500 ของเพจทั้งหมดบนอินเทอร์เน็ต ที่มีคำเหล่านั้นในทันที 52 00:02:24,890 --> 00:02:26,870 แต่เพียงแค่มองหาคำค้นหาเหล่านี้ 53 00:02:26,870 --> 00:02:28,760 มันจะได้กลับมาเป็นล้านๆเพจ 54 00:02:28,760 --> 00:02:31,110 ดังนั้นเครื่องมือค้นหาจะต้องสามารถ กำหนดได้ว่า 55 00:02:31,110 --> 00:02:33,120 ต้องแสดงการจับคู่ที่ดีที่สุดให้คุณเห็นก่อน 56 00:02:33,340 --> 00:02:36,010 นี่คือสิ่งที่ค่อนข้างจะยุ่งยาก เพราะเครื่องมือค้นหา 57 00:02:36,010 --> 00:02:38,040 อาจต้องเดาว่าคุณกำลังค้นหาอะไรอยู่ 58 00:02:38,930 --> 00:02:41,360 เครื่องมือค้นหาแต่ละอัน ใช้อัลกอริทึมของตัวเอง 59 00:02:41,360 --> 00:02:44,230 จัดอันดับเพจตามที่มันคิดว่าคุณต้องการอะไร 60 00:02:44,930 --> 00:02:47,660 อัลกอริทึมที่จัดอันดับของเครื่องมือค้นหา อาจตรวจสอบว่า 61 00:02:47,990 --> 00:02:50,360 มีคำค้นหาของคุณแสดงในหัวข้อเพจไหม 62 00:02:50,900 --> 00:02:53,820 หรือตรวจสอบว่า คำทั้งหมดที่แสดงนั้นอยู่ติดกันหรือไม่ 63 00:02:54,520 --> 00:02:57,020 หรือตรวจสอบจากการคำนวณอื่นๆ 64 00:02:57,020 --> 00:02:58,610 ที่ช่วยให้ตรวจสอบได้ดีขึ้น 65 00:02:58,670 --> 00:03:01,420 เพจไหนที่คุณต้องการดู และเพจไหนที่คุณไม่ต้องการดู 66 00:03:02,960 --> 00:03:04,960 กูเกิลคิดค้นอัลกอริทึมที่มีชื่อเสียงที่สุด 67 00:03:04,960 --> 00:03:08,530 ในการเลือกผลลัพธ์ที่เกี่ยวข้องมากที่สุด ของการค้นหาโดยคำนึงถึง 68 00:03:08,560 --> 00:03:11,230 จำนวนหน้าเว็บเพจอื่นๆที่เชื่อมโยง กับเพจที่ได้รับ 69 00:03:11,830 --> 00:03:14,140 แนวคิดคือถ้าเว็บไซต์จำนวนมาก 70 00:03:14,140 --> 00:03:15,660 คิดว่าเว็บเพจนั้นน่าสนใจ 71 00:03:15,660 --> 00:03:17,940 นั่นอาจจะเป็นสิ่งที่คุณกำลังมองหาอยู่ 72 00:03:18,190 --> 00:03:20,020 อัลกอริทึมนี้เรียกว่าการจัดอันดับเพจ 73 00:03:20,590 --> 00:03:22,330 ไม่ใช่เพราะมันจัดอันดับเว็บเพจ 74 00:03:22,570 --> 00:03:25,210 แต่เพราะว่ามันได้รับการตั้งชื่อตาม ผู้คิดค้น แลร์รี เพจ 75 00:03:25,480 --> 00:03:27,333 ผู้ซึ่งเป็นหนึ่งในผู้ก่อตั้งกูเกิล 76 00:03:27,940 --> 00:03:30,520 เนื่องจากเว็บไซต์มักจะทำเงินให้ เมื่อคุณเข้าไปเยี่ยมชม 77 00:03:30,820 --> 00:03:32,950 สแปมเมอร์จึงพยายามหาวิธีการ 78 00:03:32,950 --> 00:03:35,741 กำหนดอัลกอริทึมการค้นหา เพื่อให้เพจของพวกเขา 79 00:03:35,742 --> 00:03:37,931 อยู่ในรายการที่สูงขึ้นในผลลัพธ์ 80 00:03:38,260 --> 00:03:40,750 เครื่องมือค้นหาอัปเดตอัลกอริทึมเป็นประจำ 81 00:03:40,750 --> 00:03:44,296 เพื่อป้องกันไม่ให้เว็บไซต์ปลอมหรือ เว็บที่ไม่น่าเชื่อถือมาอยู่ด้านบนสุด 82 00:03:44,680 --> 00:03:47,350 ท้ายที่สุด มันก็ขึ้นอยู่กับคุณ ที่จะต้องจับตาดู 83 00:03:47,500 --> 00:03:49,450 เพจที่ไม่น่าเชื่อถือเหล่านั้นเอง 84 00:03:49,690 --> 00:03:52,990 โดยดูที่อยู่เว็บและทำให้แน่ใจว่า เป็นแหล่งที่เชื่อถือได้ 85 00:03:53,680 --> 00:03:55,390 โปรแกรมการค้นหามีการพัฒนาอยู่เสมอ 86 00:03:55,420 --> 00:03:58,420 เพื่อปรับปรุงอัลกอริธึม ที่จะให้ผลลัพธ์ที่ดีกว่า 87 00:03:58,540 --> 00:04:00,460 และให้ผลลัพธ์เร็วกว่าคู่แข่ง 88 00:04:01,000 --> 00:04:03,100 เครื่องมือค้นหาในวันนี้ใช้ข้อมูล 89 00:04:03,100 --> 00:04:06,820 ที่คุณไม่ได้ระบุไว้อย่างชัดเจน เพื่อช่วยจำกัดการค้นหาให้แคบลง 90 00:04:07,150 --> 00:04:10,120 ตัวอย่างเช่น ถ้าคุณค้นหาสวนสาธารณะของสุนัข 91 00:04:10,240 --> 00:04:12,190 เครื่องมือค้นหาจำนวนมากจะให้ผลลัพธ์เป็น 92 00:04:12,190 --> 00:04:13,840 สวนสาธารณะสุนัขทั้งหมดในบริเวณใกล้เคียง 93 00:04:14,080 --> 00:04:16,260 แม้ว่าคุณจะไม่ได้พิมพ์ตำแหน่งของคุณลงไป 94 00:04:17,800 --> 00:04:20,530 เครื่องมือค้นหาที่ทันสมัยนั้น ยังสามารถเข้าใจได้มากกว่า 95 00:04:20,530 --> 00:04:22,060 แค่คำในหน้าเพจ 96 00:04:22,300 --> 00:04:24,970 ว่าจริงๆแล้วพวกเขาหมายถึงอะไรกันแน่ เพื่อค้นหาสิ่งที่ดีที่สุด 97 00:04:24,970 --> 00:04:26,750 ที่ตรงกับสิ่งที่คุณกำลังมองหา 98 00:04:27,130 --> 00:04:29,980 ตัวอย่างเช่นหากคุณค้นหาว่า พิชเชอร์ที่รวดเร็ว 99 00:04:30,280 --> 00:04:32,300 มันจะรู้ว่าคุณกำลังมองหานักกีฬา 100 00:04:32,500 --> 00:04:34,450 แต่ถ้าคุณค้นหาว่า พิชเชอร์ขนาดใหญ่ 101 00:04:34,450 --> 00:04:36,730 มันจะหาทางเลือกสำหรับห้องครัวให้คุณ 102 00:04:38,420 --> 00:04:41,910 เพื่อให้เข้าใจคำศัพท์ได้ดีขึ้น เราใช้สิ่ง ที่เรียกว่า การเรียนรู้ของเครื่องจักรกล 103 00:04:41,910 --> 00:04:43,985 ซึ่งเป็นปัญญาประดิษฐ์ประเภทหนึ่ง 104 00:04:43,985 --> 00:04:46,050 มันช่วยให้อัลกอริทึมค้นหาสามารถค้นหา 105 00:04:46,090 --> 00:04:48,400 ไม่ใช่เพียงแค่ตัวอักษรหรือคำในเพจเท่านั้น 106 00:04:48,400 --> 00:04:51,280 แต่ยังเข้าใจความหมายพื้นฐานของคำด้วย 107 00:04:53,690 --> 00:04:55,850 อินเทอร์เน็ตกำลังเติบโตขึ้นอย่างทวีคูณ 108 00:04:56,210 --> 00:04:59,810 แต่ถ้าทีมที่ออกแบบเครื่องมือค้นหา ทำงานอย่างถูกต้อง 109 00:05:00,080 --> 00:05:04,090 ข้อมูลที่คุณต้องการควร อยู่ที่การกดแป้นพิมพ์ไม่กี่ครั้ง