WEBVTT 00:00:06.070 --> 00:00:07.120 สวัสดี ผมชื่อ จอห์น 00:00:07.510 --> 00:00:10.140 ผมเป็นหัวหน้าทีมค้นคว้าและวิจัย เครื่องจักรที่กูเกิล 00:00:12.130 --> 00:00:14.230 ผมคิดว่ามันเป็นแรงบันดาลใจอย่างน่าอัศจรรย์ 00:00:14.230 --> 00:00:16.214 ให้ผู้คนทั่วโลก 00:00:16.215 --> 00:00:19.160 หันมาใช้เครื่องมือค้นหาเพื่อ ถามคำถามที่เล็กน้อย 00:00:19.160 --> 00:00:20.930 และถามคำถามที่สำคัญอย่างเหลือเชื่อ 00:00:20.930 --> 00:00:23.450 ดังนั้นมันจึงเป็นความรับผิดชอบที่ยิ่งใหญ่ ที่จะให้ 00:00:23.450 --> 00:00:24.864 คำตอบที่ดีที่สุดกับพวกเขา 00:00:26.710 --> 00:00:30.610 สวัสดี ฉันชื่อ อัคชาญา ฉันทำงานอยู่ในเครื่องมือค้นหาบิง 00:00:30.910 --> 00:00:33.190 มีหลายครั้งที่เราจะเริ่มมองหา 00:00:33.190 --> 00:00:35.800 ปัญญาประดิษฐ์และเครื่องจักรกล 00:00:35.830 --> 00:00:39.010 แต่เราต้องระบุว่าผู้ใช้จะนำไปใช้งานอย่างไร 00:00:39.140 --> 00:00:42.390 เพราะในช่วงสุดท้ายของวัน เราต้องการสร้างผลกระทบต่อสังคม 00:00:43.780 --> 00:00:45.400 มาลองถามคำถามง่ายๆกัน 00:00:45.820 --> 00:00:48.070 การเดินทางไปดาวอังคารใช้เวลานานเท่าไหร่? 00:00:49.330 --> 00:00:50.950 ผลลัพธ์เหล่านี้มาจากไหน 00:00:51.370 --> 00:00:54.100 และทำไมรายการนี้ถึงอยู่ก่อนหน้าอันอื่น? 00:00:55.700 --> 00:00:58.150 โอเค เรามาดูกันว่าเครื่องมือค้นหา 00:00:58.150 --> 00:00:59.860 เปลี่ยนคำขอของคุณเป็นผลลัพธ์ได้อย่างไร 00:01:00.690 --> 00:01:03.360 สิ่งแรกที่คุณต้องรู้คือเมื่อคุณค้นหา 00:01:03.430 --> 00:01:06.480 เครื่องมือค้นหาไม่ได้ออกไปที่ World Wide Web 00:01:06.480 --> 00:01:08.010 เพื่อทำการค้นหาให้คุณตามเวลาปัจจุบัน 00:01:08.140 --> 00:01:10.610 และนั่นเป็นเพราะมีเว็บไซต์กว่าพันล้านเว็บ 00:01:10.610 --> 00:01:14.140 บนอินเทอร์เน็ตและอีกหลายร้อยเว็บไซต์กำลัง ถูกสร้างขึ้นทุกนาที 00:01:14.140 --> 00:01:16.210 ดังนั้นหากเครื่องมือค้นหาต้องค้นหาผ่าน 00:01:16.240 --> 00:01:18.690 ทุกเว๊บไซต์เพื่อค้นหาสิ่งที่คุณต้องการ 00:01:18.690 --> 00:01:20.120 มันจะใช้เวลาตลอดกาล 00:01:20.500 --> 00:01:21.940 ดังนั้นเพื่อให้การค้นหาของคุณเร็วขึ้น 00:01:21.970 --> 00:01:24.940 เครื่องมือค้นหาจึงทำการสแกนเว็บล่วงหน้า อย่างต่อเนื่อง 00:01:25.420 --> 00:01:28.560 เพื่อบันทึกข้อมูลที่อาจช่วยในการค้นหา ของคุณในภายหลัง 00:01:28.930 --> 00:01:31.270 ด้วยวิธีนี้เมื่อคุณค้นหาการ เดินทางไปดาวอังคาร 00:01:31.630 --> 00:01:33.700 เครื่องมือค้นหามีสิ่งที่ต้องการแล้ว 00:01:33.700 --> 00:01:35.728 เพื่อให้คำตอบคุณได้ในทันที 00:01:36.250 --> 00:01:37.540 นี่คือวิธีการทำงานของมัน 00:01:37.900 --> 00:01:42.010 อินเทอร์เน็ตเป็นสายใยที่เชื่อมต่อ ระหว่างเพจโดยไฮเปอร์ลิงก์ 00:01:42.400 --> 00:01:44.680 เครื่องมือค้นหากำลังเรียกใช้ โปรแกรมที่เรียกว่า 00:01:44.680 --> 00:01:47.380 แมงมุมที่เดินผ่านหน้าเว็บเพจเหล่านี้ อย่างต่อเนื่อง 00:01:47.380 --> 00:01:49.040 เพื่อรวบรวมข้อมูลเกี่ยวกับพวกมัน 00:01:49.780 --> 00:01:51.550 ทุกครั้งที่พบไฮเปอร์ลิงก์ 00:01:52.090 --> 00:01:55.000 มันจะติดตามไปจนกว่าจะเยี่ยมชมครบทุกเพจ 00:01:55.030 --> 00:01:57.240 มันสามารถค้นหาได้จากอินเทอร์เน็ตทั้งหมด 00:01:57.335 --> 00:01:59.170 สำหรับแต่ละเพจที่แมงมุมไปเยี่ยมชม 00:01:59.200 --> 00:02:02.320 มันจะบันทึกข้อมูลที่อาจจำเป็น สำหรับการค้นหา 00:02:02.500 --> 00:02:05.650 โดยเพิ่มลงไปในฐานข้อมูลพิเศษ ที่เรียกว่าดัชนีการค้นหา 00:02:07.166 --> 00:02:09.530 ทีนี้กลับมาที่การค้นหาก่อนหน้า 00:02:09.590 --> 00:02:11.990 และมาดูกันว่าเครื่องมือค้นหา 00:02:11.990 --> 00:02:13.333 ทำให้เกิดผลลัพธ์ได้อย่างไร 00:02:13.640 --> 00:02:16.460 เมื่อคุณถามว่าใช้เวลานานเท่าไร ในการเดินทางไปดาวอังคาร 00:02:16.640 --> 00:02:18.860 เครื่องมือค้นหาจะมองหาคำในแต่ละคำเหล่านั้น 00:02:18.920 --> 00:02:21.410 ในดัชนีการค้นหาเพื่อรับรายการ 00:02:21.410 --> 00:02:24.500 ของเพจทั้งหมดบนอินเทอร์เน็ต ที่มีคำเหล่านั้นในทันที 00:02:24.890 --> 00:02:26.870 แต่เพียงแค่มองหาคำค้นหาเหล่านี้ 00:02:26.870 --> 00:02:28.760 มันจะได้กลับมาเป็นล้านๆเพจ 00:02:28.760 --> 00:02:31.110 ดังนั้นเครื่องมือค้นหาจะต้องสามารถ กำหนดได้ว่า 00:02:31.110 --> 00:02:33.120 ต้องแสดงการจับคู่ที่ดีที่สุดให้คุณเห็นก่อน 00:02:33.340 --> 00:02:36.010 นี่คือสิ่งที่ค่อนข้างจะยุ่งยาก เพราะเครื่องมือค้นหา 00:02:36.010 --> 00:02:38.040 อาจต้องเดาว่าคุณกำลังค้นหาอะไรอยู่ 00:02:38.930 --> 00:02:41.360 เครื่องมือค้นหาแต่ละอัน ใช้อัลกอริทึมของตัวเอง 00:02:41.360 --> 00:02:44.230 จัดอันดับเพจตามที่มันคิดว่าคุณต้องการอะไร 00:02:44.930 --> 00:02:47.660 อัลกอริทึมที่จัดอันดับของเครื่องมือค้นหา อาจตรวจสอบว่า 00:02:47.990 --> 00:02:50.360 มีคำค้นหาของคุณแสดงในหัวข้อเพจไหม 00:02:50.900 --> 00:02:53.820 หรือตรวจสอบว่า คำทั้งหมดที่แสดงนั้นอยู่ติดกันหรือไม่ 00:02:54.520 --> 00:02:57.020 หรือตรวจสอบจากการคำนวณอื่นๆ 00:02:57.020 --> 00:02:58.610 ที่ช่วยให้ตรวจสอบได้ดีขึ้น 00:02:58.670 --> 00:03:01.420 เพจไหนที่คุณต้องการดู และเพจไหนที่คุณไม่ต้องการดู 00:03:02.960 --> 00:03:04.960 กูเกิลคิดค้นอัลกอริทึมที่มีชื่อเสียงที่สุด 00:03:04.960 --> 00:03:08.530 ในการเลือกผลลัพธ์ที่เกี่ยวข้องมากที่สุด ของการค้นหาโดยคำนึงถึง 00:03:08.560 --> 00:03:11.230 จำนวนหน้าเว็บเพจอื่นๆที่เชื่อมโยง กับเพจที่ได้รับ 00:03:11.830 --> 00:03:14.140 แนวคิดคือถ้าเว็บไซต์จำนวนมาก 00:03:14.140 --> 00:03:15.660 คิดว่าเว็บเพจนั้นน่าสนใจ 00:03:15.660 --> 00:03:17.940 นั่นอาจจะเป็นสิ่งที่คุณกำลังมองหาอยู่ 00:03:18.190 --> 00:03:20.020 อัลกอริทึมนี้เรียกว่าการจัดอันดับเพจ 00:03:20.590 --> 00:03:22.330 ไม่ใช่เพราะมันจัดอันดับเว็บเพจ 00:03:22.570 --> 00:03:25.210 แต่เพราะว่ามันได้รับการตั้งชื่อตาม ผู้คิดค้น แลร์รี เพจ 00:03:25.480 --> 00:03:27.333 ผู้ซึ่งเป็นหนึ่งในผู้ก่อตั้งกูเกิล 00:03:27.940 --> 00:03:30.520 เนื่องจากเว็บไซต์มักจะทำเงินให้ เมื่อคุณเข้าไปเยี่ยมชม 00:03:30.820 --> 00:03:32.950 สแปมเมอร์จึงพยายามหาวิธีการ 00:03:32.950 --> 00:03:35.741 กำหนดอัลกอริทึมการค้นหา เพื่อให้เพจของพวกเขา 00:03:35.742 --> 00:03:37.931 อยู่ในรายการที่สูงขึ้นในผลลัพธ์ 00:03:38.260 --> 00:03:40.750 เครื่องมือค้นหาอัปเดตอัลกอริทึมเป็นประจำ 00:03:40.750 --> 00:03:44.296 เพื่อป้องกันไม่ให้เว็บไซต์ปลอมหรือ เว็บที่ไม่น่าเชื่อถือมาอยู่ด้านบนสุด 00:03:44.680 --> 00:03:47.350 ท้ายที่สุด มันก็ขึ้นอยู่กับคุณ ที่จะต้องจับตาดู 00:03:47.500 --> 00:03:49.450 เพจที่ไม่น่าเชื่อถือเหล่านั้นเอง 00:03:49.690 --> 00:03:52.990 โดยดูที่อยู่เว็บและทำให้แน่ใจว่า เป็นแหล่งที่เชื่อถือได้ 00:03:53.680 --> 00:03:55.390 โปรแกรมการค้นหามีการพัฒนาอยู่เสมอ 00:03:55.420 --> 00:03:58.420 เพื่อปรับปรุงอัลกอริธึม ที่จะให้ผลลัพธ์ที่ดีกว่า 00:03:58.540 --> 00:04:00.460 และให้ผลลัพธ์เร็วกว่าคู่แข่ง 00:04:01.000 --> 00:04:03.100 เครื่องมือค้นหาในวันนี้ใช้ข้อมูล 00:04:03.100 --> 00:04:06.820 ที่คุณไม่ได้ระบุไว้อย่างชัดเจน เพื่อช่วยจำกัดการค้นหาให้แคบลง 00:04:07.150 --> 00:04:10.120 ตัวอย่างเช่น ถ้าคุณค้นหาสวนสาธารณะของสุนัข 00:04:10.240 --> 00:04:12.190 เครื่องมือค้นหาจำนวนมากจะให้ผลลัพธ์เป็น 00:04:12.190 --> 00:04:13.840 สวนสาธารณะสุนัขทั้งหมดในบริเวณใกล้เคียง 00:04:14.080 --> 00:04:16.260 แม้ว่าคุณจะไม่ได้พิมพ์ตำแหน่งของคุณลงไป 00:04:17.800 --> 00:04:20.530 เครื่องมือค้นหาที่ทันสมัยนั้น ยังสามารถเข้าใจได้มากกว่า 00:04:20.530 --> 00:04:22.060 แค่คำในหน้าเพจ 00:04:22.300 --> 00:04:24.970 ว่าจริงๆแล้วพวกเขาหมายถึงอะไรกันแน่ เพื่อค้นหาสิ่งที่ดีที่สุด 00:04:24.970 --> 00:04:26.750 ที่ตรงกับสิ่งที่คุณกำลังมองหา 00:04:27.130 --> 00:04:29.980 ตัวอย่างเช่นหากคุณค้นหาว่า พิชเชอร์ที่รวดเร็ว 00:04:30.280 --> 00:04:32.300 มันจะรู้ว่าคุณกำลังมองหานักกีฬา 00:04:32.500 --> 00:04:34.450 แต่ถ้าคุณค้นหาว่า พิชเชอร์ขนาดใหญ่ 00:04:34.450 --> 00:04:36.730 มันจะหาทางเลือกสำหรับห้องครัวให้คุณ 00:04:38.420 --> 00:04:41.910 เพื่อให้เข้าใจคำศัพท์ได้ดีขึ้น เราใช้สิ่ง ที่เรียกว่า การเรียนรู้ของเครื่องจักรกล 00:04:41.910 --> 00:04:43.985 ซึ่งเป็นปัญญาประดิษฐ์ประเภทหนึ่ง 00:04:43.985 --> 00:04:46.050 มันช่วยให้อัลกอริทึมค้นหาสามารถค้นหา 00:04:46.090 --> 00:04:48.400 ไม่ใช่เพียงแค่ตัวอักษรหรือคำในเพจเท่านั้น 00:04:48.400 --> 00:04:51.280 แต่ยังเข้าใจความหมายพื้นฐานของคำด้วย 00:04:53.690 --> 00:04:55.850 อินเทอร์เน็ตกำลังเติบโตขึ้นอย่างทวีคูณ 00:04:56.210 --> 00:04:59.810 แต่ถ้าทีมที่ออกแบบเครื่องมือค้นหา ทำงานอย่างถูกต้อง 00:05:00.080 --> 00:05:04.090 ข้อมูลที่คุณต้องการควร อยู่ที่การกดแป้นพิมพ์ไม่กี่ครั้ง