-
สวัสดีครับ ผมจอห์นผมนำทีมการค้นหา
และการเรียนรู้ด้วยเครื่องที่ Google
-
ผมว่าการที่คนทั่วโลกเข้าหาเสิร์ชเอนจิ้น
เพื่อถามคำถามต่าง ๆ
-
สร้างแรงบันดาลใจได้อย่างมาก
-
เราจึงมีความรับผิดชอบในการ
หาคำตอบที่ดีที่สุดให้พวกเขา
-
สวัสดีค่ะ ฉันอัคชายา
ทำงานกับทีมค้นหาของ Bing
-
หลายครั้งที่เราทำงานกับปัญญาประดิษฐ์
และการเรียนรู้ของเครื่อง
-
แต่เราต้องแจ้งว่าผู้ใช้งานจะใช้ยังไง
-
เพราะเราต้องการก่อให้เกิดผลต่อสังคม
-
มาลองถามคำถามง่าย ๆ กัน
-
เดินทางไปดาวอังคาร ใช้เวลาเท่าไหร่
-
ผลลัพธ์พวกนี้มาจากไหน
-
แล้วทำไมอันนี้ปรากฎขึ้นก่อนอันอื่น
-
มาดูกันครับว่าเสิร์ชเอนจิ้นเปลี่ยนคำถาม
ให้กลายเป็นผลลัพธ์อย่างไร
-
ก่อนอื่นต้องรู้ก่อนว่า เวลาค้นหา
-
เสิร์ชเอนจิ้นไม่ได้เข้า WWW
เพื่อรันการค้นหาตามเวลาจริง
-
เพราะในอินเทอร์เน็ต
มีมากกว่าพันล้านเว็บไซต์
-
และยังเกิดขึ้นอีกนาทีละหลายร้อยเว็บไซต์
-
หากเสิร์ชเอนจิ้นต้องค้นทุกเว็บไซต์
และหาอันที่คุณต้องการ
-
ก็คงไม่มีวันหาครบ
-
การค้นหาให้เร็วขึ้นนั้น
เสิร์ชเอนจิ้นจะสแกนเว็บล่วงหน้าให้
-
และบันทึกข้อมูลที่อาจช่วยคุณค้นหาภายหลัง
-
ทีนี้ พอเราหาข้อมูลการเดินทางไปดาวอังคาร
-
เสิร์ชเอนจิ้นจึงมีคำตอบให้แล้ว
และตอบคุณได้แบบเรียลไทม์
-
คืออย่างนี้ค่ะ
-
อินเทอร์เน็ตคือหน้าเว็บต่าง ๆ
ที่เชื่อมต่อกันด้วยไฮเปอร์ลิงก์
-
เสิร์ชเอนจิ้นรันโปรแกรมเรียกว่าสไปเดอร์
-
ที่คอยข้ามหน้าเว็บเพื่อเก็บข้อมูล
-
พอมันเจอไฮเปอร์ลิงก์แต่ละครั้ง
-
ก็จะตามไปจนเยี่ยมชมทุกเพจ
ที่มันหาเจอทั่วทั้งอินเทอร์เน็ต
-
พอเจ้าสไปเดอร์เยี่ยมแต่ละเพจ
ก็จะบันทึกข้อมูล
-
ที่อาจต้องการใช้ค้นหา
-
ด้วยการเพิ่มเข้าฐานข้อมูลพิเศษ
เรียกว่า ดัชนีการค้นหา
-
กลับไปดูการค้นหาก่อนหน้านี้กัน
-
และดูว่าเสิร์ชเอนจิ้นหาผลลัพธ์พบได้ยังไง
-
พอถามว่า ไปดาวอังคารใช้เวลาเท่าไร
-
เสิร์ชเอนจิ้นจะหาแต่ละคำในดัชนีการค้นหา
-
และลิสต์เพจทั้งหมดในอินเทอร์เน็ต
ที่มีคำเหล่านั้น
-
แต่ถ้าหาทีละคำ อาจได้หลายล้านเพจ
-
เสิร์ชเอนจิ้นจึงต้องตัดสินใจ
เพจที่มีการเข้าคู่กันที่สุดให้คุณดูก่อน
-
มันยากตรงนี้ครับ เพราะเสิร์ชเอนจิ้น
อาจต้องเดาว่าคุณกำลังหาอะไร
-
เสิร์ชเอนจิ้นแต่ละตัว
ใช้อัลกอริธึมของตัวเอง
-
ในการจัดลำดับเพจ
จากสิ่งที่มันคิดว่าคุณต้องการ
-
อัลกอริธึมการจัดลำดับเพจอาจดูว่า
คำที่ใช้ค้นหาอยู่ในชื่อเพจไหม
-
ดูว่าแต่ละคำปรากฎติด ๆ กันเลยไหม
-
หรือมีตัวเลขอื่นให้คำนวณ
เพื่อให้มันตัดสินใจได้ดีขึ้นว่า
-
เพจไหนที่คุณอยากเห็น
และเพจไหนที่คุณไม่อยากเห็น
-
Google สร้างอัลกอริธึม
ที่มีชื่อเสียงที่สุด
-
ในการเลือกผลลัพธ์ที่เกี่ยวข้อง
เพื่อการค้นหา ด้วยการดูว่า
-
มีเว็บเพจอื่นกี่เพจที่ลิงก์กับเพจนั้น
-
ไอเดียคือถ้าหลายเว็บไซต์คิดว่า
เว็บเพจนั้นน่าสนใจ
-
ก็น่าจะเป็นสิ่งที่คุณตามหา
-
อัลกอริธึมนี้เรียกว่า page rank
ไม่ใช่เพราะมันจัดการเว็บเพจ
-
แต่เพราะตั้งชื่อตามผู้คิดค้น
ชื่อแลร์รี่ เพจ
-
หนึ่งในผู้ก่อตั้ง Google ครับ
-
เว็บไซต์มักทำเงิน
จากการที่คุณเข้าเยี่ยมชม
-
พวกสแปมเมอร์จึงมักพยายามหาทาง
ทำให้อัลกอริธึมผิดเพี้ยน
-
ให้เพจของตนปรากฎเป็นอันดับแรก ๆ
ในการค้นหา
-
เสิร์ชเอนจิ้นมักอัปเดตอัลกอริธึม
-
เพื่อป้องกันไซต์ปลอมหรือไม่น่าเชื่อถือ
-
ทั้งนี้คุณเอง
ก็ยังต้องระวังเพจที่ไม่น่าไว้ใจ
-
ด้วยการดูที่อยู่เว็บ
ว่าเป็นแหล่งที่น่าเชื่อถือหรือไม่
-
โปรแกรมการค้นหาพัฒนาเสมอ
เพื่อปรับปรุงอัลกอริธึม
-
ให้แสดงผลลัพธ์ที่ดีขึ้น
เร็วขึ้นกว่าคู่แข่ง
-
เสิร์ชเอนจิ้นในปัจจุบัน
สามารถแสดงข้อมูลที่คุณยังไม่ทันได้ให้
-
เพื่อทำให้การค้นหาเจาะจงขึ้น
-
เช่น ถ้าเราจะหาสวนสาธารณะสุนัข
-
เสิร์ชเอนจิ้นหลายเจ้าจะแสดงผลลัพธ์
สวนสาธารณะสุนัขใกล้คุณ
-
โดยที่คุณไม่ต้องพิมพ์ตำแหน่งลงไปเลย
-
เสิร์ชเอนจิ้นยุคใหม่เข้าใจไม่เพียง
แค่คำบนหน้าเพจ
-
แต่ยังเข้าใจความหมายเพื่อหาเพจ
ที่เข้ากับสิ่งที่คุณค้นหามากที่สุด
-
เช่นถ้าคุณหาพิทเชอร์มือไว
-
มันรู้เลยว่าคุณหานักกีฬา
-
แต่ถ้าคุณหาพิทเชอร์ (เหยือกน้ำ) ขนาดใหญ่
มันจะหาอุปกรณ์ในครัวมาให้แทน
-
เราใช้การเรียนรู้ของเครื่อง
เพื่อให้เข้าใจคำต่าง ๆ ดีขึ้น
-
เป็นปัญญาประดิษฐ์ประเภทหนึ่ง
-
ช่วยให้อัลกอริธึมค้นหา
เข้าถึงมากกว่าตัวอักษรและคำในเพจ
-
แต่ให้เข้าใจความหมายในคำด้วย
-
อินเทอร์เน็ตเติบโตขึ้นอย่างมาก
-
แต่หากทีมที่ออกแบบเสิร์ชเอนจิ้น
ทำหน้าที่ได้ดี
-
ข้อมูลที่คุณต้องการ
ก็อยู่ห่างออกไปแค่ปลายนิ้วค่ะ