สวัสดีครับ ผมจอห์นผมนำทีมการค้นหา และการเรียนรู้ด้วยเครื่องที่ Google ผมว่าการที่คนทั่วโลกเข้าหาเสิร์ชเอนจิ้น เพื่อถามคำถามต่าง ๆ สร้างแรงบันดาลใจได้อย่างมาก เราจึงมีความรับผิดชอบในการ หาคำตอบที่ดีที่สุดให้พวกเขา สวัสดีค่ะ ฉันอัคชายา ทำงานกับทีมค้นหาของ Bing หลายครั้งที่เราทำงานกับปัญญาประดิษฐ์ และการเรียนรู้ของเครื่อง แต่เราต้องแจ้งว่าผู้ใช้งานจะใช้ยังไง เพราะเราต้องการก่อให้เกิดผลต่อสังคม มาลองถามคำถามง่าย ๆ กัน เดินทางไปดาวอังคาร ใช้เวลาเท่าไหร่ ผลลัพธ์พวกนี้มาจากไหน แล้วทำไมอันนี้ปรากฎขึ้นก่อนอันอื่น มาดูกันครับว่าเสิร์ชเอนจิ้นเปลี่ยนคำถาม ให้กลายเป็นผลลัพธ์อย่างไร ก่อนอื่นต้องรู้ก่อนว่า เวลาค้นหา เสิร์ชเอนจิ้นไม่ได้เข้า WWW เพื่อรันการค้นหาตามเวลาจริง เพราะในอินเทอร์เน็ต มีมากกว่าพันล้านเว็บไซต์ และยังเกิดขึ้นอีกนาทีละหลายร้อยเว็บไซต์ หากเสิร์ชเอนจิ้นต้องค้นทุกเว็บไซต์ และหาอันที่คุณต้องการ ก็คงไม่มีวันหาครบ การค้นหาให้เร็วขึ้นนั้น เสิร์ชเอนจิ้นจะสแกนเว็บล่วงหน้าให้ และบันทึกข้อมูลที่อาจช่วยคุณค้นหาภายหลัง ทีนี้ พอเราหาข้อมูลการเดินทางไปดาวอังคาร เสิร์ชเอนจิ้นจึงมีคำตอบให้แล้ว และตอบคุณได้แบบเรียลไทม์ คืออย่างนี้ค่ะ อินเทอร์เน็ตคือหน้าเว็บต่าง ๆ ที่เชื่อมต่อกันด้วยไฮเปอร์ลิงก์ เสิร์ชเอนจิ้นรันโปรแกรมเรียกว่าสไปเดอร์ ที่คอยข้ามหน้าเว็บเพื่อเก็บข้อมูล พอมันเจอไฮเปอร์ลิงก์แต่ละครั้ง ก็จะตามไปจนเยี่ยมชมทุกเพจ ที่มันหาเจอทั่วทั้งอินเทอร์เน็ต พอเจ้าสไปเดอร์เยี่ยมแต่ละเพจ ก็จะบันทึกข้อมูล ที่อาจต้องการใช้ค้นหา ด้วยการเพิ่มเข้าฐานข้อมูลพิเศษ เรียกว่า ดัชนีการค้นหา กลับไปดูการค้นหาก่อนหน้านี้กัน และดูว่าเสิร์ชเอนจิ้นหาผลลัพธ์พบได้ยังไง พอถามว่า ไปดาวอังคารใช้เวลาเท่าไร เสิร์ชเอนจิ้นจะหาแต่ละคำในดัชนีการค้นหา และลิสต์เพจทั้งหมดในอินเทอร์เน็ต ที่มีคำเหล่านั้น แต่ถ้าหาทีละคำ อาจได้หลายล้านเพจ เสิร์ชเอนจิ้นจึงต้องตัดสินใจ เพจที่มีการเข้าคู่กันที่สุดให้คุณดูก่อน มันยากตรงนี้ครับ เพราะเสิร์ชเอนจิ้น อาจต้องเดาว่าคุณกำลังหาอะไร เสิร์ชเอนจิ้นแต่ละตัว ใช้อัลกอริธึมของตัวเอง ในการจัดลำดับเพจ จากสิ่งที่มันคิดว่าคุณต้องการ อัลกอริธึมการจัดลำดับเพจอาจดูว่า คำที่ใช้ค้นหาอยู่ในชื่อเพจไหม ดูว่าแต่ละคำปรากฎติด ๆ กันเลยไหม หรือมีตัวเลขอื่นให้คำนวณ เพื่อให้มันตัดสินใจได้ดีขึ้นว่า เพจไหนที่คุณอยากเห็น และเพจไหนที่คุณไม่อยากเห็น Google สร้างอัลกอริธึม ที่มีชื่อเสียงที่สุด ในการเลือกผลลัพธ์ที่เกี่ยวข้อง เพื่อการค้นหา ด้วยการดูว่า มีเว็บเพจอื่นกี่เพจที่ลิงก์กับเพจนั้น ไอเดียคือถ้าหลายเว็บไซต์คิดว่า เว็บเพจนั้นน่าสนใจ ก็น่าจะเป็นสิ่งที่คุณตามหา อัลกอริธึมนี้เรียกว่า page rank ไม่ใช่เพราะมันจัดการเว็บเพจ แต่เพราะตั้งชื่อตามผู้คิดค้น ชื่อแลร์รี่ เพจ หนึ่งในผู้ก่อตั้ง Google ครับ เว็บไซต์มักทำเงิน จากการที่คุณเข้าเยี่ยมชม พวกสแปมเมอร์จึงมักพยายามหาทาง ทำให้อัลกอริธึมผิดเพี้ยน ให้เพจของตนปรากฎเป็นอันดับแรก ๆ ในการค้นหา เสิร์ชเอนจิ้นมักอัปเดตอัลกอริธึม เพื่อป้องกันไซต์ปลอมหรือไม่น่าเชื่อถือ ทั้งนี้คุณเอง ก็ยังต้องระวังเพจที่ไม่น่าไว้ใจ ด้วยการดูที่อยู่เว็บ ว่าเป็นแหล่งที่น่าเชื่อถือหรือไม่ โปรแกรมการค้นหาพัฒนาเสมอ เพื่อปรับปรุงอัลกอริธึม ให้แสดงผลลัพธ์ที่ดีขึ้น เร็วขึ้นกว่าคู่แข่ง เสิร์ชเอนจิ้นในปัจจุบัน สามารถแสดงข้อมูลที่คุณยังไม่ทันได้ให้ เพื่อทำให้การค้นหาเจาะจงขึ้น เช่น ถ้าเราจะหาสวนสาธารณะสุนัข เสิร์ชเอนจิ้นหลายเจ้าจะแสดงผลลัพธ์ สวนสาธารณะสุนัขใกล้คุณ โดยที่คุณไม่ต้องพิมพ์ตำแหน่งลงไปเลย เสิร์ชเอนจิ้นยุคใหม่เข้าใจไม่เพียง แค่คำบนหน้าเพจ แต่ยังเข้าใจความหมายเพื่อหาเพจ ที่เข้ากับสิ่งที่คุณค้นหามากที่สุด เช่นถ้าคุณหาพิทเชอร์มือไว มันรู้เลยว่าคุณหานักกีฬา แต่ถ้าคุณหาพิทเชอร์ (เหยือกน้ำ) ขนาดใหญ่ มันจะหาอุปกรณ์ในครัวมาให้แทน เราใช้การเรียนรู้ของเครื่อง เพื่อให้เข้าใจคำต่าง ๆ ดีขึ้น เป็นปัญญาประดิษฐ์ประเภทหนึ่ง ช่วยให้อัลกอริธึมค้นหา เข้าถึงมากกว่าตัวอักษรและคำในเพจ แต่ให้เข้าใจความหมายในคำด้วย อินเทอร์เน็ตเติบโตขึ้นอย่างมาก แต่หากทีมที่ออกแบบเสิร์ชเอนจิ้น ทำหน้าที่ได้ดี ข้อมูลที่คุณต้องการ ก็อยู่ห่างออกไปแค่ปลายนิ้วค่ะ