नमस्ते, मेरे नाम का जॉन है। मैं गूगल की सर्च और मशीन लर्निंग टीमों का नेतृत्व करता हूं। मुझे लगता है कि यह आश्चर्यजनक रूप से प्रेरणादायक है कि दुनिया भर के लोग सामान्य और अविश्वसनीय रूप से महत्वपूर्ण प्रश्न पूछने के लिए खोज इंजन का रुख करते हैं। इसलिए यह एक बड़ी जिम्मेदारी है कि हम उन्हें बेहतरीन जवाब प्रदान करें। नमस्ते, मेरे नाम अक्षया है और मैं बिंग सर्च टीम पर काम करती हूँ। कई बार हम कृत्रिम बुद्धिमत्ता और मशीन लर्निंग की ओर देखते हैं, लेकिन हमें यह पता करना होगा कि उपयोगकर्ता इसका उपयोग कैसे करने जा रहे हैं, क्योंकि आखिरी में हम समाज पर प्रभाव डालना चाहते हैं। आइये एक सरल प्रश्न पूछते पूछता हैं। मंगल तक जाने में कितना समय लगता है? ये परिणाम कहां से आए और इसे दूसरे से पहले क्यों सूचीबद्ध किया गया? ठीक है, चलिए देखते हैं कि सर्च इंजन आपके अनुरोध को परिणाम में कैसे बदलता है। कुछ खोजते समय जो पहली चीज़ आपको जाननी चाहिए, वह है कि सर्च इंजन वास्तव में रियल टाइम में आपकी खोज को चलाने के लिए वर्ल्ड वाइड वेब पर नहीं जा रहा है। और ऐसा इसलिए है क्योंकि इंटरनेट पर एक बिलियन से अधिक वेबसाइटें हैं और हर एक मिनट में सैकड़ों और बनाई जा रही हैं। तो यदि सर्च इंजन जो आप चाहते हैं उसकी तलाश में प्रत्येक साइट खंगालेगा, तो उसके लिए कुछ भी संभव नहीं होगा। इसलिए आपकी खोज को तेज बनाने के लिए, सर्च इंजन लगातार उन सूचनाओं को रिकॉर्ड करने के लिए वेब की स्कैनिंग करता रहता है, जो बाद में आपकी खोज में मदद कर सकती है। इस तरह, जब आप मंगल की यात्रा के बारे में खोजते हैं, तो सर्च इंजन के पास पहले से ही वह है जो आपको रियल टाइम में जवाब देने के लिए ज़रूरी है। यह इस तरह काम करता है। इंटरनेट पृष्ठों का एक वेब है, जो हाइपरलिंक द्वारा एक दूसरे से कनेक्ट रहते हैं। सर्च इंजन लगातार स्पाइडर नामक प्रोग्राम चलाते हैं जो इन वेब पेजों के माध्यम से उनके बारे में जानकारी एकत्र करने के लिए गुजरता है। जब भी उसे हाइपरलिंक मिलता है, तो वह उसे तब तक फॉलो करता है जब तक कि वह इंटरनेट पर मौजूद सभी पृष्ठों तक नहीं पहुँच जाता। स्पाइडर द्वारा विजिट किये जाने वाले प्रत्येक पृष्ठ के लिए, यह उस जानकारी को रिकॉर्ड करता है जिसकी इसे खोज के लिए ज़रूरत पड़ सकती है, इसे विशेष डाटाबेस से जोड़कर जिसे सर्च इंडेक्स कहते हैं। अब, पहले की उस खोज पर वापस चलते हैं और देखते हैं कि क्या हम यह पता लगा सकते हैं कि सर्च इंजन परिणाम कैसे प्रदर्शित करता है। जब आप पूछते हैं कि मंगल की यात्रा में कितना समय लगता है, तो सर्च इंजन उन शब्दों को सर्च इंडेक्स में देखता है, ताकि इंटरनेट पर मौजूद उन शब्दों वाले सभी पृष्ठों की सूची तुरंत प्राप्त की जा सके। लेकिन केवल इन सर्च टर्म की तलाश में लाखों पृष्ठ सामने आ सकते हैं, इसलिए सर्च इंजन को आपको पहले दिखाने के लिए सर्वोत्तम मैच को निर्धारित करने में सक्षम होना चाहिए। यहीं यह पेचीदा हो जाता है, क्योंकि सर्च इंजन को यह अनुमान लगाना होता है कि आप क्या खोज रहे हैं। प्रत्येक सर्च इंजन अपनी एल्गोरिदम का उपयोग इस आधार पर पृष्ठों को रैंक करने के लिए करता है कि आप क्या चाहते हैं। सर्च इंजन की रैंकिंग एल्गोरिदम यह देखती है कि क्या आपका खोज शब्द पृष्ठ शीर्षक में दिखाई देता है, साथ ही यह भी कि क्या सभी शब्द एक दूसरे के बगल में दिखाई देते हैं, या किसी अन्य गणना की संख्या जो इसे बेहतर तरीके से निर्धारित करने में मदद करे कि आप कौन से पृष्ठ देखना चाहेंगे और कौन से नहीं। गूगल ने किसी खोज के लिए सबसे अधिक प्रासंगिक परिणामों को चुनने के लिए सबसे प्रसिद्ध एल्गोरिदम का आविष्कार किया, जिसके तहत यह ध्यान दिया जाता है कि दिए गए पृष्ठ से कितने अन्य वेब पेज लिंक हैं। विचार यह है कि यदि बहुत सारी वेबसाइटें सोचती हैं कि वेब पेज दिलचस्प है, तो शायद यह वही है जो आप खोज रहे हैं। इस एल्गोरिदम को पेज रैंक कहा जाता है, इसलिए नहीं कि यह वेब पेज रैंक करती है, बल्कि इसलिए कि इसका नाम इसके आविष्कारक, लैरी पेज के नाम पर रखा गया, जो गूगल के संस्थापकों में से एक है। क्योंकि वेबसाइट अक्सर आपकी विजिट पर पैसा कमाती हैं, इसलिए स्पैमर लगातार सर्च एल्गोरिदम से छेड़छाड़ के तरीके खोजते हैं, ताकि उनके पृष्ठ परिणामों में सबसे ऊपर रहें। फर्जी या अविश्वसनीय साइटों को शीर्ष पर पहुंचने से रोकने के लिए सर्च इंजन नियमित रूप से अपनी एल्गोरिदम को अपडेट करते हैं। अंत में, आपको इन पृष्ठों पर ध्यान देना है, जो अविश्वसनीय हैं, और ऐसा आप वेब एड्रेस को देखकर कर सकते हैं और सुनिश्चित कर सकते हैं कि यह विश्वसनीय स्रोत है। सर्च प्रोग्राम हमेशा एल्गोरिदम को बेहतर बनाने के लिए विकसित हो रहे हैं, जिसमें वे अपने प्रतिद्वंद्वियों की तुलना में बेहतर और तेज़ परिणाम दर्शाते हैं। आज के सर्च इंजन ऐसी जानकारी का भी उपयोग करते हैं, जो आपने स्पष्ट रूप से नहीं दी है, जिससे आपकी खोज आसान हो सके। इसलिए उदाहरण के लिए, यदि आप डॉग पार्क के बारे में खोजते हैं, तो कई सर्च इंजन आपको आसपास के सभी डॉग पार्क के परिणाम देंगे, भले ही आपने अपनी लोकेशन टाइप न की हो। आधुनिक सर्च इंजन पृष्ठ पर लिखे शब्दों से कहीं ज्यादा समझते हैं, कि उन शब्दों का क्या अर्थ है जिससे कि वो आपकी खोज के लिए सबसे अच्छा परिणाम दे पाएं। उदाहरण के लिए, यदि आप फ़ास्ट पिचर खोजते हैं, तो वह समझेगा कि आप एथलीट खोज रहे हैं। लेकिन यदि आप लार्ज पिचर खोजते हैं, तो यह आपको किचन के विकल्प प्रदान करेगा। शब्दों को बेहतर समझने के लिए, हम मशीन लर्निंग इस्तेमाल करते हैं, एक तरह की कृत्रिम बुद्धि। यह सर्च एल्गोरिदम को न केवल पृष्ठ में दिए व्यक्तिगत अक्षरों या शब्दों को खोजने में सक्षम बनाता है, बल्कि शब्दों के अंतर्निहित अर्थ को भी समझता है। इंटरनेट तेजी से बढ़ रहा है, लेकिन अगर सर्च इंजन डिजाइन करने वाली टीमें हमारे काम सही ढंग से करती हैं, तो आपको जो जानकारी चाहिए, वह बस कुछ कीस्ट्रोक्स दूर होनी चाहिए।