-
नमस्ते, मेरे नाम का जॉन है।
-
मैं गूगल की सर्च और मशीन लर्निंग
टीमों का नेतृत्व करता हूं।
-
मुझे लगता है कि यह आश्चर्यजनक रूप से प्रेरणादायक
-
है कि दुनिया भर के लोग सामान्य
-
और अविश्वसनीय रूप से महत्वपूर्ण प्रश्न पूछने के लिए
-
खोज इंजन का रुख करते हैं।
-
इसलिए यह एक बड़ी जिम्मेदारी है कि हम उन्हें
-
बेहतरीन जवाब प्रदान करें।
-
नमस्ते, मेरे नाम अक्षया है और मैं बिंग सर्च टीम पर काम करती हूँ।
-
कई बार हम कृत्रिम बुद्धिमत्ता और मशीन लर्निंग
-
की ओर देखते हैं, लेकिन हमें यह पता करना
-
होगा कि उपयोगकर्ता इसका उपयोग कैसे करने जा
-
रहे हैं, क्योंकि आखिरी में हम समाज पर प्रभाव डालना चाहते हैं।
-
आइये एक सरल प्रश्न पूछते पूछता हैं।
-
मंगल तक जाने में कितना समय लगता है?
-
ये परिणाम कहां से आए और इसे दूसरे
-
से पहले क्यों सूचीबद्ध किया गया?
-
ठीक है, चलिए देखते हैं कि सर्च इंजन आपके अनुरोध को
-
परिणाम में कैसे बदलता है।
-
कुछ खोजते समय जो पहली चीज़ आपको जाननी
-
चाहिए, वह है कि सर्च इंजन वास्तव में रियल टाइम
-
में आपकी खोज को चलाने के लिए वर्ल्ड वाइड वेब पर नहीं जा रहा है।
-
और ऐसा इसलिए है क्योंकि इंटरनेट पर एक बिलियन
-
से अधिक वेबसाइटें हैं और हर एक मिनट में सैकड़ों और बनाई जा रही हैं।
-
तो यदि सर्च इंजन जो आप चाहते हैं उसकी
-
तलाश में प्रत्येक साइट खंगालेगा,
-
तो उसके लिए कुछ भी संभव नहीं होगा।
-
इसलिए आपकी खोज को तेज बनाने के लिए,
-
सर्च इंजन लगातार उन सूचनाओं को रिकॉर्ड करने के लिए वेब
-
की स्कैनिंग करता रहता है, जो बाद में आपकी खोज में मदद कर सकती है।
-
इस तरह, जब आप मंगल की यात्रा के बारे में खोजते हैं,
-
तो सर्च इंजन के पास पहले से ही वह है जो आपको रियल
-
टाइम में जवाब देने के लिए ज़रूरी है।
-
यह इस तरह काम करता है।
-
इंटरनेट पृष्ठों का एक वेब है, जो हाइपरलिंक द्वारा एक दूसरे से कनेक्ट रहते हैं।
-
सर्च इंजन लगातार स्पाइडर नामक प्रोग्राम चलाते
-
हैं जो इन वेब पेजों के माध्यम से उनके बारे में
-
जानकारी एकत्र करने के लिए गुजरता है।
-
जब भी उसे हाइपरलिंक मिलता है,
-
तो वह उसे तब तक फॉलो करता है जब तक कि वह
-
इंटरनेट पर मौजूद सभी पृष्ठों तक नहीं पहुँच जाता।
-
स्पाइडर द्वारा विजिट किये जाने वाले प्रत्येक पृष्ठ के लिए,
-
यह उस जानकारी को रिकॉर्ड करता है जिसकी इसे खोज के लिए ज़रूरत पड़
-
सकती है, इसे विशेष डाटाबेस से जोड़कर जिसे सर्च इंडेक्स कहते हैं।
-
अब, पहले की उस खोज पर वापस चलते हैं
-
और देखते हैं कि क्या हम यह पता लगा सकते
-
हैं कि सर्च इंजन परिणाम कैसे प्रदर्शित करता है।
-
जब आप पूछते हैं कि मंगल की यात्रा में कितना
-
समय लगता है, तो सर्च इंजन उन शब्दों को
-
सर्च इंडेक्स में देखता है, ताकि इंटरनेट पर
-
मौजूद उन शब्दों वाले सभी पृष्ठों की सूची तुरंत प्राप्त की जा सके।
-
लेकिन केवल इन सर्च टर्म की तलाश में लाखों
-
पृष्ठ सामने आ सकते हैं, इसलिए सर्च
-
इंजन को आपको पहले दिखाने के लिए सर्वोत्तम
-
मैच को निर्धारित करने में सक्षम होना चाहिए।
-
यहीं यह पेचीदा हो जाता है, क्योंकि सर्च इंजन को
-
यह अनुमान लगाना होता है कि आप क्या खोज रहे हैं।
-
प्रत्येक सर्च इंजन अपनी एल्गोरिदम का उपयोग इस आधार पर
-
पृष्ठों को रैंक करने के लिए करता है कि आप क्या चाहते हैं।
-
सर्च इंजन की रैंकिंग एल्गोरिदम यह देखती है कि क्या
-
आपका खोज शब्द पृष्ठ शीर्षक में दिखाई देता है, साथ
-
ही यह भी कि क्या सभी शब्द एक दूसरे के बगल में दिखाई देते हैं,
-
या किसी अन्य गणना की संख्या जो इसे बेहतर तरीके
-
से निर्धारित करने में मदद करे कि आप कौन से पृष्ठ
-
देखना चाहेंगे और कौन से नहीं।
-
गूगल ने किसी खोज के लिए सबसे अधिक प्रासंगिक
-
परिणामों को चुनने के लिए सबसे प्रसिद्ध एल्गोरिदम का आविष्कार किया,
-
जिसके तहत यह ध्यान दिया जाता है कि दिए गए पृष्ठ से कितने अन्य वेब पेज लिंक हैं।
-
विचार यह है कि यदि बहुत सारी वेबसाइटें
-
सोचती हैं कि वेब पेज दिलचस्प है,
-
तो शायद यह वही है जो आप खोज रहे हैं।
-
इस एल्गोरिदम को पेज रैंक कहा जाता है,
-
इसलिए नहीं कि यह वेब पेज रैंक करती है,
-
बल्कि इसलिए कि इसका नाम इसके आविष्कारक,
-
लैरी पेज के नाम पर रखा गया, जो गूगल के संस्थापकों में से एक है।
-
क्योंकि वेबसाइट अक्सर आपकी विजिट पर पैसा कमाती हैं,
-
इसलिए स्पैमर लगातार सर्च एल्गोरिदम से छेड़छाड़
-
के तरीके खोजते हैं, ताकि उनके पृष्ठ
-
परिणामों में सबसे ऊपर रहें।
-
फर्जी या अविश्वसनीय साइटों को शीर्ष पर पहुंचने
-
से रोकने के लिए सर्च इंजन नियमित रूप से अपनी एल्गोरिदम को अपडेट करते हैं।
-
अंत में, आपको इन पृष्ठों पर ध्यान देना है, जो अविश्वसनीय हैं,
-
और ऐसा आप वेब एड्रेस को देखकर कर सकते हैं
-
और सुनिश्चित कर सकते हैं कि यह विश्वसनीय स्रोत है।
-
सर्च प्रोग्राम हमेशा एल्गोरिदम को बेहतर बनाने
-
के लिए विकसित हो रहे हैं, जिसमें वे अपने
-
प्रतिद्वंद्वियों की तुलना में बेहतर और तेज़ परिणाम दर्शाते हैं।
-
आज के सर्च इंजन ऐसी जानकारी का भी उपयोग करते हैं, जो
-
आपने स्पष्ट रूप से नहीं दी है, जिससे आपकी खोज आसान हो सके।
-
इसलिए उदाहरण के लिए, यदि आप डॉग पार्क
-
के बारे में खोजते हैं, तो कई सर्च इंजन आपको
-
आसपास के सभी डॉग पार्क के परिणाम देंगे,
-
भले ही आपने अपनी लोकेशन टाइप न की हो।
-
आधुनिक सर्च इंजन पृष्ठ पर लिखे शब्दों से
-
कहीं ज्यादा समझते हैं, कि उन शब्दों का
-
क्या अर्थ है जिससे कि वो आपकी खोज के
-
लिए सबसे अच्छा परिणाम दे पाएं।
-
उदाहरण के लिए, यदि आप फ़ास्ट पिचर खोजते हैं,
-
तो वह समझेगा कि आप एथलीट खोज रहे हैं।
-
लेकिन यदि आप लार्ज पिचर खोजते हैं,
-
तो यह आपको किचन के विकल्प प्रदान करेगा।
-
शब्दों को बेहतर समझने के लिए, हम मशीन लर्निंग इस्तेमाल करते हैं,
-
एक तरह की कृत्रिम बुद्धि।
-
यह सर्च एल्गोरिदम को न केवल पृष्ठ में दिए व्यक्तिगत
-
अक्षरों या शब्दों को खोजने में सक्षम बनाता है,
-
बल्कि शब्दों के अंतर्निहित अर्थ को भी समझता है।
-
इंटरनेट तेजी से बढ़ रहा है, लेकिन अगर सर्च इंजन डिजाइन करने वाली टीमें हमारे काम सही ढंग से करती हैं,
-
तो आपको जो जानकारी चाहिए,
-
वह बस कुछ कीस्ट्रोक्स दूर होनी चाहिए।