< Return to Video

The Internet: How Search Works

  • 0:06 - 0:07
    नमस्ते, मेरे नाम का जॉन है।
  • 0:08 - 0:10
    मैं गूगल की सर्च और मशीन लर्निंग
    टीमों का नेतृत्व करता हूं।
  • 0:12 - 0:14
    मुझे लगता है कि यह आश्चर्यजनक रूप से प्रेरणादायक
  • 0:14 - 0:16
    है कि दुनिया भर के लोग सामान्य
  • 0:16 - 0:19
    और अविश्वसनीय रूप से महत्वपूर्ण प्रश्न पूछने के लिए
  • 0:19 - 0:21
    खोज इंजन का रुख करते हैं।
  • 0:21 - 0:23
    इसलिए यह एक बड़ी जिम्मेदारी है कि हम उन्हें
  • 0:23 - 0:25
    बेहतरीन जवाब प्रदान करें।
  • 0:27 - 0:31
    नमस्ते, मेरे नाम अक्षया है और मैं बिंग सर्च टीम पर काम करती हूँ।
  • 0:31 - 0:33
    कई बार हम कृत्रिम बुद्धिमत्ता और मशीन लर्निंग
  • 0:33 - 0:36
    की ओर देखते हैं, लेकिन हमें यह पता करना
  • 0:36 - 0:39
    होगा कि उपयोगकर्ता इसका उपयोग कैसे करने जा
  • 0:39 - 0:42
    रहे हैं, क्योंकि आखिरी में हम समाज पर प्रभाव डालना चाहते हैं।
  • 0:44 - 0:45
    आइये एक सरल प्रश्न पूछते पूछता हैं।
  • 0:46 - 0:48
    मंगल तक जाने में कितना समय लगता है?
  • 0:49 - 0:51
    ये परिणाम कहां से आए और इसे दूसरे
  • 0:51 - 0:54
    से पहले क्यों सूचीबद्ध किया गया?
  • 0:56 - 0:58
    ठीक है, चलिए देखते हैं कि सर्च इंजन आपके अनुरोध को
  • 0:58 - 1:00
    परिणाम में कैसे बदलता है।
  • 1:01 - 1:03
    कुछ खोजते समय जो पहली चीज़ आपको जाननी
  • 1:03 - 1:06
    चाहिए, वह है कि सर्च इंजन वास्तव में रियल टाइम
  • 1:06 - 1:08
    में आपकी खोज को चलाने के लिए वर्ल्ड वाइड वेब पर नहीं जा रहा है।
  • 1:08 - 1:11
    और ऐसा इसलिए है क्योंकि इंटरनेट पर एक बिलियन
  • 1:11 - 1:14
    से अधिक वेबसाइटें हैं और हर एक मिनट में सैकड़ों और बनाई जा रही हैं।
  • 1:14 - 1:16
    तो यदि सर्च इंजन जो आप चाहते हैं उसकी
  • 1:16 - 1:19
    तलाश में प्रत्येक साइट खंगालेगा,
  • 1:19 - 1:20
    तो उसके लिए कुछ भी संभव नहीं होगा।
  • 1:20 - 1:22
    इसलिए आपकी खोज को तेज बनाने के लिए,
  • 1:22 - 1:25
    सर्च इंजन लगातार उन सूचनाओं को रिकॉर्ड करने के लिए वेब
  • 1:25 - 1:29
    की स्कैनिंग करता रहता है, जो बाद में आपकी खोज में मदद कर सकती है।
  • 1:29 - 1:31
    इस तरह, जब आप मंगल की यात्रा के बारे में खोजते हैं,
  • 1:32 - 1:34
    तो सर्च इंजन के पास पहले से ही वह है जो आपको रियल
  • 1:34 - 1:36
    टाइम में जवाब देने के लिए ज़रूरी है।
  • 1:36 - 1:38
    यह इस तरह काम करता है।
  • 1:38 - 1:42
    इंटरनेट पृष्ठों का एक वेब है, जो हाइपरलिंक द्वारा एक दूसरे से कनेक्ट रहते हैं।
  • 1:42 - 1:45
    सर्च इंजन लगातार स्पाइडर नामक प्रोग्राम चलाते
  • 1:45 - 1:47
    हैं जो इन वेब पेजों के माध्यम से उनके बारे में
  • 1:47 - 1:49
    जानकारी एकत्र करने के लिए गुजरता है।
  • 1:50 - 1:52
    जब भी उसे हाइपरलिंक मिलता है,
  • 1:52 - 1:55
    तो वह उसे तब तक फॉलो करता है जब तक कि वह
  • 1:55 - 1:57
    इंटरनेट पर मौजूद सभी पृष्ठों तक नहीं पहुँच जाता।
  • 1:57 - 1:59
    स्पाइडर द्वारा विजिट किये जाने वाले प्रत्येक पृष्ठ के लिए,
  • 1:59 - 2:02
    यह उस जानकारी को रिकॉर्ड करता है जिसकी इसे खोज के लिए ज़रूरत पड़
  • 2:02 - 2:06
    सकती है, इसे विशेष डाटाबेस से जोड़कर जिसे सर्च इंडेक्स कहते हैं।
  • 2:07 - 2:10
    अब, पहले की उस खोज पर वापस चलते हैं
  • 2:10 - 2:12
    और देखते हैं कि क्या हम यह पता लगा सकते
  • 2:12 - 2:13
    हैं कि सर्च इंजन परिणाम कैसे प्रदर्शित करता है।
  • 2:14 - 2:16
    जब आप पूछते हैं कि मंगल की यात्रा में कितना
  • 2:17 - 2:19
    समय लगता है, तो सर्च इंजन उन शब्दों को
  • 2:19 - 2:21
    सर्च इंडेक्स में देखता है, ताकि इंटरनेट पर
  • 2:21 - 2:24
    मौजूद उन शब्दों वाले सभी पृष्ठों की सूची तुरंत प्राप्त की जा सके।
  • 2:25 - 2:27
    लेकिन केवल इन सर्च टर्म की तलाश में लाखों
  • 2:27 - 2:29
    पृष्ठ सामने आ सकते हैं, इसलिए सर्च
  • 2:29 - 2:31
    इंजन को आपको पहले दिखाने के लिए सर्वोत्तम
  • 2:31 - 2:33
    मैच को निर्धारित करने में सक्षम होना चाहिए।
  • 2:33 - 2:36
    यहीं यह पेचीदा हो जाता है, क्योंकि सर्च इंजन को
  • 2:36 - 2:38
    यह अनुमान लगाना होता है कि आप क्या खोज रहे हैं।
  • 2:39 - 2:41
    प्रत्येक सर्च इंजन अपनी एल्गोरिदम का उपयोग इस आधार पर
  • 2:41 - 2:44
    पृष्ठों को रैंक करने के लिए करता है कि आप क्या चाहते हैं।
  • 2:45 - 2:48
    सर्च इंजन की रैंकिंग एल्गोरिदम यह देखती है कि क्या
  • 2:48 - 2:50
    आपका खोज शब्द पृष्ठ शीर्षक में दिखाई देता है, साथ
  • 2:51 - 2:54
    ही यह भी कि क्या सभी शब्द एक दूसरे के बगल में दिखाई देते हैं,
  • 2:55 - 2:57
    या किसी अन्य गणना की संख्या जो इसे बेहतर तरीके
  • 2:57 - 2:59
    से निर्धारित करने में मदद करे कि आप कौन से पृष्ठ
  • 2:59 - 3:01
    देखना चाहेंगे और कौन से नहीं।
  • 3:03 - 3:05
    गूगल ने किसी खोज के लिए सबसे अधिक प्रासंगिक
  • 3:05 - 3:09
    परिणामों को चुनने के लिए सबसे प्रसिद्ध एल्गोरिदम का आविष्कार किया,
  • 3:09 - 3:11
    जिसके तहत यह ध्यान दिया जाता है कि दिए गए पृष्ठ से कितने अन्य वेब पेज लिंक हैं।
  • 3:12 - 3:14
    विचार यह है कि यदि बहुत सारी वेबसाइटें
  • 3:14 - 3:16
    सोचती हैं कि वेब पेज दिलचस्प है,
  • 3:16 - 3:18
    तो शायद यह वही है जो आप खोज रहे हैं।
  • 3:18 - 3:20
    इस एल्गोरिदम को पेज रैंक कहा जाता है,
  • 3:21 - 3:22
    इसलिए नहीं कि यह वेब पेज रैंक करती है,
  • 3:23 - 3:25
    बल्कि इसलिए कि इसका नाम इसके आविष्कारक,
  • 3:25 - 3:27
    लैरी पेज के नाम पर रखा गया, जो गूगल के संस्थापकों में से एक है।
  • 3:28 - 3:31
    क्योंकि वेबसाइट अक्सर आपकी विजिट पर पैसा कमाती हैं,
  • 3:31 - 3:33
    इसलिए स्पैमर लगातार सर्च एल्गोरिदम से छेड़छाड़
  • 3:33 - 3:36
    के तरीके खोजते हैं, ताकि उनके पृष्ठ
  • 3:36 - 3:38
    परिणामों में सबसे ऊपर रहें।
  • 3:38 - 3:41
    फर्जी या अविश्वसनीय साइटों को शीर्ष पर पहुंचने
  • 3:41 - 3:44
    से रोकने के लिए सर्च इंजन नियमित रूप से अपनी एल्गोरिदम को अपडेट करते हैं।
  • 3:45 - 3:47
    अंत में, आपको इन पृष्ठों पर ध्यान देना है, जो अविश्वसनीय हैं,
  • 3:48 - 3:49
    और ऐसा आप वेब एड्रेस को देखकर कर सकते हैं
  • 3:50 - 3:53
    और सुनिश्चित कर सकते हैं कि यह विश्वसनीय स्रोत है।
  • 3:54 - 3:55
    सर्च प्रोग्राम हमेशा एल्गोरिदम को बेहतर बनाने
  • 3:55 - 3:58
    के लिए विकसित हो रहे हैं, जिसमें वे अपने
  • 3:59 - 4:00
    प्रतिद्वंद्वियों की तुलना में बेहतर और तेज़ परिणाम दर्शाते हैं।
  • 4:01 - 4:03
    आज के सर्च इंजन ऐसी जानकारी का भी उपयोग करते हैं, जो
  • 4:03 - 4:07
    आपने स्पष्ट रूप से नहीं दी है, जिससे आपकी खोज आसान हो सके।
  • 4:07 - 4:10
    इसलिए उदाहरण के लिए, यदि आप डॉग पार्क
  • 4:10 - 4:12
    के बारे में खोजते हैं, तो कई सर्च इंजन आपको
  • 4:12 - 4:14
    आसपास के सभी डॉग पार्क के परिणाम देंगे,
  • 4:14 - 4:16
    भले ही आपने अपनी लोकेशन टाइप न की हो।
  • 4:18 - 4:21
    आधुनिक सर्च इंजन पृष्ठ पर लिखे शब्दों से
  • 4:21 - 4:22
    कहीं ज्यादा समझते हैं, कि उन शब्दों का
  • 4:22 - 4:25
    क्या अर्थ है जिससे कि वो आपकी खोज के
  • 4:25 - 4:27
    लिए सबसे अच्छा परिणाम दे पाएं।
  • 4:27 - 4:30
    उदाहरण के लिए, यदि आप फ़ास्ट पिचर खोजते हैं,
  • 4:30 - 4:32
    तो वह समझेगा कि आप एथलीट खोज रहे हैं।
  • 4:32 - 4:34
    लेकिन यदि आप लार्ज पिचर खोजते हैं,
  • 4:34 - 4:37
    तो यह आपको किचन के विकल्प प्रदान करेगा।
  • 4:38 - 4:42
    शब्दों को बेहतर समझने के लिए, हम मशीन लर्निंग इस्तेमाल करते हैं,
  • 4:42 - 4:44
    एक तरह की कृत्रिम बुद्धि।
  • 4:44 - 4:46
    यह सर्च एल्गोरिदम को न केवल पृष्ठ में दिए व्यक्तिगत
  • 4:46 - 4:48
    अक्षरों या शब्दों को खोजने में सक्षम बनाता है,
  • 4:48 - 4:51
    बल्कि शब्दों के अंतर्निहित अर्थ को भी समझता है।
  • 4:54 - 4:56
    इंटरनेट तेजी से बढ़ रहा है, लेकिन अगर सर्च इंजन डिजाइन करने वाली टीमें हमारे काम सही ढंग से करती हैं,
  • 4:56 - 5:00
    तो आपको जो जानकारी चाहिए,
  • 5:00 - 5:04
    वह बस कुछ कीस्ट्रोक्स दूर होनी चाहिए।
Title:
The Internet: How Search Works
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How Internet Works
Duration:
05:13

Hindi subtitles

Revisions