0:00:06.070,0:00:07.120 नमस्ते, मेरे नाम का जॉन है। 0:00:07.510,0:00:10.140 मैं गूगल की सर्च और मशीन लर्निंग [br]टीमों का नेतृत्व करता हूं। 0:00:12.130,0:00:14.230 मुझे लगता है कि यह आश्चर्यजनक रूप से प्रेरणादायक 0:00:14.230,0:00:16.214 है कि दुनिया भर के लोग सामान्य 0:00:16.215,0:00:19.160 और अविश्वसनीय रूप से महत्वपूर्ण प्रश्न पूछने के लिए 0:00:19.160,0:00:20.930 खोज इंजन का रुख करते हैं। 0:00:20.930,0:00:23.450 इसलिए यह एक बड़ी जिम्मेदारी है कि हम उन्हें 0:00:23.450,0:00:24.864 बेहतरीन जवाब प्रदान करें। 0:00:26.710,0:00:30.610 नमस्ते, मेरे नाम अक्षया है और मैं बिंग सर्च टीम पर काम करती हूँ। 0:00:30.910,0:00:33.190 कई बार हम कृत्रिम बुद्धिमत्ता और मशीन लर्निंग 0:00:33.190,0:00:35.800 की ओर देखते हैं, लेकिन हमें यह पता करना 0:00:35.830,0:00:39.010 होगा कि उपयोगकर्ता इसका उपयोग कैसे करने जा 0:00:39.140,0:00:42.390 रहे हैं, क्योंकि आखिरी में हम समाज पर प्रभाव डालना चाहते हैं। 0:00:43.780,0:00:45.400 आइये एक सरल प्रश्न पूछते पूछता हैं। 0:00:45.820,0:00:48.070 मंगल तक जाने में कितना समय लगता है? 0:00:49.330,0:00:50.950 ये परिणाम कहां से आए और इसे दूसरे 0:00:51.370,0:00:54.100 से पहले क्यों सूचीबद्ध किया गया? 0:00:55.700,0:00:58.150 ठीक है, चलिए देखते हैं कि सर्च इंजन आपके अनुरोध को 0:00:58.150,0:00:59.860 परिणाम में कैसे बदलता है। 0:01:00.690,0:01:03.360 कुछ खोजते समय जो पहली चीज़ आपको जाननी 0:01:03.430,0:01:06.480 चाहिए, वह है कि सर्च इंजन वास्तव में रियल टाइम 0:01:06.480,0:01:08.010 में आपकी खोज को चलाने के लिए वर्ल्ड वाइड वेब पर नहीं जा रहा है। 0:01:08.140,0:01:10.610 और ऐसा इसलिए है क्योंकि इंटरनेट पर एक बिलियन 0:01:10.610,0:01:14.140 से अधिक वेबसाइटें हैं और हर एक मिनट में सैकड़ों और बनाई जा रही हैं। 0:01:14.140,0:01:16.210 तो यदि सर्च इंजन जो आप चाहते हैं उसकी 0:01:16.240,0:01:18.690 तलाश में प्रत्येक साइट खंगालेगा, 0:01:18.690,0:01:20.120 तो उसके लिए कुछ भी संभव नहीं होगा। 0:01:20.500,0:01:21.940 इसलिए आपकी खोज को तेज बनाने के लिए, 0:01:21.970,0:01:24.940 सर्च इंजन लगातार उन सूचनाओं को रिकॉर्ड करने के लिए वेब 0:01:25.420,0:01:28.560 की स्कैनिंग करता रहता है, जो बाद में आपकी खोज में मदद कर सकती है। 0:01:28.930,0:01:31.270 इस तरह, जब आप मंगल की यात्रा के बारे में खोजते हैं, 0:01:31.630,0:01:33.700 तो सर्च इंजन के पास पहले से ही वह है जो आपको रियल 0:01:33.700,0:01:35.728 टाइम में जवाब देने के लिए ज़रूरी है। 0:01:36.250,0:01:37.540 यह इस तरह काम करता है। 0:01:37.900,0:01:42.010 इंटरनेट पृष्ठों का एक वेब है, जो हाइपरलिंक द्वारा एक दूसरे से कनेक्ट रहते हैं। 0:01:42.400,0:01:44.680 सर्च इंजन लगातार स्पाइडर नामक प्रोग्राम चलाते 0:01:44.680,0:01:47.380 हैं जो इन वेब पेजों के माध्यम से उनके बारे में 0:01:47.380,0:01:49.040 जानकारी एकत्र करने के लिए गुजरता है। 0:01:49.780,0:01:51.550 जब भी उसे हाइपरलिंक मिलता है, 0:01:52.090,0:01:55.000 तो वह उसे तब तक फॉलो करता है जब तक कि वह 0:01:55.030,0:01:57.240 इंटरनेट पर मौजूद सभी पृष्ठों तक नहीं पहुँच जाता। 0:01:57.335,0:01:59.170 स्पाइडर द्वारा विजिट किये जाने वाले प्रत्येक पृष्ठ के लिए, 0:01:59.200,0:02:02.320 यह उस जानकारी को रिकॉर्ड करता है जिसकी इसे खोज के लिए ज़रूरत पड़ 0:02:02.500,0:02:05.650 सकती है, इसे विशेष डाटाबेस से जोड़कर जिसे सर्च इंडेक्स कहते हैं। 0:02:07.166,0:02:09.530 अब, पहले की उस खोज पर वापस चलते हैं 0:02:09.590,0:02:11.990 और देखते हैं कि क्या हम यह पता लगा सकते 0:02:11.990,0:02:13.333 हैं कि सर्च इंजन परिणाम कैसे प्रदर्शित करता है। 0:02:13.640,0:02:16.460 जब आप पूछते हैं कि मंगल की यात्रा में कितना 0:02:16.640,0:02:18.860 समय लगता है, तो सर्च इंजन उन शब्दों को 0:02:18.920,0:02:21.410 सर्च इंडेक्स में देखता है, ताकि इंटरनेट पर 0:02:21.410,0:02:24.500 मौजूद उन शब्दों वाले सभी पृष्ठों की सूची तुरंत प्राप्त की जा सके। 0:02:24.890,0:02:26.870 लेकिन केवल इन सर्च टर्म की तलाश में लाखों 0:02:26.870,0:02:28.760 पृष्ठ सामने आ सकते हैं, इसलिए सर्च 0:02:28.760,0:02:31.110 इंजन को आपको पहले दिखाने के लिए सर्वोत्तम 0:02:31.110,0:02:33.120 मैच को निर्धारित करने में सक्षम होना चाहिए। 0:02:33.340,0:02:36.010 यहीं यह पेचीदा हो जाता है, क्योंकि सर्च इंजन को 0:02:36.010,0:02:38.040 यह अनुमान लगाना होता है कि आप क्या खोज रहे हैं। 0:02:38.930,0:02:41.360 प्रत्येक सर्च इंजन अपनी एल्गोरिदम का उपयोग इस आधार पर 0:02:41.360,0:02:44.230 पृष्ठों को रैंक करने के लिए करता है कि आप क्या चाहते हैं। 0:02:44.930,0:02:47.660 सर्च इंजन की रैंकिंग एल्गोरिदम यह देखती है कि क्या 0:02:47.990,0:02:50.360 आपका खोज शब्द पृष्ठ शीर्षक में दिखाई देता है, साथ 0:02:50.900,0:02:53.820 ही यह भी कि क्या सभी शब्द एक दूसरे के बगल में दिखाई देते हैं, 0:02:54.520,0:02:57.020 या किसी अन्य गणना की संख्या जो इसे बेहतर तरीके 0:02:57.020,0:02:58.610 से निर्धारित करने में मदद करे कि आप कौन से पृष्ठ 0:02:58.670,0:03:01.420 देखना चाहेंगे और कौन से नहीं। 0:03:02.960,0:03:04.960 गूगल ने किसी खोज के लिए सबसे अधिक प्रासंगिक 0:03:04.960,0:03:08.530 परिणामों को चुनने के लिए सबसे प्रसिद्ध एल्गोरिदम का आविष्कार किया, 0:03:08.560,0:03:11.230 जिसके तहत यह ध्यान दिया जाता है कि दिए गए पृष्ठ से कितने अन्य वेब पेज लिंक हैं। 0:03:11.830,0:03:14.140 विचार यह है कि यदि बहुत सारी वेबसाइटें 0:03:14.140,0:03:15.660 सोचती हैं कि वेब पेज दिलचस्प है, 0:03:15.660,0:03:17.940 तो शायद यह वही है जो आप खोज रहे हैं। 0:03:18.190,0:03:20.020 इस एल्गोरिदम को पेज रैंक कहा जाता है, 0:03:20.590,0:03:22.330 इसलिए नहीं कि यह वेब पेज रैंक करती है, 0:03:22.570,0:03:25.210 बल्कि इसलिए कि इसका नाम इसके आविष्कारक, 0:03:25.480,0:03:27.333 लैरी पेज के नाम पर रखा गया, जो गूगल के संस्थापकों में से एक है। 0:03:27.940,0:03:30.520 क्योंकि वेबसाइट अक्सर आपकी विजिट पर पैसा कमाती हैं, 0:03:30.820,0:03:32.950 इसलिए स्पैमर लगातार सर्च एल्गोरिदम से छेड़छाड़ 0:03:32.950,0:03:35.741 के तरीके खोजते हैं, ताकि उनके पृष्ठ 0:03:35.742,0:03:37.931 परिणामों में सबसे ऊपर रहें। 0:03:38.260,0:03:40.750 फर्जी या अविश्वसनीय साइटों को शीर्ष पर पहुंचने 0:03:40.750,0:03:44.296 से रोकने के लिए सर्च इंजन नियमित रूप से अपनी एल्गोरिदम को अपडेट करते हैं। 0:03:44.680,0:03:47.350 अंत में, आपको इन पृष्ठों पर ध्यान देना है, जो अविश्वसनीय हैं, 0:03:47.500,0:03:49.450 और ऐसा आप वेब एड्रेस को देखकर कर सकते हैं 0:03:49.690,0:03:52.990 और सुनिश्चित कर सकते हैं कि यह विश्वसनीय स्रोत है। 0:03:53.680,0:03:55.390 सर्च प्रोग्राम हमेशा एल्गोरिदम को बेहतर बनाने 0:03:55.420,0:03:58.420 के लिए विकसित हो रहे हैं, जिसमें वे अपने 0:03:58.540,0:04:00.460 प्रतिद्वंद्वियों की तुलना में बेहतर और तेज़ परिणाम दर्शाते हैं। 0:04:01.000,0:04:03.100 आज के सर्च इंजन ऐसी जानकारी का भी उपयोग करते हैं, जो 0:04:03.100,0:04:06.820 आपने स्पष्ट रूप से नहीं दी है, जिससे आपकी खोज आसान हो सके। 0:04:07.150,0:04:10.120 इसलिए उदाहरण के लिए, यदि आप डॉग पार्क 0:04:10.240,0:04:12.190 के बारे में खोजते हैं, तो कई सर्च इंजन आपको 0:04:12.190,0:04:13.840 आसपास के सभी डॉग पार्क के परिणाम देंगे, 0:04:14.080,0:04:16.260 भले ही आपने अपनी लोकेशन टाइप न की हो। 0:04:17.800,0:04:20.530 आधुनिक सर्च इंजन पृष्ठ पर लिखे शब्दों से 0:04:20.530,0:04:22.060 कहीं ज्यादा समझते हैं, कि उन शब्दों का 0:04:22.300,0:04:24.970 क्या अर्थ है जिससे कि वो आपकी खोज के 0:04:24.970,0:04:26.750 लिए सबसे अच्छा परिणाम दे पाएं। 0:04:27.130,0:04:29.980 उदाहरण के लिए, यदि आप फ़ास्ट पिचर खोजते हैं, 0:04:30.280,0:04:32.300 तो वह समझेगा कि आप एथलीट खोज रहे हैं। 0:04:32.500,0:04:34.450 लेकिन यदि आप लार्ज पिचर खोजते हैं, 0:04:34.450,0:04:36.730 तो यह आपको किचन के विकल्प प्रदान करेगा। 0:04:38.420,0:04:41.910 शब्दों को बेहतर समझने के लिए, हम मशीन लर्निंग इस्तेमाल करते हैं, 0:04:41.910,0:04:43.985 एक तरह की कृत्रिम बुद्धि। 0:04:43.985,0:04:46.050 यह सर्च एल्गोरिदम को न केवल पृष्ठ में दिए व्यक्तिगत 0:04:46.090,0:04:48.400 अक्षरों या शब्दों को खोजने में सक्षम बनाता है, 0:04:48.400,0:04:51.280 बल्कि शब्दों के अंतर्निहित अर्थ को भी समझता है। 0:04:53.690,0:04:55.850 इंटरनेट तेजी से बढ़ रहा है, लेकिन अगर सर्च इंजन डिजाइन करने वाली टीमें हमारे काम सही ढंग से करती हैं, 0:04:56.210,0:04:59.810 तो आपको जो जानकारी चाहिए, 0:05:00.080,0:05:04.090 वह बस कुछ कीस्ट्रोक्स दूर होनी चाहिए।