WEBVTT 00:00:06.070 --> 00:00:07.120 हाय, माझं नाव जॉन. 00:00:07.510 --> 00:00:10.140 मी गुगलमध्ये सर्च आणि मशीन लर्निंग टीम्सचा प्रमुख आहे. 00:00:12.130 --> 00:00:14.230 मला वाटतं 00:00:14.230 --> 00:00:16.214 सगळ्या जगातले लोक साधे-सोपे प्रश्न विचारण्यासाठी आणि खूप महत्त्वाचे 00:00:16.215 --> 00:00:19.160 प्रश्न विचारण्यासाठी सर्च इंजिनकडे वळतात, 00:00:19.160 --> 00:00:20.930 हे खूप प्रेरणादायी आहे. 00:00:20.930 --> 00:00:23.450 त्यामुळं आपल्याला शक्य आहेत तितकी 00:00:23.450 --> 00:00:24.864 सर्वोत्तम उत्तरं त्यांना देणं ही मोठी जबाबदारी आहे. 00:00:26.710 --> 00:00:30.610 हाय, माझं नाव अक्षया आहे आणि मी बिंग सर्च टीममध्ये काम करते. 00:00:30.910 --> 00:00:33.190 अनेकदा आम्ही कृत्रिम बुद्धिमत्तेचा आणि मशीन 00:00:33.190 --> 00:00:35.800 लर्निंगचा अभ्यास करतो, 00:00:35.830 --> 00:00:39.010 पण युजर्स याचा वापर कसा करतील, याचा विचार आम्हाला करावा लागतो, 00:00:39.140 --> 00:00:42.390 कारण शेवटी आपल्याला समाजावर प्रभाव टाकायचा असतो. 00:00:43.780 --> 00:00:45.400 एक साधा प्रश्न विचारूया. 00:00:45.820 --> 00:00:48.070 मंगळापर्यंत प्रवास करण्यासाठी किती वेळ लागतो? 00:00:49.330 --> 00:00:50.950 हे निकाल कुठून आले आणि 00:00:51.370 --> 00:00:54.100 हा इतर निकालांच्या आधी यादीत का आला? 00:00:55.700 --> 00:00:58.150 ठीक आहे, जरा बघूया की सर्च इंजिननं तुमच्या विनंतीचं 00:00:58.150 --> 00:00:59.860 निकालात कसं रूपांतर केलं. 00:01:00.690 --> 00:01:03.360 तुम्हाला एक गोष्ट पहिल्यांदा माहिती पाहिजे की जेव्हा तुम्ही सर्च करता तेव्हा 00:01:03.430 --> 00:01:06.480 प्रत्यक्षात सर्च इंजिन वर्ल्ड वाईड वेबकडे जाऊन तुमचा शोध 00:01:06.480 --> 00:01:08.010 त्यावेळी रन करत नाही. 00:01:08.140 --> 00:01:10.610 आणि त्याचं कारण म्हणजे इंटरनेटवर कोट्यावधी वेबसाईट्स आहेत आणि 00:01:10.610 --> 00:01:14.140 दर मिनिटाला नवीन शेकडो वेबसाईट्स तयार होत आहेत. 00:01:14.140 --> 00:01:16.210 त्यामुळं जर सर्च इंजिनला 00:01:16.240 --> 00:01:18.690 तुम्हाला जे हवंय ते शोधण्यासाठी प्रत्येक साईटवर जावं लागलं 00:01:18.690 --> 00:01:20.120 तर त्याला अनंत काळ लागेल. 00:01:20.500 --> 00:01:21.940 त्यामुळं हा शोध अधिक जलद करण्यासाठी, 00:01:21.970 --> 00:01:24.940 सर्च इंजिन्स वेबवर सतत आधीच स्कॅनिंग करत असतात. 00:01:25.420 --> 00:01:28.560 तुम्ही नंतर सर्च केल्यावर मदत करण्यासाठी आधीच माहिती नोंदवून ठेवत असतात. 00:01:28.930 --> 00:01:31.270 अशाप्रकारे, जेव्हा तुम्ही मंगळापर्यंतच्या प्रवासाबद्दल सर्च करता, 00:01:31.630 --> 00:01:33.700 तेव्हा सर्च इंजिनकडं तुम्हाला त्याचवेळी माहिती देण्यासाठी आवश्यक 00:01:33.700 --> 00:01:35.728 गोष्टी आधीच असतात. 00:01:36.250 --> 00:01:37.540 हे कसं काम करतं ते पाहूया. 00:01:37.900 --> 00:01:42.010 इंटरनेट म्हणजे एकमेकांना हायपरलिंकनं जोडलेल्या पानांचं जाळं आहे. 00:01:42.400 --> 00:01:44.680 सर्च इंजिन्स सातत्यानं एक प्रोग्रॅम रन करत असतात 00:01:44.680 --> 00:01:47.380 त्याला स्पायडर असं म्हणतात, तो सगळ्या वेब पेजेसना भेट देऊन 00:01:47.380 --> 00:01:49.040 त्यांच्याबद्दलची माहिती गोळा करतो. 00:01:49.780 --> 00:01:51.550 प्रत्येकवेळी त्याला हायपरलिंक मिळाली की, 00:01:52.090 --> 00:01:55.000 तो इंटरनेटवर सापडणाऱ्या प्रत्येक पेजला भेट दिली 00:01:55.030 --> 00:01:57.240 जाईपर्यंत तिचं अनुसरण करतो. 00:01:57.335 --> 00:01:59.170 स्पायडर भेट देत असलेल्या प्रत्येक पेजसाठी, 00:01:59.200 --> 00:02:02.320 तो त्याला सर्चसाठी आवश्यक असेल अशी कोणतीही माहिती सर्च इंडेक्स 00:02:02.500 --> 00:02:05.650 नावाच्या एका खास डेटाबेसमध्ये नोंदवून ठेवतो. 00:02:07.166 --> 00:02:09.530 आता, आपण पुन्हा आधीच्या सर्चकडं जाऊया 00:02:09.590 --> 00:02:11.990 आणि सर्च इंजिनला या शोधाचा निकाल 00:02:11.990 --> 00:02:13.333 कसा सापडला, ते शोधूया. 00:02:13.640 --> 00:02:16.460 जेव्हा तुम्ही मंगळापर्यंत प्रवास करण्यासाठी किती वेळ लागतो असं विचारता, 00:02:16.640 --> 00:02:18.860 तेव्हा सर्च इंजिन हे शब्द सर्च इंडेक्समध्ये 00:02:18.920 --> 00:02:21.410 शोधतं आणि ताबडतोब इंटरनेटवरच्या ज्या पानांवर हे शब्द आहेत 00:02:21.410 --> 00:02:24.500 त्यांची यादी आणतं. 00:02:24.890 --> 00:02:26.870 पण फक्त हे सर्च केलेले शब्द शोधले तर 00:02:26.870 --> 00:02:28.760 कोट्यावधी पानं येतील, 00:02:28.760 --> 00:02:31.110 त्यामुळं तुम्हाला आधी दाखवण्यासाठी सर्वांत चांगली जुळणारी 00:02:31.110 --> 00:02:33.120 पानं कुठली आहेत, हे सर्च इंजिनला ठरवता येणं आवश्यक असतं. 00:02:33.340 --> 00:02:36.010 इथं हे थोडं अवघड होतं कारण सर्च इंजिनला 00:02:36.010 --> 00:02:38.040 तुम्ही काय शोधत आहात त्याचा अंदाज करणं आवश्यक असतं. 00:02:38.930 --> 00:02:41.360 प्रत्येक सर्च इंजिन त्याचा स्वत:चा अल्गोरिदम 00:02:41.360 --> 00:02:44.230 वापरून तुम्हाला काय हवं आहे याचा विचार करून त्यानुसार या पानांची क्रमवारी लावतं. 00:02:44.930 --> 00:02:47.660 सर्च इंजिनचा हा रँक अल्गोरिदम 00:02:47.990 --> 00:02:50.360 तुम्ही शोधलेला शब्दसमूह पानाच्या शीर्षकात आहे का, ते पाहू शकतं, 00:02:50.900 --> 00:02:53.820 किंवा सगळे शब्द एकमेकांजवळ आहेत का ते पाहू शकतं, 00:02:54.520 --> 00:02:57.020 किंवा इतर असंख्य कॅलक्युलेशन्स करतं 00:02:57.020 --> 00:02:58.610 त्यामुळं त्याला तुम्हाला पहायची असलेली 00:02:58.670 --> 00:03:01.420 आणि पहायची नसलेली पानं ठरवायला मदत होते. 00:03:02.960 --> 00:03:04.960 गुगलनं सर्वांत सुयोग्य निकाल शोधण्यासाठी 00:03:04.960 --> 00:03:08.530 सर्वांत प्रसिद्ध अल्गोरिदम शोधला आहे. दिलेल्या पानाला इतर किती वेब पेजेस जोडलेली 00:03:08.560 --> 00:03:11.230 आहेत, ते यात विचारात घेतलं जातं. 00:03:11.830 --> 00:03:14.140 यामागची कल्पना अशी आहे की खूप वेबसाईट्सना हे 00:03:14.140 --> 00:03:15.660 वेबपेज रंजक आहे, असं वाटत असेल तर, 00:03:15.660 --> 00:03:17.940 ते कदाचित तुम्ही शोधत असलेलं पान असेल. 00:03:18.190 --> 00:03:20.020 या अल्गोरिदमला पेज रँक असं म्हणतात. 00:03:20.590 --> 00:03:22.330 तो वेब पेजेसना रँकिंग देतो म्हणून नव्हे, 00:03:22.570 --> 00:03:25.210 तर त्याचा संशोधक लॅरी पेजवरून हे नाव दिलं आहे. 00:03:25.480 --> 00:03:27.333 तो गुगलच्या संस्थापकांपैकी एक आहे. 00:03:27.940 --> 00:03:30.520 जेव्हा तुम्ही एखाद्या वेबसाईटला भेट देता, तेव्हा ती बऱ्याचदा पैसे कमवत असल्यामुळं, 00:03:30.820 --> 00:03:32.950 स्पॅमर्स नेहमी सर्च अल्गोरिदमला 00:03:32.950 --> 00:03:35.741 फसवण्याचे मार्ग शोधत असतात. त्यांची पाने 00:03:35.742 --> 00:03:37.931 निकालात जास्त वर दिसावीत म्हणून. 00:03:38.260 --> 00:03:40.750 खोटया किंवा अविश्वासार्ह साईट्स सर्वांत वर दिसू नयेत म्हणून सर्च इंजिन्स त्यांचे 00:03:40.750 --> 00:03:44.296 अल्गोरिदम नियमितपणे अद्ययावत करत असतात. 00:03:44.680 --> 00:03:47.350 शेवटी, अविश्वासार्ह पानांवर लक्ष ठेवणं 00:03:47.500 --> 00:03:49.450 तुमचंच काम आहे. तुम्ही वेब अॅड्रेस पाहून 00:03:49.690 --> 00:03:52.990 हा स्रोत विश्वासार्ह आहे, हे सुनिश्चित करू शकता. 00:03:53.680 --> 00:03:55.390 अल्गोरिदम्सनी अधिक चांगले निकाल आणावेत, आणि 00:03:55.420 --> 00:03:58.420 ते निकाल प्रतिस्पर्ध्यांपेक्षा जास्त जलद आणावेत 00:03:58.540 --> 00:04:00.460 म्हणून सर्च प्रोग्रॅम्स नेहमी सुधारले जात असतात. 00:04:01.000 --> 00:04:03.100 तुमचा शोध अजून विशिष्ट करण्यासाठी 00:04:03.100 --> 00:04:06.820 हल्लीची सर्च इंजिन्स तुम्ही स्पष्टपणे न दिलेली माहितीसुद्धा वापरतात. 00:04:07.150 --> 00:04:10.120 उदा. जर तुम्ही कुत्र्यांच्या उद्यानांसाठी सर्च केलात तर 00:04:10.240 --> 00:04:12.190 अनेक सर्च इंजिन्स तुम्हाला 00:04:12.190 --> 00:04:13.840 तुमच्या जवळच्या सगळ्या कुत्र्यांच्या उद्यानांबद्दलचे शोध निकाल दाखवतील, 00:04:14.080 --> 00:04:16.260 तुम्ही तुमचे ठिकाण टाईप केलेले नसले तरीही. 00:04:17.800 --> 00:04:20.530 आधुनिक सर्च इंजिन्सना पानांवरील शब्दांव्यतिरिक्तसुद्धा 00:04:20.530 --> 00:04:22.060 अनेक जास्त गोष्टी समजतात. 00:04:22.300 --> 00:04:24.970 तुम्ही शोधत असलेल्या गोष्टीसाठी 00:04:24.970 --> 00:04:26.750 सगळ्यात जुळणारे निकाल आणण्यासाठी त्यांना या शब्दांचा अर्थही कळतो. 00:04:27.130 --> 00:04:29.980 उदा. जर तुम्ही वेगवान पिचर असे सर्च केलेत तर 00:04:30.280 --> 00:04:32.300 त्याला तुम्ही खेळाडू शोधत आहात हे कळेल. 00:04:32.500 --> 00:04:34.450 पण तुम्ही मोठा पिचर असे सर्च केलेत तर 00:04:34.450 --> 00:04:36.730 तो तुम्हाला तुमच्या स्वयंपाकघरासाठीचे पर्याय दाखवेल. 00:04:38.420 --> 00:04:41.910 शब्द अधिक चांगले समजून घेण्यासाठी, आम्ही मशीन लर्निंग, हा कृत्रिम बुद्धिमत्तेचा 00:04:41.910 --> 00:04:43.985 प्रकार वापरतो. 00:04:43.985 --> 00:04:46.050 त्यामुळं अल्गोरिदम्सना त्या पानामध्ये केवळ सुट्टी अक्षरे किंवा 00:04:46.090 --> 00:04:48.400 सुट्टे शब्द शोधण्याची क्षमताच नव्हे तर 00:04:48.400 --> 00:04:51.280 त्यांचा अर्थसुद्धा कळण्याची क्षमता येते. 00:04:53.690 --> 00:04:55.850 इंटरनेटची घातांकीय वाढ होते आहे, 00:04:56.210 --> 00:04:59.810 पण सर्च इंजिन डिझाईन करणाऱ्या टीम्स आपले काम व्यवस्थित करत आहेत, 00:05:00.080 --> 00:05:04.090 तुम्हाला हवी असलेली माहिती काही कीज दाबायचा अवकाश की लगेच हजर आहे.