1 00:00:06,070 --> 00:00:07,120 हाय, माझं नाव जॉन. 2 00:00:07,510 --> 00:00:10,140 मी गुगलमध्ये सर्च आणि मशीन लर्निंग टीम्सचा प्रमुख आहे. 3 00:00:12,130 --> 00:00:14,230 मला वाटतं 4 00:00:14,230 --> 00:00:16,214 सगळ्या जगातले लोक साधे-सोपे प्रश्न विचारण्यासाठी आणि खूप महत्त्वाचे 5 00:00:16,215 --> 00:00:19,160 प्रश्न विचारण्यासाठी सर्च इंजिनकडे वळतात, 6 00:00:19,160 --> 00:00:20,930 हे खूप प्रेरणादायी आहे. 7 00:00:20,930 --> 00:00:23,450 त्यामुळं आपल्याला शक्य आहेत तितकी 8 00:00:23,450 --> 00:00:24,864 सर्वोत्तम उत्तरं त्यांना देणं ही मोठी जबाबदारी आहे. 9 00:00:26,710 --> 00:00:30,610 हाय, माझं नाव अक्षया आहे आणि मी बिंग सर्च टीममध्ये काम करते. 10 00:00:30,910 --> 00:00:33,190 अनेकदा आम्ही कृत्रिम बुद्धिमत्तेचा आणि मशीन 11 00:00:33,190 --> 00:00:35,800 लर्निंगचा अभ्यास करतो, 12 00:00:35,830 --> 00:00:39,010 पण युजर्स याचा वापर कसा करतील, याचा विचार आम्हाला करावा लागतो, 13 00:00:39,140 --> 00:00:42,390 कारण शेवटी आपल्याला समाजावर प्रभाव टाकायचा असतो. 14 00:00:43,780 --> 00:00:45,400 एक साधा प्रश्न विचारूया. 15 00:00:45,820 --> 00:00:48,070 मंगळापर्यंत प्रवास करण्यासाठी किती वेळ लागतो? 16 00:00:49,330 --> 00:00:50,950 हे निकाल कुठून आले आणि 17 00:00:51,370 --> 00:00:54,100 हा इतर निकालांच्या आधी यादीत का आला? 18 00:00:55,700 --> 00:00:58,150 ठीक आहे, जरा बघूया की सर्च इंजिननं तुमच्या विनंतीचं 19 00:00:58,150 --> 00:00:59,860 निकालात कसं रूपांतर केलं. 20 00:01:00,690 --> 00:01:03,360 तुम्हाला एक गोष्ट पहिल्यांदा माहिती पाहिजे की जेव्हा तुम्ही सर्च करता तेव्हा 21 00:01:03,430 --> 00:01:06,480 प्रत्यक्षात सर्च इंजिन वर्ल्ड वाईड वेबकडे जाऊन तुमचा शोध 22 00:01:06,480 --> 00:01:08,010 त्यावेळी रन करत नाही. 23 00:01:08,140 --> 00:01:10,610 आणि त्याचं कारण म्हणजे इंटरनेटवर कोट्यावधी वेबसाईट्स आहेत आणि 24 00:01:10,610 --> 00:01:14,140 दर मिनिटाला नवीन शेकडो वेबसाईट्स तयार होत आहेत. 25 00:01:14,140 --> 00:01:16,210 त्यामुळं जर सर्च इंजिनला 26 00:01:16,240 --> 00:01:18,690 तुम्हाला जे हवंय ते शोधण्यासाठी प्रत्येक साईटवर जावं लागलं 27 00:01:18,690 --> 00:01:20,120 तर त्याला अनंत काळ लागेल. 28 00:01:20,500 --> 00:01:21,940 त्यामुळं हा शोध अधिक जलद करण्यासाठी, 29 00:01:21,970 --> 00:01:24,940 सर्च इंजिन्स वेबवर सतत आधीच स्कॅनिंग करत असतात. 30 00:01:25,420 --> 00:01:28,560 तुम्ही नंतर सर्च केल्यावर मदत करण्यासाठी आधीच माहिती नोंदवून ठेवत असतात. 31 00:01:28,930 --> 00:01:31,270 अशाप्रकारे, जेव्हा तुम्ही मंगळापर्यंतच्या प्रवासाबद्दल सर्च करता, 32 00:01:31,630 --> 00:01:33,700 तेव्हा सर्च इंजिनकडं तुम्हाला त्याचवेळी माहिती देण्यासाठी आवश्यक 33 00:01:33,700 --> 00:01:35,728 गोष्टी आधीच असतात. 34 00:01:36,250 --> 00:01:37,540 हे कसं काम करतं ते पाहूया. 35 00:01:37,900 --> 00:01:42,010 इंटरनेट म्हणजे एकमेकांना हायपरलिंकनं जोडलेल्या पानांचं जाळं आहे. 36 00:01:42,400 --> 00:01:44,680 सर्च इंजिन्स सातत्यानं एक प्रोग्रॅम रन करत असतात 37 00:01:44,680 --> 00:01:47,380 त्याला स्पायडर असं म्हणतात, तो सगळ्या वेब पेजेसना भेट देऊन 38 00:01:47,380 --> 00:01:49,040 त्यांच्याबद्दलची माहिती गोळा करतो. 39 00:01:49,780 --> 00:01:51,550 प्रत्येकवेळी त्याला हायपरलिंक मिळाली की, 40 00:01:52,090 --> 00:01:55,000 तो इंटरनेटवर सापडणाऱ्या प्रत्येक पेजला भेट दिली 41 00:01:55,030 --> 00:01:57,240 जाईपर्यंत तिचं अनुसरण करतो. 42 00:01:57,335 --> 00:01:59,170 स्पायडर भेट देत असलेल्या प्रत्येक पेजसाठी, 43 00:01:59,200 --> 00:02:02,320 तो त्याला सर्चसाठी आवश्यक असेल अशी कोणतीही माहिती सर्च इंडेक्स 44 00:02:02,500 --> 00:02:05,650 नावाच्या एका खास डेटाबेसमध्ये नोंदवून ठेवतो. 45 00:02:07,166 --> 00:02:09,530 आता, आपण पुन्हा आधीच्या सर्चकडं जाऊया 46 00:02:09,590 --> 00:02:11,990 आणि सर्च इंजिनला या शोधाचा निकाल 47 00:02:11,990 --> 00:02:13,333 कसा सापडला, ते शोधूया. 48 00:02:13,640 --> 00:02:16,460 जेव्हा तुम्ही मंगळापर्यंत प्रवास करण्यासाठी किती वेळ लागतो असं विचारता, 49 00:02:16,640 --> 00:02:18,860 तेव्हा सर्च इंजिन हे शब्द सर्च इंडेक्समध्ये 50 00:02:18,920 --> 00:02:21,410 शोधतं आणि ताबडतोब इंटरनेटवरच्या ज्या पानांवर हे शब्द आहेत 51 00:02:21,410 --> 00:02:24,500 त्यांची यादी आणतं. 52 00:02:24,890 --> 00:02:26,870 पण फक्त हे सर्च केलेले शब्द शोधले तर 53 00:02:26,870 --> 00:02:28,760 कोट्यावधी पानं येतील, 54 00:02:28,760 --> 00:02:31,110 त्यामुळं तुम्हाला आधी दाखवण्यासाठी सर्वांत चांगली जुळणारी 55 00:02:31,110 --> 00:02:33,120 पानं कुठली आहेत, हे सर्च इंजिनला ठरवता येणं आवश्यक असतं. 56 00:02:33,340 --> 00:02:36,010 इथं हे थोडं अवघड होतं कारण सर्च इंजिनला 57 00:02:36,010 --> 00:02:38,040 तुम्ही काय शोधत आहात त्याचा अंदाज करणं आवश्यक असतं. 58 00:02:38,930 --> 00:02:41,360 प्रत्येक सर्च इंजिन त्याचा स्वत:चा अल्गोरिदम 59 00:02:41,360 --> 00:02:44,230 वापरून तुम्हाला काय हवं आहे याचा विचार करून त्यानुसार या पानांची क्रमवारी लावतं. 60 00:02:44,930 --> 00:02:47,660 सर्च इंजिनचा हा रँक अल्गोरिदम 61 00:02:47,990 --> 00:02:50,360 तुम्ही शोधलेला शब्दसमूह पानाच्या शीर्षकात आहे का, ते पाहू शकतं, 62 00:02:50,900 --> 00:02:53,820 किंवा सगळे शब्द एकमेकांजवळ आहेत का ते पाहू शकतं, 63 00:02:54,520 --> 00:02:57,020 किंवा इतर असंख्य कॅलक्युलेशन्स करतं 64 00:02:57,020 --> 00:02:58,610 त्यामुळं त्याला तुम्हाला पहायची असलेली 65 00:02:58,670 --> 00:03:01,420 आणि पहायची नसलेली पानं ठरवायला मदत होते. 66 00:03:02,960 --> 00:03:04,960 गुगलनं सर्वांत सुयोग्य निकाल शोधण्यासाठी 67 00:03:04,960 --> 00:03:08,530 सर्वांत प्रसिद्ध अल्गोरिदम शोधला आहे. दिलेल्या पानाला इतर किती वेब पेजेस जोडलेली 68 00:03:08,560 --> 00:03:11,230 आहेत, ते यात विचारात घेतलं जातं. 69 00:03:11,830 --> 00:03:14,140 यामागची कल्पना अशी आहे की खूप वेबसाईट्सना हे 70 00:03:14,140 --> 00:03:15,660 वेबपेज रंजक आहे, असं वाटत असेल तर, 71 00:03:15,660 --> 00:03:17,940 ते कदाचित तुम्ही शोधत असलेलं पान असेल. 72 00:03:18,190 --> 00:03:20,020 या अल्गोरिदमला पेज रँक असं म्हणतात. 73 00:03:20,590 --> 00:03:22,330 तो वेब पेजेसना रँकिंग देतो म्हणून नव्हे, 74 00:03:22,570 --> 00:03:25,210 तर त्याचा संशोधक लॅरी पेजवरून हे नाव दिलं आहे. 75 00:03:25,480 --> 00:03:27,333 तो गुगलच्या संस्थापकांपैकी एक आहे. 76 00:03:27,940 --> 00:03:30,520 जेव्हा तुम्ही एखाद्या वेबसाईटला भेट देता, तेव्हा ती बऱ्याचदा पैसे कमवत असल्यामुळं, 77 00:03:30,820 --> 00:03:32,950 स्पॅमर्स नेहमी सर्च अल्गोरिदमला 78 00:03:32,950 --> 00:03:35,741 फसवण्याचे मार्ग शोधत असतात. त्यांची पाने 79 00:03:35,742 --> 00:03:37,931 निकालात जास्त वर दिसावीत म्हणून. 80 00:03:38,260 --> 00:03:40,750 खोटया किंवा अविश्वासार्ह साईट्स सर्वांत वर दिसू नयेत म्हणून सर्च इंजिन्स त्यांचे 81 00:03:40,750 --> 00:03:44,296 अल्गोरिदम नियमितपणे अद्ययावत करत असतात. 82 00:03:44,680 --> 00:03:47,350 शेवटी, अविश्वासार्ह पानांवर लक्ष ठेवणं 83 00:03:47,500 --> 00:03:49,450 तुमचंच काम आहे. तुम्ही वेब अॅड्रेस पाहून 84 00:03:49,690 --> 00:03:52,990 हा स्रोत विश्वासार्ह आहे, हे सुनिश्चित करू शकता. 85 00:03:53,680 --> 00:03:55,390 अल्गोरिदम्सनी अधिक चांगले निकाल आणावेत, आणि 86 00:03:55,420 --> 00:03:58,420 ते निकाल प्रतिस्पर्ध्यांपेक्षा जास्त जलद आणावेत 87 00:03:58,540 --> 00:04:00,460 म्हणून सर्च प्रोग्रॅम्स नेहमी सुधारले जात असतात. 88 00:04:01,000 --> 00:04:03,100 तुमचा शोध अजून विशिष्ट करण्यासाठी 89 00:04:03,100 --> 00:04:06,820 हल्लीची सर्च इंजिन्स तुम्ही स्पष्टपणे न दिलेली माहितीसुद्धा वापरतात. 90 00:04:07,150 --> 00:04:10,120 उदा. जर तुम्ही कुत्र्यांच्या उद्यानांसाठी सर्च केलात तर 91 00:04:10,240 --> 00:04:12,190 अनेक सर्च इंजिन्स तुम्हाला 92 00:04:12,190 --> 00:04:13,840 तुमच्या जवळच्या सगळ्या कुत्र्यांच्या उद्यानांबद्दलचे शोध निकाल दाखवतील, 93 00:04:14,080 --> 00:04:16,260 तुम्ही तुमचे ठिकाण टाईप केलेले नसले तरीही. 94 00:04:17,800 --> 00:04:20,530 आधुनिक सर्च इंजिन्सना पानांवरील शब्दांव्यतिरिक्तसुद्धा 95 00:04:20,530 --> 00:04:22,060 अनेक जास्त गोष्टी समजतात. 96 00:04:22,300 --> 00:04:24,970 तुम्ही शोधत असलेल्या गोष्टीसाठी 97 00:04:24,970 --> 00:04:26,750 सगळ्यात जुळणारे निकाल आणण्यासाठी त्यांना या शब्दांचा अर्थही कळतो. 98 00:04:27,130 --> 00:04:29,980 उदा. जर तुम्ही वेगवान पिचर असे सर्च केलेत तर 99 00:04:30,280 --> 00:04:32,300 त्याला तुम्ही खेळाडू शोधत आहात हे कळेल. 100 00:04:32,500 --> 00:04:34,450 पण तुम्ही मोठा पिचर असे सर्च केलेत तर 101 00:04:34,450 --> 00:04:36,730 तो तुम्हाला तुमच्या स्वयंपाकघरासाठीचे पर्याय दाखवेल. 102 00:04:38,420 --> 00:04:41,910 शब्द अधिक चांगले समजून घेण्यासाठी, आम्ही मशीन लर्निंग, हा कृत्रिम बुद्धिमत्तेचा 103 00:04:41,910 --> 00:04:43,985 प्रकार वापरतो. 104 00:04:43,985 --> 00:04:46,050 त्यामुळं अल्गोरिदम्सना त्या पानामध्ये केवळ सुट्टी अक्षरे किंवा 105 00:04:46,090 --> 00:04:48,400 सुट्टे शब्द शोधण्याची क्षमताच नव्हे तर 106 00:04:48,400 --> 00:04:51,280 त्यांचा अर्थसुद्धा कळण्याची क्षमता येते. 107 00:04:53,690 --> 00:04:55,850 इंटरनेटची घातांकीय वाढ होते आहे, 108 00:04:56,210 --> 00:04:59,810 पण सर्च इंजिन डिझाईन करणाऱ्या टीम्स आपले काम व्यवस्थित करत आहेत, 109 00:05:00,080 --> 00:05:04,090 तुम्हाला हवी असलेली माहिती काही कीज दाबायचा अवकाश की लगेच हजर आहे.