WEBVTT 00:00:06.070 --> 00:00:07.120 سلام، من جان هستم. 00:00:07.510 --> 00:00:10.140 رهبری تیم‌های جستجو و یادگیری ماشینی در شرکت Google به عهده من است. 00:00:12.130 --> 00:00:14.230 فکر می‌کنم این کار فوق‌العاده الهام بخش است 00:00:14.230 --> 00:00:16.214 این که مردم در سراسر جهان 00:00:16.215 --> 00:00:19.160 هم سوال‌های پیش ‌و پا افتاده‌شان را از Google می‌پرسند 00:00:19.160 --> 00:00:20.930 و هم سوال‌های بسیار بسیار مهم را. 00:00:20.930 --> 00:00:23.450 بنابراین وظیفه بزرگ ما 00:00:23.450 --> 00:00:24.864 دادن بهترین جواب به آن‌ها است. 00:00:26.710 --> 00:00:30.610 سلام، اسم من آکشایا است. من در تیم موتور جستجوی Bing کار می‌کنم. 00:00:30.910 --> 00:00:33.190 خیلی وقت‌ها شده که اقدام به بررسی 00:00:33.190 --> 00:00:35.800 هوش مصنوعی و یادگیری ماشینی کرده باشیم 00:00:35.830 --> 00:00:39.010 اما باید به اهمیت چگونگی استفاده کاربرها از آن هم اشاره کرد 00:00:39.140 --> 00:00:42.390 چرا که هدف اصلی ما تاثیرگذاری بر جامعه است. 00:00:43.780 --> 00:00:45.400 بیایید با یک سوال ساده شروع کنیم. 00:00:45.820 --> 00:00:48.070 سفر به مریخ چقدر طول می‌کشد؟ 00:00:49.330 --> 00:00:50.950 این نتایج از کجا به دست آمدند؟ 00:00:51.370 --> 00:00:54.100 و چرا این یکی قبل از دیگری آمده است؟ 00:00:55.700 --> 00:00:58.150 پس بریم ببینیم موتور جستجو 00:00:58.150 --> 00:00:59.860 چگونه درخواست شما را به نتیجه تبدیل می‌کند؟ 00:01:00.690 --> 00:01:03.360 اولین چیزی که باید بدانید این است که وقتی یک جستجو انجام می‌دهید 00:01:03.430 --> 00:01:06.480 موتور جستجو در واقع به شبکه جهانی وب نمی‌رود 00:01:06.480 --> 00:01:08.010 تا جستجوی شما را در زمان واقعی انجام دهد. 00:01:08.140 --> 00:01:10.610 به این دلیل که بیش از یک میلیارد وب‌سایت در اینترنت وجود دارد 00:01:10.610 --> 00:01:14.140 و صدها وب‌سایت دیگر هم در هر دقیقه ایجاد می‌شوند. 00:01:14.140 --> 00:01:16.210 پس اگر قرار بود موتور جستجو تک تک وب‌ سایت‌ها را 00:01:16.240 --> 00:01:18.690 برای پیدا کردن چیزی که شما می‌خواهید جستجو کند 00:01:18.690 --> 00:01:20.120 تا ابد طول می‌کشید! 00:01:20.500 --> 00:01:21.940 پس برای سریع‌تر کردن جستجوی شما 00:01:21.970 --> 00:01:24.940 موتورهای جستجو، به طور مداوم وب را از قبل بررسی می‌کنند 00:01:25.420 --> 00:01:28.560 تا اطلاعاتی که می‌تواند بعداً به جستجوی شما کمک کنند را ثبت کنند. 00:01:28.930 --> 00:01:31.270 به این ترتیب، وقتی درمورد سفر به مریخ جستجو می‌کنید 00:01:31.630 --> 00:01:33.700 موتور جستجو آنچه لازم است را در چنته دارد 00:01:33.700 --> 00:01:35.728 تا آن را درزمان واقعی به شما ارائه کند. 00:01:36.250 --> 00:01:37.540 خب، نحوه عملکرد آن چگونه است؟ 00:01:37.900 --> 00:01:42.010 اینترنت شبکه‌ای از صفحات است که به وسیله هایپرلینک به یکدیگر متصل شده‌اند. 00:01:42.400 --> 00:01:44.680 موتورهای جستجو دائماً در حال اجرای یک برنامه 00:01:44.680 --> 00:01:47.380 به نام Spider هستند که در میان صفحات وب حرکت می‌کند 00:01:47.380 --> 00:01:49.040 تا اطلاعاتی در مورد آنها به دست بیاورد. 00:01:49.780 --> 00:01:51.550 هر بار که به یک هایپرلینک برمی‌خورد، 00:01:52.090 --> 00:01:55.000 تا جایی آن را دنبال می‌کند که از تمام صفحات 00:01:55.030 --> 00:01:57.240 در کل اینترنت بازدید کرده باشد. 00:01:57.335 --> 00:01:59.170 برای هر صفحه‌ای که Spider از آن بازدید می‌کند، 00:01:59.200 --> 00:02:02.320 اطلاعاتی را که ممکن است نیاز به جستجو داشته باشد را با افزودن به 00:02:02.500 --> 00:02:05.650 یک پایگاه داده خاص به نام فهرست جستجو، ثبت می‌کند. 00:02:07.166 --> 00:02:09.530 حالا بیایید به مثال قبلی برگردیم 00:02:09.590 --> 00:02:11.990 و ببینیم موتور جستجو چگونه ما را به 00:02:11.990 --> 00:02:13.333 نتایجی که می‌خواهیم می‌رساند. 00:02:13.640 --> 00:02:16.460 وقتی می‌پرسید سفر به مریخ چقدر طول می‌کشد، 00:02:16.640 --> 00:02:18.860 موتور جستجو به تک‌تک کلمات آن عبارت در فهرست جستجو نگاه می‌کند 00:02:18.920 --> 00:02:21.410 تا هر چه سریع‌تر یک لیست از تمام صفحاتی در اینترنت که 00:02:21.410 --> 00:02:24.500 شامل آن کلمات می‌شوند را دریافت کند. 00:02:24.890 --> 00:02:26.870 گشتن به دنبال این عبارات جستجو به تنهایی 00:02:26.870 --> 00:02:28.760 ممکن است میلیون ها صفحه را بازگرداند، 00:02:28.760 --> 00:02:31.110 بنابراین موتور جستجو باید بتواند قبل از هرچیز 00:02:31.110 --> 00:02:33.120 بهترین تطابق‌ها را به شما نشان دهد. 00:02:33.340 --> 00:02:36.010 اینجاست که کار کمی سخت می‌شود زیرا ممکن است 00:02:36.010 --> 00:02:38.040 موتور جستجو مجبور شود حدس بزند که شما به دنبال چه چیزی هستید. 00:02:38.930 --> 00:02:41.360 هر موتور جستجو از الگوریتم خودش برای رتبه بندی صفحات 00:02:41.360 --> 00:02:44.230 بر اساس آنچه فکر که می‌کند نیاز دارید استفاده می‌کند. 00:02:44.930 --> 00:02:47.660 الگوریتم رتبه بندی موتور جستجو می‌تواند بررسی کند که آیا 00:02:47.990 --> 00:02:50.360 عبارت جستجوی شما در عنوان صفحه، نمایش داده شده 00:02:50.900 --> 00:02:53.820 یا همه کلمات در کنار هم ظاهر شده‌اند 00:02:54.520 --> 00:02:57.020 و یا هر تعداد محاسبات دیگری که 00:02:57.020 --> 00:02:58.610 بتواند تعیین کند کدام صفحات را می‌خواهید ببینید 00:02:58.670 --> 00:03:01.420 و کدام صفحات را نمی‌خواهید ببینید. 00:03:02.960 --> 00:03:04.960 شرکت Google معروف‌ترین الگوریتم را برای انتخاب 00:03:04.960 --> 00:03:08.530 مرتبط ترین نتایج جستجو، با در نظر گرفتن تعداد صفحات وبی که 00:03:08.560 --> 00:03:11.230 به یک صفحه معین پیوند دارند، اختراع کرده است. 00:03:11.830 --> 00:03:14.140 به این شکل که اگر تعداد زیادی وب‌سایت فکر کنند 00:03:14.140 --> 00:03:15.660 که یک صفحه وب جالب است، 00:03:15.660 --> 00:03:17.940 پس احتمالا همان صفحه‌ای است که شما به دنبال آن هستید. 00:03:18.190 --> 00:03:20.020 به این الگوریتم رتبه‌ی صفحه می‌گویند، زیرا 00:03:20.590 --> 00:03:22.330 نه تنها صفحات وب را رتبه بندی می‌کند، بلکه 00:03:22.570 --> 00:03:25.210 کسی که آن را اختراع کرده هم لری پیج نام دارد. 00:03:25.480 --> 00:03:27.333 او هم یکی از بنیانگذاران Google است. 00:03:27.940 --> 00:03:30.520 معمولا بازدید از یک وب‌سایت موجب کسب درآمد برای آن می‌شود 00:03:30.820 --> 00:03:32.950 به همین دلیل هرزنامه‌ نویس‌ها دائماً در تلاش برای یافتن راهی برای 00:03:32.950 --> 00:03:35.741 بازی با الگوریتم جستجو هستند، به طوری که صفحات آنها 00:03:35.742 --> 00:03:37.931 در نتایج فهرست شده بالاتر دیده شود. 00:03:38.260 --> 00:03:40.750 موتورهای جستجو به طور مرتب الگوریتم‌های خود را به روز می کنند 00:03:40.750 --> 00:03:44.296 تا از رسیدن سایت‌های جعلی یا غیرقابل اعتماد به بالای فهرست جلوگیری کنند. 00:03:44.680 --> 00:03:47.350 در نهایت، این شما هستید که باید با نگاه کردن به آدرس وب 00:03:47.500 --> 00:03:49.450 و اطمینان از اینکه منابع قابل اعتمادی هستند، 00:03:49.690 --> 00:03:52.990 مراقب صفحات غیرقابل اعتماد باشید. 00:03:53.680 --> 00:03:55.390 برنامه‌های جستجو همیشه در حال پیشرفت هستند 00:03:55.420 --> 00:03:58.420 تا با ارتقای الگوریتم‌ها سبب نمایش نتایج بهتر شوند، 00:03:58.540 --> 00:04:00.460 نتایجی که سریع‌تر از رقبا نمایش داده شوند. 00:04:01.000 --> 00:04:03.100 موتورهای جستجوی امروزی حتی از اطلاعاتی استفاده می‌کنند که شما به صراحت بیان نکرده‌اید. 00:04:03.100 --> 00:04:06.820 به این ترتیب به شما کمک می‌کنند تا جستجوی خود را محدود کنید. 00:04:07.150 --> 00:04:10.120 مثلا، اگر پارک‌های مخصوص سگ را جستجو کرده باشید، 00:04:10.240 --> 00:04:12.190 بسیاری از موتورهای جستجو نتایجی را نمایش می‌دهند که 00:04:12.190 --> 00:04:13.840 شامل تمام پارک‌های مخصوص سگ در نزدیکی شما می‌شود، 00:04:14.080 --> 00:04:16.260 حتی اگر در جستجوی خود، موقعیت مکانی را ذکر نکرده باشید. 00:04:17.800 --> 00:04:20.530 موتورهای جستجوی مدرن نیز 00:04:20.530 --> 00:04:22.060 بیشتر از کلمات موجود در یک صفحه را درک می کنند، 00:04:22.300 --> 00:04:24.970 اما معنای واقعی آنها برای یافتن بهترین مورد 00:04:24.970 --> 00:04:26.750 مطابق با آنچه شما به دنبال آن هستید چیست؟ 00:04:27.130 --> 00:04:29.980 به عنوان مثال، اگر عبارت "fast pitcher" را جستجو کنید 00:04:30.280 --> 00:04:32.300 موتور جستجو تشخیص می‌دهد که شما به دنبال یک ورزشکار هستید. 00:04:32.500 --> 00:04:34.450 اما اگر عبارت "large pitcher" را جستجو کنید، 00:04:34.450 --> 00:04:36.730 گزینه‌هایی مربوط به آشپزخانه را برای شما نمایش می‌دهد. 00:04:38.420 --> 00:04:41.910 برای تشخیص بهتر کلمات، ما از اصطلاحی به نام یادگیری ماشینی استفاده می‌کنیم، 00:04:41.910 --> 00:04:43.985 که نوعی هوش مصنوعی است 00:04:43.985 --> 00:04:46.050 و به الگوریتم‌های جستجو این امکان را می‌دهد که 00:04:46.090 --> 00:04:48.400 هم حروف یا کلمات جداگانه را در صفحه جستجو کنند 00:04:48.400 --> 00:04:51.280 و هم معنی اصلی کلمات را درک کنند. 00:04:53.690 --> 00:04:55.850 اینترنت به طور تصاعدی در حال رشد است، 00:04:56.210 --> 00:04:59.810 اما اگر تیم‌های طراحی موتورهای جستجو آنچه مد نظر ما هست را درست انجام دهند، 00:05:00.080 --> 00:05:04.090 اطلاعاتی که می‌خواهید تنها با چند کلیک ساده به دست می‌آیند.