0:00:06.070,0:00:07.120 Cześć, nazywam się John. 0:00:07.510,0:00:10.140 Kieruję zespołami ds. nauki wyszukiwania [br]i maszyn w Google. 0:00:12.130,0:00:14.230 Fakt, że ludzie na całym świecie 0:00:14.230,0:00:16.214 sięgają po wyszukiwarki, aby stawiać 0:00:16.215,0:00:19.160 proste pytania i pytania ogromnej wagi, 0:00:19.160,0:00:20.930 niezwykle mnie inspiruje. 0:00:20.930,0:00:23.450 Udzielenie im najlepszej odpowiedzi 0:00:23.450,0:00:24.864 z możliwych to wielka odpowiedzialność. 0:00:26.710,0:00:30.610 Cześć, nazywam się Akshaya i pracuję[br]w zespole badan firmy Bing. 0:00:30.910,0:00:33.190 Wielokrotnie zastanawiamy się [br]nad sztuczną 0:00:33.190,0:00:35.800 inteligencją i nauką[br]maszynową, 0:00:35.830,0:00:39.010 należy wziąć jednak pod uwagę to, [br]jak będą z tego korzystać użytkownicy, 0:00:39.140,0:00:42.390 ponieważ, w szerszym ujęciu, chcemy[br]wywierać jakiś wpływ na społeczeństwo. 0:00:43.780,0:00:45.400 Zadajmy proste pytanie. 0:00:45.820,0:00:48.070 Ile trwa lot na Marsa? 0:00:49.330,0:00:50.950 Skąd pochodzą wyniki 0:00:51.370,0:00:54.100 i dlaczego konkretna pozycja[br]pojawia się przed inną? 0:00:55.700,0:00:58.150 Zgłębmy temat i [br]zobaczcie jak wyszukiwarka 0:00:58.150,0:00:59.860 przekształca zapytanie w wynik. 0:01:00.690,0:01:03.360 Po pierwsze trzeba wiedzieć, że[br]podczas wyszukiwania 0:01:03.430,0:01:06.480 wyszukiwarka nie wchodzi do Internetu, 0:01:06.480,0:01:08.010 aby poprowadzić wyszukiwanie w czasie rzeczywistym. 0:01:08.140,0:01:10.610 Wynika to faktu istnienia ponad[br]miliarda stron internetowych 0:01:10.610,0:01:14.140 w Internecie, a w każdej minucie[br]powstają setki nowych. 0:01:14.140,0:01:16.210 Jeśli taka wyszukiwarka[br]miała przejrzeć każdą, pojedynczą 0:01:16.240,0:01:18.690 stronę, aby znaleźć to, czego [br]ktoś szuka, 0:01:18.690,0:01:20.120 trwałoby to w nieskończoność. 0:01:20.500,0:01:21.940 Aby przyspieszyć wyszukiwanie, 0:01:21.970,0:01:24.940 wyszukiwarki nieustannie[br]przeglądają internet z wyprzedzeniem, 0:01:25.420,0:01:28.560 aby zapisywać informacje, które mogą[br]się przydać do wyszukiwania w przyszłości. 0:01:28.930,0:01:31.270 Z tego powodu, gdy szukamy[br]informacji o locie na Marsa, 0:01:31.630,0:01:33.700 wyszukiwarka [br]już posiada informacje potrzebne 0:01:33.700,0:01:35.728 do udzielenia odpowiedzi w czasie [br]w czasie rzeczywisym. 0:01:36.250,0:01:37.540 A działa to w sposób następujący. 0:01:37.900,0:01:42.010 Internet jest siecią stron[br]połączonych ze sobą hiperłączami. 0:01:42.400,0:01:44.680 Wyszukiwarki pracują [br]przez cały czas korzystając z programu 0:01:44.680,0:01:47.380 Spider, który przegląda te strony, 0:01:47.380,0:01:49.040 aby zbierać informacje na ich temat. 0:01:49.780,0:01:51.550 Za każdym razem, gdy znajdzie hiperłącze 0:01:52.090,0:01:55.000 śledzi je, aż do momentu,[br]gdy wejdzie na każdą stronę, 0:01:55.030,0:01:57.240 jaką może znaleźć w całym[br]Internecie. 0:01:57.335,0:01:59.170 Z każdej strony, na którą wejdzie, 0:01:59.200,0:02:02.320 Spider ewidencjonuje informacje, [br]których może potrzebować do wyszukiwania, 0:02:02.500,0:02:05.650 dodając specjalną[br]bazę danych zwaną indeksem wyszukiwania. 0:02:07.166,0:02:09.530 Wróćmy zatem do wcześniejszego[br]wyszukiwania i sprawdźmy, 0:02:09.590,0:02:11.990 czy jesteśmy w stanie dojść do tego, [br]jak wyszukiwarka 0:02:11.990,0:02:13.333 uzyskuje wyniki. 0:02:13.640,0:02:16.460 Gdy padnie pytanie[br]ile trwa lot na Marsa, 0:02:16.640,0:02:18.860 wyszukiwarka sprawdza [br]każde z słów 0:02:18.920,0:02:21.410 w indeksie wyszukiwarki, [br]aby natychmiast otrzymać wykaz 0:02:21.410,0:02:24.500 wszystkich stron w Internecie, [br]w których one występują. 0:02:24.890,0:02:26.870 Szukanie terminów wyszukiwania 0:02:26.870,0:02:28.760 może spowodować uzyskanie milionów stron, 0:02:28.760,0:02:31.110 więc wyszukiwarka musi być w stanie[br]zdecydować, 0:02:31.110,0:02:33.120 co pasuje najlepiej i to pokazać na[br]początku. 0:02:33.340,0:02:36.010 I tutaj pojawia się pierwsza pułapka, [br]ponieważ wyszukiwarka 0:02:36.010,0:02:38.040 będzie musiała zgadywać, [br]czego ktoś szuka. 0:02:38.930,0:02:41.360 Każda wyszukiwarka posiada[br]własny algorytm, 0:02:41.360,0:02:44.230 porządkujący strony według tego, [br]co według niej ma być znalezione. 0:02:44.930,0:02:47.660 Algorytm rankingu wyszukiwarki[br]jest w stanie sprawdzić, 0:02:47.990,0:02:50.360 czy termin wyszukiwany pojawia się[br]na stronie tytułowej, 0:02:50.900,0:02:53.820 jest w stanie sprawdzić, czy wszystkie[br]słowa pokazują się obok siebie, 0:02:54.520,0:02:57.020 albo dowolną liczbę innych obliczeń, 0:02:57.020,0:02:58.610 które pomagają określić, 0:02:58.670,0:03:01.420 które strony szukający[br]chce obejrzeć, a których nie. 0:03:02.960,0:03:04.960 Google opracował [br]najsłynniejszy algorytm 0:03:04.960,0:03:08.530 wybierania najtrafniejszych wyników[br]wyszukiwania z uwzględnieniem 0:03:08.560,0:03:11.230 liczby innych stron internetowych[br]powiązanych z daną stroną. 0:03:11.830,0:03:14.140 Koncepcja polega na tym, że[br]wiele witryn internetowych uzna, 0:03:14.140,0:03:15.660 że strona internetowa jest ciekawa, 0:03:15.660,0:03:17.940 zatem prawdopodobnie o tę[br]chodzi szukającemu. 0:03:18.190,0:03:20.020 Ten algorytm nosi nazwę "ranking Page'a", 0:03:20.590,0:03:22.330 nie ze względu na to, że ustala kolejność [br]stron, "page", po angielsku "strona", 0:03:22.570,0:03:25.210 ale z uwagi na nazwisko twórcy, Larry'ego[br]Page'a, 0:03:25.480,0:03:27.333 który jest jednym z założycieli Google. 0:03:27.940,0:03:30.520 Ponieważ często strona zarabia, [br]gdy się na nią wchodzi, 0:03:30.820,0:03:32.950 spamerzy nieustannie szukają[br]sposobów 0:03:32.950,0:03:35.741 złamania algorytmu wyszukiwania, [br]aby ich stony 0:03:35.742,0:03:37.931 plasowały się wyżej na liście wyników. 0:03:38.260,0:03:40.750 Wyszukiwarki nieustannie aktualizują[br]swoje algorytmy, 0:03:40.750,0:03:44.296 aby nie dopuścić na miejsca czołowe[br]podejrzanych stron. 0:03:44.680,0:03:47.350 Ostatecznie jednak, to użytkownik musi[br]uważać, czy 0:03:47.500,0:03:49.450 takie strony nie są podejrzane 0:03:49.690,0:03:52.990 sprawdzając adres internetowy i[br]sprawdzając, czy jest to rzetelne źródło. 0:03:53.680,0:03:55.390 Takie programy zawsze starają się 0:03:55.420,0:03:58.420 doskonalić swoje algorytmy tak, [br]aby uzyskiwać lepsze wyniki, 0:03:58.540,0:04:00.460 szybciej od konkurencji. 0:04:01.000,0:04:03.100 Obecnie wyszukiwarki[br]korzystają nawet z takich informacji, 0:04:03.100,0:04:06.820 których wyszukujący nie podał, [br]aby pomóc zawęzić zakres wyszukiwania. 0:04:07.150,0:04:10.120 Na przykład, jeśli ktoś szuka parku,[br]do którego można wchodzić z psem, 0:04:10.240,0:04:12.190 wiele wyszukiwarek [br]podaje wyniki 0:04:12.190,0:04:13.840 w postaci wszystkie parki w pobliżu.[br]do których można wchodzić z psem, 0:04:14.080,0:04:16.260 mimo, że szukający[br]nie wpisał swojej lokalizacji. 0:04:17.800,0:04:20.530 Nowoczesne wyszukiwarki[br]rozumieją również więcej, 0:04:20.530,0:04:22.060 niż podają słowa na stronie, 0:04:22.300,0:04:24.970 czyli co one rzeczywiście oznaczają, [br]aby uzyskać wyniki, które najlepiej 0:04:24.970,0:04:26.750 pasują do kryteriów wyszukiwania. 0:04:27.130,0:04:29.980 Przykładowo, jeśli ktoś poszukuje szybkiego[br]miotacza - po angielsku "pitcher", 0:04:30.280,0:04:32.300 wyszukiwarka wie, że szukany jest[br]sportowiec. 0:04:32.500,0:04:34.450 Ale gdy szukamy wielkiego dzbana,[br]po angielsku również "pitcher", 0:04:34.450,0:04:36.730 znajdzie opcje [br]wyposażenia kuchni. 0:04:38.420,0:04:41.910 Aby lepiej rozumieć słowa [br]korzystamy z tzw, uczenia maszynowego, 0:04:41.910,0:04:43.985 rodzaju sztucznej inteligencji. 0:04:43.985,0:04:46.050 Umożliwia to algorytmom[br]wyszukiwania szukać 0:04:46.090,0:04:48.400 już nie pojedynczych liter[br]lub słów na stronie, 0:04:48.400,0:04:51.280 ale rozumie znaczenie, jakie kryje[br]się za parawanem słów. 0:04:53.690,0:04:55.850 Internet rozrasta się w postępie geometrycznym, 0:04:56.210,0:04:59.810 ale jeśli zespoły odpowiadające za [br]wyszukiwarki będą się przykładać do pracy, 0:05:00.080,0:05:04.090 potrzebne nam informacje znajdą się zawsze[br]w odległości "kilku uderzeń klawiszy".