Cześć, nazywam się John. Kieruję zespołami ds. wyszukiwarki i systemów uczących się w Google. Fakt, że ludzie na całym świecie sięgają po wyszukiwarki, aby stawiać proste pytania i pytania ogromnej wagi, niezwykle mnie inspiruje. Udzielenie im najlepszej odpowiedzi z możliwych to wielka odpowiedzialność. Cześć, nazywam się Akshaya i pracuję w zespole ds. wyszukiwania firmy Bing. Wielokrotnie zastanawiamy się nad sztuczną inteligencją i systemami uczącymi się, należy wziąć jednak pod uwagę to, jak będą z tego korzystać użytkownicy, ponieważ, w szerszym ujęciu, chcemy wywierać jakiś wpływ na społeczeństwo. Zadajmy proste pytanie. Ile trwa lot na Marsa? Skąd pochodzą wyniki i dlaczego konkretna odpowiedź pojawia się przed inną? Zajmijmy się tym i zobaczcie jak wyszukiwarka przekształca zapytanie w wynik. Po pierwsze trzeba wiedzieć, że podczas wyszukiwania wyszukiwarka nie wchodzi do Internetu, aby poprowadzić wyszukiwanie w czasie rzeczywistym. Wynika to faktu istnienia ponad miliarda stron internetowych w Internecie, a w każdej minucie powstają setki nowych. Jeśli taka wyszukiwarka miałaby przejrzeć każdą, pojedynczą stronę, aby znaleźć to, czego ktoś szuka, trwałoby to w nieskończoność. Aby przyspieszyć wyszukiwanie, wyszukiwarki nieustannie przeglądają internet z wyprzedzeniem, aby zapisywać informacje, które mogą się przydać do wyszukiwania w przyszłości. Z tego powodu, gdy szukamy informacji o locie na Marsa, wyszukiwarka już posiada informacje potrzebne do udzielenia odpowiedzi w czasie rzeczywistym. A działa to w sposób następujący. Internet jest siecią stron połączonych ze sobą hiperłączami. Wyszukiwarki pracują przez cały czas korzystając z programu Spider, który przegląda te strony, aby zbierać informacje na ich temat. Za każdym razem, gdy znajdzie hiperłącze śledzi je, aż do momentu, gdy wejdzie na każdą stronę, jaką może znaleźć w całym Internecie. Z każdej strony, na którą wejdzie, Spider ewidencjonuje informacje, których może potrzebować do wyszukiwania, dodając specjalną bazę danych zwaną indeksem wyszukiwania. Wróćmy zatem do wcześniejszego wyszukiwania i sprawdźmy, czy jesteśmy w stanie dojść do tego, jak wyszukiwarka uzyskuje wyniki. Gdy padnie pytanie ile trwa lot na Marsa, wyszukiwarka sprawdza każde z słów w indeksie wyszukiwarki, aby natychmiast otrzymać wykaz wszystkich stron w Internecie, w których one występują. Szukanie terminów wyszukiwania może spowodować uzyskanie milionów stron, więc wyszukiwarka musi być w stanie zdecydować, co pasuje najlepiej i to pokazać na początku. I tutaj pojawia się pierwsza pułapka, ponieważ wyszukiwarka będzie musiała zgadywać, czego ktoś szuka. Każda wyszukiwarka posiada własny algorytm, porządkujący strony według tego, co według niej ma być znalezione. Algorytm rankingu wyszukiwarki jest w stanie sprawdzić, czy termin wyszukiwany pojawia się na stronie tytułowej, jest w stanie sprawdzić, czy wszystkie słowa pokazują się obok siebie, albo dowolną liczbę innych kombinacji, które pomagają określić, które strony szukający chce obejrzeć, a których nie. Google opracował najsłynniejszy algorytm wybierania najtrafniejszych wyników wyszukiwania z uwzględnieniem liczby innych stron internetowych powiązanych z daną stroną. Koncepcja polega na tym, że wiele witryn internetowych uzna, że strona internetowa jest ciekawa, zatem prawdopodobnie o tę chodzi szukającemu. Ten algorytm nosi nazwę "ranking Page'a", nie ze względu na to, że ustala kolejność stron, "page", po angielsku "strona", ale z uwagi na nazwisko twórcy, Larry'ego Page'a, który jest jednym z założycieli Google. Ponieważ często strona zarabia, gdy się na nią wchodzi, spamerzy nieustannie szukają sposobów złamania algorytmu wyszukiwania, aby ich stony plasowały się wyżej na liście wyników. Wyszukiwarki nieustannie aktualizują swoje algorytmy, aby nie dopuścić na miejsca czołowe podejrzanych stron. Ostatecznie jednak, to użytkownik musi uważać, czy takie strony nie są podejrzane sprawdzając adres internetowy i sprawdzając, czy jest to rzetelne źródło. Takie programy zawsze starają się doskonalić swoje algorytmy tak, aby uzyskiwać lepsze wyniki, szybciej od konkurencji. Obecnie wyszukiwarki korzystają nawet z takich informacji, których wyszukujący nie podał, aby zawęzić zakres wyszukiwania. Na przykład, jeśli ktoś szuka parku, do którego można wchodzić z psem, wiele wyszukiwarek podaje wyniki w postaci wszystkich parków w pobliżu. do których można wchodzić z psem, mimo, że szukający nie wpisał swojej lokalizacji. Nowoczesne wyszukiwarki rozumieją również więcej, niż podają słowa na stronie, czyli co one rzeczywiście oznaczają, aby uzyskać wyniki, które najlepiej pasują do kryteriów wyszukiwania. Przykładowo, jeśli ktoś poszukuje szybkiego miotacza - po angielsku "pitcher", wyszukiwarka wie, że szukany jest sportowiec. Ale gdy szukamy wielkiego dzbana, po angielsku również "pitcher", znajdzie opcje wyposażenia kuchni. Aby lepiej rozumieć słowa korzystamy z tzw. systemów uczących się, rodzaju sztucznej inteligencji. Uaktywnia to algorytmy wyszukiwania celem poszukiwania już nie pojedynczych liter lub słów na stronie, ale pojęcia znaczenia, jakie kryje się za parawanem słów. Internet rozrasta się w postępie geometrycznym, ale jeśli zespoły odpowiadające za wyszukiwarki będą się przykładać do pracy, potrzebne nam informacje znajdą się zawsze w odległości "kilku uderzeń klawiszy".