Cześć, nazywam się John.
Kieruję zespołami ds. nauki wyszukiwania
i maszyn w Google.
Fakt, że ludzie na całym świecie
sięgają po wyszukiwarki, aby stawiać
proste pytania i pytania ogromnej wagi,
niezwykle mnie inspiruje.
Udzielenie im najlepszej odpowiedzi
z możliwych to wielka odpowiedzialność.
Cześć, nazywam się Akshaya i pracuję
w zespole badan firmy Bing.
Wielokrotnie zastanawiamy się
nad sztuczną
inteligencją i nauką
maszynową,
należy wziąć jednak pod uwagę to,
jak będą z tego korzystać użytkownicy,
ponieważ, w szerszym ujęciu, chcemy
wywierać jakiś wpływ na społeczeństwo.
Zadajmy proste pytanie.
Ile trwa lot na Marsa?
Skąd pochodzą wyniki
i dlaczego konkretna pozycja
pojawia się przed inną?
Zgłębmy temat i
zobaczcie jak wyszukiwarka
przekształca zapytanie w wynik.
Po pierwsze trzeba wiedzieć, że
podczas wyszukiwania
wyszukiwarka nie wchodzi do Internetu,
aby poprowadzić wyszukiwanie w czasie rzeczywistym.
Wynika to faktu istnienia ponad
miliarda stron internetowych
w Internecie, a w każdej minucie
powstają setki nowych.
Jeśli taka wyszukiwarka
miała przejrzeć każdą, pojedynczą
stronę, aby znaleźć to, czego
ktoś szuka,
trwałoby to w nieskończoność.
Aby przyspieszyć wyszukiwanie,
wyszukiwarki nieustannie
przeglądają internet z wyprzedzeniem,
aby zapisywać informacje, które mogą
się przydać do wyszukiwania w przyszłości.
Z tego powodu, gdy szukamy
informacji o locie na Marsa,
wyszukiwarka
już posiada informacje potrzebne
do udzielenia odpowiedzi w czasie
w czasie rzeczywisym.
A działa to w sposób następujący.
Internet jest siecią stron
połączonych ze sobą hiperłączami.
Wyszukiwarki pracują
przez cały czas korzystając z programu
Spider, który przegląda te strony,
aby zbierać informacje na ich temat.
Za każdym razem, gdy znajdzie hiperłącze
śledzi je, aż do momentu,
gdy wejdzie na każdą stronę,
jaką może znaleźć w całym
Internecie.
Z każdej strony, na którą wejdzie,
Spider ewidencjonuje informacje,
których może potrzebować do wyszukiwania,
dodając specjalną
bazę danych zwaną indeksem wyszukiwania.
Wróćmy zatem do wcześniejszego
wyszukiwania i sprawdźmy,
czy jesteśmy w stanie dojść do tego,
jak wyszukiwarka
uzyskuje wyniki.
Gdy padnie pytanie
ile trwa lot na Marsa,
wyszukiwarka sprawdza
każde z słów
w indeksie wyszukiwarki,
aby natychmiast otrzymać wykaz
wszystkich stron w Internecie,
w których one występują.
Szukanie terminów wyszukiwania
może spowodować uzyskanie milionów stron,
więc wyszukiwarka musi być w stanie
zdecydować,
co pasuje najlepiej i to pokazać na
początku.
I tutaj pojawia się pierwsza pułapka,
ponieważ wyszukiwarka
będzie musiała zgadywać,
czego ktoś szuka.
Każda wyszukiwarka posiada
własny algorytm,
porządkujący strony według tego,
co według niej ma być znalezione.
Algorytm rankingu wyszukiwarki
jest w stanie sprawdzić,
czy termin wyszukiwany pojawia się
na stronie tytułowej,
jest w stanie sprawdzić, czy wszystkie
słowa pokazują się obok siebie,
albo dowolną liczbę innych obliczeń,
które pomagają określić,
które strony szukający
chce obejrzeć, a których nie.
Google opracował
najsłynniejszy algorytm
wybierania najtrafniejszych wyników
wyszukiwania z uwzględnieniem
liczby innych stron internetowych
powiązanych z daną stroną.
Koncepcja polega na tym, że
wiele witryn internetowych uzna,
że strona internetowa jest ciekawa,
zatem prawdopodobnie o tę
chodzi szukającemu.
Ten algorytm nosi nazwę "ranking Page'a",
nie ze względu na to, że ustala kolejność
stron, "page", po angielsku "strona",
ale z uwagi na nazwisko twórcy, Larry'ego
Page'a,
który jest jednym z założycieli Google.
Ponieważ często strona zarabia,
gdy się na nią wchodzi,
spamerzy nieustannie szukają
sposobów
złamania algorytmu wyszukiwania,
aby ich stony
plasowały się wyżej na liście wyników.
Wyszukiwarki nieustannie aktualizują
swoje algorytmy,
aby nie dopuścić na miejsca czołowe
podejrzanych stron.
Ostatecznie jednak, to użytkownik musi
uważać, czy
takie strony nie są podejrzane
sprawdzając adres internetowy i
sprawdzając, czy jest to rzetelne źródło.
Takie programy zawsze starają się
doskonalić swoje algorytmy tak,
aby uzyskiwać lepsze wyniki,
szybciej od konkurencji.
Obecnie wyszukiwarki
korzystają nawet z takich informacji,
których wyszukujący nie podał,
aby pomóc zawęzić zakres wyszukiwania.
Na przykład, jeśli ktoś szuka parku,
do którego można wchodzić z psem,
wiele wyszukiwarek
podaje wyniki
w postaci wszystkie parki w pobliżu.
do których można wchodzić z psem,
mimo, że szukający
nie wpisał swojej lokalizacji.
Nowoczesne wyszukiwarki
rozumieją również więcej,
niż podają słowa na stronie,
czyli co one rzeczywiście oznaczają,
aby uzyskać wyniki, które najlepiej
pasują do kryteriów wyszukiwania.
Przykładowo, jeśli ktoś poszukuje szybkiego
miotacza - po angielsku "pitcher",
wyszukiwarka wie, że szukany jest
sportowiec.
Ale gdy szukamy wielkiego dzbana,
po angielsku również "pitcher",
znajdzie opcje
wyposażenia kuchni.
Aby lepiej rozumieć słowa
korzystamy z tzw, uczenia maszynowego,
rodzaju sztucznej inteligencji.
Umożliwia to algorytmom
wyszukiwania szukać
już nie pojedynczych liter
lub słów na stronie,
ale rozumie znaczenie, jakie kryje
się za parawanem słów.
Internet rozrasta się w postępie geometrycznym,
ale jeśli zespoły odpowiadające za
wyszukiwarki będą się przykładać do pracy,
potrzebne nam informacje znajdą się zawsze
w odległości "kilku uderzeń klawiszy".