-
Cześć, nazywam się John.
-
Kieruję zespołami ds. nauki wyszukiwania
i maszyn w Google.
-
Fakt, że ludzie na całym świecie
-
sięgają po wyszukiwarki, aby stawiać
-
proste pytania i pytania ogromnej wagi,
-
niezwykle mnie inspiruje.
-
Udzielenie im najlepszej odpowiedzi
-
z możliwych to wielka odpowiedzialność.
-
Cześć, nazywam się Akshaya i pracuję
w zespole badan firmy Bing.
-
Wielokrotnie zastanawiamy się
nad sztuczną
-
inteligencją i nauką
maszynową,
-
należy wziąć jednak pod uwagę to,
jak będą z tego korzystać użytkownicy,
-
ponieważ, w szerszym ujęciu, chcemy
wywierać jakiś wpływ na społeczeństwo.
-
Zadajmy proste pytanie.
-
Ile trwa lot na Marsa?
-
Skąd pochodzą wyniki
-
i dlaczego konkretna pozycja
pojawia się przed inną?
-
Zgłębmy temat i
zobaczcie jak wyszukiwarka
-
przekształca zapytanie w wynik.
-
Po pierwsze trzeba wiedzieć, że
podczas wyszukiwania
-
wyszukiwarka nie wchodzi do Internetu,
-
aby poprowadzić wyszukiwanie w czasie rzeczywistym.
-
Wynika to faktu istnienia ponad
miliarda stron internetowych
-
w Internecie, a w każdej minucie
powstają setki nowych.
-
Jeśli taka wyszukiwarka
miała przejrzeć każdą, pojedynczą
-
stronę, aby znaleźć to, czego
ktoś szuka,
-
trwałoby to w nieskończoność.
-
Aby przyspieszyć wyszukiwanie,
-
wyszukiwarki nieustannie
przeglądają internet z wyprzedzeniem,
-
aby zapisywać informacje, które mogą
się przydać do wyszukiwania w przyszłości.
-
Z tego powodu, gdy szukamy
informacji o locie na Marsa,
-
wyszukiwarka
już posiada informacje potrzebne
-
do udzielenia odpowiedzi w czasie
w czasie rzeczywisym.
-
A działa to w sposób następujący.
-
Internet jest siecią stron
połączonych ze sobą hiperłączami.
-
Wyszukiwarki pracują
przez cały czas korzystając z programu
-
Spider, który przegląda te strony,
-
aby zbierać informacje na ich temat.
-
Za każdym razem, gdy znajdzie hiperłącze
-
śledzi je, aż do momentu,
gdy wejdzie na każdą stronę,
-
jaką może znaleźć w całym
Internecie.
-
Z każdej strony, na którą wejdzie,
-
Spider ewidencjonuje informacje,
których może potrzebować do wyszukiwania,
-
dodając specjalną
bazę danych zwaną indeksem wyszukiwania.
-
Wróćmy zatem do wcześniejszego
wyszukiwania i sprawdźmy,
-
czy jesteśmy w stanie dojść do tego,
jak wyszukiwarka
-
uzyskuje wyniki.
-
Gdy padnie pytanie
ile trwa lot na Marsa,
-
wyszukiwarka sprawdza
każde z słów
-
w indeksie wyszukiwarki,
aby natychmiast otrzymać wykaz
-
wszystkich stron w Internecie,
w których one występują.
-
Szukanie terminów wyszukiwania
-
może spowodować uzyskanie milionów stron,
-
więc wyszukiwarka musi być w stanie
zdecydować,
-
co pasuje najlepiej i to pokazać na
początku.
-
I tutaj pojawia się pierwsza pułapka,
ponieważ wyszukiwarka
-
będzie musiała zgadywać,
czego ktoś szuka.
-
Każda wyszukiwarka posiada
własny algorytm,
-
porządkujący strony według tego,
co według niej ma być znalezione.
-
Algorytm rankingu wyszukiwarki
jest w stanie sprawdzić,
-
czy termin wyszukiwany pojawia się
na stronie tytułowej,
-
jest w stanie sprawdzić, czy wszystkie
słowa pokazują się obok siebie,
-
albo dowolną liczbę innych obliczeń,
-
które pomagają określić,
-
które strony szukający
chce obejrzeć, a których nie.
-
Google opracował
najsłynniejszy algorytm
-
wybierania najtrafniejszych wyników
wyszukiwania z uwzględnieniem
-
liczby innych stron internetowych
powiązanych z daną stroną.
-
Koncepcja polega na tym, że
wiele witryn internetowych uzna,
-
że strona internetowa jest ciekawa,
-
zatem prawdopodobnie o tę
chodzi szukającemu.
-
Ten algorytm nosi nazwę "ranking Page'a",
-
nie ze względu na to, że ustala kolejność
stron, "page", po angielsku "strona",
-
ale z uwagi na nazwisko twórcy, Larry'ego
Page'a,
-
który jest jednym z założycieli Google.
-
Ponieważ często strona zarabia,
gdy się na nią wchodzi,
-
spamerzy nieustannie szukają
sposobów
-
złamania algorytmu wyszukiwania,
aby ich stony
-
plasowały się wyżej na liście wyników.
-
Wyszukiwarki nieustannie aktualizują
swoje algorytmy,
-
aby nie dopuścić na miejsca czołowe
podejrzanych stron.
-
Ostatecznie jednak, to użytkownik musi
uważać, czy
-
takie strony nie są podejrzane
-
sprawdzając adres internetowy i
sprawdzając, czy jest to rzetelne źródło.
-
Takie programy zawsze starają się
-
doskonalić swoje algorytmy tak,
aby uzyskiwać lepsze wyniki,
-
szybciej od konkurencji.
-
Obecnie wyszukiwarki
korzystają nawet z takich informacji,
-
których wyszukujący nie podał,
aby pomóc zawęzić zakres wyszukiwania.
-
Na przykład, jeśli ktoś szuka parku,
do którego można wchodzić z psem,
-
wiele wyszukiwarek
podaje wyniki
-
w postaci wszystkie parki w pobliżu.
do których można wchodzić z psem,
-
mimo, że szukający
nie wpisał swojej lokalizacji.
-
Nowoczesne wyszukiwarki
rozumieją również więcej,
-
niż podają słowa na stronie,
-
czyli co one rzeczywiście oznaczają,
aby uzyskać wyniki, które najlepiej
-
pasują do kryteriów wyszukiwania.
-
Przykładowo, jeśli ktoś poszukuje szybkiego
miotacza - po angielsku "pitcher",
-
wyszukiwarka wie, że szukany jest
sportowiec.
-
Ale gdy szukamy wielkiego dzbana,
po angielsku również "pitcher",
-
znajdzie opcje
wyposażenia kuchni.
-
Aby lepiej rozumieć słowa
korzystamy z tzw, uczenia maszynowego,
-
rodzaju sztucznej inteligencji.
-
Umożliwia to algorytmom
wyszukiwania szukać
-
już nie pojedynczych liter
lub słów na stronie,
-
ale rozumie znaczenie, jakie kryje
się za parawanem słów.
-
Internet rozrasta się w postępie geometrycznym,
-
ale jeśli zespoły odpowiadające za
wyszukiwarki będą się przykładać do pracy,
-
potrzebne nam informacje znajdą się zawsze
w odległości "kilku uderzeń klawiszy".