Sziasztok! John vagyok.
Én vezetem a keresővel és gépi tanulással
foglalkozó csapatokat a Google-nél.
Szerintem elképesztően inspiráló,
hogy az emberek szerte a világon
a keresőmotorokhoz folyamodnak, hogy
pofonegyszerű
és hihetetlenül fontos kérdéseket
tegyenek fel.
Hatalmas tehát a felelősségünk, hogy
a lehető legjobb válaszokat adjuk.
Sziasztok! Akshaya vagyok, és a Bing
kereső csapatában dolgozom.
Sokszor előfordul, hogy ha elkezdjük
vizsgálni
a mesterséges intelligenciát és
a gépi tanulást
de azon is gondolkoznunk kell, hogyan
fogják hasznosítani ezt a felhasználók,
mert végül is a társadalomra akarunk
hatást gyakorolni.
Tegyünk fel egy egyszerű kérdést.
Mennyi ideig tart eljutni a Marsra?
Honnan származnak ezek az eredmények
és miért került ez a másik elé?
Oké, merüljünk bele, és lássuk,
hogyan alkotta meg a keresőmotor
a kérdésünkből az eredményt.
Az első dolog, amit tudnunk kell,
hogy amikor elindítunk egy keresést,
a keresőmotor ténylegesen nem megy ki
a világhálóra, hogy
valós időben lefolytassa a keresésünket.
Azért, mert több mint egymilliárd
honlap van az interneten,
és percenként több száz újat hoznak létre.
Ha a keresőmotornak
végig kellene néznie
minden honlapot, hogy
megtalálja, amit keresünk,
az örökké tartana.
Ezért, hogy felgyorsítsa a keresést,
a keresőmotor már előre folyamatosan
pásztázza a netet,
hogy rögzítse az információkat, amelyek
később segíthetnek a keresésben.
Így amikor a Marsra utazással
kapcsolatban keresünk,
a keresőmotornak már
rendelkezésére áll az, amivel
meg tudja adni a választ valós időben.
A következőképp működik.
Az internet oldalak hálózata, amelyet
hiperhivatkozások kötnek össze.
A motor folyamatosan futtat
egy Spider nevű programot,
amely keresztülhalad ezeken
a honlapokon,
hogy információkat gyűjtsön róluk.
Valahányszor hiperhivatkozást talál,
követi azt, amíg meg nem látogatott
minden honlapot,
amit a teljes interneten talál.
Minden lapról, amit meglátogat,
rögzíti az információkat,
amelyekre szükség lehet a kereséshez úgy,
hogy hozzáadja őket egy különleges
adatbázishoz, amit keresőindexnek hívnak.
Most lépjünk vissza a korábbi
keresésünkhöz,
és nézzük, ki tudjuk-e találni,
hogy állt elő a motor
az eredménnyel.
Amikor megkérdezzük,mennyi ideig tart
az utazás a Marsra,
a keresőmotor mindezeket a szavakat
megkeresi
a keresőindexben,
így azonnal van egy listája
minden a lapról az interneten,
amely tartalmazza e szavakat.
De ha csak ezeket a keresőszavakat nézi,
az eredmény több millió honlap lenne,
így a motornak képesnek kell
lennie meghatározni,
a legjobb egyezéseket,
hogy azokat mutassa először.
A dolog itt kezd trükkös lenni,
mert a motornak
lehet, hogy találgatnia kell,
hogy mit keresünk.
Minden keresőmotor
a saját algoritmusát alkalmazza
a lapok rangsorolásánál annak alapján,
hogy szerinte mit akarunk.
A keresőmotor rangsoroló
algoritmusa ellenőrizheti,
hogy a keresett kifejezés
szerepel-e a lap címében,
ellenőrizheti, hogy a szavak
előfordulnak-e egymás mellett,
vagy végezhet másféle számítást,
amivel jobban meghatározhatja
melyik lapot szeretnénk látni,
és melyiket nem.
A Google találta fel a
leghíresebb algoritmust
a legjobb találatok kiválasztásához,
amely számításba veszi,
hány további honlap kapcsolódik
egy adott oldalhoz.
Az elképzelés az, hogy ha sok
webhely véli úgy,
hogy egy weblap érdekes,
akkor valószínű ez az,
amit keresünk.
Ezt az algoritmust "page rank"-nek
nevezik,
nem azért, mert rangsorolja a lapokat (szó
szerinti jelentés)
hanem azért, mert feltalálójáról,
Larry Page-ről,
aki a Google egyik alapítójáról
nevezték el.
Mivel a honlap gyakran pénzt keres azzal,
ha meglátogatják,
spammerek állandóan
próbálnak módot találni arra,
hogy kijátsszák a kereső
algoritmust, és oldalaik
jobb helyezést érjenek el
a keresési eredményekben.
A keresőmotorok rendszeresen frissítik
algoritmusukat,
hogy megelőzzék hamis és megbízhatatlan
lapok előre kerülését.
Végül nekünk kell,
figyelnünk
ezekre a a nem megbízható lapokra úgy,
hogy megnézzük a webcímet, és
meggyőződünk róla, megbízható forrás-e.
A keresőprogramok állandóan fejlődnek,
javítják az algoritmust, hogy jobb
eredményeket,
gyorsabb eredményeket hozzanak,
mint versenytársaik.
Napjaink keresőmotorjai
olyan információt is felhasználnak
amit nem adunk meg kifejezetten, hogy
segítsen leszűkíteni a keresést.
Ha például már kerestünk kutyaparkot,
sok keresőmotor ad eredményeket
minden környező kutyaparkra,
bár nem adtuk meg
a helyadatainkat.
A modern keresőmotorok emellett
többet is megértenek
mint a szavakat a lapon,
hanem a teljes jelentést, hogy a
legjobbat találják meg,
ami megfelel annak, amit keresünk.
Például ha a keresőszavunk
"fast pitcher",
a motor tudni fogja,
hogy sportolót keresünk.
Ha viszont a keresőszó "large pitcher"
akkor konyhafelszerelés után
fog nézni.
A szavak jobb megértéséhez használjuk
a gépi tanulás kifejezést
egyfajta mesterséges intelligenciát.
Ez képessé teszi a kereső
algoritmusokat, hogy ne csak
egyes betűket, szavakat
keressenek a lapon,
hanem megértsék a szavak
mögötti jelentést is.
Az internet exponenciálisan nő,
de a keresőmotorokat tervező csapatok
jól dolgoznak, mert
az információ, amit keresünk mindig
elérhető néhány leütéssel.