-
Sziasztok! John vagyok.
-
Én vezetem a keresővel és gépi tanulással
foglalkozó csapatokat a Google-nél.
-
Szerintem elképesztően inspiráló,
-
hogy az emberek szerte a világon
-
a keresőmotorokhoz folyamodnak, hogy
pofonegyszerű
-
és hihetetlenül fontos kérdéseket
tegyenek fel.
-
Hatalmas tehát a felelősségünk, hogy
-
a lehető legjobb válaszokat adjuk.
-
Sziasztok! Akshaya vagyok, és a Bing
kereső csapatában dolgozom.
-
Sokszor előfordul, hogy ha elkezdjük
vizsgálni
-
a mesterséges intelligenciát és
a gépi tanulást
-
de azon is gondolkoznunk kell, hogyan
fogják hasznosítani ezt a felhasználók,
-
mert végül is a társadalomra akarunk
hatást gyakorolni.
-
Tegyünk fel egy egyszerű kérdést.
-
Mennyi ideig tart eljutni a Marsra?
-
Honnan származnak ezek az eredmények
-
és miért került ez a másik elé?
-
Oké, merüljünk bele, és lássuk,
hogyan alkotta meg a keresőmotor
-
a kérdésünkből az eredményt.
-
Az első dolog, amit tudnunk kell,
hogy amikor elindítunk egy keresést,
-
a keresőmotor ténylegesen nem megy ki
a világhálóra, hogy
-
valós időben lefolytassa a keresésünket.
-
Ez azért van így, mert több mint egymilliárd
honlap van az interneten,
-
és percenként több száz újat hoznak létre.
-
Ha tehát a keresőmotornak
végig kellene néznie
-
minden egyes honlapot ahhoz, hogy
megtalálja, amit keresünk,
-
az örökké tartana.
-
Ezért, hogy felgyorsítsa a keresésünket,
-
a keresőmotor már előre folyamatosan
pásztázza a netet,
-
hogy rögzítse az információkat, amelyek
később segíthetnek a keresésben.
-
Így amikor a Marsra utazással
kapcsolatban keresünk,
-
a keresőmotornak már
rendelkezésére áll az, amivel
-
meg tudja adni a választ valós időben.
-
A következőképp működik.
-
Az internet oldalak hálózata, amelyet
hiperhivatkozások kötnek össze.
-
A keresőmotor folyamatosan futtat
egy Spider nevű programot,
-
amely keresztülhalad ezeken
a honlapokon,
-
hogy információkat gyűjtsön róluk.
-
Valahányszor hiperhivatkozást talál,
-
követi azt, amíg meg nem látogatott
minden honlapot,
-
amit a teljes interneten talál.
-
Minden lapról, amit a Spider meglátogat,
-
rögzíti azokat az információkat,
amelyekre szüksége lehet a kereséshez úgy,
-
hogy hozzáadja őket egy különleges
adatbázishoz, amit keresőindexnek hívnak.
-
Most lépjünk vissza a korábbi
keresésünkhöz,
-
és nézzük meg, ki tudjuk-e találni,
hogyan állt elő a motor
-
az eredménnyel.
-
Amikor megkérdezzük,mennyi ideig tart
az utazás a Marsra,
-
a keresőmotor mindezeket a szavakat
megkeresi
-
a keresőindexben,
így azonnal van egy listája
-
mindazokról a lapokról az interneten,
amelyek tartalmazzák e szavakat.
-
De ha csak ezeket a keresőszavakat nézi,
-
az eredmény több millió honlap lenne,
-
ezért a keresőmotornak képesnek kell
lennie meghatározni,
-
a legjobb egyezéseket,
hogy azokat mutassa először.
-
A dolog itt kezd trükkös lenni,
mert a keresőmotornak
-
lehet, hogy találgatnia kell,
mi az amit keresünk.
-
Minden keresőmotor
a saját algoritmusát alkalmazza
-
a lapok rangsorolásánál annak alapján,
hogy szerinte mit akarunk.
-
A keresőmotor rangsoroló
algoritmusa ellenőrizheti,
-
hogy a keresett kifejezés
szerepel-e a lap címében,
-
ellenőrizheti, hogy a szavak előfordulnak-e
egymás mellett,
-
vagy végezhet másféle számítást,
-
amivel jobban meghatározhatja
-
melyik lapot szeretnénk látni,
és melyiket nem.
-
A Google találta fel a
leghíresebb algoritmust
-
a legrelevánsabb találatok kiválasztásához
egy keresésben, amely számításba veszi,
-
hány további honlap kapcsolódik
egy adott oldalhoz.
-
Az elképzelés az, hogy ha sok
webhely véli úgy,
-
hogy egy weblap érdekes,
-
akkor valószínű ez az,
amit keresünk.
-
Ezt az algoritmust "page rank"-nek nevezik,
-
de nem azért, mert rangsorolja a lapokat (szó
szerinti jelentés),
-
hanem azért, mert a feltalálójáról,
Larry Page-ről nevezték el,
-
aki a Google egyik alapítója.
-
Mivel a honlap gyakran pénzt keres azzal,
ha meglátogatják,
-
spammerek állandóan
próbálnak módot találni arra,
-
hogy kijátsszák a kereső
algoritmust, és oldalaik
-
jobb helyezést érjenek el
a keresési eredményekben.
-
A keresőmotorok rendszeresen frissítik
algoritmusukat,
-
hogy megelőzzék hamis és megbízhatatlan
lapok előre kerülését.
-
Végül is a mi feladatunk,
hogy figyeljünk
-
ezekre a a nem megbízható lapokra úgy,
-
hogy megnézzük a webcímet, és
-
és meggyőződünk róla,
hogy megbízható forrás-e.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-