Sziasztok! John vagyok. Én vezetem a keresővel és gépi tanulással foglalkozó csapatokat a Google-nél. Szerintem elképesztően inspiráló, hogy az emberek szerte a világon a keresőmotorokhoz folyamodnak, hogy pofonegyszerű és hihetetlenül fontos kérdéseket tegyenek fel. Hatalmas tehát a felelősségünk, hogy a lehető legjobb válaszokat adjuk. Sziasztok! Akshaya vagyok, és a Bing kereső csapatában dolgozom. Sokszor előfordul, hogy ha elkezdjük vizsgálni a mesterséges intelligenciát és a gépi tanulást de azon is gondolkoznunk kell, hogyan fogják hasznosítani ezt a felhasználók, mert végül is a társadalomra akarunk hatást gyakorolni. Tegyünk fel egy egyszerű kérdést. Mennyi ideig tart eljutni a Marsra? Honnan származnak ezek az eredmények és miért került ez a másik elé? Oké, merüljünk bele, és lássuk, hogyan alkotta meg a keresőmotor a kérdésünkből az eredményt. Az első dolog, amit tudnunk kell, hogy amikor elindítunk egy keresést, a keresőmotor ténylegesen nem megy ki a világhálóra, hogy valós időben lefolytassa a keresésünket. Azért, mert több mint egymilliárd honlap van az interneten, és percenként több száz újat hoznak létre. Ha a keresőmotornak végig kellene néznie minden honlapot, hogy megtalálja, amit keresünk, az örökké tartana. Ezért, hogy felgyorsítsa a keresést, a keresőmotor már előre folyamatosan pásztázza a netet, hogy rögzítse az információkat, amelyek később segíthetnek a keresésben. Így amikor a Marsra utazással kapcsolatban keresünk, a keresőmotornak már rendelkezésére áll az, amivel meg tudja adni a választ valós időben. A következőképp működik. Az internet oldalak hálózata, amelyet hiperhivatkozások kötnek össze. A motor folyamatosan futtat egy Spider nevű programot, amely keresztülhalad ezeken a honlapokon, hogy információkat gyűjtsön róluk. Valahányszor hiperhivatkozást talál, követi azt, amíg meg nem látogatott minden honlapot, amit a teljes interneten talál. Minden lapról, amit meglátogat, rögzíti az információkat, amelyekre szükség lehet a kereséshez úgy, hogy hozzáadja őket egy különleges adatbázishoz, amit keresőindexnek hívnak. Most lépjünk vissza a korábbi keresésünkhöz, és nézzük, ki tudjuk-e találni, hogy állt elő a motor az eredménnyel. Amikor megkérdezzük,mennyi ideig tart az utazás a Marsra, a keresőmotor mindezeket a szavakat megkeresi a keresőindexben, így azonnal van egy listája minden a lapról az interneten, amely tartalmazza e szavakat. De ha csak ezeket a keresőszavakat nézi, az eredmény több millió honlap lenne, így a motornak képesnek kell lennie meghatározni, a legjobb egyezéseket, hogy azokat mutassa először. A dolog itt kezd trükkös lenni, mert a motornak lehet, hogy találgatnia kell, hogy mit keresünk. Minden keresőmotor a saját algoritmusát alkalmazza a lapok rangsorolásánál annak alapján, hogy szerinte mit akarunk. A keresőmotor rangsoroló algoritmusa ellenőrizheti, hogy a keresett kifejezés szerepel-e a lap címében, ellenőrizheti, hogy a szavak előfordulnak-e egymás mellett, vagy végezhet másféle számítást, amivel jobban meghatározhatja melyik lapot szeretnénk látni, és melyiket nem. A Google találta fel a leghíresebb algoritmust a legjobb találatok kiválasztásához, amely számításba veszi, hány további honlap kapcsolódik egy adott oldalhoz. Az elképzelés az, hogy ha sok webhely véli úgy, hogy egy weblap érdekes, akkor valószínű ez az, amit keresünk. Ezt az algoritmust "page rank"-nek nevezik, nem azért, mert rangsorolja a lapokat (szó szerinti jelentés) hanem azért, mert feltalálójáról, Larry Page-ről, aki a Google egyik alapítójáról nevezték el. Mivel a honlap gyakran pénzt keres azzal, ha meglátogatják, spammerek állandóan próbálnak módot találni arra, hogy kijátsszák a kereső algoritmust, és oldalaik jobb helyezést érjenek el a keresési eredményekben. A keresőmotorok rendszeresen frissítik algoritmusukat, hogy megelőzzék hamis és megbízhatatlan lapok előre kerülését. Végül nekünk kell, figyelnünk ezekre a a nem megbízható lapokra úgy, hogy megnézzük a webcímet, és meggyőződünk róla, megbízható forrás-e. A keresőprogramok állandóan fejlődnek, javítják az algoritmust, hogy jobb eredményeket, gyorsabb eredményeket hozzanak, mint versenytársaik. Napjaink keresőmotorjai olyan információt is felhasználnak amit nem adunk meg kifejezetten, hogy segítsen leszűkíteni a keresést. Ha például már kerestünk kutyaparkot, sok keresőmotor ad eredményeket minden környező kutyaparkra, bár nem adtuk meg a helyadatainkat. A modern keresőmotorok emellett többet is megértenek mint a szavakat a lapon, hanem a teljes jelentést, hogy a legjobbat találják meg, ami megfelel annak, amit keresünk. Például ha a keresőszavunk "fast pitcher", a motor tudni fogja, hogy sportolót keresünk. Ha viszont a keresőszó "large pitcher" akkor konyhafelszerelés után fog nézni. A szavak jobb megértéséhez használjuk a gépi tanulás kifejezést egyfajta mesterséges intelligenciát. Ez képessé teszi a kereső algoritmusokat, hogy ne csak egyes betűket, szavakat keressenek a lapon, hanem megértsék a szavak mögötti jelentést is. Az internet exponenciálisan nő, de a keresőmotorokat tervező csapatok jól dolgoznak, mert az információ, amit keresünk mindig elérhető néhány leütéssel.