WEBVTT 00:00:06.070 --> 00:00:07.510 Sziasztok! John vagyok. 00:00:07.510 --> 00:00:11.210 Én vezetem a keresővel és gépi tanulással foglalkozó csapatokat a Google-nél. 00:00:12.130 --> 00:00:14.230 Szerintem elképesztően inspiráló, 00:00:14.230 --> 00:00:16.214 hogy az emberek szerte a világon 00:00:16.215 --> 00:00:19.160 a keresőmotorokhoz folyamodnak, hogy pofonegyszerű 00:00:19.160 --> 00:00:21.380 és hihetetlenül fontos kérdéseket tegyenek fel. 00:00:21.380 --> 00:00:23.450 Hatalmas tehát a felelősségünk, hogy 00:00:23.450 --> 00:00:25.524 a lehető legjobb válaszokat adjuk. 00:00:26.710 --> 00:00:30.610 Sziasztok! Akshaya vagyok, és a Bing kereső csapatában dolgozom. 00:00:30.910 --> 00:00:33.190 Sokszor előfordul, hogy ha elkezdjük vizsgálni 00:00:33.190 --> 00:00:35.800 a mesterséges intelligenciát és a gépi tanulást 00:00:35.800 --> 00:00:39.460 de azon is gondolkoznunk kell, hogyan fogják hasznosítani ezt a felhasználók, 00:00:39.460 --> 00:00:42.390 mert végül is a társadalomra akarunk hatást gyakorolni. 00:00:43.780 --> 00:00:45.400 Tegyünk fel egy egyszerű kérdést. 00:00:45.820 --> 00:00:48.070 Mennyi ideig tart eljutni a Marsra? 00:00:49.330 --> 00:00:51.370 Honnan származnak ezek az eredmények 00:00:51.370 --> 00:00:54.100 és miért került ez a másik elé? 00:00:55.700 --> 00:00:58.760 Oké, merüljünk bele, és lássuk, hogyan alkotta meg a keresőmotor 00:00:58.760 --> 00:01:00.390 a kérdésünkből az eredményt. 00:01:00.390 --> 00:01:03.700 Az első dolog, amit tudnunk kell, hogy amikor elindítunk egy keresést, 00:01:03.700 --> 00:01:06.480 a keresőmotor ténylegesen nem megy ki a világhálóra, hogy 00:01:06.480 --> 00:01:08.420 valós időben lefolytassa a keresésünket. 00:01:08.420 --> 00:01:11.280 Azért, mert több mint egymilliárd honlap van az interneten, 00:01:11.280 --> 00:01:14.140 és percenként több száz újat hoznak létre. 00:01:14.140 --> 00:01:16.240 Ha a keresőmotornak végig kellene néznie 00:01:16.240 --> 00:01:18.690 minden honlapot, hogy megtalálja, amit keresünk, 00:01:18.690 --> 00:01:20.120 az örökké tartana. 00:01:20.500 --> 00:01:21.940 Ezért, hogy felgyorsítsa a keresést, 00:01:21.970 --> 00:01:24.940 a keresőmotor már előre folyamatosan pásztázza a netet, 00:01:25.420 --> 00:01:28.560 hogy rögzítse az információkat, amelyek később segíthetnek a keresésben. 00:01:28.930 --> 00:01:31.270 Így amikor a Marsra utazással kapcsolatban keresünk, 00:01:31.630 --> 00:01:33.700 a keresőmotornak már rendelkezésére áll az, amivel 00:01:33.700 --> 00:01:35.728 meg tudja adni a választ valós időben. 00:01:36.250 --> 00:01:37.540 A következőképp működik. 00:01:37.900 --> 00:01:42.010 Az internet oldalak hálózata, amelyet hiperhivatkozások kötnek össze. 00:01:42.400 --> 00:01:44.680 A keresőmotor folyamatosan futtat egy Spider nevű programot, 00:01:44.680 --> 00:01:47.380 amely keresztülhalad ezeken a honlapokon, 00:01:47.380 --> 00:01:49.040 hogy információkat gyűjtsön róluk. 00:01:49.780 --> 00:01:51.550 Valahányszor hiperhivatkozást talál, 00:01:52.090 --> 00:01:55.000 követi azt, amíg meg nem látogatott minden honlapot, 00:01:55.030 --> 00:01:57.240 amit a teljes interneten talál. 00:01:57.335 --> 00:01:59.170 Minden lapról, amit a Spider meglátogat, 00:01:59.200 --> 00:02:02.320 rögzíti azokat az információkat, amelyekre szüksége lehet a kereséshez úgy, 00:02:02.500 --> 00:02:05.650 hogy hozzáadja őket egy különleges adatbázishoz, amit keresőindexnek hívnak. 00:02:07.166 --> 00:02:09.530 Most lépjünk vissza a korábbi keresésünkhöz, 00:02:09.590 --> 00:02:11.990 és nézzük meg, ki tudjuk-e találni, hogyan állt elő a motor 00:02:11.990 --> 00:02:13.333 az eredménnyel. 00:02:13.640 --> 00:02:16.460 Amikor megkérdezzük,mennyi ideig tart az utazás a Marsra, 00:02:16.640 --> 00:02:18.860 a keresőmotor mindezeket a szavakat megkeresi 00:02:18.920 --> 00:02:21.410 a keresőindexben, így azonnal van egy listája 00:02:21.410 --> 00:02:24.500 mindazokról a lapokról az interneten, amelyek tartalmazzák e szavakat. 00:02:24.890 --> 00:02:26.870 De ha csak ezeket a keresőszavakat nézi, 00:02:26.870 --> 00:02:28.760 az eredmény több millió honlap lenne, 00:02:28.760 --> 00:02:31.110 ezért a keresőmotornak képesnek kell lennie meghatározni, 00:02:31.110 --> 00:02:33.120 a legjobb egyezéseket, hogy azokat mutassa először. 00:02:33.340 --> 00:02:36.010 A dolog itt kezd trükkös lenni, mert a keresőmotornak 00:02:36.010 --> 00:02:38.040 lehet, hogy találgatnia kell, mi az amit keresünk. 00:02:38.930 --> 00:02:41.360 Minden keresőmotor a saját algoritmusát alkalmazza 00:02:41.360 --> 00:02:44.230 a lapok rangsorolásánál annak alapján, hogy szerinte mit akarunk. 00:02:44.930 --> 00:02:47.660 A keresőmotor rangsoroló algoritmusa ellenőrizheti, 00:02:47.990 --> 00:02:50.360 hogy a keresett kifejezés szerepel-e a lap címében, 00:02:50.900 --> 00:02:53.820 ellenőrizheti, hogy a szavak előfordulnak-e egymás mellett, 00:02:54.520 --> 00:02:57.020 vagy végezhet másféle számítást, 00:02:57.020 --> 00:02:58.610 amivel jobban meghatározhatja 00:02:58.670 --> 00:03:01.420 melyik lapot szeretnénk látni, és melyiket nem. 00:03:02.960 --> 00:03:04.960 A Google találta fel a leghíresebb algoritmust 00:03:04.960 --> 00:03:06.745 a legrelevánsabb találatok kiválasztásához egy keresésben, amely számításba veszi, 00:03:06.745 --> 00:03:08.530 hány további honlap kapcsolódik egy adott oldalhoz. 00:03:08.560 --> 00:03:11.230 Az elképzelés az, hogy ha sok webhely véli úgy, 00:03:11.830 --> 00:03:14.140 hogy egy weblap érdekes, 00:03:14.140 --> 00:03:15.660 akkor valószínű ez az, amit keresünk. 00:03:15.660 --> 00:03:17.940 Ezt az algoritmust "page rank"-nek nevezik, 00:03:18.190 --> 00:03:20.020 de nem azért, mert rangsorolja a lapokat (szó szerinti jelentés), 00:03:20.590 --> 00:03:22.330 hanem azért, mert a feltalálójáról, Larry Page-ről nevezték el, 00:03:22.570 --> 00:03:25.210 aki a Google egyik alapítója. 00:03:25.480 --> 00:03:27.333 Mivel a honlap gyakran pénzt keres azzal, ha meglátogatják, 00:03:27.940 --> 00:03:30.520 spammerek állandóan próbálnak módot találni arra, 00:03:30.820 --> 00:03:32.950 hogy kijátsszák a kereső algoritmust, és oldalaik 00:03:32.950 --> 00:03:35.741 jobb helyezést érjenek el a keresési eredményekben. 00:03:35.742 --> 00:03:37.931 A keresőmotorok rendszeresen frissítik algoritmusukat, 00:03:38.260 --> 00:03:40.750 hogy megelőzzék hamis és megbízhatatlan lapok előre kerülését. 00:03:40.750 --> 00:03:44.296 Végül is a mi feladatunk, hogy figyeljünk 00:03:44.680 --> 00:03:47.350 ezekre a a nem megbízható lapokra úgy, 00:03:47.500 --> 00:03:49.450 hogy megnézzük a webcímet, és meggyőződünk róla, megbízható forrás-e. 00:03:49.690 --> 00:03:52.990 A keresőprogramok állandóan fejlődnek, 00:03:53.680 --> 00:03:55.390 javítják az algoritmust, hogy jobb eredményeket, 00:03:55.420 --> 00:03:58.420 gyorsabb eredményeket tudjanak hozni, mint versenytársaik. 00:03:58.540 --> 00:04:00.460 Napjaink keresőmotorjai olyan információt is felhasználnak 00:04:01.000 --> 00:04:03.100 amit nem adunk meg kifejezetten, hogy segítsen leszűkíteni a keresésünket. 00:04:03.100 --> 00:04:06.820 Ha például már kerestünk kutyaparkot, 00:04:07.150 --> 00:04:10.120 sok keresőmotor ad eredményeket 00:04:10.240 --> 00:04:12.190 minden környező kutyaparkra, 00:04:12.190 --> 00:04:13.840 bár nem adtuk meg a helyadatainkat. 00:04:14.080 --> 00:04:16.260 A modern keresőmotorok emellett többet is megértenek 00:04:17.800 --> 00:04:20.530 mint a szavakat a lapon, 00:04:20.530 --> 00:04:22.060 hanem a teljes jelentést, hogy a legjobbat találják meg, 00:04:22.300 --> 00:04:24.970 ami megfelel annak, amit keresünk. 00:04:24.970 --> 00:04:26.750 Például ha a keresőszavunk "fast pitcher", 00:04:27.130 --> 00:04:29.980 a motor tudni fogja, hogy sportolót keresünk. 00:04:30.280 --> 00:04:32.300 Ha viszont a keresőszó "large pitcher" 00:04:32.500 --> 00:04:34.450 akkor konyhafelszerelés után fog nézni. 00:04:34.450 --> 00:04:36.730 A szavak jobb megértéséhez használjuk azt, amit gépi tanulásnak nevezünk, 00:04:38.420 --> 00:04:41.910 egyfajta mesterséges intelligenciát. 00:04:41.910 --> 00:04:43.985 Ez képessé teszi a kereső algoritmusokat, hogy ne csak 00:04:43.985 --> 00:04:46.050 egyes betűket, szavakat keressenek a lapon, 00:04:46.090 --> 00:04:48.400 hanem megértsék a szavak mögötti jelentést is. 00:04:48.400 --> 00:04:51.280 Az internet exponenciálisan nő, 00:04:53.690 --> 00:04:55.850 de a keresőmotorokat tervező csapatok jól dolgoznak, mert 00:04:56.210 --> 00:04:59.810 az információ, amit keresünk mindig elérhető néhány leütéssel.