1 00:00:06,070 --> 00:00:07,510 Sziasztok! John vagyok. 2 00:00:07,510 --> 00:00:11,210 Én vezetem a keresővel és gépi tanulással foglalkozó csapatokat a Google-nél. 3 00:00:12,130 --> 00:00:14,230 Szerintem elképesztően inspiráló, 4 00:00:14,230 --> 00:00:16,214 hogy az emberek szerte a világon 5 00:00:16,215 --> 00:00:19,160 a keresőmotorokhoz folyamodnak, hogy pofonegyszerű 6 00:00:19,160 --> 00:00:21,380 és hihetetlenül fontos kérdéseket tegyenek fel. 7 00:00:21,380 --> 00:00:23,450 Hatalmas tehát a felelősségünk, hogy 8 00:00:23,450 --> 00:00:25,524 a lehető legjobb válaszokat adjuk. 9 00:00:26,710 --> 00:00:30,610 Sziasztok! Akshaya vagyok, és a Bing kereső csapatában dolgozom. 10 00:00:30,910 --> 00:00:33,190 Sokszor előfordul, hogy ha elkezdjük vizsgálni 11 00:00:33,190 --> 00:00:35,800 a mesterséges intelligenciát és a gépi tanulást 12 00:00:35,800 --> 00:00:39,460 de azon is gondolkoznunk kell, hogyan fogják hasznosítani ezt a felhasználók, 13 00:00:39,460 --> 00:00:42,390 mert végül is a társadalomra akarunk hatást gyakorolni. 14 00:00:43,780 --> 00:00:45,400 Tegyünk fel egy egyszerű kérdést. 15 00:00:45,820 --> 00:00:48,070 Mennyi ideig tart eljutni a Marsra? 16 00:00:49,330 --> 00:00:51,370 Honnan származnak ezek az eredmények 17 00:00:51,370 --> 00:00:54,100 és miért került ez a másik elé? 18 00:00:55,700 --> 00:00:58,760 Oké, merüljünk bele, és lássuk, hogyan alkotta meg a keresőmotor 19 00:00:58,760 --> 00:01:00,390 a kérdésünkből az eredményt. 20 00:01:00,390 --> 00:01:03,700 Az első dolog, amit tudnunk kell, hogy amikor elindítunk egy keresést, 21 00:01:03,700 --> 00:01:06,480 a keresőmotor ténylegesen nem megy ki a világhálóra, hogy 22 00:01:06,480 --> 00:01:08,420 valós időben lefolytassa a keresésünket. 23 00:01:08,420 --> 00:01:11,280 Azért, mert több mint egymilliárd honlap van az interneten, 24 00:01:11,280 --> 00:01:14,140 és percenként több száz újat hoznak létre. 25 00:01:14,140 --> 00:01:16,240 Ha a keresőmotornak végig kellene néznie 26 00:01:16,240 --> 00:01:18,690 minden honlapot, hogy megtalálja, amit keresünk, 27 00:01:18,690 --> 00:01:20,120 az örökké tartana. 28 00:01:20,120 --> 00:01:21,940 Ezért, hogy felgyorsítsa a keresést, 29 00:01:21,970 --> 00:01:24,940 a keresőmotor már előre folyamatosan pásztázza a netet, 30 00:01:25,150 --> 00:01:28,680 hogy rögzítse az információkat, amelyek később segíthetnek a keresésben. 31 00:01:28,680 --> 00:01:31,270 Így amikor a Marsra utazással kapcsolatban keresünk, 32 00:01:31,370 --> 00:01:33,700 a keresőmotornak már rendelkezésére áll az, amivel 33 00:01:33,700 --> 00:01:35,728 meg tudja adni a választ valós időben. 34 00:01:36,250 --> 00:01:37,540 A következőképp működik. 35 00:01:37,900 --> 00:01:42,010 Az internet oldalak hálózata, amelyet hiperhivatkozások kötnek össze. 36 00:01:42,010 --> 00:01:44,680 A motor folyamatosan futtat egy Spider nevű programot, 37 00:01:44,680 --> 00:01:47,380 amely keresztülhalad ezeken a honlapokon, 38 00:01:47,380 --> 00:01:49,040 hogy információkat gyűjtsön róluk. 39 00:01:49,780 --> 00:01:51,550 Valahányszor hiperhivatkozást talál, 40 00:01:52,090 --> 00:01:55,000 követi azt, amíg meg nem látogatott minden honlapot, 41 00:01:55,030 --> 00:01:57,240 amit a teljes interneten talál. 42 00:01:57,245 --> 00:01:59,170 Minden lapról, amit meglátogat, 43 00:01:59,170 --> 00:02:02,320 rögzíti az információkat, amelyekre szükség lehet a kereséshez úgy, 44 00:02:02,500 --> 00:02:06,150 hogy hozzáadja őket egy különleges adatbázishoz, amit keresőindexnek hívnak. 45 00:02:07,166 --> 00:02:09,530 Most lépjünk vissza a korábbi keresésünkhöz, 46 00:02:09,530 --> 00:02:12,210 és nézzük, ki tudjuk-e találni, hogy állt elő a motor 47 00:02:12,210 --> 00:02:13,333 az eredménnyel. 48 00:02:13,640 --> 00:02:16,460 Amikor megkérdezzük,mennyi ideig tart az utazás a Marsra, 49 00:02:16,640 --> 00:02:18,860 a keresőmotor mindezeket a szavakat megkeresi 50 00:02:18,920 --> 00:02:21,410 a keresőindexben, így azonnal van egy listája 51 00:02:21,410 --> 00:02:24,500 minden a lapról az interneten, amely tartalmazza e szavakat. 52 00:02:24,890 --> 00:02:26,870 De ha csak ezeket a keresőszavakat nézi, 53 00:02:26,870 --> 00:02:28,760 az eredmény több millió honlap lenne, 54 00:02:28,760 --> 00:02:31,110 így a motornak képesnek kell lennie meghatározni, 55 00:02:31,110 --> 00:02:33,560 a legjobb egyezéseket, hogy azokat mutassa először. 56 00:02:33,560 --> 00:02:36,010 A dolog itt kezd trükkös lenni, mert a motornak 57 00:02:36,010 --> 00:02:38,430 lehet, hogy találgatnia kell, hogy mit keresünk. 58 00:02:38,930 --> 00:02:41,360 Minden keresőmotor a saját algoritmusát alkalmazza 59 00:02:41,360 --> 00:02:44,530 a lapok rangsorolásánál annak alapján, hogy szerinte mit akarunk. 60 00:02:44,930 --> 00:02:47,660 A keresőmotor rangsoroló algoritmusa ellenőrizheti, 61 00:02:47,900 --> 00:02:50,360 hogy a keresett kifejezés szerepel-e a lap címében, 62 00:02:50,820 --> 00:02:54,030 ellenőrizheti, hogy a szavak előfordulnak-e egymás mellett, 63 00:02:54,520 --> 00:02:57,020 vagy végezhet másféle számítást, 64 00:02:57,020 --> 00:02:58,610 amivel jobban meghatározhatja 65 00:02:58,670 --> 00:03:01,420 melyik lapot szeretnénk látni, és melyiket nem. 66 00:03:02,740 --> 00:03:04,960 A Google találta fel a leghíresebb algoritmust 67 00:03:04,960 --> 00:03:08,406 a legjobb találatok kiválasztásához, amely számításba veszi, 68 00:03:08,406 --> 00:03:11,220 hány további honlap kapcsolódik egy adott oldalhoz. 69 00:03:11,220 --> 00:03:13,893 Az elképzelés az, hogy ha sok webhely véli úgy, 70 00:03:13,893 --> 00:03:15,927 hogy egy weblap érdekes, 71 00:03:15,927 --> 00:03:17,970 akkor valószínű ez az, amit keresünk. 72 00:03:17,970 --> 00:03:20,030 Ezt az algoritmust "page rank"-nek nevezik, 73 00:03:20,030 --> 00:03:22,980 nem azért, mert rangsorolja a lapokat (szó szerinti jelentés) 74 00:03:22,980 --> 00:03:25,590 hanem azért, mert feltalálójáról, Larry Page-ről, 75 00:03:25,590 --> 00:03:27,800 aki a Google egyik alapítójáról nevezték el. 76 00:03:27,800 --> 00:03:30,570 Mivel a honlap gyakran pénzt keres azzal, ha meglátogatják, 77 00:03:30,570 --> 00:03:33,240 spammerek állandóan próbálnak módot találni arra, 78 00:03:33,240 --> 00:03:35,590 hogy kijátsszák a kereső algoritmust, és oldalaik 79 00:03:35,590 --> 00:03:38,201 jobb helyezést érjenek el a keresési eredményekben. 80 00:03:38,201 --> 00:03:40,990 A keresőmotorok rendszeresen frissítik algoritmusukat, 81 00:03:40,990 --> 00:03:44,690 hogy megelőzzék hamis és megbízhatatlan lapok előre kerülését. 82 00:03:44,690 --> 00:03:47,339 Végül nekünk kell, figyelnünk 83 00:03:47,339 --> 00:03:49,700 ezekre a a nem megbízható lapokra úgy, 84 00:03:49,700 --> 00:03:53,430 hogy megnézzük a webcímet, és meggyőződünk róla, megbízható forrás-e. 85 00:03:53,430 --> 00:03:55,676 A keresőprogramok állandóan fejlődnek, 86 00:03:55,676 --> 00:03:58,090 javítják az algoritmust, hogy jobb eredményeket, 87 00:03:58,090 --> 00:04:00,590 gyorsabb eredményeket hozzanak, mint versenytársaik. 88 00:04:00,590 --> 00:04:03,380 Napjaink keresőmotorjai olyan információt is felhasználnak 89 00:04:03,380 --> 00:04:06,749 amit nem adunk meg kifejezetten, hogy segítsen leszűkíteni a keresést. 90 00:04:06,749 --> 00:04:10,109 Ha például már kerestünk kutyaparkot, 91 00:04:10,109 --> 00:04:12,210 sok keresőmotor ad eredményeket 92 00:04:12,210 --> 00:04:14,001 minden környező kutyaparkra, 93 00:04:14,001 --> 00:04:17,980 bár nem adtuk meg a helyadatainkat. 94 00:04:17,980 --> 00:04:20,470 A modern keresőmotorok emellett többet is megértenek 95 00:04:20,470 --> 00:04:22,310 mint a szavakat a lapon, 96 00:04:22,310 --> 00:04:25,090 hanem a teljes jelentést, hogy a legjobbat találják meg, 97 00:04:25,090 --> 00:04:26,930 ami megfelel annak, amit keresünk. 98 00:04:26,930 --> 00:04:30,200 Például ha a keresőszavunk "fast pitcher", 99 00:04:30,200 --> 00:04:32,580 a motor tudni fogja, hogy sportolót keresünk. 100 00:04:32,580 --> 00:04:34,580 Ha viszont a keresőszó "large pitcher" 101 00:04:34,580 --> 00:04:38,970 akkor konyhafelszerelés után fog nézni. 102 00:04:38,970 --> 00:04:41,970 A szavak jobb megértéséhez használjuk a gépi tanulás kifejezést 103 00:04:41,970 --> 00:04:43,720 egyfajta mesterséges intelligenciát. 104 00:04:43,720 --> 00:04:46,650 Ez képessé teszi a kereső algoritmusokat, hogy ne csak 105 00:04:46,650 --> 00:04:49,329 egyes betűket, szavakat keressenek a lapon, 106 00:04:49,329 --> 00:04:52,690 hanem megértsék a szavak mögötti jelentést is. 107 00:04:53,460 --> 00:04:56,030 Az internet exponenciálisan nő, 108 00:04:56,030 --> 00:05:00,114 de a keresőmotorokat tervező csapatok jól dolgoznak, mert 109 00:05:00,114 --> 00:05:04,789 az információ, amit keresünk mindig elérhető néhány leütéssel.