1 00:00:06,070 --> 00:00:07,120 Sziasztok! John vagyok. 2 00:00:07,510 --> 00:00:10,140 Én vezetem a keresővel és gépi tanulással foglalkozó csapatokat a Google-nél. 3 00:00:12,130 --> 00:00:14,230 Szerintem elképesztően inspiráló, 4 00:00:14,230 --> 00:00:16,214 hogy az emberek szerte a világon 5 00:00:16,215 --> 00:00:19,160 a keresőmotorokhoz folyamodnak, hogy pofonegyszerű 6 00:00:19,160 --> 00:00:20,930 és hihetetlenül fontos kérdéseket tegyenek fel. 7 00:00:20,930 --> 00:00:23,450 Hatalmas tehát a felelősségünk, hogy 8 00:00:23,450 --> 00:00:24,864 a lehető legjobb válaszokat adjuk. 9 00:00:26,710 --> 00:00:30,610 Sziasztok! Akshaya vagyok, és a Bing kereső csapatában dolgozom. 10 00:00:30,910 --> 00:00:33,190 Sokszor előfordul, hogy ha elkezdjük vizsgálni 11 00:00:33,190 --> 00:00:35,800 a mesterséges intelligenciát és a gépi tanulást 12 00:00:35,830 --> 00:00:39,010 de azon is gondolkoznunk kell, hogyan fogják hasznosítani ezt a felhasználók, 13 00:00:39,140 --> 00:00:42,390 mert végül is a társadalomra akarunk hatást gyakorolni. 14 00:00:43,780 --> 00:00:45,400 Tegyünk fel egy egyszerű kérdést. 15 00:00:45,820 --> 00:00:48,070 Mennyi ideig tart eljutni a Marsra? 16 00:00:49,330 --> 00:00:50,950 Honnan származnak ezek az eredmények 17 00:00:51,370 --> 00:00:54,100 és miért került ez a másik elé? 18 00:00:55,700 --> 00:00:58,150 Oké, merüljünk bele, és lássuk, hogyan alkotta meg a keresőmotor 19 00:00:58,150 --> 00:00:59,860 a kérdésünkből az eredményt. 20 00:01:00,690 --> 00:01:03,360 Az első dolog, amit tudnunk kell, hogy amikor elindítunk egy keresést, 21 00:01:03,430 --> 00:01:06,480 a keresőmotor ténylegesen nem megy ki a világhálóra, hogy 22 00:01:06,480 --> 00:01:08,010 valós időben lefolytassa a keresésünket. 23 00:01:08,140 --> 00:01:10,610 Ez azért van így, mert több mint egymilliárd honlap van az interneten, 24 00:01:10,610 --> 00:01:14,140 és percenként több száz újat hoznak létre. 25 00:01:14,140 --> 00:01:16,210 Ha tehát a keresőmotornak végig kellene néznie 26 00:01:16,240 --> 00:01:18,690 minden egyes honlapot ahhoz, hogy megtalálja, amit keresünk, 27 00:01:18,690 --> 00:01:20,120 az örökké tartana. 28 00:01:20,500 --> 00:01:21,940 Ezért, hogy felgyorsítsa a keresésünket, 29 00:01:21,970 --> 00:01:24,940 a keresőmotor már előre folyamatosan pásztázza a netet, 30 00:01:25,420 --> 00:01:28,560 hogy rögzítse az információkat, amelyek később segíthetnek a keresésben. 31 00:01:28,930 --> 00:01:31,270 Így amikor a Marsra utazással kapcsolatban keresünk, 32 00:01:31,630 --> 00:01:33,700 a keresőmotornak már rendelkezésére áll az, amivel 33 00:01:33,700 --> 00:01:35,728 meg tudja adni a választ valós időben. 34 00:01:36,250 --> 00:01:37,540 A következőképp működik. 35 00:01:37,900 --> 00:01:42,010 Az internet oldalak hálózata, amelyet hiperhivatkozások kötnek össze. 36 00:01:42,400 --> 00:01:44,680 A keresőmotor folyamatosan futtat egy Spider nevű programot, 37 00:01:44,680 --> 00:01:47,380 amely keresztülhalad ezeken a honlapokon, 38 00:01:47,380 --> 00:01:49,040 hogy információkat gyűjtsön róluk. 39 00:01:49,780 --> 00:01:51,550 Valahányszor hiperhivatkozást talál, 40 00:01:52,090 --> 00:01:55,000 követi azt, amíg meg nem látogatott minden honlapot, 41 00:01:55,030 --> 00:01:57,240 amit a teljes interneten talál. 42 00:01:57,335 --> 00:01:59,170 Minden lapról, amit a Spider meglátogat, 43 00:01:59,200 --> 00:02:02,320 rögzíti azokat az információkat, amelyekre szüksége lehet a kereséshez úgy, 44 00:02:02,500 --> 00:02:05,650 hogy hozzáadja őket egy különleges adatbázishoz, amit keresőindexnek hívnak. 45 00:02:07,166 --> 00:02:09,530 Most lépjünk vissza a korábbi keresésünkhöz, 46 00:02:09,590 --> 00:02:11,990 és nézzük meg, ki tudjuk-e találni, hogyan állt elő a motor 47 00:02:11,990 --> 00:02:13,333 az eredménnyel. 48 00:02:13,640 --> 00:02:16,460 Amikor megkérdezzük,mennyi ideig tart az utazás a Marsra, 49 00:02:16,640 --> 00:02:18,860 a keresőmotor mindezeket a szavakat megkeresi 50 00:02:18,920 --> 00:02:21,410 a keresőindexben, így azonnal van egy listája 51 00:02:21,410 --> 00:02:24,500 mindazokról a lapokról az interneten, amelyek tartalmazzák e szavakat. 52 00:02:24,890 --> 00:02:26,870 De ha csak ezeket a keresőszavakat nézi, 53 00:02:26,870 --> 00:02:28,760 az eredmény több millió honlap lenne, 54 00:02:28,760 --> 00:02:31,110 ezért a keresőmotornak képesnek kell lennie meghatározni, 55 00:02:31,110 --> 00:02:33,120 a legjobb egyezéseket, hogy azokat mutassa először. 56 00:02:33,340 --> 00:02:36,010 A dolog itt kezd trükkös lenni, mert a keresőmotornak 57 00:02:36,010 --> 00:02:38,040 lehet, hogy találgatnia kell, mi az amit keresünk. 58 00:02:38,930 --> 00:02:41,360 Minden keresőmotor a saját algoritmusát alkalmazza 59 00:02:41,360 --> 00:02:44,230 a lapok rangsorolásánál annak alapján, hogy szerinte mit akarunk. 60 00:02:44,930 --> 00:02:47,660 A keresőmotor rangsoroló algoritmusa ellenőrizheti, 61 00:02:47,990 --> 00:02:50,360 hogy a keresett kifejezés szerepel-e a lap címében, 62 00:02:50,900 --> 00:02:53,820 ellenőrizheti, hogy a szavak előfordulnak-e egymás mellett, 63 00:02:54,520 --> 00:02:57,020 vagy végezhet másféle számítást, 64 00:02:57,020 --> 00:02:58,610 amivel jobban meghatározhatja 65 00:02:58,670 --> 00:03:01,420 melyik lapot szeretnénk látni, és melyiket nem. 66 00:03:02,960 --> 00:03:04,960 A Google találta fel a leghíresebb algoritmust 67 00:03:04,960 --> 00:03:06,745 a legrelevánsabb találatok kiválasztásához egy keresésben, amely számításba veszi, 68 00:03:06,745 --> 00:03:08,530 hány további honlap kapcsolódik egy adott oldalhoz. 69 00:03:08,560 --> 00:03:11,230 Az elképzelés az, hogy ha sok webhely véli úgy, 70 00:03:11,830 --> 00:03:14,140 hogy egy weblap érdekes, 71 00:03:14,140 --> 00:03:15,660 akkor valószínű ez az, amit keresünk. 72 00:03:15,660 --> 00:03:17,940 Ezt az algoritmust "page rank"-nek nevezik, 73 00:03:18,190 --> 00:03:20,020 de nem azért, mert rangsorolja a lapokat (szó szerinti jelentés), 74 00:03:20,590 --> 00:03:22,330 hanem azért, mert a feltalálójáról, Larry Page-ről nevezték el, 75 00:03:22,570 --> 00:03:25,210 aki a Google egyik alapítója. 76 00:03:25,480 --> 00:03:27,333 Mivel a honlap gyakran pénzt keres azzal, ha meglátogatják, 77 00:03:27,940 --> 00:03:30,520 spammerek állandóan próbálnak módot találni arra, 78 00:03:30,820 --> 00:03:32,950 hogy kijátsszák a kereső algoritmust, és oldalaik 79 00:03:32,950 --> 00:03:35,741 jobb helyezést érjenek el a keresési eredményekben. 80 00:03:35,742 --> 00:03:37,931 A keresőmotorok rendszeresen frissítik algoritmusukat, 81 00:03:38,260 --> 00:03:40,750 hogy megelőzzék hamis és megbízhatatlan lapok előre kerülését. 82 00:03:40,750 --> 00:03:44,296 Végül is a mi feladatunk, hogy figyeljünk 83 00:03:44,680 --> 00:03:47,350 ezekre a a nem megbízható lapokra úgy, 84 00:03:47,500 --> 00:03:49,450 hogy megnézzük a webcímet, és 85 00:03:49,690 --> 00:03:52,990 és meggyőződünk róla, hogy megbízható forrás-e. 86 00:03:53,680 --> 00:03:55,390 87 00:03:55,420 --> 00:03:58,420 88 00:03:58,540 --> 00:04:00,460 89 00:04:01,000 --> 00:04:03,100 90 00:04:03,100 --> 00:04:06,820 91 00:04:07,150 --> 00:04:10,120 92 00:04:10,240 --> 00:04:12,190 93 00:04:12,190 --> 00:04:13,840 94 00:04:14,080 --> 00:04:16,260 95 00:04:17,800 --> 00:04:20,530 96 00:04:20,530 --> 00:04:22,060 97 00:04:22,300 --> 00:04:24,970 98 00:04:24,970 --> 00:04:26,750 99 00:04:27,130 --> 00:04:29,980 100 00:04:30,280 --> 00:04:32,300 101 00:04:32,500 --> 00:04:34,450 102 00:04:34,450 --> 00:04:36,730 103 00:04:38,420 --> 00:04:41,910 104 00:04:41,910 --> 00:04:43,985 105 00:04:43,985 --> 00:04:46,050 106 00:04:46,090 --> 00:04:48,400 107 00:04:48,400 --> 00:04:51,280 108 00:04:53,690 --> 00:04:55,850 109 00:04:56,210 --> 00:04:59,810 110 00:05:00,080 --> 00:05:04,090