WEBVTT 00:00:06.070 --> 00:00:07.120 Bună, mă numesc John. 00:00:07.510 --> 00:00:10.140 Conduc echipele Google de cercetare și învățareautomată. 00:00:12.130 --> 00:00:14.230 Cred că este uimitor de însuflețitor 00:00:14.230 --> 00:00:16.214 că oameni din întreaga lume 00:00:16.215 --> 00:00:19.160 apelează la motoare de căutare să pună întrebări obișnuite 00:00:19.160 --> 00:00:20.930 și întrebări incredibil de importante 00:00:20.930 --> 00:00:23.450 Este o răspundere imensă să putem oferim 00:00:23.450 --> 00:00:24.864 cele mai bune răspunsuri. 00:00:26.710 --> 00:00:30.610 Bună, mă numesc Akshaya și lucrez în echipa de cercetare Bing. 00:00:30.910 --> 00:00:33.190 Există multe situații când începem să căutăm în 00:00:33.190 --> 00:00:35.800 inteligența artificială și învățarea automată, 00:00:35.830 --> 00:00:39.010 dar trebuie să discutăm despre cum le vor folosi utilizatorii, 00:00:39.140 --> 00:00:42.390 pentru că la sfârșitul zilei de lucru, vrem să influențăm societatea. 00:00:43.780 --> 00:00:45.400 Să punem o întrebare simplă. 00:00:45.820 --> 00:00:48.070 Cât durează să călătorim până pe Marte? 00:00:49.330 --> 00:00:50.950 De unde au venit rezultatele astea 00:00:51.370 --> 00:00:54.100 și de ce acesta s-a listat înaintea celuilalt? 00:00:55.700 --> 00:00:58.150 Ok, să intrăm și să vedem cum a prefăcut motorul 00:00:58.150 --> 00:00:59.860 de căutare cererea ta într-un rezultat. 00:01:00.690 --> 00:01:03.360 Primul lucru pe care trebuie să-l știi este atunci când faci o căutare, 00:01:03.430 --> 00:01:06.480 motorul de căutare nu se duce efectiv în World Wide Web 00:01:06.480 --> 00:01:08.010 ca să execute căutarea ta în timp real. 00:01:08.140 --> 00:01:10.610 Și asta pentru că există peste un miliard de site-uri 00:01:10.610 --> 00:01:14.140 pe internet și alte sute sunt create la fiecare minut. 00:01:14.140 --> 00:01:16.210 Dacă motorul de căutare trebuia să caute prin 00:01:16.240 --> 00:01:18.690 fiecare site să-l găsească pe cel dorit de tine, 00:01:18.690 --> 00:01:20.120 ar fi durat o veșnicie. 00:01:20.500 --> 00:01:21.940 Pentru a face căutarea ta mai rapidă, 00:01:21.970 --> 00:01:24.940 motoarele de căutare scanează constant netul în avans 00:01:25.420 --> 00:01:28.560 și înregistrează informațiile care te-ar ajuta mai târziu la căutarea ta. 00:01:28.930 --> 00:01:31.270 Astfel, când cauți despre călătoria către Marte, 00:01:31.630 --> 00:01:33.700 motorul de căutare are deja ce este necesar 00:01:33.700 --> 00:01:35.728 să returneze răspunsul tău în timp real. 00:01:36.250 --> 00:01:37.540 Iată cum funcționează. 00:01:37.900 --> 00:01:42.010 Internetul este o pânză de pagini conectate una de alta prin hiperlink-uri. 00:01:42.400 --> 00:01:44.680 Motoarele de căutare rulează constant un program numit 00:01:44.680 --> 00:01:47.380 Păianjen, care trece prin aceste pagini web 00:01:47.380 --> 00:01:49.040 să colecteze informații despre ele. 00:01:49.780 --> 00:01:51.550 Ori de câte ori găsește un hiperlik, 00:01:52.090 --> 00:01:55.000 îl urmărește până ce a vizitat fiecare pagină 00:01:55.030 --> 00:01:57.240 găsită pe întregul internet. 00:01:57.335 --> 00:01:59.170 Pentru fiecare pagină vizitată de păianjen, el înregistrează orice 00:01:59.200 --> 00:02:02.320 informații de care ar putea avea nevoie pentru o cautare 00:02:02.500 --> 00:02:05.650 adăugând-o într-o bază de date specială denumită index de căutare. 00:02:07.166 --> 00:02:09.530 Acum, să revenim la acea căutare de mai devreme 00:02:09.590 --> 00:02:11.990 și să vedem dacă putem înțelege cum a putut motorul de căutare 00:02:11.990 --> 00:02:13.333 să aducă rezultatele. 00:02:13.640 --> 00:02:16.460 Când întrebi cât durează să călătorești până pe Marte, 00:02:16.640 --> 00:02:18.860 motorul de căutare caută în fiecare din acele cuvinte 00:02:18.920 --> 00:02:21.410 în indexul de căutare pentru a obține imediat o listă 00:02:21.410 --> 00:02:24.500 a tuturor paginilor de pe internet care conțin acele cuvinte. 00:02:24.890 --> 00:02:26.870 Dar doar căutarea acestor termeni 00:02:26.870 --> 00:02:28.760 ar putea returna milioane de pagini, 00:02:28.760 --> 00:02:31.110 deci motorul de căutare trebuie să poată determina cele mai bune potriviri 00:02:31.110 --> 00:02:33.120 pe care să ți le arate primele. 00:02:33.340 --> 00:02:36.010 Aici devine puțin delicat motorul de căutare 00:02:36.010 --> 00:02:38.040 ar putea să ghicească ceea ce cauți. 00:02:38.930 --> 00:02:41.360 Fiecare motor de căutare folosește propriul algoritm 00:02:41.360 --> 00:02:44.230 să ordoneze paginile după ce crede el că îți dorești. 00:02:44.930 --> 00:02:47.660 Algoritmul de ordonare al motorului poate verifica dacă 00:02:47.990 --> 00:02:50.360 termenul tău de căutare apare în titlul paginii, 00:02:50.900 --> 00:02:53.820 poate verifica dacă toate cuvintele apar unul lângă altul, 00:02:54.520 --> 00:02:57.020 sau orice număr de alte calcule, care 00:02:57.020 --> 00:02:58.610 îl ajută să determine mai bine 00:02:58.670 --> 00:03:01.420 paginile pe care vrei să le vezi și pe care nu vrei. 00:03:02.960 --> 00:03:04.960 Google a inventat cel mai faimos algoritm 00:03:04.960 --> 00:03:08.530 să aleagă cele mai relevante rezultate pentru o căutare luând în considerare 00:03:08.560 --> 00:03:11.230 câte alte pagini Web sunt legate de o pagină dată. 00:03:11.830 --> 00:03:14.140 Ideea e că dacă mai multe site-uri web consideră 00:03:14.140 --> 00:03:15.660 că o pagină este interesantă, 00:03:15.660 --> 00:03:17.940 atunci poate este cea pe care o cauți tu. 00:03:18.190 --> 00:03:20.020 Acest algoritm se numește page rank, 00:03:20.590 --> 00:03:22.330 nu pentru că ordonează paginile, ci 00:03:22.570 --> 00:03:25.210 pentru că a fost denumit după inventatorul ei, Larry Page, 00:03:25.480 --> 00:03:27.333 unul dintre fondatorii Google. 00:03:27.940 --> 00:03:30.520 Pentru că un site face adeseori bani când îl vizitezi, 00:03:30.820 --> 00:03:32.950 spamerii încearcă într-una să găsească moduri 00:03:32.950 --> 00:03:35.741 să vâneze algoritmul de căutare ca paginile lor 00:03:35.742 --> 00:03:37.931 să fie listate primele în rezultate. 00:03:38.260 --> 00:03:40.750 Motoarele de căutare își actualizează regulat algoritmii 00:03:40.750 --> 00:03:44.296 să prevină ca site-urile false sau nesigure să ajungă în vârf. 00:03:44.680 --> 00:03:47.350 În fine, depinde de tine să urmărești 00:03:47.500 --> 00:03:49.450 aceste pagini care sunt nesigure 00:03:49.690 --> 00:03:52.990 căutând la adresa web și asigurându-te că este o sursă sigură. 00:03:53.680 --> 00:03:55.390 Programele de căutare evoluează mereu 00:03:55.420 --> 00:03:58.420 îmbunătățind algoritmii care returnează rezultate mai bune, 00:03:58.540 --> 00:04:00.460 rezultate mai rapide decât ale rivalilor. 00:04:01.000 --> 00:04:03.100 Motoarele de căutare moderne folosesc chiar informații 00:04:03.100 --> 00:04:06.820 pe care nu le-ai furnizat explicit care te ajută să îți reduci căutarea. 00:04:07.150 --> 00:04:10.120 De exemplu, dacă ai făcut o căutare pentru parcuri de câini 00:04:10.240 --> 00:04:12.190 multe motoare de căutare ți-ar da rezultate 00:04:12.190 --> 00:04:13.840 pentru toate parcurile de câini din apropiere, 00:04:14.080 --> 00:04:16.260 chiar dacă nu ai introdus locația ta. 00:04:17.800 --> 00:04:20.530 Motoarele de căutare moderne înțeleg mai multe 00:04:20.530 --> 00:04:22.060 decât cuvintele pe o pagină, 00:04:22.300 --> 00:04:24.970 dar ce înseamnă, de fapt, să-ș găsească pe cel mai bun 00:04:24.970 --> 00:04:26.750 care se potrivește cu ceea ce cauți. 00:04:27.130 --> 00:04:29.980 De exemplu, dacă dai căutare după un aruncător rapid, 00:04:30.280 --> 00:04:32.300 el va știi că te uiți după un atlet. 00:04:32.500 --> 00:04:34.450 Dar dacă cauți un ulcior mare, 00:04:34.450 --> 00:04:36.730 el va găsi opțiunile pentru bucătăria ta. 00:04:38.420 --> 00:04:41.910 Ca să înțeleagă cuvintele mai bine, folosim ceea ce se numește învățare automată, 00:04:41.910 --> 00:04:43.985 un fel de inteligență artificială. 00:04:43.985 --> 00:04:46.050 Ea permite algoritmilor de căutare să caute nu numai 00:04:46.090 --> 00:04:48.400 litere sau cuvinte separate în pagină, 00:04:48.400 --> 00:04:51.280 ci să înțeleagă sensul de bază al cuvintelor. 00:04:53.690 --> 00:04:55.850 Internetul crește în mod exponențial, 00:04:56.210 --> 00:04:59.810 dar dacă echipele care proiectează motoarele de căutare ne fac treaba corect 00:05:00.080 --> 00:05:04.090 informațiile pe care le dorești ar trebui să fie doar la câteva taste distanță.