0:00:02.158,0:00:05.067 INTERNET: COME FUNZIONA LA RICERCA 0:00:06.280,0:00:09.190 Ciao, mi chiamo John 0:00:09.190,0:00:10.645 dirigo i gruppi che si occupano di ricerca 0:00:10.645,0:00:12.100 e machine learning in Google. 0:00:12.100,0:00:13.980 È incredibilmente stimolante 0:00:13.980,0:00:15.860 che le persone da ogni parte del mondo 0:00:15.860,0:00:18.380 si rivolgano ai motori di ricerca, 0:00:18.380,0:00:19.640 per formulare, dalle domande più banali 0:00:19.640,0:00:20.900 a quelle più importanti. 0:00:20.900,0:00:22.710 Perciò è una enorme responsabilità fornire loro 0:00:22.710,0:00:24.520 le migliori risposte possibili. 0:00:26.200,0:00:28.570 Ciao, mi chiamo Akshaya 0:00:28.570,0:00:30.940 e lavoro nel gruppo che si occupa della ricerca in Bing. 0:00:30.940,0:00:32.720 Per molte questioni presto inizieremo a guardare 0:00:32.720,0:00:34.500 all'intelligenza artificiale e al "machine learning"[br](apprendimento automatico) 0:00:37.040,0:00:39.580 ma dovremo preoccuparci di come tutto ciò verrà usato, 0:00:39.580,0:00:41.200 perché alla fine vogliamo avere un impatto positivo 0:00:41.200,0:00:42.820 sulla società. 0:00:43.520,0:00:46.010 Poniamoci una semplice domanda: 0:00:46.010,0:00:48.500 "Quanto tempo ci vuole per andare su Marte?" 0:00:48.500,0:00:51.710 Da dove arrivano questi risultati? 0:00:51.710,0:00:54.920 E perché questo è stato elencato prima di quest'altro? 0:00:54.920,0:00:57.550 Bene, approfondiamo il tema 0:00:57.550,0:00:58.865 e vediamo come un motore di ricerca 0:00:58.865,0:01:00.180 trasforma la tua domanda in un risultato. 0:01:00.580,0:01:03.950 La prima cosa da sapere, è che quando fai una ricerca, 0:01:03.950,0:01:04.997 il motore di ricerca non sta effettivamente andando 0:01:04.997,0:01:06.045 sul World Wide Web 0:01:06.045,0:01:08.140 per eseguire la ricerca in tempo reale. 0:01:08.140,0:01:11.240 Ci sono più di un miliardo di siti web su Internet 0:01:11.240,0:01:13.445 e a centinaia ne vengono creati ogni minuto. 0:01:13.445,0:01:15.650 Se un motore di ricerca dovesse davvero 0:01:15.650,0:01:16.632 passare in rassegna ogni singolo sito web 0:01:16.632,0:01:17.615 per cercare quello che desideri 0:01:17.615,0:01:19.580 ci metterebbe un'eternità. 0:01:19.580,0:01:22.035 Quindi, per rendere la ricerca più veloce, 0:01:22.035,0:01:23.262 i motori di ricerca eseguono preventivamente 0:01:23.262,0:01:24.490 una scansione continua del web 0:01:24.490,0:01:26.445 in modo da registrare tutte le informazioni 0:01:26.445,0:01:28.400 che potrebbero poi rivelarsi utili per la tua ricerca. 0:01:28.600,0:01:31.020 In questo modo, quando cerchi "viaggio verso Marte" 0:01:31.020,0:01:33.150 il motore di ricerca sa già cosa gli serve 0:01:33.150,0:01:35.280 per darti una risposta in tempo reale. 0:01:36.340,0:01:37.880 Ecco come funziona: 0:01:37.880,0:01:38.995 Internet è una ragnatela di pagine 0:01:38.995,0:01:40.110 connesse le une alle altre 0:01:40.110,0:01:42.340 tramite collegamenti ipertestuali (link). 0:01:42.340,0:01:44.620 I motori di ricerca eseguono in continuazione un programma, 0:01:44.620,0:01:46.900 chiamato "spider" 0:01:46.900,0:01:48.280 che attraversa tutte queste pagine web 0:01:48.280,0:01:49.660 per accumulare dati su di esse. 0:01:49.660,0:01:52.000 Ogni volta che trova un link, 0:01:52.000,0:01:53.280 lo segue fino a che ha visitato 0:01:53.280,0:01:54.560 ogni pagina che sia riuscito 0:01:54.560,0:01:57.120 a trovare sull'intera rete Internet. 0:01:57.120,0:01:59.910 Per ogni pagina visitata, 0:01:59.910,0:02:01.305 lo spider registra tutti i dati che possono essere utili 0:02:01.305,0:02:02.700 per rispondere ad una futura ricerca 0:02:02.700,0:02:04.690 aggiungendola ad uno speciale database 0:02:04.690,0:02:06.680 chiamato "search index" (indice di ricerca). 0:02:07.300,0:02:09.100 Torniamo ora alla nostra ricerca iniziale 0:02:09.100,0:02:10.000 e vediamo se riusciamo a capire come fa il motore di ricerca 0:02:10.000,0:02:10.900 a fornire i risultati. 0:02:13.520,0:02:14.910 Quando tu chiedi 0:02:14.910,0:02:16.300 "Quanto tempo ci vuole per andare su Marte?" 0:02:16.300,0:02:18.010 il motore di ricerca cerca ognuna delle parole 0:02:18.010,0:02:19.720 presenti nella domanda nel proprio indice 0:02:19.720,0:02:22.110 per fornirti immediatamente una lista 0:02:22.110,0:02:23.305 di tutte le pagine di Internet 0:02:23.305,0:02:24.500 contenenti quelle parole. 0:02:24.640,0:02:26.560 Però, limitarsi a cercare quelle parole, 0:02:26.560,0:02:28.480 ti restituirebbe milioni di pagine, 0:02:28.480,0:02:29.650 perciò il motore di ricerca 0:02:29.650,0:02:30.820 deve essere in grado di individuare 0:02:30.820,0:02:33.160 quelle più pertinenti da mostrare per prime. 0:02:33.160,0:02:34.780 Questa è la fase più complicata, 0:02:34.780,0:02:36.430 perché il motore di ricerca 0:02:36.430,0:02:38.080 deve capire cosa stai veramente cercando. 0:02:38.080,0:02:39.630 Ogni motore di ricerca usa un proprio algoritmo 0:02:39.630,0:02:41.180 per classificare le pagine 0:02:41.180,0:02:44.280 in base a ciò che prevede possa interessare. 0:02:44.640,0:02:47.240 L'algoritmo di classificazione dei risultati 0:02:47.240,0:02:48.350 potrebbe ad esempio verificare 0:02:48.350,0:02:49.460 se le parole che hai cercato 0:02:49.460,0:02:51.680 compaiano nel titolo della pagina, 0:02:51.680,0:02:53.080 potrebbe controllare 0:02:53.080,0:02:54.480 se tutte le parole compaiano una di seguito all'altra, 0:02:54.480,0:02:56.190 o eseguire una qualunque altra valutazione utile 0:02:56.190,0:02:57.900 a determinare in modo migliore 0:02:57.900,0:03:01.800 quali pagine web potresti voler vedere e quali no. 0:03:02.660,0:03:04.950 Google inventò l'algoritmo più famoso 0:03:04.950,0:03:07.240 per selezionare i migliori risultati di una ricerca, 0:03:07.240,0:03:09.300 prendendo in considerazione 0:03:09.300,0:03:10.330 quante altre pagine web 0:03:10.330,0:03:11.360 rimandino con un link a una certa pagina web. 0:03:11.360,0:03:14.160 L'idea è che se molti siti web ritengono che 0:03:14.160,0:03:15.990 una certa pagina sia interessante, 0:03:15.990,0:03:17.820 allora è probabile che sia quella che stai cercando. 0:03:17.820,0:03:20.410 Questo algoritmo è chiamato "Page Rank", 0:03:20.410,0:03:23.000 non perché classifica le pagine web, 0:03:23.000,0:03:25.110 ma perchè prende il nome dal suo inventore: 0:03:25.110,0:03:27.220 Larry Page, uno dei fondatori di Google. 0:03:27.620,0:03:29.210 Visto che spesso un sito web 0:03:29.210,0:03:30.800 guadagna del denaro quando tu lo visiti, 0:03:30.800,0:03:32.500 gli spammer sono costantemente alla ricerca di modi 0:03:32.500,0:03:34.200 per ingannare gli algoritmi dei motori di ricerca 0:03:34.200,0:03:36.060 per far sì che le loro pagine web vengano elencate 0:03:36.060,0:03:37.920 più in alto tra i risultati. 0:03:37.920,0:03:39.380 I motori di ricerca aggiornano regolarmente 0:03:39.380,0:03:40.840 i propri algoritmi 0:03:40.840,0:03:42.660 per evitare che siti falsi e inaffidabili 0:03:42.660,0:03:44.480 raggiungano le prime posizioni. 0:03:44.480,0:03:47.120 In ultima istanza, 0:03:47.120,0:03:48.440 tocca però a te stare in guardia 0:03:48.440,0:03:49.760 nei confronti di pagine poco raccomandabili 0:03:49.760,0:03:51.550 guardando l'indirizzo web delle pagine che visiti 0:03:51.550,0:03:53.340 e assicurandoti che si tratti di fonti affidabili. 0:03:53.340,0:03:55.240 I programmi di ricerca sono in continua evoluzione 0:03:55.240,0:03:57.140 per migliorare gli algoritmi, 0:03:57.140,0:03:58.850 così da fornire risultati migliori 0:03:58.850,0:04:00.560 e più velocemente dei concorrenti. 0:04:00.880,0:04:02.670 Gli odierni motori di ricerca usano addirittura dati 0:04:02.670,0:04:04.460 che tu non hai esplicitamente fornito loro 0:04:04.460,0:04:06.560 per aiutarti a restringere il campo delle tue ricerche. 0:04:06.660,0:04:10.280 Per esempio, se tu hai cercato "parchi per cani" 0:04:10.280,0:04:13.130 molti motori di ricerca ti restituiranno risultati 0:04:13.130,0:04:14.555 relativi a parchi per cani della tua zona 0:04:14.555,0:04:15.980 anche se tu non avevi specificato la tua posizione. 0:04:17.651,0:04:20.685 I moderni motori di ricerca riescono anche a comprendere 0:04:20.685,0:04:23.720 il reale significato delle parole scritte su una pagina, 0:04:23.720,0:04:25.380 al fine di trovare il risultato che abbia 0:04:25.380,0:04:27.040 una migliore corrispondenza con ciò che stai cercando. 0:04:27.040,0:04:29.810 Per esempio, se tu cerchi "fast pitcher"[br](lanciatore veloce), 0:04:29.810,0:04:31.195 il motore di ricerca capirà che stai cercando 0:04:31.195,0:04:32.580 un giocatore di baseball. 0:04:32.580,0:04:34.890 Mentre se cerchi "large pitcher"[br](brocca grande), 0:04:34.890,0:04:37.200 capirà che stai cercando un accessorio per la tua cucina. 0:04:38.880,0:04:40.005 Per interpretare il significato delle parole, 0:04:40.005,0:04:40.567 usiamo una tecnologia chiamata 0:04:40.567,0:04:41.130 "machine learning"[br](apprendimento automatico), 0:04:41.130,0:04:43.380 una branca dell'intelligenza artificiale. 0:04:43.380,0:04:45.460 Essa permette agli algoritmi di ricerca di cercare, 0:04:45.460,0:04:47.540 non solo singole lettere o parole sulla pagina, 0:04:47.540,0:04:51.800 ma di comprendere il significato intrinseco delle parole. 0:04:53.540,0:04:56.140 Internet sta crescendo in maniera esponenziale, 0:04:56.140,0:04:57.440 ma se i gruppi che si occupano di progettare[br]i motori di ricerca 0:04:57.440,0:04:58.740 faranno bene il loro lavoro, 0:04:58.740,0:05:01.860 le informazioni che desideri 0:05:01.860,0:05:04.980 resteranno sempre raggiungibili in pochi click.