0:00:02.158,0:00:05.067 INTERNET: COME FUNZIONA LA RICERCA 0:00:06.280,0:00:12.100 Ciao, mi chiamo John e dirigo i gruppi che si occupano di ricerca e machine learning in Google. 0:00:12.100,0:00:13.980 Penso che sia incredibilmente stimolante 0:00:13.980,0:00:15.860 che le persone da ogni parte del mondo 0:00:15.860,0:00:18.380 si rivolgano ai motori di ricerca, 0:00:18.380,0:00:20.900 per formulare dalle domande più banali a quelle più importanti. 0:00:20.900,0:00:22.710 Perciò è una enorme responsabilità fornire loro 0:00:22.710,0:00:24.520 le migliori risposte possibili. 0:00:26.200,0:00:30.940 Ciao, mi chiamo Akshaya e lavoro nel gruppo che si occupa della ricerca in Bing. 0:00:30.940,0:00:34.500 Ci sono molte situazioni per le quali presto inizieremo a guardare all'intelligenza artificiale 0:00:34.500,0:00:37.040 e all'apprendimento automatico (machine learning) per fornire delle risposte, 0:00:37.040,0:00:39.580 ma dovremo preoccuparci di come gli utenti useranno tutto ciò 0:00:39.580,0:00:42.820 perché alla fine vogliamo avere un impatto positivo sulla società. 0:00:43.520,0:00:46.010 Poniamoci una semplice domanda: 0:00:46.010,0:00:48.500 "Quanto tempo ci vuole per viaggiare fino a Marte?" 0:00:48.500,0:00:51.710 Da dove arrivano questi risultati 0:00:51.710,0:00:54.920 e perché questo è stato elencato prima di quest'altro? 0:00:54.920,0:00:57.550 Bene, andiamo in profondità 0:00:57.550,0:01:00.180 e vediamo come un motore di ricerca trasforma la tua domanda in un risultato. 0:01:00.580,0:01:03.950 La prima cosa da sapere, è che quando fai una ricerca, 0:01:03.950,0:01:06.045 il motore di ricerca non sta effettivamente andando sul World Wide Web 0:01:06.045,0:01:08.140 per eseguire la ricerca in tempo reale. 0:01:08.140,0:01:11.240 Ci sono più di un miliardo di siti web su Internet 0:01:11.240,0:01:13.445 e a centinaia ne vengono creati ogni minuto. 0:01:13.445,0:01:15.650 Se un motore di ricerca dovesse davvero 0:01:15.650,0:01:17.615 passare in rassegna ogni singolo sito web per cercare quello che desideri 0:01:17.615,0:01:19.580 ci metterebbe un'infinità di tempo. 0:01:19.580,0:01:24.490 Perciò, per rendere la ricerca più veloce,[br]i motori di ricerca eseguono continuamente[br]una scansione anticipata del web 0:01:24.490,0:01:28.400 per registrare le informazioni che potrebbero[br]essere utili alla tua ricerca successivamente. 0:01:28.600,0:01:31.020 In tal modo quando tu cerchi "viaggio per Marte" 0:01:31.020,0:01:35.280 il motore di ricerca ha già in archivio ciò che[br]gli serve per restituirti una risposta in tempo reale. 0:01:36.340,0:01:37.880 Ecco come funziona: 0:01:37.880,0:01:42.340 Internet è una ragnatela di pagine connesse le une[br]alle altre tramite collegamenti ipertestuali (link). 0:01:42.340,0:01:46.900 I motori di ricerca eseguono continuativamente[br]un programma chiamato "spider" (o "crawler") 0:01:46.900,0:01:49.660 che viaggia lungo le pagine web per accumulare[br]informazioni su di esse. 0:01:49.660,0:01:52.000 Ogni volta che trova un link lo segue 0:01:52.000,0:01:57.120 fino a che abbia visitato ogni pagina che sia riuscito[br]a trovare sull'intera rete Internet. 0:01:57.120,0:02:02.700 Per ciascuna pagina visitata, lo spider registra[br]ogni informazione che potrebbe essere necessaria[br]per rispondere a una futura ricerca 0:02:02.700,0:02:06.680 aggiungendola a uno speciale database chiamato[br]"search index" ("indice di ricerca"). 0:02:07.300,0:02:10.900 Torniamo ora alla nostra ricerca iniziale[br]e vediamo se riusciamo a capire 0:02:10.900,0:02:13.520 come fa il motore di ricerca a fornire i risultati. 0:02:13.520,0:02:16.300 Quando tu chiedi "Quanto tempo ci vuole per viaggiare fino a Marte?" 0:02:16.300,0:02:19.720 il motore di ricerca cerca ognuna delle parole della domanda[br]nel proprio search index 0:02:19.720,0:02:24.500 per fornirti immediatamente una lista di tutte le pagine[br]della rete Internet contenenti quelle parole. 0:02:24.640,0:02:28.480 Cercare semplicemente quelle parole, però,[br]potrebbe restituirti milioni di pagine, 0:02:28.480,0:02:33.160 perciò il motore di ricerca ha bisogno di riuscire a determinare[br]quelle più pertinenti per mostrartele per prime. 0:02:33.160,0:02:34.780 Questa è la fase in cui le cose si fanno più difficili 0:02:34.780,0:02:38.080 perché il motore di ricerca potrebbe aver bisogno di fare[br]una stima di ciò che ti serve realmente. 0:02:38.080,0:02:44.280 Ogni motore di ricerca usa propri specifici algoritmi[br]per ordinare le pagine sulla base di ciò che stima[br]tu potresti volere. 0:02:44.640,0:02:47.240 L'algoritmo di ordinamento dei risultati[br]usato da un motore di ricerca 0:02:47.240,0:02:51.680 potrebbe ad esempio controllare se i tuoi temini[br]di ricerca compaiano nel titolo di una pagina, 0:02:51.680,0:02:54.480 potrebbe controllare se tutte le parole compaiano[br]una di seguito all'altra, 0:02:54.480,0:02:57.900 o eseguire una qualunque altra valutazione utile a determinare 0:02:57.900,0:03:01.800 in maniera migliore quali pagine web tu potresti voler vedere e quali no. 0:03:02.660,0:03:07.240 Google inventò l'algoritmo più famoso per scegliere[br]i risultati più rilevanti relativamente a una data ricerca, 0:03:07.240,0:03:11.360 prendendo in considerazione quante altre pagine web rimandino[br]con un link a una certa pagina web. 0:03:11.360,0:03:14.160 L'idea è che se molti siti web ritengono che 0:03:14.160,0:03:17.820 una certa pagina sia interessante[br]allora è probabile che sia quella che stai cercando. 0:03:17.820,0:03:23.000 Questo algoritmo fu chiamato "Page Rank", non (solo)[br]perché fa una graduatoria delle pagine web, 0:03:23.000,0:03:27.220 ma per dargli il nome del suo inventore,[br]Larry Page, uno dei fondatori di Google. 0:03:27.620,0:03:30.800 Siccome un sito web spesso guadagna del denaro quando[br]tu lo visiti, 0:03:30.800,0:03:34.200 gli spammer sono costantemente alla ricerca di modi[br]per ingannare gli algoritmi dei motori di ricerca 0:03:34.200,0:03:37.920 in maniera che le proprie pagine web vengano[br]elencate più in alto tra i risultati. 0:03:37.920,0:03:40.840 I motori di ricerca, d'altro canto,[br]aggiornano regolarmente i propri algoritmi 0:03:40.840,0:03:44.480 per evitare che siti inattendibili e truffaldini[br]raggiungano le prime posizioni. 0:03:44.480,0:03:49.760 In ultima istanza, tocca però a te stare[br]in guardia contro le pagine inattendibili 0:03:49.760,0:03:53.340 guardando l'indirizzo web delle pagine che visiti[br]e assicurandoti che si tratti di fonti affidabili. 0:03:53.340,0:03:57.140 I programmi che effettuano le ricerche sono[br]in continua evoluzione per migliorare gli algoritmi, 0:03:57.140,0:04:00.560 così da fornire risultati migliori[br]e più velocemente dei propri concorrenti. 0:04:00.880,0:04:04.460 Gli odierni motori di ricerca usano addirittura[br]informazioni che tu non hai esplicitamente fornito loro 0:04:04.460,0:04:06.560 per aiutarti a restringere il campo delle tue ricerche. 0:04:06.660,0:04:10.280 Per esempio, se tu hai fatto una ricerca[br]inerente ai parchi per cani 0:04:10.280,0:04:15.980 molti motori di ricerca ti restituiranno risultati[br]relativi ai parchi per cani nelle tue vicinanze[br]anche se tu non avevi digitato la tua posizione. 0:04:17.260,0:04:23.720 I moderni motori di ricerca capiscono inoltre[br]non solo le parole scritte su una pagina[br]ma anche che cosa esse significano, 0:04:23.720,0:04:27.040 al fine di trovare il risultato che abbia una[br]migliore corrispondenza con ciò che stai cercando. 0:04:27.040,0:04:32.580 Per esempio, se tu cerchi "fast pitcher" [br]"lanciatore veloce") il motore di ricerca capirà che[br]la tua ricerca si riferisce a un giocatore di baseball, 0:04:32.580,0:04:37.200 mentre se cerchi "large pitcher" ("brocca grande")[br]capirà che stai cercando un accessorio per la tua cucina. 0:04:38.880,0:04:43.380 Per interpretare le parole in maniera migliore,[br]usiamo una tecnologia chiamata "machine learning",[br]un tipo di intelligenza artificiale. 0:04:43.380,0:04:47.540 Essa permette agli algoritmi di ricerca di[br]cercare non solo singole lettere o parole 0:04:47.540,0:04:51.800 sulla pagina, ma di comprendere[br]il significato ad esse sottostante. 0:04:53.540,0:04:58.740 Internet sta crescendo in maniera esponenziale,[br]ma se i team che si occupano di progettare i motori di ricerca 0:04:58.740,0:05:04.980 faranno bene il proprio lavoro le informazioni che desideri[br]dovrebbero continuare a essere sempre raggiungibili in pochi click.