INTERNET: COME FUNZIONA LA RICERCA Ciao, mi chiamo John e dirigo i gruppi che si occupano di ricerca e machine learning in Google. Penso che sia incredibilmente stimolante che le persone da ogni parte del mondo si rivolgano ai motori di ricerca, per formulare dalle domande più banali a quelle più importanti. Perciò è una enorme responsabilità fornire loro le migliori risposte possibili. Ciao, mi chiamo Akshaya e lavoro nel gruppo che si occupa della ricerca in Bing. Ci sono molte situazioni per le quali presto inizieremo a guardare all'intelligenza artificiale e all'apprendimento automatico (machine learning) per fornire delle risposte, ma dovremo preoccuparci di come gli utenti useranno tutto ciò perché alla fine vogliamo avere un impatto positivo sulla società. Poniamoci una semplice domanda: "Quanto tempo ci vuole per viaggiare fino a Marte?" Da dove arrivano questi risultati e perché questo è stato elencato prima di quest'altro? Bene, andiamo in profondità e vediamo come un motore di ricerca trasforma la tua domanda in un risultato. La prima cosa da sapere, è che quando fai una ricerca, il motore di ricerca non sta effettivamente andando sul World Wide Web per eseguire la ricerca in tempo reale. Ci sono più di un miliardo di siti web su Internet e a centinaia ne vengono creati ogni minuto. Se un motore di ricerca dovesse davvero passare in rassegna ogni singolo sito web per cercare quello che desideri ci metterebbe un'infinità di tempo. Perciò, per rendere la ricerca più veloce, i motori di ricerca eseguono continuamente una scansione anticipata del web per registrare le informazioni che potrebbero essere utili alla tua ricerca successivamente. In tal modo quando tu cerchi "viaggio per Marte" il motore di ricerca ha già in archivio ciò che gli serve per restituirti una risposta in tempo reale. Ecco come funziona: Internet è una ragnatela di pagine connesse le une alle altre tramite collegamenti ipertestuali (link). I motori di ricerca eseguono continuativamente un programma chiamato "spider" (o "crawler") che viaggia lungo le pagine web per accumulare informazioni su di esse. Ogni volta che trova un link lo segue fino a che abbia visitato ogni pagina che sia riuscito a trovare sull'intera rete Internet. Per ciascuna pagina visitata, lo spider registra ogni informazione che potrebbe essere necessaria per rispondere a una futura ricerca aggiungendola a uno speciale database chiamato "search index" ("indice di ricerca"). Torniamo ora alla nostra ricerca iniziale e vediamo se riusciamo a capire come fa il motore di ricerca a fornire i risultati. Quando tu chiedi "Quanto tempo ci vuole per viaggiare fino a Marte?" il motore di ricerca cerca ognuna delle parole della domanda nel proprio search index per fornirti immediatamente una lista di tutte le pagine della rete Internet contenenti quelle parole. Cercare semplicemente quelle parole, però, potrebbe restituirti milioni di pagine, perciò il motore di ricerca ha bisogno di riuscire a determinare quelle più pertinenti per mostrartele per prime. Questa è la fase in cui le cose si fanno più difficili perché il motore di ricerca potrebbe aver bisogno di fare una stima di ciò che ti serve realmente. Ogni motore di ricerca usa propri specifici algoritmi per ordinare le pagine sulla base di ciò che stima tu potresti volere. L'algoritmo di ordinamento dei risultati usato da un motore di ricerca potrebbe ad esempio controllare se i tuoi temini di ricerca compaiano nel titolo di una pagina, potrebbe controllare se tutte le parole compaiano una di seguito all'altra, o eseguire una qualunque altra valutazione utile a determinare in maniera migliore quali pagine web tu potresti voler vedere e quali no. Google inventò l'algoritmo più famoso per scegliere i risultati più rilevanti relativamente a una data ricerca, prendendo in considerazione quante altre pagine web rimandino con un link a una certa pagina web. L'idea è che se molti siti web ritengono che una certa pagina sia interessante allora è probabile che sia quella che stai cercando. Questo algoritmo fu chiamato "Page Rank", non (solo) perché fa una graduatoria delle pagine web, ma per dargli il nome del suo inventore, Larry Page, uno dei fondatori di Google. Siccome un sito web spesso guadagna del denaro quando tu lo visiti, gli spammer sono costantemente alla ricerca di modi per ingannare gli algoritmi dei motori di ricerca in maniera che le proprie pagine web vengano elencate più in alto tra i risultati. I motori di ricerca, d'altro canto, aggiornano regolarmente i propri algoritmi per evitare che siti inattendibili e truffaldini raggiungano le prime posizioni. In ultima istanza, tocca però a te stare in guardia contro le pagine inattendibili guardando l'indirizzo web delle pagine che visiti e assicurandoti che si tratti di fonti affidabili. I programmi che effettuano le ricerche sono in continua evoluzione per migliorare gli algoritmi, così da fornire risultati migliori e più velocemente dei propri concorrenti. Gli odierni motori di ricerca usano addirittura informazioni che tu non hai esplicitamente fornito loro per aiutarti a restringere il campo delle tue ricerche. Per esempio, se tu hai fatto una ricerca inerente ai parchi per cani molti motori di ricerca ti restituiranno risultati relativi ai parchi per cani nelle tue vicinanze anche se tu non avevi digitato la tua posizione. I moderni motori di ricerca capiscono inoltre non solo le parole scritte su una pagina ma anche che cosa esse significano, al fine di trovare il risultato che abbia una migliore corrispondenza con ciò che stai cercando. Per esempio, se tu cerchi "fast pitcher" "lanciatore veloce") il motore di ricerca capirà che la tua ricerca si riferisce a un giocatore di baseball, mentre se cerchi "large pitcher" ("brocca grande") capirà che stai cercando un accessorio per la tua cucina. Per interpretare le parole in maniera migliore, usiamo una tecnologia chiamata "machine learning", un tipo di intelligenza artificiale. Essa permette agli algoritmi di ricerca di cercare non solo singole lettere o parole sulla pagina, ma di comprendere il significato ad esse sottostante. Internet sta crescendo in maniera esponenziale, ma se i team che si occupano di progettare i motori di ricerca faranno bene il proprio lavoro le informazioni che desideri dovrebbero continuare a essere sempre raggiungibili in pochi click.