INTERNET: COME FUNZIONA LA RICERCA Ciao, mi chiamo John e dirigo i gruppi che si occupano di ricerca e machine learning in Google. È incredibilmente stimolante che le persone da ogni parte del mondo si rivolgano ai motori di ricerca, per formulare, dalle domande più banali a quelle più importanti. Perciò è una enorme responsabilità fornire loro le migliori risposte possibili. Ciao, mi chiamo Akshaya e lavoro nel gruppo che si occupa della ricerca in Bing. Ci sono molte situazioni per le quali presto inizieremo a guardare all'intelligenza artificiale e al "machine learning" (apprendimento automatico) per fornire delle risposte, ma dovremo preoccuparci di come gli utenti useranno tutto ciò, perché alla fine vogliamo avere un impatto positivo sulla società. Poniamoci una semplice domanda: "Quanto tempo ci vuole per andare su Marte?" Da dove arrivano questi risultati e perché questo è stato elencato prima di quest'altro? Bene, approfondiamo il tema e vediamo come un motore di ricerca trasforma la tua domanda in un risultato. La prima cosa da sapere, è che quando fai una ricerca, il motore di ricerca non sta effettivamente andando sul World Wide Web per eseguire la ricerca in tempo reale. Ci sono più di un miliardo di siti web su Internet e a centinaia ne vengono creati ogni minuto. Se un motore di ricerca dovesse davvero passare in rassegna ogni singolo sito web per cercare quello che desideri ci metterebbe un'eternità. Quindi, per rendere la ricerca più veloce, i motori di ricerca eseguono preventivamente una scansione continua del web in modo da registrare tutte le informazioni che potrebbero poi rivelarsi utili per la tua ricerca. In questo modo, quando cerchi "viaggio verso Marte" il motore di ricerca sa già cosa gli serve per darti una risposta in tempo reale. Ecco come funziona: Internet è una ragnatela di pagine connesse le une alle altre tramite collegamenti ipertestuali (link). I motori di ricerca eseguono in continuazione un programma, chiamato "spider" che attraversa tutte queste pagine web per accumulare dati su di esse. Ogni volta che trova un link, lo segue fino a che ha visitato ogni pagina che sia riuscito a trovare sull'intera rete Internet. Per ogni pagina visitata, lo spider registra tutti i dati che possono essere utili per rispondere ad una futura ricerca aggiungendola ad uno speciale database chiamato "search index" (indice di ricerca). Torniamo ora alla nostra ricerca iniziale e vediamo se riusciamo a capire come fa il motore di ricerca a fornire i risultati. Quando tu chiedi "Quanto tempo ci vuole per andare su Marte?" il motore di ricerca cerca ognuna delle parole presenti nella domanda nel proprio indice per fornirti immediatamente una lista di tutte le pagine di Internet contenenti quelle parole. Però, limitarsi a cercare quelle parole, ti restituirebbe milioni di pagine, perciò il motore di ricerca deve essere in grado di individuare quelle più pertinenti da mostrare per prime. Questa è la fase più complicata, perché il motore di ricerca deve capire cosa stai veramente cercando. Ogni motore di ricerca usa un proprio algoritmo per classificare le pagine in base a ciò che prevede possa interessare. L'algoritmo di classificazione dei risultati potrebbe ad esempio verificare se le parole che hai cercato compaiano nel titolo della pagina, potrebbe controllare se tutte le parole compaiano una di seguito all'altra, o eseguire una qualunque altra valutazione utile a determinare in modo migliore quali pagine web potresti voler vedere e quali no. Google inventò l'algoritmo più famoso per selezionare i migliori risultati di una ricerca, prendendo in considerazione quante altre pagine web rimandino con un link a una certa pagina web. L'idea è che se molti siti web ritengono che una certa pagina sia interessante, allora è probabile che sia quella che stai cercando. Questo algoritmo è chiamato "Page Rank", non perché classifica le pagine web, ma perchè prende il nome dal suo inventore: Larry Page, uno dei fondatori di Google. Visto che spesso un sito web guadagna del denaro quando tu lo visiti, gli spammer sono costantemente alla ricerca di modi per ingannare gli algoritmi dei motori di ricerca per far sì che le loro pagine web vengano elencate più in alto tra i risultati. I motori di ricerca aggiornano regolarmente i propri algoritmi per evitare che siti falsi e inaffidabili raggiungano le prime posizioni. In ultima istanza, tocca però a te stare in guardia nei confronti di pagine poco raccomandabili guardando l'indirizzo web delle pagine che visiti e assicurandoti che si tratti di fonti affidabili. I programmi di ricerca sono in continua evoluzione per migliorare gli algoritmi, così da fornire risultati migliori e più velocemente dei concorrenti. Gli odierni motori di ricerca usano addirittura dati che tu non hai esplicitamente fornito loro per aiutarti a restringere il campo delle tue ricerche. Per esempio, se tu hai cercato "parchi per cani" molti motori di ricerca ti restituiranno risultati relativi a parchi per cani della tua zona anche se tu non avevi specificato la tua posizione. I moderni motori di ricerca riescono a comprendere il reale significato delle parole scritte su una pagina, al fine di trovare il risultato che abbia una migliore corrispondenza con ciò che stai cercando. Per esempio, se tu cerchi "fast pitcher" (lanciatore veloce), il motore di ricerca capirà che stai cercando un giocatore di baseball. Mentre se cerchi "large pitcher" (brocca grande), capirà che stai cercando un accessorio per la tua cucina. Per interpretare il significato delle parole, usiamo una tecnologia chiamata "machine learning" (apprendimento automatico), una branca dell'intelligenza artificiale. Essa permette agli algoritmi di ricerca di cercare solo singole lettere o parole sulla pagina, ma di comprendere il significato intrinseco delle parole. Internet sta crescendo in maniera esponenziale, ma se i gruppi che si occupano di progettare i motori di ricerca faranno bene il loro lavoro, le informazioni che desideri resteranno sempre raggiungibili in pochi click.