INTERNET: COME FUNZIONA LA RICERCA
Ciao, mi chiamo John e dirigo i gruppi che si occupano di ricerca e machine learning in Google.
Penso che sia incredibilmente stimolante
che le persone da ogni parte del mondo
si rivolgano ai motori di ricerca,
per formulare dalle domande più banali a quelle più importanti.
Perciò è una enorme responsabilità fornire loro
le migliori risposte possibili.
Ciao, mi chiamo Akshaya e lavoro nel gruppo che si occupa della ricerca in Bing.
Ci sono molte situazioni per le quali presto inizieremo a guardare all'intelligenza artificiale
e all'apprendimento automatico (machine learning) per fornire delle risposte,
ma dovremo preoccuparci di come gli utenti useranno tutto ciò
perché alla fine vogliamo avere un impatto positivo sulla società.
Poniamoci una semplice domanda:
"Quanto tempo ci vuole per viaggiare fino a Marte?"
Da dove arrivano questi risultati
e perché questo è stato elencato prima di quest'altro?
Bene, andiamo in profondità
e vediamo come un motore di ricerca trasforma la tua domanda in un risultato.
La prima cosa da sapere, è che quando fai una ricerca,
il motore di ricerca non sta effettivamente andando sul World Wide Web
per eseguire la ricerca in tempo reale.
Ci sono più di un miliardo di siti web su Internet
e a centinaia ne vengono creati ogni minuto.
Se un motore di ricerca dovesse davvero
passare in rassegna ogni singolo sito web per cercare quello che desideri
ci metterebbe un'infinità di tempo.
Perciò, per rendere la ricerca più veloce,
i motori di ricerca eseguono continuamente
una scansione anticipata del web
per registrare le informazioni che potrebbero
essere utili alla tua ricerca successivamente.
In tal modo quando tu cerchi "viaggio per Marte"
il motore di ricerca ha già in archivio ciò che
gli serve per restituirti una risposta in tempo reale.
Ecco come funziona:
Internet è una ragnatela di pagine connesse le une
alle altre tramite collegamenti ipertestuali (link).
I motori di ricerca eseguono continuativamente
un programma chiamato "spider" (o "crawler")
che viaggia lungo le pagine web per accumulare
informazioni su di esse.
Ogni volta che trova un link lo segue
fino a che abbia visitato ogni pagina che sia riuscito
a trovare sull'intera rete Internet.
Per ciascuna pagina visitata, lo spider registra
ogni informazione che potrebbe essere necessaria
per rispondere a una futura ricerca
aggiungendola a uno speciale database chiamato
"search index" ("indice di ricerca").
Torniamo ora alla nostra ricerca iniziale
e vediamo se riusciamo a capire
come fa il motore di ricerca a fornire i risultati.
Quando tu chiedi "Quanto tempo ci vuole per viaggiare fino a Marte?"
il motore di ricerca cerca ognuna delle parole della domanda
nel proprio search index
per fornirti immediatamente una lista di tutte le pagine
della rete Internet contenenti quelle parole.
Cercare semplicemente quelle parole, però,
potrebbe restituirti milioni di pagine,
perciò il motore di ricerca ha bisogno di riuscire a determinare
quelle più pertinenti per mostrartele per prime.
Questa è la fase in cui le cose si fanno più difficili
perché il motore di ricerca potrebbe aver bisogno di fare
una stima di ciò che ti serve realmente.
Ogni motore di ricerca usa propri specifici algoritmi
per ordinare le pagine sulla base di ciò che stima
tu potresti volere.
L'algoritmo di ordinamento dei risultati
usato da un motore di ricerca
potrebbe ad esempio controllare se i tuoi temini
di ricerca compaiano nel titolo di una pagina,
potrebbe controllare se tutte le parole compaiano
una di seguito all'altra,
o eseguire una qualunque altra valutazione utile a determinare
in maniera migliore quali pagine web tu potresti voler vedere e quali no.
Google inventò l'algoritmo più famoso per scegliere
i risultati più rilevanti relativamente a una data ricerca,
prendendo in considerazione quante altre pagine web rimandino
con un link a una certa pagina web.
L'idea è che se molti siti web ritengono che
una certa pagina sia interessante
allora è probabile che sia quella che stai cercando.
Questo algoritmo fu chiamato "Page Rank", non (solo)
perché fa una graduatoria delle pagine web,
ma per dargli il nome del suo inventore,
Larry Page, uno dei fondatori di Google.
Siccome un sito web spesso guadagna del denaro quando
tu lo visiti,
gli spammer sono costantemente alla ricerca di modi
per ingannare gli algoritmi dei motori di ricerca
in maniera che le proprie pagine web vengano
elencate più in alto tra i risultati.
I motori di ricerca, d'altro canto,
aggiornano regolarmente i propri algoritmi
per evitare che siti inattendibili e truffaldini
raggiungano le prime posizioni.
In ultima istanza, tocca però a te stare
in guardia contro le pagine inattendibili
guardando l'indirizzo web delle pagine che visiti
e assicurandoti che si tratti di fonti affidabili.
I programmi che effettuano le ricerche sono
in continua evoluzione per migliorare gli algoritmi,
così da fornire risultati migliori
e più velocemente dei propri concorrenti.
Gli odierni motori di ricerca usano addirittura
informazioni che tu non hai esplicitamente fornito loro
per aiutarti a restringere il campo delle tue ricerche.
Per esempio, se tu hai fatto una ricerca
inerente ai parchi per cani
molti motori di ricerca ti restituiranno risultati
relativi ai parchi per cani nelle tue vicinanze
anche se tu non avevi digitato la tua posizione.
I moderni motori di ricerca capiscono inoltre
non solo le parole scritte su una pagina
ma anche che cosa esse significano,
al fine di trovare il risultato che abbia una
migliore corrispondenza con ciò che stai cercando.
Per esempio, se tu cerchi "fast pitcher"
"lanciatore veloce") il motore di ricerca capirà che
la tua ricerca si riferisce a un giocatore di baseball,
mentre se cerchi "large pitcher" ("brocca grande")
capirà che stai cercando un accessorio per la tua cucina.
Per interpretare le parole in maniera migliore,
usiamo una tecnologia chiamata "machine learning",
un tipo di intelligenza artificiale.
Essa permette agli algoritmi di ricerca di
cercare non solo singole lettere o parole
sulla pagina, ma di comprendere
il significato ad esse sottostante.
Internet sta crescendo in maniera esponenziale,
ma se i team che si occupano di progettare i motori di ricerca
faranno bene il proprio lavoro le informazioni che desideri
dovrebbero continuare a essere sempre raggiungibili in pochi click.