INTERNET - COME FUNZIONA LA RICERCA
Ciao, mi chiamo John
dirigo i gruppi che si occupano di ricerca
e apprendimento automatico in Google.
È incredibilmente stimolante
che le persone da ogni parte del mondo
si rivolgano ai motori di ricerca,
per formulare domande, dalle più banali
a quelle più importanti.
Perciò è un'enorme responsabilità fornire loro
le migliori risposte possibili.
Ciao, mi chiamo Akshaya
e lavoro nel gruppo che si occupa della ricerca in Bing.
Per molte questioni presto inizieremo a guardare
all'intelligenza artificiale e all'apprendimento automatico
ma dovremo preoccuparci di come tutto ciò verrà usato,
perché alla fine vogliamo avere un impatto positivo
sulla società.
Poniamoci una semplice domanda:
"Quanto tempo ci vuole per andare su Marte?"
Da dove arrivano questi risultati?
E perché questo è stato elencato prima di quest'altro?
Bene, approfondiamo il tema
e vediamo come un motore di ricerca
trasforma la tua domanda in un risultato.
La prima cosa da sapere, è che quando fai una ricerca,
il motore di ricerca non sta effettivamente andando
sul World Wide Web
per eseguire la ricerca in tempo reale.
Ci sono più di un miliardo di siti web su Internet
e a centinaia ne vengono creati ogni minuto.
Se un motore di ricerca dovesse davvero
passare in rassegna ogni singolo sito web
per cercare quello che desideri
ci metterebbe un'eternità.
Quindi, per rendere la ricerca più veloce,
i motori di ricerca eseguono preventivamente
una scansione continua del web
in modo da registrare tutte le informazioni
che potrebbero poi rivelarsi utili per la tua ricerca.
In questo modo, quando cerchi "viaggio verso Marte"
il motore di ricerca sa già cosa gli serve
per darti una risposta in tempo reale.
Ecco come funziona:
Internet è una ragnatela di pagine
connesse le une alle altre
tramite collegamenti ipertestuali (link).
I motori di ricerca eseguono in continuazione un programma,
chiamato "spider"
che attraversa tutte queste pagine web
per raccogliere dati su di esse.
Ogni volta che trova un link,
lo segue fino a che ha visitato
ogni pagina che sia riuscito
a trovare sull'intera rete Internet.
Per ogni pagina visitata,
lo spider registra tutti i dati che possono essere utili
per rispondere ad una futura ricerca
aggiungendoli ad una speciale base di dati
chiamato "search index" (indice di ricerca).
Torniamo ora alla nostra ricerca iniziale
e vediamo se riusciamo a capire come fa il motore di ricerca
a fornire i risultati.
Quando tu chiedi
"Quanto tempo ci vuole per andare su Marte?"
il motore di ricerca cerca ognuna di queste parole
nel proprio indice
per fornirti immediatamente una lista
di tutte le pagine di Internet
contenenti quelle parole.
Però, limitarsi a cercare quelle parole,
ti restituirebbe milioni di pagine,
perciò il motore di ricerca
deve essere in grado di individuare
quelle più pertinenti da mostrare per prime.
Questa è la fase più complicata,
perché il motore di ricerca
deve capire cosa stai veramente cercando.
Ogni motore di ricerca usa un proprio algoritmo
per classificare le pagine
in base a ciò che prevede possa interessare.
L'algoritmo di classificazione dei risultati
potrebbe verificare
se le parole che hai cercato
compaiono nel titolo della pagina,
potrebbe controllare
se tutte le parole compaiono una di seguito all'altra,
o eseguire una qualunque altra valutazione utile
a determinare in modo migliore
quali pagine web potresti voler vedere e quali no.
Google inventò l'algoritmo più famoso
per selezionare i migliori risultati di una ricerca,
prendendo in considerazione
quante altre pagine web
rimandino con un link a una certa pagina web.
L'idea è che se molti siti web ritengono che
una certa pagina sia interessante,
allora è probabile che sia quella che stai cercando.
Questo algoritmo è chiamato "Page Rank",
non perché classifica le pagine web,
ma perchè prende il nome dal suo inventore:
Larry Page, uno dei fondatori di Google.
Visto che spesso un sito web
guadagna del denaro quando tu lo visiti,
gli spammer sono costantemente alla ricerca di modi
per ingannare gli algoritmi dei motori di ricerca
per far sì che le loro pagine web vengano elencate
più in alto tra i risultati.
I motori di ricerca aggiornano regolarmente
i propri algoritmi
per evitare che siti falsi e inaffidabili
raggiungano le prime posizioni.
In ultima istanza,
tocca però a te stare in guardia
nei confronti di pagine poco affidabili
guardando l'indirizzo web delle pagine che visiti
e assicurandoti che si tratti di fonti affidabili.
Gli algoritmi di ricerca sono in continua evoluzione
per migliorare gli algoritmi,
così da fornire risultati migliori
e più velocemente dei concorrenti.
Gli odierni motori di ricerca usano addirittura dati
che tu non hai esplicitamente fornito loro
per aiutarti a restringere il campo delle tue ricerche.
Per esempio, se tu hai cercato "parchi per cani"
molti motori di ricerca ti restituiranno risultati
relativi a parchi per cani della tua zona
anche se tu non avevi specificato la tua posizione.
I moderni motori di ricerca riescono anche a comprendere
il reale significato delle parole scritte su una pagina,
al fine di trovare il risultato che abbia
una migliore corrispondenza con ciò che stai cercando.
Per esempio, se tu cerchi "fast pitcher"
(lanciatore veloce),
il motore di ricerca capirà che stai cercando
un giocatore di baseball.
Mentre se cerchi "large pitcher"
(brocca grande),
capirà che stai cercando un accessorio per la tua cucina.
Per interpretare il significato delle parole,
usiamo una tecnologia chiamata
apprendimento automatico,
una branca dell'intelligenza artificiale.
Essa permette agli algoritmi di ricerca di cercare,
non solo singole lettere o parole sulla pagina,
ma di comprendere il significato intrinseco delle parole.
Internet sta crescendo in maniera esponenziale,
ma se i gruppi che si occupano di progettare
i motori di ricerca
faranno bene il loro lavoro,
le informazioni che desideri
resteranno sempre raggiungibili in pochi click.