Svelati alcuni segretucci di Google

Lo specialista di riferimento per gli algoritmi di ricerca è stato intervistato dal NY Times

Avatar di Dario D'Elia

a cura di Dario D'Elia

Il New York Times ha pubblicato un interessante articolo su alcuni segreti di Google. In verità il colosso di Mountain View ha concesso per la prima volta alla stampa di scambiare una chiacchierata con Amit Singhal, uno degli specialisti di riferimento che si occupa degli algoritmi di ricerca. Insomma, la mente che si nasconde dietro alle numerose formule che permettono la corretta indicizzazione delle pagine web e il funzionamento dell'intero sistema di query.

Una sistema così sofisticato, infatti, ha bisogno di un costante lavoro di aggiornamento e manutenzione. Non a caso il gruppo di sviluppatori e ingegneri che collaborano con Singhal, implementa ogni settimana circa mezza dozzina di piccole correzioni.

"La ricerca negli ultimi anni si è spostata dal dammi cosa scrivo al dammi cosa voglio", ha spiegato Singhal. "Le aspettative sono alte adesso", ha sottolineato Udi Manber, responsabile del search-quality group di Google. "All'inizio individuare quello che si cercava era considerato un miracolo. Adesso se non si trova nei primi tre risultati, vuol dire che c'è qualcosa di sbagliato".

Manber è convinto che ormai si tratti di una questione di bilanciamento degli interventi: un cambiamento può insomma migliorare una cosa e peggiorarne un'altra."Qualcuno segnala una query che non funziona a Amit, e lui ne fa tesoro cercando di immaginarsi come risolvere la cosa algoritmicamente", ha confermato Matt Cutts, collaboratore di Singhal e responsabile della lotta al Web spam.

Ad esempio, uno dei problemi più urgenti riguarda la questione dei cosiddetti risultati "freschi", ovvero correlati alle pagine web appena create o recentemente aggiornate. Meglio fornire le nuove informazioni o le pagine che nel tempo si sono distinte per qualità? Fino a poco tempo fa Google preferiva la seconda opzione, approfittando anche del conseguente linking. Singhal, però, adesso ha deciso di cambiare strategia, soprattutto considerando l'avvento di nuovi servizi che si avvantaggiano dell'aggiornamento in tempo reale.

Pochi mesi fa il team al completo si è riunito. Singhal ha spiegato che la semplice variazione delle formule - per aumentare il numero delle pagine web nuove - avrebbe abbassato la qualità complessiva dei risultati. L'unica soluzione, a suo parere, era di adottare un nuovo modello matematico che cercasse di prevedere le esigenze degli utenti. Il QDF (query deserves freshness) è stato quindi messo sotto attento studio. L'elemento chiave era quello di determinare quanto un argomento fosse "caldo". In pratica incrociando i dati provenienti dal numero delle query correlate ad un argomento e le nuove pubblicazioni (o aggiornamenti) inerenti è stato possibile aggiungere un elemento in più per la discrimine di ranking.

Di fatto questa è un'ulteriore piccola implementazione che fra qualche mese potrebbe nascondersi dietro a qualcosa di più importante. Il lavoro di Singhal, dal 2000, è stato proprio quello di arricchire il sistema di page ranking con almeno 200 altri tipi di informazione. Questi comprendono elementi presenti sulle pagine web (parole, link, immagini, etc.), negli storici, nei data pattern, etc.

Chi utilizza i servizi di Google, come ad esempio Gmail, dispone infatti di un'arma ancora più efficiente, perché il suo storico personale online influenza i risultati delle proprie ricerche.