I motori di ricerca che scavano nella DeepWeb

C'è ancora molto spazio per migliorare la ricerca in rete, come dimostrano tanti lavori in corso, anche a Mountain View.

Avatar di Valerio Porcu

a cura di Valerio Porcu

Senior Editor

Non è un segreto per nessuno: i migliori risultati sono quelli di Google. Eppure anche il migliore dei motori di ricerca riesce a mostrare solo una piccola parte di quello che la rete offre. Il trilione (1.000.000.000.000.000.000) di pagine indicizzate da Google, infatti, tralascia la maggior parte dei dati esistenti, che molti hanno ribattezzato la "Deep Web", la rete profonda.

Quello che vorremmo è un motore che possa rispondere a domande come "stasera porto una ragazza a cena a Bologna, mi consigli un locale romantico?", oppure "devo andare da Roma a Bologna, qual è il volo più economico dopodomani?".

Ad oggi i motori di ricerca di affidano a programmi automatici che scandagliano la rete in cerca d'informazioni, esaminando pagine e seguendo collegamenti. Un approccio efficace, ma solo per la "superficie" della rete.

Ed è qui che entrano in gioco i "nuovi" motori di ricerca, come Kosmix, frutto di una star-up guidata da A. Rajamaran, che ha attirato gli investimenti di un "pezzo grosso" come il direttore esecutivo di Amazon, J.P. Bezos.

Kosmix, come apprendiamo da un articolo del NYT, tenta di scavare nelle profondità della rete, per produrre risultati più vicini a quelli dei nostri desideri. Non più "trovare l'ago nel pagliaio" ma "esplorare il pagliaio", per dirla con la felice metafora di Rajamaran.

Sì, ma quanto è grande il pagliaio? Al momento, non è nemmeno misurabile. Il gran numero di database esistenti, e di possibili combinazioni, rende il lavoro dei motori di ricerca un'impresa molto ardua.  

Anche Google sta lavorando ai misteri della Deep Web, con un programma che cerca di analizzare più dettagliatamente i dati esistenti, così come Juliana Freire, che sta lavorando a DeepPeep, un progetto che mira a indicizzare tutti i database presenti in rete, le cui ricerche, però, si basano su un analisi della rete accoppiata ad una categorizzazione e semplificazione dei termini di ricerca.

Se per i piccoli si tratta di un progetto stimolante, per Google è tutto un altro paio di maniche. Modificare i criteri di ricerca, infatti, significa mettere in discussione il modello di ricerca che tutti conosciamo, un'interfaccia semplice e risultati chiari, e non è detto che sarebbe una buona idea.

Non è la prima volta, infine, che parliamo di tecnologie che potrebbero portare la ricerca online ad un nuovo livello di qualità, come quelle che promette, per esempio, DeepDyve, che s'ispira alle ricerche sul genoma. Guardiamo con interesse a questi progetti, anche se non ci attendiamo rivoluzioni nel futuro prossimo.

Apprendiamo con piacere che anche Big G è al lavoro su queste tecnologie, che si aggiungono a quelle sulla ricerca semantica, che sono emerse qualche tempo fa. Forse non sarà domani, ma la sensazione è che la comparsa di un nuovo modello di ricerca sia sempre più vicina.

Ringraziamo Pino Bruno per la collaborazione.