In quella che potrebbe rivelarsi una delle applicazioni più affascinanti e significative dell'intelligenza artificiale fino ad oggi, Google ha annunciato un ambizioso progetto che mira a comprendere, e potenzialmente a comunicare, con i delfini. Sfruttando un nuovo modello di IA denominato DolphinGemma e la potenza degli smartphone Pixel, l'azienda californiana si addentra nel complesso mondo delle vocalizzazioni di questi intelligenti mammiferi marini.

L'iniziativa nasce da una prestigiosa collaborazione che vede Google unire le forze con i ricercatori del Georgia Institute of Technology (Georgia Tech) e, soprattutto, con il Wild Dolphin Project (WDP). Quest'ultimo rappresenta una pietra miliare nella ricerca sui cetacei, avendo dedicato oltre quarant'anni allo studio sul campo, raccogliendo un archivio senza precedenti di suoni emessi dai delfini e correlandoli meticolosamente ai loro comportamenti osservati in natura.

La comprensione della comunicazione dei delfini è una sfida scientifica di lunga data. Grazie al lavoro pionieristico del WDP, oggi sappiamo che i delfini utilizzano un repertorio vocale sorprendentemente variegato. Esistono i cosiddetti "fischi distintivi" (signature whistles), unici per ogni individuo, che funzionano in modo simile ai nomi propri, permettendo ad esempio alle madri di localizzare i propri piccoli dispersi. Altri suoni specifici sono stati associati a contesti comportamentali precisi: i "click buzzes", sequenze rapide di click, sono spesso uditi durante le fasi di corteggiamento o mentre i delfini inseguono prede o allontanano squali; i "burst-pulse squawks", suoni più aspri e potenti, sembrano invece legati a situazioni di conflitto o combattimento tra individui.

È su questa enorme mole di dati acustici e comportamentali, accumulata dal WDP, che è stato addestrato il cuore tecnologico del progetto: DolphinGemma. Questo modello linguistico di grandi dimensioni (LLM) è una versione specializzata della famiglia di modelli Gemma, sviluppata internamente da Google. L'addestramento specifico su migliaia di ore di registrazioni e annotazioni permette a DolphinGemma di analizzare le complesse sequenze sonore prodotte dai delfini – fischi, click, squittii, squawks e altro ancora – per identificarne pattern, strutture ricorrenti e, auspicabilmente, svelarne la "grammatica" sottostante.

L'innovazione, tuttavia, non si ferma al software. Un elemento chiave del progetto è l'utilizzo degli smartphone Google Pixel direttamente sul campo da parte dei ricercatori del WDP. Questi dispositivi non fungono da semplici registratori audio. Integrano il software SoundStream tokenizer di Google, capace di processare i suoni dei delfini in tempo reale, convertendoli in un formato digitale immediatamente utilizzabile dal modello DolphinGemma. Google evidenzia un aspetto tecnico cruciale: il modello DolphinGemma, forte dei suoi 400 milioni di parametri, è stato ottimizzato per poter essere eseguito direttamente sui processori dei Pixel.

Questo permette l'analisi "on the edge", direttamente sul luogo di registrazione, senza la necessità di trasferire enormi file audio a server remoti, velocizzando il processo e rendendolo più efficiente in condizioni operative spesso difficili. L'impiego di smartphone commerciali come i Pixel, inoltre, offre un vantaggio non trascurabile in termini di costi, riducendo la necessità di ricorrere a costose apparecchiature specializzate per l'idrofonia e l'analisi acustica.

Il funzionamento di DolphinGemma è analogo a quello di altri LLM che processano il linguaggio umano: analizza sequenze di input (in questo caso, i suoni dei delfini) per identificare regolarità, relazioni e prevedere gli elementi successivi più probabili in una sequenza. Questa capacità predittiva è fondamentale per iniziare a decifrare la struttura comunicativa dei cetacei.

Parallelamente, il WDP e il Georgia Tech portano avanti un altro progetto complementare e altrettanto innovativo: CHAT (Cetacean Hearing Augmentation Telemetry). La prima implementazione di CHAT si basava sul Google Pixel 6. A differenza di DolphinGemma, che si concentra sull'ascolto e l'analisi, CHAT tenta un approccio più interattivo. Il sistema è progettato per generare fischi sintetici e associarli a specifici oggetti o elementi di interesse per i delfini, come particolari tipi di alghe (sargassum), piante marine (seagrass) o persino delle sciarpe colorate utilizzate dai ricercatori durante le sessioni di osservazione.

L'obiettivo finale di CHAT è ambizioso: verificare se i delfini, una volta appresa l'associazione tra un suono artificiale e un oggetto, inizieranno a imitare quel suono per "richiedere" l'oggetto stesso. Se questo esperimento avesse successo, si aprirebbe la strada a una forma rudimentale ma concreta di comunicazione bidirezionale tra umani e delfini. Google ha già confermato che una versione aggiornata di CHAT, basata sul più recente Pixel 9, sarà pronta per essere impiegata nella stagione di ricerca estiva del 2025.

È fondamentale comprendere la sinergia tra i due sistemi. DolphinGemma, con la sua capacità di analisi e previsione, supporta attivamente CHAT. Il LLM può infatti aiutare a identificare più precocemente e con maggiore accuratezza i tentativi di imitazione vocale da parte dei delfini, anche se parziali o iniziali. Questo, come spiega Google, permetterebbe ai ricercatori di rispondere più prontamente ai segnali dei delfini, rendendo l'interazione "più fluida e rinforzante", incentivando così gli animali a proseguire nello scambio comunicativo.

Sebbene l'idea di poter "conversare" liberamente con i delfini appartenga ancora a un futuro lontano, questo progetto segna un passo avanti rivoluzionario. Dimostra come la convergenza tra intelligenza artificiale avanzata, decenni di ricerca etologica dedicata e tecnologia mobile accessibile possa fornire strumenti senza precedenti per esplorare uno degli ambiti più affascinanti e misteriosi del mondo naturale: la comunicazione animale. L'ascolto attento e l'analisi profonda permessi da DolphinGemma e CHAT potrebbero svelare nuovi incredibili dettagli sulla vita sociale e cognitiva di una delle specie più intelligenti del nostro pianeta.