Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Affare su queste cuffie Sony: il secondo sconto si svela al checkout Affare su queste cuffie Sony: il secondo sconto si svela al ...
Immagine di META vuole accedere alle foto private sul vostro smartphone META vuole accedere alle foto private sul vostro smartphone...

La pazza idea di Google, usare i Pixel e l'IA per parlare con i delfini

Google collabora con Georgia Tech e Wild Dolphin Project, integrando la ricerca sui delfini selvatici per nuove scoperte scientifiche.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Luca Zaninello

a cura di Luca Zaninello

Managing Editor

Pubblicato il 15/04/2025 alle 14:30

In quella che potrebbe rivelarsi una delle applicazioni più affascinanti e significative dell'intelligenza artificiale fino ad oggi, Google ha annunciato un ambizioso progetto che mira a comprendere, e potenzialmente a comunicare, con i delfini. Sfruttando un nuovo modello di IA denominato DolphinGemma e la potenza degli smartphone Pixel, l'azienda californiana si addentra nel complesso mondo delle vocalizzazioni di questi intelligenti mammiferi marini.

L'iniziativa nasce da una prestigiosa collaborazione che vede Google unire le forze con i ricercatori del Georgia Institute of Technology (Georgia Tech) e, soprattutto, con il Wild Dolphin Project (WDP). Quest'ultimo rappresenta una pietra miliare nella ricerca sui cetacei, avendo dedicato oltre quarant'anni allo studio sul campo, raccogliendo un archivio senza precedenti di suoni emessi dai delfini e correlandoli meticolosamente ai loro comportamenti osservati in natura.

La comprensione della comunicazione dei delfini è una sfida scientifica di lunga data. Grazie al lavoro pionieristico del WDP, oggi sappiamo che i delfini utilizzano un repertorio vocale sorprendentemente variegato. Esistono i cosiddetti "fischi distintivi" (signature whistles), unici per ogni individuo, che funzionano in modo simile ai nomi propri, permettendo ad esempio alle madri di localizzare i propri piccoli dispersi. Altri suoni specifici sono stati associati a contesti comportamentali precisi: i "click buzzes", sequenze rapide di click, sono spesso uditi durante le fasi di corteggiamento o mentre i delfini inseguono prede o allontanano squali; i "burst-pulse squawks", suoni più aspri e potenti, sembrano invece legati a situazioni di conflitto o combattimento tra individui.

È su questa enorme mole di dati acustici e comportamentali, accumulata dal WDP, che è stato addestrato il cuore tecnologico del progetto: DolphinGemma. Questo modello linguistico di grandi dimensioni (LLM) è una versione specializzata della famiglia di modelli Gemma, sviluppata internamente da Google. L'addestramento specifico su migliaia di ore di registrazioni e annotazioni permette a DolphinGemma di analizzare le complesse sequenze sonore prodotte dai delfini – fischi, click, squittii, squawks e altro ancora – per identificarne pattern, strutture ricorrenti e, auspicabilmente, svelarne la "grammatica" sottostante.

Immagine id 54783

L'innovazione, tuttavia, non si ferma al software. Un elemento chiave del progetto è l'utilizzo degli smartphone Google Pixel direttamente sul campo da parte dei ricercatori del WDP. Questi dispositivi non fungono da semplici registratori audio. Integrano il software SoundStream tokenizer di Google, capace di processare i suoni dei delfini in tempo reale, convertendoli in un formato digitale immediatamente utilizzabile dal modello DolphinGemma. Google evidenzia un aspetto tecnico cruciale: il modello DolphinGemma, forte dei suoi 400 milioni di parametri, è stato ottimizzato per poter essere eseguito direttamente sui processori dei Pixel.

Questo permette l'analisi "on the edge", direttamente sul luogo di registrazione, senza la necessità di trasferire enormi file audio a server remoti, velocizzando il processo e rendendolo più efficiente in condizioni operative spesso difficili. L'impiego di smartphone commerciali come i Pixel, inoltre, offre un vantaggio non trascurabile in termini di costi, riducendo la necessità di ricorrere a costose apparecchiature specializzate per l'idrofonia e l'analisi acustica.

Il funzionamento di DolphinGemma è analogo a quello di altri LLM che processano il linguaggio umano: analizza sequenze di input (in questo caso, i suoni dei delfini) per identificare regolarità, relazioni e prevedere gli elementi successivi più probabili in una sequenza. Questa capacità predittiva è fondamentale per iniziare a decifrare la struttura comunicativa dei cetacei.

Parallelamente, il WDP e il Georgia Tech portano avanti un altro progetto complementare e altrettanto innovativo: CHAT (Cetacean Hearing Augmentation Telemetry). La prima implementazione di CHAT si basava sul Google Pixel 6. A differenza di DolphinGemma, che si concentra sull'ascolto e l'analisi, CHAT tenta un approccio più interattivo. Il sistema è progettato per generare fischi sintetici e associarli a specifici oggetti o elementi di interesse per i delfini, come particolari tipi di alghe (sargassum), piante marine (seagrass) o persino delle sciarpe colorate utilizzate dai ricercatori durante le sessioni di osservazione.

L'obiettivo finale di CHAT è ambizioso: verificare se i delfini, una volta appresa l'associazione tra un suono artificiale e un oggetto, inizieranno a imitare quel suono per "richiedere" l'oggetto stesso. Se questo esperimento avesse successo, si aprirebbe la strada a una forma rudimentale ma concreta di comunicazione bidirezionale tra umani e delfini. Google ha già confermato che una versione aggiornata di CHAT, basata sul più recente Pixel 9, sarà pronta per essere impiegata nella stagione di ricerca estiva del 2025.

È fondamentale comprendere la sinergia tra i due sistemi. DolphinGemma, con la sua capacità di analisi e previsione, supporta attivamente CHAT. Il LLM può infatti aiutare a identificare più precocemente e con maggiore accuratezza i tentativi di imitazione vocale da parte dei delfini, anche se parziali o iniziali. Questo, come spiega Google, permetterebbe ai ricercatori di rispondere più prontamente ai segnali dei delfini, rendendo l'interazione "più fluida e rinforzante", incentivando così gli animali a proseguire nello scambio comunicativo.

Sebbene l'idea di poter "conversare" liberamente con i delfini appartenga ancora a un futuro lontano, questo progetto segna un passo avanti rivoluzionario. Dimostra come la convergenza tra intelligenza artificiale avanzata, decenni di ricerca etologica dedicata e tecnologia mobile accessibile possa fornire strumenti senza precedenti per esplorare uno degli ambiti più affascinanti e misteriosi del mondo naturale: la comunicazione animale. L'ascolto attento e l'analisi profonda permessi da DolphinGemma e CHAT potrebbero svelare nuovi incredibili dettagli sulla vita sociale e cognitiva di una delle specie più intelligenti del nostro pianeta.

Fonte dell'articolo: www.techspot.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Questo nuovo materiale "vive" e ricostruisce gli edifici
  • #2
    Uso della VRAM ridotto all'osso con la nuova versione del DLSS
  • #3
    Anche Amazon nella rete del “NO IVA”: ecco gli affari nascosti
  • #4
    Uno YouTuber ha acquistato uno dei marchi più famosi del retrogaming
  • #5
    Milioni di stampanti in tutto il mondo a rischio sicurezza
  • #6
    Questa è la tech che salverà le schede video da 8GB
Articolo 1 di 5
META vuole accedere alle foto private sul vostro smartphone
Meta accede alle foto private del rullino per "elaborazione cloud", analizzando volti e contenuti tramite AI con termini che permettono uso futuro dei dati.
Immagine di META vuole accedere alle foto private sul vostro smartphone
1
Leggi questo articolo
Articolo 2 di 5
Affare su queste cuffie Sony: il secondo sconto si svela al checkout
Offerta imperdibile per le Sony WH-1000XM5 con noise cancelling premium: da 399€ scendono a 329€ e poi al checkout a soli 269€ circa.
Immagine di Affare su queste cuffie Sony: il secondo sconto si svela al checkout
Leggi questo articolo
Articolo 3 di 5
Gli USA non si fidano, OnePlus nei guai?
Preoccupazioni per i dati utenti e server collegati alla Cina potrebbero portare a un'indagine federale completa.
Immagine di Gli USA non si fidano, OnePlus nei guai?
Leggi questo articolo
Articolo 4 di 5
I nuovi pieghevoli Samsung saranno da record
Un nuovo leak sembra anticipare la sorpresa di Samsung: pieghevoli sottilissimi per combattere la concorrenza cinese.
Immagine di I nuovi pieghevoli Samsung saranno da record
Leggi questo articolo
Articolo 5 di 5
Chrome smetterà di funzionare su centinaia di milioni di smartphone
Chrome terminerà il supporto per Android 8 e 9 dal 5 agosto 2025: milioni di dispositivi coinvolti, ecco le alternative per continuare a navigare.
Immagine di Chrome smetterà di funzionare su centinaia di milioni di smartphone
1
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.