L'intelligenza artificiale potrebbe presto aiutarci a comprendere meglio i nostri amici a quattro zampe: i ricercatori dell'Università del Michigan, in collaborazione con l'Istituto Nazionale di Astrofisica, Ottica ed Elettronica del Messico, sono, infatti, al lavoro su strumenti innovativi capaci di identificare il tono dei latrati dei cani, distinguendo tra giocosità e aggressività, informazioni che possono rivelarsi essenziali per i proprietari di animali.

L'utilizzo di modelli di IA, originariamente addestrati per elaborare il linguaggio umano, si sta dimostrando un efficace punto di partenza per addestrare nuovi sistemi focalizzati sulla comunicazione animale. Questi risultati sono stati presentati durante la Joint International Conference on Computational Linguistics, Language Resources and Evaluation, delineando un futuro in cui potremmo non essere totalmente all'oscuro riguardo le varie sfumature della comunicazione animale.

"Utilizzando modelli di elaborazione del linguaggio inizialmente addestrati sulla voce umana, la nostra ricerca apre una nuova finestra su come possiamo sfruttare ciò che abbiamo costruito fino a ora nel campo dell'elaborazione del discorso per iniziare a comprendere le sfumature dei latrati dei cani."

Ha dichiarato Rada Mihalcea, Professore Collegiale di Informatica e Ingegneria, e Janice M. Jenkins, direttrice del laboratorio AI dell'Università del Michigan che ha condotto lo studio.

Nonostante i modelli di IA per le lingue umane siano addestrati su vasti corpora di testi scritti, il processo non è altrettanto diretto per i cani, dato che questi ultimi non digitano e i loro vocalizzi sono meno frequentemente registrati rispetto a quelli umani. Per superare questo ostacolo, i ricercatori hanno riadattato un modello esistente, progettato originariamente per analizzare il discorso umano, permettendogli di riconoscere le caratteristiche salienti della voce umana, come tono, intonazione e accento.

Artem Abzaliev, autore principale e dottorando, afferma: "Questi modelli sono in grado di apprendere e codificare i pattern incredibilmente complessi del linguaggio e della parole umana." Utilizzando il modello di discorso umano Wav2Vec2, i ricercatori hanno creato un dataset con vocalizzazioni di 74 cani di diverse razze, età e sesso, in una varietà di contesti. Hanno scoperto che Wav2Vec2 migliora le prestazioni rispetto ad altri modelli specifici addestrati sui dati dei latrati, raggiungendo un'accuratezza fino al 70% in quattro compiti di classificazione.

I latrati sono stati registrati in diverse situazioni — gioco, aggressione, ecc. — e poi il modello è stato testato sulla sua capacità di identificarli: latrati molto aggressivi verso uno sconosciuto; latrati normali verso uno sconosciuto; gemiti e grugniti negativi in presenza di uno sconosciuto. I ricercatori sono in grado di distinguere i vari tipi di latrato poiché conoscono già il contesto in cui sono stati emessi.

"Questa è la prima volta che le tecniche ottimizzate per il discorso umano vengono impiegate per aiutare nella decodifica della comunicazione animale," ha detto Mihalcea. "I nostri risultati mostrano che i suoni e i pattern derivati dal discorso umano possono servire come base per analizzare e comprendere i pattern acustici di altri suoni, come le vocalizzazioni animali."