Google: il riconoscimento vocale di Gboard funzionerà anche offline

Google ha annunciato che il riconoscimento vocale della Gboard sarà disponibile anche in offline per i dispositivi Pixel in lingua inglese. Il risultato è stato raggiunto utilizzando dei trasduttori di reti neurali ricorrenti che riconoscono i singoli caratteri pronunciati.

Avatar di Lucia Massaro

a cura di Lucia Massaro

La famosa tastiera di Google Gboard integra un sistema di riconoscimento vocale attraverso cui è possibile dettare delle parole che l’intelligenza artificiale trasforma in testo scritto. Finora, questa opzione era sfruttabile solo se si disponeva di una connessione Internet. Tramite il proprio blog, il team del colosso di Mountain View ha comunicato, oggi, che la funzione sarà disponibile anche in offline.

Per il momento, però, è utilizzabile solo in lingua inglese e solamente sui dispositivi Pixel. Il processo che sta dietro al riconoscimento vocale è complesso e comprende una serie di modelli che sono difficilmente archiviabili su uno smartphone a causa della quantità di memoria che richiedono (circa 2GB). Per questo, attualmente il processo viene eseguito in remoto sui server Google che analizzano e rinviano indietro il testo pronunciato.

Credit: Google 

Tutto ciò, ovviamente, avviene via Internet e comporta un certo ritardo nella risposta. L’obiettivo del gruppo di ricerca, dunque, è sempre stato la riduzione della latenza. Google è riuscita a ridurre il modello fino a 80MB per poterlo immagazzinare nello storage del dispositivo e per permettere il funzionamento anche in offline.

L’obiettivo è stato raggiunto grazie all’utilizzo di trasduttori di reti neurali ricorrenti (RNN-Ts) che - a differenza dei modelli precedenti in cui l’output era la parola creata attraverso il riconoscimento dei fonemi – analizza gli input restituendo immediatamente i caratteri uno per uno. In pratica, il nuovo modello riconoscerà le singole lettere delle parole pronunciate riscrivendole come se si stesse digitando invece di riconoscere i fonemi. Inoltre, il tasso di errore è stato ridotto a un mero 5%.

Una novità davvero interessante che espande i confini dell’intelligenza artificiale e che migliorerà la vita di quegli utenti che usano regolarmente il riconoscimento vocale per una serie di attività. Per il momento, la disponibilità è limitata ma Google si augura che “date le tendenze del settore, con la convergenza di hardware specializzato e miglioramenti algoritmici, le tecniche presentate possano presto essere adottate in più lingue e in più ampi campi di applicazione”.

Google Pixel 3 XL che il Pixel 3 sono disponibili in Italia sullo store ufficiale. Li trovate a questo link.