OpenAI ha implementato una significativa revisione dell'interfaccia utente per la modalità vocale di ChatGPT, integrandola direttamente nelle conversazioni testuali esistenti invece di mantenerla confinata in una schermata separata. Il cambiamento, ora disponibile sia sull'app mobile che sulla versione web, rappresenta un passo importante verso un'esperienza utente più fluida e multimodale, eliminando la necessità di passare tra diverse interfacce per interagire con l'assistente AI.
Fino a questo momento, per attivare la Modalità Vocale era necessario toccare l'icona vocale nell'angolo inferiore destro dell'app, che apriva un'interfaccia completamente separata caratterizzata dalla famosa sfera blu pulsante. Con il nuovo approccio, la funzionalità vocale si attiva direttamente all'interno della chat attuale, mantenendo il contesto della conversazione e permettendo una transizione più naturale tra input vocale e testuale. Gli utenti che preferiscono comunque la modalità standalone possono riabilitarla attraverso le impostazioni, alla voce Voice Mode, selezionando "Separate mode".
La nuova implementazione introduce funzionalità tecniche significative che migliorano l'usabilità complessiva. Durante una conversazione vocale, ChatGPT genera ora una trascrizione in tempo reale di quanto viene detto e delle risposte fornite dall'AI, rendendo più semplice seguire il filo del discorso e riferirsi a informazioni precedenti senza dover affidarsi esclusivamente alla memoria. Questa caratteristica era già stata individuata in un'analisi dell'APK dell'applicazione Android da parte di Android Authority, confermando che OpenAI stava lavorando all'integrazione da diverse settimane.
L'aspetto più interessante dell'aggiornamento riguarda la capacità dell'AI di mostrare informazioni contestuali come mappe, dati meteorologici e immagini direttamente all'interno della conversazione, senza interrompere il flusso dell'interazione vocale. Questa integrazione multimodale elimina la necessità di aprire applicazioni separate o di copiare informazioni manualmente, rendendo l'esperienza d'uso più simile a quella di un assistente digitale completo che combina comprensione del linguaggio naturale con visualizzazioni dinamiche dei dati.
La modalità vocale di ChatGPT, lanciata per competere direttamente con Gemini Live di Google, consente conversazioni hands-free più naturali con l'intelligenza artificiale. Il sistema è progettato per gestire pause, intonazioni ed espressioni vocali, offrendo un'interazione che si avvicina maggiormente a una conversazione umana rispetto ai tradizionali comandi vocali. OpenAI offre due versioni della funzionalità: una standard disponibile gratuitamente per tutti gli utenti e una Advanced Voice Mode riservata agli abbonati a pagamento, che include voci più naturali e capacità di elaborazione più sofisticate.