Microsoft ha annunciato un creatore di deepfake

Il nuovo "Azure AI Speech text to speech avatar" è uno strumento molto potente, ma che può essere usato per creare veri e propri deepfake.

Avatar di Marco Pedrani

a cura di Marco Pedrani

Managing Editor

Il Black Friday sta arrivando, non perderti le migliori offerte scelte dalla nostra redazione!

Nel corso del Microsoft Ignite 2023 l’azienda ha mostrato il nuovo Azure AI Speech text to speech avatar, strumento che permette in buona sostanza di creare dei deepfake, dal momento che è in grado di generare un avatar fotorealistico di una persona e animarlo, facendogli dire frasi che non sono state necessariamente dette da quella persona.

La funzionalità è già disponibile in anteprima pubblica ed è facilissima da usare: basta semplicemente caricare una foto della persona a cui l’avatar deve assomigliare e scrivere un testo di quello che deve dire, l’intelligenza artificiale farà il resto. Il modello per il text-to-speech può anche essere addestrato sulla voce della persona, così che l’avatar reciti le frasi scritte con la voce del soggetto.

Microsoft ha creato lo stupendo per “creare in modo efficiente video di formazione, presentazioni di prodotti e testimonianze dei clienti”, ma è inutile dire che può essere usato anche per molti altri scopi. Gli avatar sono anche in grado di parlare più lingue e si appoggiano a GPT-3.5 per rispondere a domande al di fuori del testo predefinito.

Per prevenire gli abusi, Microsoft permetterà alla maggior parte degli abbonati Azure di accedere solo ad avatar predefiniti. Gli avatar personalizzati saranno disponibili solo su registrazione, con accesso limitato e solo per determinati casi d’uso.

Nonostante le rassicurazioni dell’azienda, in molti hanno sollevato alcuni interrogativi di carattere etico, a cui Microsoft non ha purtroppo risposto chiaramente. Un esempio riguarda i recenti scioperi di SAG-AFTRA e l’uso di intelligenza artificiale per creare somiglianze con gli attori; gli studi cinematografici alla fine hanno ceduto e pagheranno gli attori per i contenuti dove l’IA ha generato avatar simili a loro, ma cosa farà Microsoft?

Techcrunch ha posto la domanda direttamente all’azienda, che purtroppo non ha risposto e non ha nemmeno indicato se gli avatar generati dall’IA saranno indicati come tali, in modo da differenziarli dai veri attori.

Altra novità riguarda Personal Voice, funzione che permette di ricreare la voce di una persona partendo da un campione di 1 minuto. È stata presentata come una novità che permette di creare assistenti vocali personalizzati, doppiare contenuti in molte lingue velocemente, o generare narrazioni, ma anche qui non mancano le preoccupazioni.

La buona notizia è che Microsoft sembra esser stata ancor più cauta che con il generatore di avatar. Gli utenti dovranno esprimere un consenso esplicito registrando una dichiarazione, solo a quel punto la voce potrà essere usata su Personal Voice. Attualmente questa nuova funzionalità è accessibile dietro registrazione a un numero limitato di aziende, che devono accettare di usare la voce delle persone solo in applicazioni dove “non vengono letti contenuti generati dall’utente o aperti”.