Video falsi, ora un'IA fa dire ciò che vuole alle persone

Ricercatori della Stanford University, del Max Planck Institute for Informatics, della Princeton University e di Adobe hanno messo a punto un'IA in grado di manipolare il parlato umano in un video, semplicemente cambiando il testo nella sua trascrizione.

Avatar di Alessandro Crea

a cura di Alessandro Crea

Già da un po' sappiamo che esistono IA in grado di sostituire i volti delle persone nei video, in maniera più o meno convincente, o anche di generarne di nuovi. Ora però la manipolazione ha fatto un ulteriore passo avanti. Alcuni ricercatori della Stanford University, del Max Planck Institute for Informatics, della Princeton University e di Adobe hanno infatti messo a punto un'IA in grado di manipolare il parlato umano in un video, semplicemente cambiando il testo nella sua trascrizione.

‎La tecnologia messa a punto sembrerebbe in grado di modificare il video, preservando al tempo stesso le caratteristiche di chi parla. L'algoritmo infatti prima analizza i fonemi e il modo di pronunciare le lettere e le parole nel video originale, creando un modello della testa della persona che sta parlando, così da riprodurne correttamente voce e movimenti.

In seguito, una volta modifica la trascrizione, l'algoritmo esegue una ricerca dei segmenti che contengono i movimenti delle labbra corrispondenti alle parole nuove, sostituendo la frase originale. La parte sostituita però potrebbe essere ancora riconoscibile, perché sarebbero presenti micropause e salti dovuti al fatto che si tratta di tanti microframmenti "cuciti" assieme nel video. Per questo l'algoritmo interviene ancora per rendere il tutto più fluido e realistico, in modo che il video appaia naturale.

Ovviamente la nuova soluzione non ha mancato di sollevare perplessità e paure visto che potenzialmente si potrebbe far dire qualsiasi cosa facendola sembrare naturale anche a personaggi pubblici o politici, ma Ohad Fried della Stanford University ha minimizzato, sostenendo che c'erano le stesse paure con i fotomontaggi, ma che alla fine il loro impatto non è stato certamente drammatico sulla nostra realtà.

Lo scienziato ha comunque spiegato che molte soluzioni sono allo studio, come il digital watermarking e che secondo lui questa tecnologia potrà invece essere molto utile nell'evitare di dover rigirare da zero intere sequenze, di film o semplicemente di trasmissioni, in cui la battuta è sbagliata o la frase è stata tagliata. ‎‎‎

Gli scienziati si stanno rivelando ancora una volta eccessivamente ottimisti nei confronti delle nuove tecnologie? Forse, certo è che già attualmente è diventato assai difficile riconoscere un video manipolato da uno originale, anche per un'IA, tanto che in molti stanno studiando soluzioni alternative che consentano di identificare con assoluta certezza cosa è vero e cosa no, aspetto fondamentale soprattutto nel caso di prove forensi.