L'intelligenza artificiale ha raggiunto un traguardo inaspettato nel campo della scrittura creativa: quando i modelli vengono affinati specificamente sulle opere complete di autori famosi, i lettori preferiscono i testi generati dall'IA rispetto alle imitazioni scritte da esperti umani. Questa scoperta, emersa da uno studio accademico ancora in fase di revisione, solleva interrogativi sul diritto d'autore e sull'uso dei contenuti protetti per addestrare sistemi di intelligenza artificiale. I risultati dello studio potrebbero infatti obbligare i tribunali a riconsiderare le attuali interpretazioni del fair use, l'eccezione che consente in alcuni casi l'utilizzo di materiale protetto senza autorizzazione.
La ricerca è stata condotta da tre accademici statunitensi: Tuhin Chakrabarty della Stony Brook University, Jane C. Ginsburg della Columbia University Law School e Paramveer Dhillon dell'University of Michigan. Il loro lavoro nasce in risposta alla valanga di contenziosi legali che ha investito l'industria dell'intelligenza artificiale. Solo negli Stati Uniti sono state depositate oltre 50 cause da parte di detentori di diritti d'autore contro aziende di IA, che spaziano dalla riproduzione di testi a quella di video e audio.
Il metodo utilizzato dai ricercatori ha messo a confronto due gruppi di testi: 150 brani scritti da studenti provenienti dai migliori programmi Master of Fine Arts degli Stati Uniti e altrettanti estratti generati dall'IA. Entrambi i gruppi dovevano imitare lo stile di 50 autori premiati, tra cui Alice Munro, Cormac McCarthy e Han Kang. I 28 candidati selezionati dalle prestigiose scuole di scrittura creativa hanno prodotto ciascuno estratti di 450 parole, cercando di riprodurre le peculiarità stilistiche di questi scrittori affermati.
I risultati iniziali hanno confermato le aspettative: quando i modelli di IA utilizzavano semplicemente comandi testuali standard, sia i 28 esperti di scrittura creativa sia i 131 lettori comuni preferivano i testi scritti dagli esseri umani. Questo dato sembrava confermare ricerche precedenti secondo cui l'intelligenza artificiale non può produrre letteratura di alto livello o saggistica creativa attraverso la sola sollecitazione con prompt.
Tuttavia, quando i ricercatori hanno effettuato il fine-tuning di ChatGPT sulle opere complete dei singoli autori, la situazione si è capovolta drammaticamente. In valutazioni cieche, dove i lettori non sapevano quale testo fosse generato dall'IA e quale scritto da umani, sia gli esperti che i lettori comuni hanno iniziato a preferire i testi prodotti dall'intelligenza artificiale. Gli esperti hanno giudicato i contenuti generati dall'IA superiori sia per fedeltà stilistica che per qualità della scrittura.
Secondo i ricercatori, il processo di affinamento rimuove quei tic stilistici tipici dell'IA che risultano fastidiosi ai lettori, come l'eccessiva densità di clichè. La capacità dell'intelligenza artificiale di imitare con precisione lo stile di un autore specifico, una volta addestrata sull'intero corpus delle sue opere, si rivela superiore persino a quella di scrittori professionisti in formazione avanzata.
Le implicazioni economiche sono significative. I ricercatori hanno calcolato che il costo mediano per affinare un modello e generare un romanzo di 100.000 parole ammonta a soli 81 dollari, rappresentando una riduzione del 99,7% rispetto ai 25.000 dollari che potrebbero essere necessari per assumere uno scrittore professionista per creare la stessa opera. Questa disparità economica, combinata con la preferenza dimostrata dai lettori, suggerisce che le opere letterarie generate dall'IA potrebbero non solo competere con quelle scritte da umani, ma addirittura soppiantarle sul mercato.
Il contesto legale in cui si inserisce questa ricerca è particolarmente turbolento. Nel caso Bartz contro Anthropic, si prevede un accordo da 1,5 miliardi di dollari dopo che l'azienda ha addestrato i suoi modelli su opere copiate. In un altro procedimento, Kadrey contro Meta, il colosso tecnologico ha prevalso per motivi tecnici legati a carenze nella causa dei ricorrenti, anche se il giudice ha riconosciuto che in molte circostanze copiare opere protette per addestrare modelli di IA generativa senza permesso sarebbe illegale.
La difesa del fair use negli Stati Uniti si basa su un test a quattro fattori che i giudici devono considerare: lo scopo e il carattere dell'utilizzo, la natura dell'opera protetta, la quantità di materiale copiato e l'effetto sull'ipotetico mercato o sul valore dell'opera protetta. Proprio quest'ultimo fattore diventa cruciale alla luce dei nuovi risultati della ricerca.
Gli studiosi del diritto hanno generalmente suggerito che addestrare modelli di IA su testi, registrazioni e video protetti sia probabilmente ammissibile come fair use, mentre la responsabilità legale potrebbe sorgere quando i modelli riproducono contenuti protetti in modo testuale. Tuttavia, gli autori dello studio sostengono che la creazione di modelli affinati sulle opere raccolte di singoli autori non dovrebbe essere considerata fair use se il modello viene utilizzato per creare output che emulano le opere dell'autore.
Le conseguenze potrebbero essere devastanti per l'industria dell'intelligenza artificiale. Nick Clegg, ex dirigente di Meta, ha recentemente dichiarato che dover chiedere il permesso agli artisti per utilizzare le loro opere "ucciderebbe sostanzialmente l'industria dell'IA in questo paese dall'oggi al domani". Le aziende del settore hanno già scommesso miliardi di dollari in data center per soddisfare la domanda prevista di servizi basati sull'IA.
I ricercatori anticipano che alcuni studiosi legali potrebbero minimizzare le scoperte sostenendo che i modelli di IA in questo scenario non producono copie testuali delle opere pubblicate. Si ribatte citando l'interpretazione estensiva dell'Ufficio del Copyright statunitense del concetto di "mercato potenziale o valore dell'opera copiata", suggerendo che il fair use potrebbe non scusare la copia originaria anche quando questa non compare nel prodotto finale, se l'effetto della copia sostituisce le opere originali. Una questione che, evidentemente, rimane aperta e destinata a essere dibattuta nelle aule di tribunale nei prossimi anni.