OpenAI, l’azienda dietro il popolare ChatGPT, potrebbe essere costretta a cancellare la sua creatura e ricominciare completamente da zero. Il motivo di questo obbligo potrebbe essere il risultato di una possibile causa legale che potrebbe vedere l’aziende multata per un ammontare di $150.000 per ogni componente protetto da copyright, utilizzato per addestrare il modello linguistico.

ChatGPT ha creato parecchia agitazione negli ultimi mesi, specialmente perché gli utenti hanno trovato varie modalità per utilizzare lo strumento AI generativo. Dall’allenamento per poter sostenere una maratona, alla composizione di testi, fino al confidarsi con l’IA in merito ai propri problemi di salute, il modello linguistico dietro all’IA realizzata da OpenAI è di indubbio valore ma la sua realizzazione a monte potrebbe costare molto cara ai suoi creatori.

Il problema di fondo sta nel fatto che modelli linguistici, GPT-3.5 e GPT-4, che rendono possibile il funzionamento dell’AI generativa di ChatGPT, vengono addestrati utilizzando dati di terze parti. OpenAI, per velocizzare il processo, ha persino creato un bot capace di estrarre informazioni dai siti web per addestrare il modello GPT. Il problema, però, e che OpenAI non si basa solo su materiale liberamente disponibile sul web e non coperto da copyright.

Il New York Times, proprio in virtù del fatto che ChatGPT sfrutta materiale coperto da copyright per venire addestrato, sta attualmente discutendo la possibilità di citare in giudizio OpenAI, dopo aver aggiornato i suoi termini di servizio per vietare all’IA di estrarre i suoi articoli, e le sue immagini, per l’addestramento dei modelli linguistici.

La natura esatta delle possibili conseguenze legali su OpenAI non è chiara, ma si vocifera che potrebbe comportare un pagamento fino a $150.000 per ogni contenuto che venga dimostrato violi il copyright.

Inoltre, la causa potrebbe costringere OpenAI a cancellare ChatGPT e a ricominciare completamente l’addestramento del suo modello linguistico, cosa che di fatto vanificherebbe tutto il lavoro svolto fino a ora dall’azienda.

Ricordiamo che questo non è il primo caso in cui OpenAI si trova sotto accusa. Autori come Sarah Silverman, difatti, si unirono in passato per citare in giudizio l’azienda in seguito a preoccupazioni analoghe, mostrando chiaramente che la produzione maggiore degli autori di qualsivoglia tipologia di contenuto, risiede nel fatto che ChatGPT possa venire addestrata per utilizzare materiale protetto da copyright.

Al momento, però, si può solo aspettare e scoprire che cosa abbia intenzione di fare il New York Times. Se deciderà di citare in giudizio OpenAI, altre aziende, e siti web, potrebbero intraprendere azioni simili per proteggere il proprio lavoro. Se, invece, le due aziende giungessero a un accordo fra le parti, supponiamo attraverso il pagamento di una licenza di utilizzo da parte di OpenAI, il risultato potrebbe essere un incremento del costo della piattaforma in virtù di costi incredibilmente alti che l’azienda dovrebbe sostenere per poter continuare ad attingere dalle varie fonti o, in alternativa, un impoverimento delle capacità linguistiche del chatbot.

Al netto di tutto questo, è indubbio che le critiche secondo cui questi modelli linguistici sembrano sempre aver fatto affidamento sul lavoro svolto da altri, sono ben lungi dal fermarsi.