ChatGPT è un avido lettore di libri. Non nel senso che li ha usati come base per sviluppare le sue capacità linguistiche, ma nel senso che conosce i testi ed è in grado di rispondere a domande su di essi.

Sì ma come si fa ad affermare una cosa del genere, visto che OpenAI conserva sotto chiave il data set usato per addestrare il suo famoso algoritmo, perché giustamente si tratta di un asset industriale tra i più preziosi?

Ebbene, il professor si è messo di buona lena e ha fatto domande a ChatGPT su una moltitudine di libri, nel tentativo di capire quali avesse letto. Dalle risposte, ha stabilito un punteggio percentuale: più è alto il valore, e più è probabile, secondo Bamman, che ChatGPT abbia letto quel libro.

Lo studio è ancora senza peer review, quindi da prendere con grandissima cautela, ma è anche molto divertente. Ci sono alcuni dati del tutto prevedibili: ChatGPT ha letto molti classici e best seller moderni, come Moby Dick, La lettera scarlatta, Orgoglio e pregiudizio, i romanzi di Harry Potter e quelli di Sherlock Holmes, Il codice Da Vinci, Cinquanta sfumature di grigio e molti altri.

Molto più stuzzicante però è la notevole quantità di fantascienza e letteratura fantastica in generale: J.R.R. Tolkien, Ray Bradbury, William Gibson, Orson Scott Card, Philip K. Dick, Margaret Atwood, George R. R. Martin, persino Douglas Adams.

Insomma, pare proprio che dentro a ChatGPT ci sia una gran bella biblioteca da nerd. Personalmente, vedere come il Silmarillion, la Guida Galattica per Autostoppisti, Charles Dickens o Philips Dick, ho sentito un piccolo (ma nemmeno tanto) brivido di piacere.

I libri letti dall’IA sono importanti, per più di una ragione

I libri di ChatGPT

Facendo domande specifiche al bot è possibile capire se sta facendo un uso illegittimo dei materiali, in violazione del copyright o delle regole sul fair use. Può succedere – e succede in effetti – con le opere di fan fiction, in genere disponibili gratuitamente online.

Ma non è solo questo.

Così come le letture in qualche modo plasmano il nostro carattere e il nostro modo di pensare (specialmente quelle giovanili), così i dati in qualche modo finiscono per definire il pensiero dell’algoritmo.

Non che un’IA possa davvero capire un romanzo, anzi è una cosa che nemmeno tanti umani sanno fare. Però chissà in che modo le risposte che ci fornisce sono in qualche modo “figlie” di quelle letture.

Quanto possono pesare alcuni testi sci-fi un un mare magnum di dati, che secondo alcuni può arrivare a un petabyte? Probabilmente molto poco: l’esame di Bamman mostra infatti che a farla da padrone sono i dati – libri in buona parte – a libero accesso. Quelli cioè su cui non pesa più nessuna questione di copyright. Insomma, il bot si è nutrito soprattutto di quello che si trova gratuitamente online.

Detto questo, secondo Bamman ha senso domandarsi se e fino a che punto queste letture hanno formato l’IA, il suo modo di ragionare e le risposte che ci fornisce. Il fatto che la letteratura fantastica e di genere sia sovrabbondante rispetto al resto ha un qualche significato?

Al momento, non abbiamo modo di rispondere, ma mi piace pensare che ChatGPT abbia letto questi libri e sia in qualche modo diventato quel modello ideale di una certa fantascienza.

Penso al modello di Star Trek, in particolare, dove i conflitti di certo non mancano ma all’interno di uno specifico recinto (la Federazione dei Pianeti) l’umanità è riuscita a superare gran parte dei problemi che ci affliggono oggi, al punto che non esiste più il denaro – il male più grande di tutti secondo molti.

Sogni utopici a parte, la letteratura di genere ha moltissimo da offrire, e oggi è forse ciò che più di tutto rappresenta l’eredità dei grandi, da Dante a Cervantes, da a Shakespeare a Borges, da Atwood a Rowling. C’è un sottile filo rosso che unisce tutto e che, spero, può rendere gli algoritmi migliori di quanto sarebbero senza l’inserimento di queste opere letterarie.

Immagine di copertina: alfazetchronicles