Ishan Anand, sviluppatore di software e appassionato utilizzatore di fogli di calcolo, ha integrato GPT-2 in Microsoft Excel. Tale impresa, sorprendentemente funzionante, fornisce una chiara idea su come i modelli linguistici di grandi dimensioni (LLM) funzionino e sull'architettura Transformer che sottende alla previsione intelligente del token successivo. "Se si comprende un foglio di calcolo, si può comprendere l'intelligenza artificiale", afferma con sicurezza Anand. Il foglio di calcolo, con dimensioni di 1,25 GB, è stato reso disponibile su GitHub per permettere a chiunque di scaricarlo e sperimentarne le funzionalità.

Per l'esperimento è stato usato GPT-2 "Small"

Questa implementazione di GPT-2 tramite foglio di calcolo è certamente, ma va ricordato che GPT-2 era all'avanguardia e ha attirato molta attenzione già nel 2019. È importante sottolineare che, essendo stato sviluppato prima dell'era della "chat". Per l'esperimento, se così vogliamo chiamarlo, Anand ha inoltre utilizzato qui il modelloil cui file binario Microsoft Excel XLSB conta 124 milioni di parametri, mentre la versione completa di GPT-2 ne dispone di 1,5 miliardi (con GPT-3 che ha ulteriormente spinto questo limite, arrivando a 175 miliardi di parametri).

Il funzionamento principale di GPT-2 si basa sulla previsione intelligente del token successivo, dove il modello linguistico dell'architettura Transformer completa un input con la parte successiva più probabile della sequenza. Questo foglio di calcolo può gestire solo 10 token di input, una cifra modesta rispetto ai 128.000 token gestiti da GPT-4 Turbo. Tuttavia, risulta comunque utile per una dimostrazione e Anand sostiene che la sua "introduzione low-code" possa essere un'ottima base per dirigenti tecnologici, esperti di marketing, product manager, responsabili politici dell'intelligenza artificiale, esperti di etica, nonché per sviluppatori e scienziati alle prime armi nel campo dell'IA.

Come funziona su Excel? Nel lavoro su più fogli, il primo contiene qualsiasi prompt si desideri inserire (con la limitazione di 10 prompt). Attraverso la tokenizzazione delle parole, le posizioni e i pesi del testo, Anand illustra il processo di perfezionamento iterativo della previsione della parola successiva e la selezione del token di output, ovvero l'ultima parola prevista della sequenza.

Lo sviluppatore avverte che non è consigliabile utilizzare questo file Excel su Mac, poiché potrebbero verificarsi frequenti crash, né caricarlo su app di fogli di calcolo cloud, dato che attualmente non funzionerebbe. Si raccomanda inoltre l'uso della versione più recente di Excel. Questo foglio di calcolo, infine, rappresenta principalmente un esercizio educativo e divertente per Anand. Va notato che uno dei vantaggi nell'utilizzare Excel sul proprio PC è che questo LLM viene eseguito completamente in locale, senza richiedere chiamate API al cloud.