Qualche settimana fa, la Svizzera aveva lanciato Apertus, il primo grande modello linguistico completamente sviluppato dalla Confederazione elvetica, frutto della collaborazione tra i Politecnici federali di Losanna e Zurigo insieme al Centro Svizzero di Calcolo Scientifico di Lugano. Il progetto, il cui nome latino significa letteralmente "aperto", rappresenta un tentativo ambizioso di costruire un'alternativa europea ai modelli dominanti come ChatGPT, con un approccio radicalmente diverso basato sulla trasparenza totale e il rispetto della privacy.
La filosofia della trasparenza totale
Quello che distingue Apertus dai suoi concorrenti più famosi è la completa apertura del suo sviluppo. Mentre i modelli di OpenAI, Google o Anthropic mantengono segreti i loro algoritmi e processi di addestramento, il progetto svizzer o ha scelto la strada opposta. Architettura, pesi del modello, dati utilizzati per l'apprendimento e tutte le procedure operative sono completamente accessibili e documentati pubblicamente.
Questa filosofia si riflette anche nella gestione dei dati utilizzati per l'addestramento. Il modello si basa esclusivamente su informazioni pubbliche, accuratamente filtrate per eliminare qualsiasi dato personale e rispettare i segnali di opt-out provenienti dalle fonti originali. Un approccio che non solo si allinea perfettamente con il nuovo AI Act europeo, ma anticipa anche future normative sulla protezione dei dati nell'era dell'intelligenza artificiale.
Le perplessità sulla strategia svizzera
Non mancano tuttavia le critiche al progetto. Il quotidiano "Le Temps" ha sollevato interrogativi sulla strategia complessiva che guida lo sviluppo di Apertus, suggerendo che l'approccio svizzero potrebbe essere eccessivamente conservativo per gli standard dell'innovazione tecnologica globale.
Secondo i critici, la priorità data all'inclusività linguistica e alle preoccupazioni etiche, pur rappresentando valori lodevoli tipicamente svizzeri come neutralità ed equità, potrebbe compromettere le prestazioni complessive del modello. In un panorama globale dove l'intelligenza artificiale sta rapidamente trasformando settori cruciali come sanità, finanza e sostenibilità, alcuni esperti ritengono che la Svizzera dovrebbe puntare su visioni più audaci e competitive.
Il modello è disponibile in due configurazioni: una versione da 8 miliardi di parametri, pensata per l'utilizzo domestico e di ricerca, e una più potente da 70 miliardi, destinata a professionisti con maggiori risorse computazionali. La licenza Apache 2.0 permette l'utilizzo sia in ambito educativo che commerciale, garantendo la massima flessibilità agli sviluppatori interessati a costruire soluzioni basate sulla tecnologia svizzera.
Un campione del multilinguismo globale
Detto ciò, l'addestramento di Apertus rappresenta un record nel campo del multilinguismo digitale. Con 15 trilioni di token elaborati in oltre mille lingue diverse, il modello svizzero dedica particolare attenzione agli idiomi tradizionalmente trascurati dai grandi sistemi di IA. Lo svizzero tedesco e il romancio, lingue che raramente trovano spazio nei dataset internazionali, occupano un posto di rilievo nel corpus di Apertus.
Questa scelta rappresenta una chiara presa di posizione contro l'omogeneizzazione linguistica che caratterizza molti modelli contemporanei, dove l'inglese domina spesso con percentuali superiori all'80% dei contenuti di addestramento.
Un materiale grezzo per sviluppatori
Diversamente da ChatGPT o altri assistenti conversazionali pronti all'uso, Apertus si presenta come un "foundation model", ovvero una base tecnica sulla quale terze parti possono costruire applicazioni specifiche. Non è quindi un chatbot immediato, ma piuttosto un materiale grezzo sofisticato che richiede ulteriore sviluppo per diventare operativo in contesti specifici.
Swisscom ha già annunciato l'intenzione di utilizzare Apertus per creare un assistente conversazionale che sarà presentato durante le Swiss{AI}weeks, un evento dedicato alla promozione dell'intelligenza artificiale sul territorio nazionale. Le potenziali applicazioni spaziano però ben oltre i chatbot, estendendosi a settori specializzati come la medicina e il diritto, dove la precisione linguistica e la conformità normativa sono fondamentali.