X, la piattaforma precedentemente nota come Twitter, ha rilasciato una nuova versione del codice sorgente del proprio algoritmo di raccomandazione, offrendo uno sguardo inedito sui meccanismi che determinano quali contenuti appaiono nel feed degli utenti. L'iniziativa arriva a tre anni di distanza dal primo tentativo di apertura del 2023, che era stato pesantemente criticato dalla comunità tech come mero "teatro della trasparenza" per via della sua incompletezza. Questa volta, il proprietario Elon Musk promette aggiornamenti quadrimestrali sul funzionamento del sistema, in quello che rappresenta un approccio decisamente più strutturato alla trasparenza algoritmica.
La documentazione pubblicata su GitHub rivela che l'intero sistema di raccomandazione si basa sull'intelligenza artificiale proprietaria della piattaforma. Secondo quanto dichiarato, il transformer basato su Grok analizza in tempo reale le sequenze di interazione degli utenti per determinare la rilevanza dei contenuti, senza alcun intervento manuale nella fase di feature engineering. Questa automazione completa, secondo X, riduce significativamente la complessità delle pipeline di dati e dell'infrastruttura di serving, rendendo il sistema più efficiente dal punto di vista computazionale.
Il funzionamento dell'algoritmo si articola in diverse fasi successive. Inizialmente, il sistema analizza lo storico delle interazioni dell'utente – clic, like, repost e altre forme di engagement – combinandolo con i contenuti recenti pubblicati dagli account seguiti. La vera innovazione risiede però nell'analisi basata su machine learning dei post "out-of-network", ovvero contenuti provenienti da account che l'utente non segue direttamente ma che il sistema ritiene potenzialmente rilevanti in base al profilo comportamentale ricostruito.
La fase di filtraggio successiva elimina automaticamente diverse categorie di contenuti: post provenienti da account bloccati, contenuti associati a parole chiave silenziate dall'utente, materiale classificato come troppo violento o identificato come spam. Il ranking finale considera fattori multipli tra cui rilevanza, diversità dei contenuti e probabilità di engagement, evitando che il feed risulti monotematico o ripetitivo. Il sistema assegna punteggi predittivi sulla probabilità che l'utente possa apprezzare, rispondere, ricondividere o interagire in qualsiasi modo con ciascun contenuto.
Le motivazioni dietro questa seconda apertura del codice rimangono parzialmente oscure. Musk ha storicamente giustificato queste iniziative come parte di una missione per rendere la piattaforma un esempio di trasparenza aziendale. Nel 2023, quando Twitter rilasciò per la prima volta il codice, il CEO affermò che la trasparenza sarebbe stata "incredibilmente imbarazzante all'inizio" ma avrebbe portato a rapidi miglioramenti nella qualità delle raccomandazioni, con l'obiettivo ultimo di guadagnare la fiducia degli utenti.
La retorica della trasparenza contrasta però con alcune scelte aziendali successive all'acquisizione del 2022. La transizione da società pubblica a privata ha ridotto gli obblighi di disclosure finanziaria, mentre la pubblicazione dei report di trasparenza – che sotto la gestione precedente avveniva più volte l'anno – ha subito una battuta d'arresto fino a settembre 2024. A dicembre, l'Unione Europea ha inflitto una multa da 140 milioni di dollari a X per violazione degli obblighi di trasparenza previsti dal Digital Services Act, contestando in particolare il sistema delle spunte di verifica che renderebbe più difficile valutare l'autenticità degli account.
Il tempismo del rilascio potrebbe essere collegato alle recenti pressioni normative sul chatbot Grok. L'ufficio del procuratore generale della California e diversi membri del Congresso statunitense hanno avviato indagini sulla piattaforma nelle ultime settimane, in seguito a segnalazioni che Grok sarebbe stato utilizzato per generare contenuti sessualmente espliciti raffiguranti donne e minori. In questo contesto, l'apertura del codice algoritmico potrebbe rappresentare un tentativo di riconquistare credibilità presso regolatori e utenti, anche se parte della comunità tech rimane scettica sulla sostanza effettiva di queste iniziative.
Dal punto di vista tecnico, l'architettura rivelata non presenta innovazioni particolarmente dirompenti rispetto agli standard del settore, ma offre comunque uno spaccato raro sul funzionamento concreto di un sistema di raccomandazione su larga scala. La promessa di aggiornamenti quadrimestrali, se mantenuta, potrebbe rappresentare un precedente interessante per altre piattaforme social, storicamente riluttanti a condividere i dettagli dei propri algoritmi per ragioni competitive e di sicurezza contro manipolazioni esterne.