Forse non abbiamo mai davvero capito quanto fosse fragile la nostra privacy online. Pensavamo che un nickname fosse sufficiente — che postare su Reddit con un alias ci proteggesse dall'essere identificati nella vita reale. Molti di noi sanno che le autorità possono rintracciare praticamente chiunque, se vogliono farlo, ma per una "persona normale" non è così facile. O forse dovremmo dire, non era facile: uno studio appena pubblicato dimostra infatti che un moderno LLM può dare nome e cognome agli account fasulli che trovate su Facebook, Instagram e altri spazi digitali.

Secondo la ricerca, ripresa da Ars Technica, i modelli linguistici di grandi dimensioni (LLM) sono in grado di identificare l'identità reale di utenti pseudonimi con una precisione fino al 90% e un recall fino al 68% — numeri enormemente superiori a qualsiasi tecnica di deanonymizzazione precedente, che richiedeva dati strutturati e lavoro manuale di investigatori specializzati.

Il meccanismo è elegante e inquietante: l'AI non cerca metadati o ID univoci. Analizza il modo in cui scrivi. Il vocabolario, le strutture sintattiche più comuni, le metafore che usi, la lunghezza tipica delle frasi, il ritmo con cui costruisci gli argomenti. Lo stile di scrittura diventa una specie di impronta digitale utile a riconoscerti.

Come funziona la deanonimizzazione con i LLM

Il paper descrive esperimenti su dataset diversi. In uno, i ricercatori hanno raccolto post da Hacker News e profili LinkedIn, li hanno "puliti" da tutti i riferimenti identificativi espliciti, e poi hanno chiesto all'LLM di correlare i due. Il modello ha trovato i match con accuratezza sorprendente, basandosi esclusivamente sullo stile testuale.

In un altro esperimento, basato su un vecchio dataset Netflix, il modello è riuscito a identificare le persone dietro a micro-identità di preferenze e comportamenti d'acquisto — e a inferire affiliazioni politiche e altre informazioni personali sensibili.

"Quello che abbiamo scoperto è che questi agenti AI possono fare qualcosa che era precedentemente molto difficile: partendo da testo libero — come una trascrizione di intervista anonimizzata — riescono a risalire all'identità completa di una persona", ha dichiarato Simon Lermen, co-autore del paper.

La conclusione è che non basta creare un account "a perdere" per essere anonimi. Oggi è molto più facile risalire alla vera identità di chi pubblica online, ed è possibile farlo anche con mezzi relativamente semplici e accessibili.

La minaccia: doxxing automatizzato su scala industriale

Le implicazioni negative sono facili da capire. Un attore malevolo — che sia un governo autoritario, un'azienda che fa profiling, o semplicemente un troll determinato — può ora identificare chi si nasconde dietro un account anonimo con un livello di automazione e scala che prima era impossibile. Questo apre la porta a doxxing sistematico, stalking, ritorsioni per opinioni espresse online. Esistono persone per cui la privacy online è una questione di sopravvivenza, e queste tecnologie le mettono in pericolo.

Pensiamo a chi usa l'anonimato per ragioni legittime e delicate: giornalisti che proteggono le loro fonti, attivisti in paesi con regimi autoritari, persone che discutono di salute mentale o situazioni familiari difficili, dipendenti che segnalano irregolarità nelle aziende. Per tutti loro, questa capacità dei LLM è una minaccia concreta.

Non è un problema che si risolve facilmente. Non basta cambiare nickname o scrivere in modo volutamente diverso — gli LLM riescono a catturare pattern profondi che resistono alle modifiche superficiali. L'unico modo per sfuggire alla deanonymizzazione è non produrre mai testi comparabili, il che nella pratica significa un silenzio digitale difficile da sostenere.

La risorsa: individuare l'odio online finalmente diventa fattibile

Ma questa stessa capacità ha un rovescio della medaglia che vale la pena esplorare. Chiunque passi tempo sui social media lo sa: l'anonimato è sistematicamente abusato da chi diffonde odio, molesta utenti vulnerabili, organizza campagne di harassment coordinato. La difficoltà di identificare questi attori — che cambiano account, usano VPN, sfruttano l'architettura delle piattaforme — ha reso per anni quasi impossibile responsabilizzarli. Certo, è pur sempre possibile raccogliere materiale e fare denuncia, e volendo la Polizia Postale ha i mezzi per risalire a una vera identità.

Ma raramente ciò succede davvero, e chi agisce in questo modo lo sa bene e per questo continua ad agire come se niente fosse.

Un caso concreto e attuale viene proprio dalla notizia di questi giorni: alcuni teenager hanno usato l'AI per creare "slander page" contro i loro insegnanti. Pagine fake, contenuti diffamatori, identità nascoste. Un'operazione che può creare danni più che reali alle vittime, e grazie alle capacità di deanonymizzazione dei LLM ora abbiamo uno strumento in più per rispondere.

Lo stesso vale per le campagne di hate speech coordinato, per i troll che molestano sistematicamente giornalisti e minoranze, per chi organizza astroturfing politico sotto falsa identità. Per investigatori giornalistici, forze dell'ordine e piattaforme che vogliono realmente applicare le proprie policy, questa è una capacità nuova e potente.

Dopottutto, in moltissimi casi stiamo parlando dei cosiddetti "leoni da tastiera", che si dimostrano aggressivi, violenti e sfacciati solo dietro allo scudo dell'anonimato. Spesso e volentieri poi si rivelano più che disposti a un passo indietro, quando la loro vera identità viene svelata.

Il dilemma irrisolvibile

Il problema è che la stessa tecnologia che smonta l'anonimato del molestatore smonta anche quello dell'attivista. Non esiste un modo di applicare la deanonimizzazione solo "ai cattivi" — è una capacità generale che chiunque, con le risorse giuste, può usare contro chiunque.

Quindi o proteggiamo l'anonimato per tutti, oppure non lo diamo a nessuno. Ed è un bel grattacapo.

Siamo di fronte a uno di quei momenti in cui una capacità tecnologica supera la nostra capacità normativa e sociale di gestirla. Forse abbiamo sempre sopravvalutato la protezione offerta dall'anonimato online — o forse l'abbiamo usata come scusa per non costruire sistemi di responsabilità più robusti che proteggessero davvero chi ne aveva bisogno senza dare copertura a chi ne abusava.

Una cosa è certa: la narrativa del "postate pure in anonimo, nessuno saprà mai chi siete" forse sta per finire. Forse tra poco questo tipo di capacità diventerà un'estensione del browser, e saremo sempre a un click dal sapere chi è veramente quell'account anonimo che ci infastidisce. Non sarebbe niente male.