image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Recensione be quiet! Light Loop 360mm, potente e silenzioso Recensione be quiet! Light Loop 360mm, potente e silenzioso...
Immagine di La California impone la verifica dell'età su tutti gli OS La California impone la verifica dell'età su tutti gli OS...

ShadowLeak evolve e supera le difese di ChatGPT

Un attacco raffinato mostra come sia possibile aggirare le protezioni di ChatGPT ed esfiltrare dati sensibili carattere per carattere.

Advertisement

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Senior Editor @Tom's Hardware Italia

Pubblicato il 08/01/2026 alle 16:25

La notizia in un minuto

  • ZombieAgent aggira le protezioni di ChatGPT contro l'esfiltrazione dati fornendo una lista di URL pre-costruiti con singoli caratteri, sfruttando una lacuna nelle restrizioni di OpenAI
  • I guardrail tradizionali si rivelano inadeguati contro il prompt injection, creando un ciclo senza fine di vulnerabilità e patch simile a SQL injection
  • OpenAI ha risposto limitando l'apertura di link da email non verificati, ma il problema resta strutturale finché non emergerà una soluzione fondamentale

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

La battaglia tra i ricercatori di sicurezza e i sistemi di intelligenza artificiale entra in una nuova fase critica. Radware ha dimostrato come sia possibile aggirare le protezioni implementate da OpenAI in ChatGPT contro l'esfiltrazione di dati sensibili attraverso agenti AI, utilizzando una variante raffinata dell'attacco ShadowLeak denominata ZombieAgent. Il caso evidenzia una problematica strutturale che affligge l'intero settore dell'intelligenza artificiale: le contromisure tradizionali basate su guardrail si rivelano inadeguate contro le tecniche di prompt injection, creando un ciclo senza fine di vulnerabilità e patch simile a quanto accade con SQL injection e memory corruption.

L'attacco originale ShadowLeak sfruttava la capacità degli agenti AI di costruire dinamicamente URL personalizzati concatenando parole, aggiungendo parametri di query o inserendo dati derivati dall'utente in un URL di base. OpenAI aveva risposto limitando ChatGPT all'apertura esclusiva di URL forniti esattamente come specificati, impedendo qualsiasi modifica o aggiunta di parametri anche quando esplicitamente richiesto. Una contromisura che sulla carta sembrava efficace, ma che si è dimostrata facilmente aggirabile con un approccio alternativo.

I ricercatori di Radware hanno sviluppato ZombieAgent modificando la strategia di attacco in modo sorprendentemente semplice. Invece di chiedere all'agente AI di costruire URL dinamicamente, il prompt injection rivisto fornisce una lista completa di URL pre-costruiti. Ogni indirizzo contiene l'URL di base seguito da un singolo carattere alfanumerico: example.com/a, example.com/b e così via per tutte le lettere dell'alfabeto, oltre a example.com/0 fino a example.com/9. Il prompt istruisce inoltre l'agente a sostituire gli spazi con un token speciale, permettendo l'esfiltrazione carattere per carattere.

ZombieAgent sfrutta una lacuna apparentemente banale: OpenAI non aveva vietato l'aggiunta di un singolo carattere a un URL, permettendo l'esfiltrazione dei dati lettera per lettera

La tecnica funziona perché gli sviluppatori di OpenAI non avevano previsto restrizioni sull'aggiunta di un singolo carattere a un URL. Questa svista ha permesso agli attaccanti di estrarre informazioni sensibili attraverso un processo iterativo, aggirando completamente i controlli implementati. L'attacco dimostra come le protezioni basate su regole specifiche siano intrinsecamente fragili quando applicate a sistemi complessi come i large language model.

OpenAI ha successivamente mitigato l'attacco ZombieAgent implementando una nuova restrizione: ChatGPT ora rifiuta di aprire qualsiasi link proveniente da email a meno che non sia presente in un indice pubblico conosciuto o sia stato fornito direttamente dall'utente in una chat. La modifica mira a bloccare l'accesso a URL di base che conducono a domini controllati dagli attaccanti, alzando ulteriormente l'asticella delle protezioni.

Pascal Geenens, vicepresidente della divisione threat intelligence di Radware, sottolinea tuttavia il problema fondamentale: "I guardrail non dovrebbero essere considerati soluzioni fondamentali per i problemi di prompt injection. Rappresentano invece una soluzione rapida per fermare un attacco specifico. Fino a quando non esisterà una soluzione fondamentale, il prompt injection rimarrà una minaccia attiva e un rischio reale per le organizzazioni che implementano assistenti e agenti AI."

La situazione rispecchia pattern consolidati nella sicurezza informatica. Negli ultimi cinque anni, vulnerabilità come SQL injection e memory corruption hanno continuato a fornire agli hacker gli strumenti necessari per compromettere software e siti web, nonostante decenni di contromisure. Le tecniche di prompt injection sembrano destinate a seguire lo stesso percorso, con un ciclo perpetuo di attacchi e mitigazioni che non risolve il problema alla radice. 

Fonte dell'articolo: arstechnica.com

Le notizie più lette

#1
Ho scritto che il coding è morto, ecco come gli sviluppatori mi hanno risposto

Business

Ho scritto che il coding è morto, ecco come gli sviluppatori mi hanno risposto

#2
AI Far West: Anthropic contro il Pentagono e la sfida globale tra Etica e Potere
1

Business

AI Far West: Anthropic contro il Pentagono e la sfida globale tra Etica e Potere

#3
Il Vibe Coding ci renderà tutti programmatori o tutti disoccupati?
4

Business

Il Vibe Coding ci renderà tutti programmatori o tutti disoccupati?

#4
HONOR al MWC 2026, fra robot-phone e foldable indistruttibili
2

MWC 2026

HONOR al MWC 2026, fra robot-phone e foldable indistruttibili

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

La California impone la verifica dell'età su tutti gli OS
6

Hardware

La California impone la verifica dell'età su tutti gli OS

Di Antonello Buzzi
Recensione be quiet! Light Loop 360mm, potente e silenzioso
3

Hardware

Recensione be quiet! Light Loop 360mm, potente e silenzioso

Di Marco Pedrani
Microsoft Teams colma una lacuna storica nelle chat
4

Hardware

Microsoft Teams colma una lacuna storica nelle chat

Di Antonello Buzzi
NVIDIA ammette che la carenza di GPU non finirà presto
7

Hardware

NVIDIA ammette che la carenza di GPU non finirà presto

Di Antonello Buzzi
Un dirigente Intel Foundry passa a Qualcomm

Hardware

Un dirigente Intel Foundry passa a Qualcomm

Di Antonello Buzzi

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • SosHomeGarden
  • Aibay
  • Coinlabs

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.