Claude trova 22 falle in Firefox in due settimane

In una collaborazione con Mozilla, Anthropic ha usato Claude Opus 4.6 per cercare vulnerabilità nel codice di Firefox. Il risultato, ottenuto in sole due settimane: oltre 100 bug individuati, 22 CVE emessi e 14 classificati come ad alta severità. In un periodo equivalente, il resto della comunità di sicurezza segnala mediamente meno della metà di queste vulnerabilità.

Il team di Anthropic ha iniziato dal motore JavaScript per poi estendere l'analisi ad altre parti del codebase. Come spiega Anthropic, Firefox "è un codebase complesso e uno dei progetti open source più testati e sicuri al mondo". La maggior parte dei bug è stata corretta in Firefox 148, rilasciato a febbraio.

Dettaglio interessante: Claude è molto più bravo a trovare le falle che a sfruttarle. Il team ha speso 4.000 dollari in crediti API per generare exploit proof-of-concept, riuscendoci solo in due casi. Gli exploit generati sarebbero stati comunque bloccati dai meccanismi di sicurezza di Firefox.

Claude Opus trova i bug molto meglio di quanto riesca a scrivere gli exploit: solo 2 su 22 tentativi andati a segno.

OpenAI risponde con Codex Security

Mentre Anthropic dimostra le capacità di Claude nella ricerca di vulnerabilità, OpenAI ha lanciato Codex Security, un sistema che scansiona automaticamente i commit alla ricerca di falle di sicurezza e propone fix. Il sistema è già operativo su 1,2 milioni di commit e sarà integrato nella piattaforma enterprise Frontier, insieme alla tecnologia di Promptfoo (startup in fase di acquisizione da parte di OpenAI) per il testing di prompt injection, jailbreak e data leak.

Il messaggio è chiaro da entrambi i lati: la prossima generazione di strumenti di cybersecurity non assisterà gli analisti umani — li sostituirà su una parte significativa del lavoro di routine, liberando risorse per le analisi che richiedono giudizio. Con un costo di 4.000 dollari per una caccia ai bug che avrebbe richiesto settimane di lavoro umano, il rapporto costo-efficacia è già ora difficile da ignorare.

Le notizie più lette

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Mursey

Si... anche a me trovano bachi ma poi la soluzione non è così immediata come la propongono.
Ci vuole sempre la revisione umana.

Questo commento è stato nascosto automaticamente.

gabriele.romano

la questione non è tanto se l'AI trova vulnerabilità, quanto piuttosto se l'AI aiuta gli hacker a utilizzare e scovare vulnerabilità anche di bassa gravità difficile da sistemare

Claude trova 22 falle in Firefox in due settimane

OpenAI risponde con Codex Security

Le notizie più lette

Le particelle potrebbero non seguire la relatività di Einstein

Un nuovo chip demolisce le prestazioni di Nvidia H200

L'AI vuole tutta la corrente del mondo, ed è un problema

NVIDIA pronta a rilanciare la GeForce RTX 3060 con Samsung

Una semplice modifica alla dieta migliora la flora intestinale

0 Commenti