image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Il disastro dell'IA a Sanremo è peggio di quello che sembra Il disastro dell'IA a Sanremo è peggio di quello che sembra...
Immagine di Windows 11 si aggiorna e stavolta è una buona notizia: le novità Windows 11 si aggiorna e stavolta è una buona notizia: le n...

Anthropic rilancia la sfida a OpenAI con Opus 4.5

Opus 4.5 porta Claude a un nuovo livello: chat senza interruzioni, coding più preciso e prestazioni che superano OpenAI e Google.

Advertisement

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Senior Editor @Tom's Hardware Italia

Pubblicato il 25/11/2025 alle 11:40

La notizia in un minuto

  • Opus 4.5 di Anthropic raggiunge l'80,9% di accuratezza nel benchmark SWE-Bench Verified per il coding, superando GPT-5.1-Codex-Max e Gemini 3 Pro
  • Claude elimina le interruzionibrusche delle conversazioni grazie a un sistema di sintesi intelligente automatica che preserva gli elementi critici oltre i 200.000 token
  • Il modello eccelle nell'uso agentico di strumenti e nel coding autonomo, con funzionalità di context management accessibili anche via API per applicazioni enterprise

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Anthropic ha alzato il tiro nella corsa ai modelli di frontiera con il rilascio di Opus 4.5, la sua soluzione flagship che segna un punto di svolta nelle prestazioni di coding e nell'esperienza utente complessiva. L'annuncio arriva in un momento particolarmente caldo per il settore dell'intelligenza artificiale generativa, con OpenAI e Google che hanno appena aggiornato le proprie offerte di punta. La mossa di Anthropic si distingue per un approccio che bilancia potenza bruta e usabilità pratica, affrontando finalmente uno dei limiti più frustranti della piattaforma Claude.

La novità più rilevante per l'utenza consumer riguarda la gestione delle conversazioni prolungate. Claude non interromperà più bruscamente i dialoghi quando raggiungono dimensioni eccessive, un problema che affliggeva gli utenti anche quando disponevano ancora di margine nelle loro quote di utilizzo settimanale. Il vecchio sistema implementava un limite rigido a 200.000 token di finestra contestuale, oltre il quale la conversazione veniva terminata senza preavviso.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

La filosofia precedente di Anthropic rifletteva una scelta tecnica precisa: invece di adottare la strategia di altri Large Language Model che eliminano progressivamente i messaggi più vecchi dal contesto, Claude preferiva terminare la sessione piuttosto che degradare gradualmente la qualità delle risposte. Questo approccio evitava conversazioni sempre più incoerenti in cui il modello iniziava a "dimenticare" informazioni in base alla loro anzianità temporale, ma al prezzo di interruzioni improvvise che compromettevano il flusso di lavoro.

La soluzione implementata ora prevede un processo automatico di sintesi intelligente che opera dietro le quinte. Il sistema analizza le fasi iniziali della conversazione, scarta ciò che considera superfluo e conserva gli elementi critici, permettendo di proseguire il dialogo senza perdere coerenza. Questo miglioramento si applica retroattivamente a tutti i modelli Claude attualmente disponibili nelle applicazioni web, mobile e desktop, non solo a Opus 4.5.

Opus 4.5 è il primo modello a superare la soglia dell'80% di accuratezza nel benchmark SWE-Bench Verified, raggiungendo l'80,9%

Sul fronte delle prestazioni pure, Opus 4.5 stabilisce un nuovo standard nel coding agentico. Il modello ha conseguito l'80,9% di accuratezza nel benchmark SWE-Bench Verified, superando sia GPT-5.1-Codex-Max di OpenAI (77,9%) che Gemini 3 Pro di Google (76,2%). Si tratta di un risultato particolarmente significativo considerando che SWE-Bench Verified valuta la capacità dei modelli di risolvere problematiche reali di ingegneria del software, un compito che richiede comprensione contestuale profonda e capacità di manipolare codice complesso.

Le eccellenze di Opus 4.5 si concentrano specificamente nell'uso agentico di strumenti e nelle attività di coding autonomo, settori dove la capacità di pianificare sequenze multi-step e interagire con API esterne risulta determinante. Tuttavia, persiste un divario rispetto a GPT-5.1 nel ragionamento visivo, come evidenziato dai risultati nel benchmark MMMU (Massive Multitask Language Understanding con componenti multimodali), segno che la competizione tra i modelli di frontiera rimane aperta su diversi fronti.

Per gli sviluppatori che utilizzano l'API di Anthropic, le stesse logiche di gestione della memoria conversazionale sono accessibili attraverso funzionalità di context management e context compaction. Questi strumenti permettono implementazioni personalizzate della compressione contestuale, aprendo scenari interessanti per applicazioni enterprise che necessitano di mantenere conversazioni estese con agenti AI senza degradare la qualità delle interazioni o incorrere in costi eccessivi legati all'utilizzo dei token.

Fonte dell'articolo: arstechnica.com

Le notizie più lette

#1
Windows 11 si aggiorna e stavolta è una buona notizia: le novità
8

Hardware

Windows 11 si aggiorna e stavolta è una buona notizia: le novità

#2
Il disastro dell'IA a Sanremo è peggio di quello che sembra

Hardware

Il disastro dell'IA a Sanremo è peggio di quello che sembra

#3
NVIDIA entra nel mercato SoC per PC Windows
3

Hardware

NVIDIA entra nel mercato SoC per PC Windows

#4
Recensione Resident Evil Requiem, la chiusura di un cerchio
2

Recensione

Recensione Resident Evil Requiem, la chiusura di un cerchio

#5
Come smascherare i volti creati dall'IA
3

Scienze

Come smascherare i volti creati dall'IA

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Windows 11 si aggiorna e stavolta è una buona notizia: le novità
8

Hardware

Windows 11 si aggiorna e stavolta è una buona notizia: le novità

Di Marco Pedrani
Il disastro dell'IA a Sanremo è peggio di quello che sembra

Hardware

Il disastro dell'IA a Sanremo è peggio di quello che sembra

Di Marco Pedrani
NVIDIA entra nel mercato SoC per PC Windows
3

Hardware

NVIDIA entra nel mercato SoC per PC Windows

Di Antonello Buzzi
Micron porta le GDDR7 a 36 Gbps per le future GPU
2

Hardware

Micron porta le GDDR7 a 36 Gbps per le future GPU

Di Antonello Buzzi
NVIDIA non ha ancora venduto H200 alla Cina

Hardware

NVIDIA non ha ancora venduto H200 alla Cina

Di Antonello Buzzi

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • SosHomeGarden
  • Aibay
  • Coinlabs

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.