image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di 5 cose da fare prima di comprare altra RAM per il vostro PC 5 cose da fare prima di comprare altra RAM per il vostro PC...
Immagine di RDNA 5 AT0, la top AMD torna per i gamer RDNA 5 AT0, la top AMD torna per i gamer...

Anthropic rilancia la sfida a OpenAI con Opus 4.5

Opus 4.5 porta Claude a un nuovo livello: chat senza interruzioni, coding più preciso e prestazioni che superano OpenAI e Google.

Advertisement

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Senior Editor @Tom's Hardware Italia

Pubblicato il 25/11/2025 alle 11:40

La notizia in un minuto

  • Opus 4.5 di Anthropic raggiunge l'80,9% di accuratezza nel benchmark SWE-Bench Verified per il coding, superando GPT-5.1-Codex-Max e Gemini 3 Pro
  • Claude elimina le interruzionibrusche delle conversazioni grazie a un sistema di sintesi intelligente automatica che preserva gli elementi critici oltre i 200.000 token
  • Il modello eccelle nell'uso agentico di strumenti e nel coding autonomo, con funzionalità di context management accessibili anche via API per applicazioni enterprise

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Anthropic ha alzato il tiro nella corsa ai modelli di frontiera con il rilascio di Opus 4.5, la sua soluzione flagship che segna un punto di svolta nelle prestazioni di coding e nell'esperienza utente complessiva. L'annuncio arriva in un momento particolarmente caldo per il settore dell'intelligenza artificiale generativa, con OpenAI e Google che hanno appena aggiornato le proprie offerte di punta. La mossa di Anthropic si distingue per un approccio che bilancia potenza bruta e usabilità pratica, affrontando finalmente uno dei limiti più frustranti della piattaforma Claude.

La novità più rilevante per l'utenza consumer riguarda la gestione delle conversazioni prolungate. Claude non interromperà più bruscamente i dialoghi quando raggiungono dimensioni eccessive, un problema che affliggeva gli utenti anche quando disponevano ancora di margine nelle loro quote di utilizzo settimanale. Il vecchio sistema implementava un limite rigido a 200.000 token di finestra contestuale, oltre il quale la conversazione veniva terminata senza preavviso.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

La filosofia precedente di Anthropic rifletteva una scelta tecnica precisa: invece di adottare la strategia di altri Large Language Model che eliminano progressivamente i messaggi più vecchi dal contesto, Claude preferiva terminare la sessione piuttosto che degradare gradualmente la qualità delle risposte. Questo approccio evitava conversazioni sempre più incoerenti in cui il modello iniziava a "dimenticare" informazioni in base alla loro anzianità temporale, ma al prezzo di interruzioni improvvise che compromettevano il flusso di lavoro.

La soluzione implementata ora prevede un processo automatico di sintesi intelligente che opera dietro le quinte. Il sistema analizza le fasi iniziali della conversazione, scarta ciò che considera superfluo e conserva gli elementi critici, permettendo di proseguire il dialogo senza perdere coerenza. Questo miglioramento si applica retroattivamente a tutti i modelli Claude attualmente disponibili nelle applicazioni web, mobile e desktop, non solo a Opus 4.5.

Opus 4.5 è il primo modello a superare la soglia dell'80% di accuratezza nel benchmark SWE-Bench Verified, raggiungendo l'80,9%

Sul fronte delle prestazioni pure, Opus 4.5 stabilisce un nuovo standard nel coding agentico. Il modello ha conseguito l'80,9% di accuratezza nel benchmark SWE-Bench Verified, superando sia GPT-5.1-Codex-Max di OpenAI (77,9%) che Gemini 3 Pro di Google (76,2%). Si tratta di un risultato particolarmente significativo considerando che SWE-Bench Verified valuta la capacità dei modelli di risolvere problematiche reali di ingegneria del software, un compito che richiede comprensione contestuale profonda e capacità di manipolare codice complesso.

Le eccellenze di Opus 4.5 si concentrano specificamente nell'uso agentico di strumenti e nelle attività di coding autonomo, settori dove la capacità di pianificare sequenze multi-step e interagire con API esterne risulta determinante. Tuttavia, persiste un divario rispetto a GPT-5.1 nel ragionamento visivo, come evidenziato dai risultati nel benchmark MMMU (Massive Multitask Language Understanding con componenti multimodali), segno che la competizione tra i modelli di frontiera rimane aperta su diversi fronti.

Per gli sviluppatori che utilizzano l'API di Anthropic, le stesse logiche di gestione della memoria conversazionale sono accessibili attraverso funzionalità di context management e context compaction. Questi strumenti permettono implementazioni personalizzate della compressione contestuale, aprendo scenari interessanti per applicazioni enterprise che necessitano di mantenere conversazioni estese con agenti AI senza degradare la qualità delle interazioni o incorrere in costi eccessivi legati all'utilizzo dei token.

Fonte dell'articolo: arstechnica.com

Le notizie più lette

#1
Un noto integratore cerebrale accorcia la vita degli uomini
2

Scienze

Un noto integratore cerebrale accorcia la vita degli uomini

#2
I browser IA sono pericolosi, e nessuno ve lo dice
4

Hardware

I browser IA sono pericolosi, e nessuno ve lo dice

#3
RDNA 5 AT0, la top AMD torna per i gamer
9

Hardware

RDNA 5 AT0, la top AMD torna per i gamer

#4
SwitchBot AI Hub rivoluziona la smart home con OpenClaw

Altri temi

SwitchBot AI Hub rivoluziona la smart home con OpenClaw

#5
C'è una brutta notizia per i giochi PlayStation su PC

Videogioco

C'è una brutta notizia per i giochi PlayStation su PC

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

RDNA 5 AT0, la top AMD torna per i gamer
9

Hardware

RDNA 5 AT0, la top AMD torna per i gamer

Di Antonello Buzzi
5 cose da fare prima di comprare altra RAM per il vostro PC
6

Hardware

5 cose da fare prima di comprare altra RAM per il vostro PC

Di Andrea Ferrario
Recensione Terramaster F2-425, NAS 2 bay con CPU Intel x86

Hardware

Recensione Terramaster F2-425, NAS 2 bay con CPU Intel x86

Di Marco Pedrani
NVIDIA mantiene la promessa: Shield TV si aggiorna ancora
4

Hardware

NVIDIA mantiene la promessa: Shield TV si aggiorna ancora

Di Antonello Buzzi
La California impone la verifica dell'età su tutti gli OS
2

Hardware

La California impone la verifica dell'età su tutti gli OS

Di Antonello Buzzi

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • SosHomeGarden
  • Aibay
  • Coinlabs

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.