image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
% Black Friday
%
Accedi a Xenforo
Immagine di Offerte da non perdere su PC Componentes: ecco l’hardware più venduto Offerte da non perdere su PC Componentes: ecco l’hardware ...
Immagine di Buone notizie, il Black Friday offre Office 2024 a vita per soli 11€ Buone notizie, il Black Friday offre Office 2024 a vita per ...

Anthropic rilancia la sfida a OpenAI con Opus 4.5

Opus 4.5 porta Claude a un nuovo livello: chat senza interruzioni, coding più preciso e prestazioni che superano OpenAI e Google.

Advertisement

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Senior Editor @Tom's Hardware Italia

Pubblicato il 25/11/2025 alle 11:40

La notizia in un minuto

  • Opus 4.5 di Anthropic raggiunge l'80,9% di accuratezza nel benchmark SWE-Bench Verified per il coding, superando GPT-5.1-Codex-Max e Gemini 3 Pro
  • Claude elimina le interruzionibrusche delle conversazioni grazie a un sistema di sintesi intelligente automatica che preserva gli elementi critici oltre i 200.000 token
  • Il modello eccelle nell'uso agentico di strumenti e nel coding autonomo, con funzionalità di context management accessibili anche via API per applicazioni enterprise

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Anthropic ha alzato il tiro nella corsa ai modelli di frontiera con il rilascio di Opus 4.5, la sua soluzione flagship che segna un punto di svolta nelle prestazioni di coding e nell'esperienza utente complessiva. L'annuncio arriva in un momento particolarmente caldo per il settore dell'intelligenza artificiale generativa, con OpenAI e Google che hanno appena aggiornato le proprie offerte di punta. La mossa di Anthropic si distingue per un approccio che bilancia potenza bruta e usabilità pratica, affrontando finalmente uno dei limiti più frustranti della piattaforma Claude.

La novità più rilevante per l'utenza consumer riguarda la gestione delle conversazioni prolungate. Claude non interromperà più bruscamente i dialoghi quando raggiungono dimensioni eccessive, un problema che affliggeva gli utenti anche quando disponevano ancora di margine nelle loro quote di utilizzo settimanale. Il vecchio sistema implementava un limite rigido a 200.000 token di finestra contestuale, oltre il quale la conversazione veniva terminata senza preavviso.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

La filosofia precedente di Anthropic rifletteva una scelta tecnica precisa: invece di adottare la strategia di altri Large Language Model che eliminano progressivamente i messaggi più vecchi dal contesto, Claude preferiva terminare la sessione piuttosto che degradare gradualmente la qualità delle risposte. Questo approccio evitava conversazioni sempre più incoerenti in cui il modello iniziava a "dimenticare" informazioni in base alla loro anzianità temporale, ma al prezzo di interruzioni improvvise che compromettevano il flusso di lavoro.

La soluzione implementata ora prevede un processo automatico di sintesi intelligente che opera dietro le quinte. Il sistema analizza le fasi iniziali della conversazione, scarta ciò che considera superfluo e conserva gli elementi critici, permettendo di proseguire il dialogo senza perdere coerenza. Questo miglioramento si applica retroattivamente a tutti i modelli Claude attualmente disponibili nelle applicazioni web, mobile e desktop, non solo a Opus 4.5.

Opus 4.5 è il primo modello a superare la soglia dell'80% di accuratezza nel benchmark SWE-Bench Verified, raggiungendo l'80,9%

Sul fronte delle prestazioni pure, Opus 4.5 stabilisce un nuovo standard nel coding agentico. Il modello ha conseguito l'80,9% di accuratezza nel benchmark SWE-Bench Verified, superando sia GPT-5.1-Codex-Max di OpenAI (77,9%) che Gemini 3 Pro di Google (76,2%). Si tratta di un risultato particolarmente significativo considerando che SWE-Bench Verified valuta la capacità dei modelli di risolvere problematiche reali di ingegneria del software, un compito che richiede comprensione contestuale profonda e capacità di manipolare codice complesso.

Le eccellenze di Opus 4.5 si concentrano specificamente nell'uso agentico di strumenti e nelle attività di coding autonomo, settori dove la capacità di pianificare sequenze multi-step e interagire con API esterne risulta determinante. Tuttavia, persiste un divario rispetto a GPT-5.1 nel ragionamento visivo, come evidenziato dai risultati nel benchmark MMMU (Massive Multitask Language Understanding con componenti multimodali), segno che la competizione tra i modelli di frontiera rimane aperta su diversi fronti.

Per gli sviluppatori che utilizzano l'API di Anthropic, le stesse logiche di gestione della memoria conversazionale sono accessibili attraverso funzionalità di context management e context compaction. Questi strumenti permettono implementazioni personalizzate della compressione contestuale, aprendo scenari interessanti per applicazioni enterprise che necessitano di mantenere conversazioni estese con agenti AI senza degradare la qualità delle interazioni o incorrere in costi eccessivi legati all'utilizzo dei token.

Fonte dell'articolo: arstechnica.com

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Buone notizie, il Black Friday offre Office 2024 a vita per soli 11€

Sponsorizzato

Buone notizie, il Black Friday offre Office 2024 a vita per soli 11€

Di Dario De Vita
Offerte da non perdere su PC Componentes: ecco l’hardware più venduto
1

Hardware

Offerte da non perdere su PC Componentes: ecco l’hardware più venduto

Di Dario De Vita
Memtest86+ 8.0 rivoluziona i test RAM: ecco le novità
2

Hardware

Memtest86+ 8.0 rivoluziona i test RAM: ecco le novità

Di Antonello Buzzi
Un miner "della domenica" vince 270.000$, contro ogni probabilità
4

Hardware

Un miner "della domenica" vince 270.000$, contro ogni probabilità

Di Marco Pedrani
Prusa Core One L, non è solo più grande | Test & Recensione
3

Hardware

Prusa Core One L, non è solo più grande | Test & Recensione

Di Andrea Ferrario

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.