image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte di Natale
Accedi a Xenforo
Immagine di Dai una marcia in più al tuo PC! Il 7800X3D a 280€ prima di Natale Dai una marcia in più al tuo PC! Il 7800X3D a 280€ prima ...
Immagine di TP-Link M8550, router 5G portatile con Wi-Fi 6E | Test & Recensione TP-Link M8550, router 5G portatile con Wi-Fi 6E | Test & Rec...

GPT 5.2 è pronto a battere Gemini nell'eterna sfida dell'IA

OpenAI lancia GPT 5.2 per rispondere alla concorrenza di Google e Anthropic. L'azienda di Sam Altman accelera lo sviluppo in un mercato sempre più competitivo.

Advertisement

Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale @Tom's Hardware Italia

Pubblicato il 12/12/2025 alle 08:39

La notizia in un minuto

  • OpenAI lancia GPT-5.2 in risposta alla crescente pressione competitiva di Google e Anthropic, dichiarando uno stato di codice rosso interno per riorganizzare priorità e risorse
  • Il nuovo modello supera esperti umani nel 70,9% dei casi in 44 professioni diverse, completando task 11 volte più rapidamente con costi inferiori all'1%
  • GPT-5.2 si articola in tre varianti (Instant, Thinking e Pro) con miglioramenti significativi in programmazione, contesto lungo, riduzione allucinazioni del 38% e capacità agentiche avanzate

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

La corsa all'intelligenza artificiale generativa segna un nuovo capitolo con l'arrivo di GPT-5.2, il modello che OpenAI presenta come una risposta diretta alla pressione crescente esercitata da Google e Anthropic. Nelle ultime settimane, i colossi della Silicon Valley hanno intensificato il ritmo degli aggiornamenti, trasformando quello che era un mercato promettente in un'arena competitiva dove ogni settimana può ridefinire le gerarchie. In questo clima di tensione, l'azienda fondata da Sam Altman ha dichiarato uno stato di codice rosso interno, riorganizzando priorità e risorse per mantenere la leadership tecnologica.

La pressione arriva soprattutto dal recente lancio di Gemini 3 da parte di Google, un evento che ha spinto OpenAI a concentrare le proprie energie sullo sviluppo di ChatGPT. Tuttavia, secondo Altman stesso, l'impatto sulle metriche aziendali è stato "minore rispetto a quanto temuto inizialmente". Il CEO ha dichiarato di aspettarsi che l'azienda superi questa fase di emergenza entro gennaio, sottolineando come sia fondamentale reagire rapidamente alle minacce competitive per poi tornare a una gestione ordinaria. La strategia sembra dare i primi frutti: GPT-5.2 arriva sul mercato a poche settimane dal predecessore GPT-5.1, sostituendolo già come soluzione di punta sia per ChatGPT che per l'API.

Immagine id 75985

Fidji Simo, CEO of applications di OpenAI, ha chiarito che il codice rosso non è stato il motore diretto del lancio di questa settimana, ma ha certamente accelerato l'allocazione di risorse verso ChatGPT. "L'integrazione di GPT-5.2 è in lavorazione da molti, molti mesi", ha precisato Simo, spiegando che la dichiarazione interna serviva a segnalare all'intera organizzazione la necessità di convogliare energie in un'area specifica, mettendo temporaneamente in secondo piano altre iniziative. Una mossa che richiama le strategie di emergenza adottate dalle aziende tecnologiche nei momenti di svolta competitiva.

GPT-5.2 supera esperti umani nel 70,9% dei casi in 44 professioni diverse

La struttura di GPT-5.2 riflette un approccio modulare pensato per diversi scenari professionali. Instant privilegia la velocità nelle operazioni di traduzione, accesso rapido alle informazioni e scrittura tecnica. Thinking si rivolge invece a flussi di lavoro complessi che richiedono analisi documentale approfondita, coding avanzato, matematica e ragionamento strutturato. Infine, Pro rappresenta la punta di diamante per quesiti tecnici di altissima difficoltà, dove l'accuratezza non può essere compromessa. OpenAI sostiene che gli utenti Enterprise già risparmiavano fino a un'ora al giorno con i modelli precedenti, e punta ora a incrementare ulteriormente questo valore.

Sul fronte delle prestazioni pure, i numeri presentati dall'azienda sono impressionanti. Nel benchmark GDPval, che misura la qualità del lavoro informativo attraverso 44 professioni differenti, GPT-5.2 Thinking supera o eguaglia esperti umani nel 70,9% dei casi, completando le attività oltre 11 volte più rapidamente e con costi inferiori all'1%. Nei test di ragionamento scientifico GPQA Diamond, le versioni Thinking e Pro raggiungono rispettivamente il 92,4% e il 93,2%, mentre in matematica avanzata il modello tocca il 40,3% in FrontierMath e stabilisce nuovi record in ARC-AGI, superando il 90% nella versione Verified e raggiungendo il 52,9% in ARC-AGI-2.

La programmazione rappresenta uno dei terreni dove i miglioramenti sono più tangibili. GPT-5.2 Thinking ottiene il 55,6% su SWE-bench Pro e l'80% nella variante Verified, risultati che secondo partner come Cursor, Windsurf, JetBrains e Azad si traducono in progressi concreti nel coding agentico, nel debug automatico e nello sviluppo front-end. OpenAI riconosce apertamente che Anthropic Opus 4.5 supera le proprie prestazioni su SWE-bench Verified, ma sostiene che Pro sia un benchmark più rappresentativo della realtà industriale, meno soggetto a contaminazione dei dati di addestramento.

Immagine id 78710

La gestione del contesto lungo segna un altro salto qualitativo significativo. Su OpenAI MRCRv2, il modello Thinking si avvicina alla perfezione assoluta nel test "4 needle" fino a 256.000 token, permettendo analisi affidabili di contratti estesi, report tecnici complessi e progetti software composti da decine di file. Questa capacità si rivela particolarmente utile per studi legali, società di consulenza e team di sviluppo che lavorano su basi di codice ampie. Parallelamente, l'interpretazione visiva compie progressi rilevanti: gli errori nella lettura di grafici, dashboard e interfacce software risultano dimezzati rispetto alla generazione precedente, con miglioramenti documentati in benchmark come CharXiv Reasoning e ScreenSpot-Pro.

La riduzione delle allucinazioni rappresenta un obiettivo cruciale per qualsiasi sistema destinato all'uso professionale. OpenAI dichiara una diminuzione del 38% degli errori generati rispetto a GPT-5.1 Thinking, basandosi su query anonime raccolte da ChatGPT. L'azienda ha inoltre introdotto meccanismi di protezione più sofisticati per gestire conversazioni che indicano disagio psicologico o dipendenza emotiva dall'intelligenza artificiale, insieme a un nuovo modello di previsione dell'età che applica automaticamente filtri aggiuntivi per utenti minorenni.

Le capacità agentiche mostrano progressi nell'orchestrazione di strumenti multipli in flussi complessi. Nel benchmark Tau2-bench Telecom, GPT-5.2 raggiunge il 98,7%, un risultato che aziende come Triple Whale, Notion, Box, Shopify e Zoom traducono in agenti più autonomi nella gestione di task end-to-end, con minore necessità di supervisione umana. Questo aspetto diventa particolarmente rilevante per operazioni di data science agentico, analisi documentale automatizzata e integrazione di workflow multi-strumento che caratterizzano sempre più gli ambienti professionali moderni.

Il rollout di GPT-5.2 è già iniziato su ChatGPT per gli abbonati e tramite API per gli sviluppatori, con la nuova serie che sostituisce GPT-5.1 come riferimento principale dell'offerta OpenAI. Il lancio conferma la volontà dell'azienda di mantenere un ritmo serrato negli aggiornamenti, rispondendo colpo su colpo alle mosse dei competitor in un settore dove pochi mesi possono segnare la differenza tra leadership e inseguimento.

Fonte dell'articolo: openai.com

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

TP-Link M8550, router 5G portatile con Wi-Fi 6E | Test & Recensione
4

Hardware

TP-Link M8550, router 5G portatile con Wi-Fi 6E | Test & Recensione

Di Marco Pedrani
Dai una marcia in più al tuo PC! Il 7800X3D a 280€ prima di Natale
2

Regali di Natale

Dai una marcia in più al tuo PC! Il 7800X3D a 280€ prima di Natale

Di Dario De Vita
AMD rilancia sull’AI: arriva il nuovo FSR Redstone
1

Hardware

AMD rilancia sull’AI: arriva il nuovo FSR Redstone

Di Antonello Buzzi
Configurazione ASUS TUF BTF con RTX 5070 Ti | 2025

In collaborazione

Configurazione ASUS TUF BTF con RTX 5070 Ti | 2025

Di Marco Pedrani
Il miglior prezzo, Windows 11 a vita a 12€ e Office 2021 a 29€

Sponsorizzato

Il miglior prezzo, Windows 11 a vita a 12€ e Office 2021 a 29€

Di Giulio Saro

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.