image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Alperia Home Digital: la bolletta moderna, semplice e green che fa per te Alperia Home Digital: la bolletta moderna, semplice e green ...
Immagine di Australian Open 2026: come e dove vederli in Italia tra streaming e TV Australian Open 2026: come e dove vederli in Italia tra stre...

GPT-4 superata, non è più l’IA migliore di tutte

Chat GPT-4 è stato superato da Claude-3 perdendo il prima di miglior modello di linguaggio, ma l'arrivo di GPT 5 dovrebbe ristabilire l'ordine.

Advertisement

Avatar di Marco Silvestri

a cura di Marco Silvestri

Editor @Tom's Hardware Italia

Pubblicato il 28/03/2024 alle 09:33
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Secondo i risultati del benchmark LMSYS, GPT-4 di OpenAI è stato superato da Claude-3 di Anthropic perdendo il suo primato di "miglior" modello di linguaggio in commercio. Il cambio di guardia segna un momento significativo nel settore, dato che GPT-4 è stato a lungo considerato il punto di riferimento per le prestazioni degli LLM.

Il benchmark LMSYS, frutto della collaborazione tra ricercatori dell'UC Berkley, UC San Diego e Carnegie Mellon University, si propone di valutare i grandi modelli di linguaggio e i chatbot che li utilizzano attraverso l'Arena Chatbot, un sistema di classifica basato sulle valutazioni umane e sull'uso del sistema di rating Elo.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

In questo contesto competitivo, Claude 3 Opus ha ottenuto un punteggio di 1253, superando di misura GPT-4 che si è fermato a 1251. Questo risultato, per quanto ristretto, ha spostato GPT-4 dalla sua lunga tenuta della prima posizione.

Non meno notevole è stata la performance di Claude 3 Haiku, un modello di dimensioni "locali" che, nonostante le sue dimensioni esponenzialmente inferiori rispetto ad Opus, è riuscito a classificarsi settimo, entrando ufficialmente nella classe di performance "GPT-4". Questa ascesa dimostra l'efficienza dei modelli più piccoli in compiti specifici e sfida la tendenza alla creazione di modelli sempre più grandi.

[Arena Update]

70K+ new Arena votes🗳️ are in!

Claude-3 Haiku has impressed all, even reaching GPT-4 level by our user preference! Its speed, capabilities & context length are unmatched now in the market🔥

Congrats @AnthropicAI on the incredible Claude-3 launch!

More exciting… pic.twitter.com/p1Guuf0B3K

— lmarena.ai (@arena) March 26, 2024
Questo contenuto è ospitato su una piattaforma esterna. Per visualizzarlo, è necessario accettare i cookie

Tuttavia, la leadership di Anthropic potrebbe non durare a lungo. Fonti interne ad OpenAI hanno recentemente rivelato che GPT-5 è quasi pronto per il debutto pubblico, previsto per metà anno. Questo nuovo modello promette di superare notevolmente GPT-4 in termini di capacità, grazie all'impiego di "agenti IA esterni" per svolgere compiti specifici, migliorando così la velocità e l'affidabilità nella risoluzione di problemi complessi.

In sintesi, anche se Claude-3 di Anthropic ora guida la classifica LMSYS, l'imminente lancio di GPT-5 potrebbe ribaltare nuovamente la situazione, evidenziando la costante evoluzione e innovazione nel campo dei grandi modelli di linguaggio.

Fonte dell'articolo: www.techspot.com

Le notizie più lette

#1
iPhone 18 Pro e Fold messi a nudo dai leak, ecco tutto quello che sappiamo
7

Smartphone

iPhone 18 Pro e Fold messi a nudo dai leak, ecco tutto quello che sappiamo

#2
ExFAT su Linux: un driver ne incrementa notevolmente la velocità

Hardware

ExFAT su Linux: un driver ne incrementa notevolmente la velocità

#3
Resident Evil Requiem senza collector, i fan sono delusi dalle motivazioni
2

Videogioco

Resident Evil Requiem senza collector, i fan sono delusi dalle motivazioni

#4
Valve riscrive le regole di Steam sull'uso dell'IA

Videogioco

Valve riscrive le regole di Steam sull'uso dell'IA

#5
Ecco perché il "loremaster" di The Elder Scrolls ha lasciato Bethesda

Videogioco

Ecco perché il "loremaster" di The Elder Scrolls ha lasciato Bethesda

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Australian Open 2026: come e dove vederli in Italia tra streaming e TV

Altri temi

Australian Open 2026: come e dove vederli in Italia tra streaming e TV

Di Dario De Vita
Alperia Home Digital: la bolletta moderna, semplice e green che fa per te

Altri temi

Alperia Home Digital: la bolletta moderna, semplice e green che fa per te

Di Dario De Vita
Sinner vs Gaston: guida TV e streaming per vederla dall’Italia

Altri temi

Sinner vs Gaston: guida TV e streaming per vederla dall’Italia

Di Dario De Vita
Non solo low cost: su AliExpress arrivano brand noti a prezzi stracciati grazie a questa promo

Altri temi

Non solo low cost: su AliExpress arrivano brand noti a prezzi stracciati grazie a questa promo

Di Dario De Vita
Il momento giusto per LEGO? Oggi su IBS, fino al 20% di sconto

Altri temi

Il momento giusto per LEGO? Oggi su IBS, fino al 20% di sconto

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.