image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Editor's Choice
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Rivoluzione sicurezza! La serie SwitchBot Lock Ultra nelle offerte di primavera Rivoluzione sicurezza! La serie SwitchBot Lock Ultra nelle o...
Immagine di Guida all'acquisto Tineco: quale modello scegliere con le offerte di primavera 2026 Guida all'acquisto Tineco: quale modello scegliere con le of...

GPT-4 superata, non è più l’IA migliore di tutte

Chat GPT-4 è stato superato da Claude-3 perdendo il prima di miglior modello di linguaggio, ma l'arrivo di GPT 5 dovrebbe ristabilire l'ordine.

Advertisement

Avatar di Marco Silvestri

a cura di Marco Silvestri

Editor @Tom's Hardware Italia

Pubblicato il 28/03/2024 alle 09:33
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Secondo i risultati del benchmark LMSYS, GPT-4 di OpenAI è stato superato da Claude-3 di Anthropic perdendo il suo primato di "miglior" modello di linguaggio in commercio. Il cambio di guardia segna un momento significativo nel settore, dato che GPT-4 è stato a lungo considerato il punto di riferimento per le prestazioni degli LLM.

Il benchmark LMSYS, frutto della collaborazione tra ricercatori dell'UC Berkley, UC San Diego e Carnegie Mellon University, si propone di valutare i grandi modelli di linguaggio e i chatbot che li utilizzano attraverso l'Arena Chatbot, un sistema di classifica basato sulle valutazioni umane e sull'uso del sistema di rating Elo.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

In questo contesto competitivo, Claude 3 Opus ha ottenuto un punteggio di 1253, superando di misura GPT-4 che si è fermato a 1251. Questo risultato, per quanto ristretto, ha spostato GPT-4 dalla sua lunga tenuta della prima posizione.

Non meno notevole è stata la performance di Claude 3 Haiku, un modello di dimensioni "locali" che, nonostante le sue dimensioni esponenzialmente inferiori rispetto ad Opus, è riuscito a classificarsi settimo, entrando ufficialmente nella classe di performance "GPT-4". Questa ascesa dimostra l'efficienza dei modelli più piccoli in compiti specifici e sfida la tendenza alla creazione di modelli sempre più grandi.

[Arena Update]

70K+ new Arena votes🗳️ are in!

Claude-3 Haiku has impressed all, even reaching GPT-4 level by our user preference! Its speed, capabilities & context length are unmatched now in the market🔥

Congrats @AnthropicAI on the incredible Claude-3 launch!

More exciting… pic.twitter.com/p1Guuf0B3K

— Arena.ai (@arena) March 26, 2024
Questo contenuto è ospitato su una piattaforma esterna. Per visualizzarlo, è necessario accettare i cookie

Tuttavia, la leadership di Anthropic potrebbe non durare a lungo. Fonti interne ad OpenAI hanno recentemente rivelato che GPT-5 è quasi pronto per il debutto pubblico, previsto per metà anno. Questo nuovo modello promette di superare notevolmente GPT-4 in termini di capacità, grazie all'impiego di "agenti IA esterni" per svolgere compiti specifici, migliorando così la velocità e l'affidabilità nella risoluzione di problemi complessi.

In sintesi, anche se Claude-3 di Anthropic ora guida la classifica LMSYS, l'imminente lancio di GPT-5 potrebbe ribaltare nuovamente la situazione, evidenziando la costante evoluzione e innovazione nel campo dei grandi modelli di linguaggio.

Fonte dell'articolo: www.techspot.com

Le notizie più lette

#1
Ma a qualcuno frega ancora della VR in ambito gaming?

Editoriale

Ma a qualcuno frega ancora della VR in ambito gaming?

#2
Nuovo driver NVMe Windows: prestazioni migliorate del 65%
1

Hardware

Nuovo driver NVMe Windows: prestazioni migliorate del 65%

#3
Anthropic lancia il Claude Marketplace

Business

Anthropic lancia il Claude Marketplace

#4
Scoperto un modo inatteso per potenziare l'esercizio fisico

Scienze

Scoperto un modo inatteso per potenziare l'esercizio fisico

#5
Microsoft rinvia una novità di Windows 11, ma ne arriva un'altra
3

Hardware

Microsoft rinvia una novità di Windows 11, ma ne arriva un'altra

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Guida all'acquisto Tineco: quale modello scegliere con le offerte di primavera 2026

Sponsorizzato

Guida all'acquisto Tineco: quale modello scegliere con le offerte di primavera 2026

Di Dario De Vita
Rivoluzione sicurezza! La serie SwitchBot Lock Ultra nelle offerte di primavera

Sponsorizzato

Rivoluzione sicurezza! La serie SwitchBot Lock Ultra nelle offerte di primavera

Di Dario De Vita
I Bestseller del giorno di apertura delle Offerte di Primavera su Amazon

Altri temi

I Bestseller del giorno di apertura delle Offerte di Primavera su Amazon

Di Dario De Vita
Le migliori TV da comprare nelle Offerte di Primavera Amazon

Altri temi

Le migliori TV da comprare nelle Offerte di Primavera Amazon

Di Dario De Vita
SwitchBot Spring Sale 2026: la casa intelligente non è mai stata così conveniente

Sponsorizzato

SwitchBot Spring Sale 2026: la casa intelligente non è mai stata così conveniente

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • SosHomeGarden
  • Aibay
  • Coinlabs

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.