image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Black Friday

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Windows: 10 cose che il 99% delle persone non conosce Windows: 10 cose che il 99% delle persone non conosce...
Immagine di Dite addio all'hack più famoso per attivare Windows 11 Dite addio all'hack più famoso per attivare Windows 11...

ChatGPT: il nuovo modello delude le aspettative e si rivela inferiore al precedente

OpenAI ha annunciato un aggiornamento del modello GPT-4o per ChatGPT, ma secondo un rapporto le prestazioni sarebbero significativamente peggiorate.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author

Pubblicato il 22/11/2024 alle 20:00

OpenAI ha annunciato un aggiornamento del modello GPT-4o per ChatGPT, ma secondo un rapporto di Artificial Analysis le prestazioni del modello sarebbero significativamente peggiorate nelle ultime settimane, raggiungendo livelli paragonabili al più limitato GPT-4o-mini.

L'analisi indipendente di Artificial Analysis, pubblicata su X, evidenzia un calo delle prestazioni di GPT-4o su diversi parametri chiave rispetto alla versione di agosto. L'Artificial Analysis Quality Index è sceso da 77 a 71, eguagliando quello di GPT-4o mini. Anche i risultati su altri benchmark come GPQA Diamond e MATH sono peggiorati sensibilmente.

Si presume che il nuovo update di ChatGPT-4o sia un modello più piccolo e meno capace del precedente.

Contemporaneamente, i ricercatori hanno rilevato un aumento della velocità di risposta del modello, passata da circa 80 a 180 token al secondo. Questo incremento di velocità, unito al calo delle prestazioni, ha portato gli analisti a ipotizzare che la nuova versione di GPT-4o sia in realtà un modello più piccolo e meno capace rispetto a quello precedente.

Sulla base di questi dati, Artificial Analysis consiglia agli sviluppatori di "non spostare i carichi di lavoro dalla versione di agosto senza un'attenta verifica", dato che OpenAI non ha ridotto i prezzi per la nuova release nonostante il presunto downgrade delle capacità.

Questa notizia arriva in contrasto con l'annuncio di OpenAI, che solo il giorno prima aveva dichiarato miglioramenti nelle capacità di scrittura creativa e di analisi di file caricati per GPT-4o. L'azienda aveva affermato che il modello era diventato "più naturale, coinvolgente e su misura per migliorare rilevanza e leggibilità".

Il presunto peggioramento delle prestazioni di GPT-4o, se confermato, potrebbe avere importanti ripercussioni nel settore dell'intelligenza artificiale. GPT-4o è considerato uno dei modelli linguistici più avanzati, utilizzato per applicazioni come traduzioni in tempo reale e conversazioni con l'IA.

Wait - is the new GPT-4o a smaller and less intelligent model?

We have completed running our independent evals on OpenAI’s GPT-4o release yesterday and are consistently measuring materially lower eval scores than the August release of GPT-4o.

GPT-4o (Nov) vs GPT-4o (Aug):
➤… pic.twitter.com/gjY2pBFuUv

— Artificial Analysis (@ArtificialAnlys) November 21, 2024
Questo contenuto è ospitato su una piattaforma esterna. Per visualizzarlo, è necessario accettare i cookie

Basti pensare che ChatGPT è stato implementato anche in Apple Intelligence (disponibile a breve anche nei nuovi iPhone 16) per le sue enormi potenzialità, integrandolo con Siri per produrre dei risultati sempre precisi e accurati.

Questa situazione solleva alcuni interrogativi sulla trasparenza delle aziende di IA riguardo agli aggiornamenti dei loro modelli e sull'affidabilità delle metriche di valutazione. Evidenzia inoltre l'importanza di test indipendenti per verificare le prestazioni effettive dei sistemi di IA, in seguito ai vari aggiornamenti proposti dalle aziende.

Gli sviluppatori e le aziende che utilizzano GPT-4o potrebbero dover riconsiderare l'adozione della nuova versione, valutando attentamente se i presunti miglioramenti di velocità compensino l'apparente calo di capacità in altri ambiti.

Fonte dell'articolo: www.digitaltrends.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Dite addio all'hack più famoso per attivare Windows 11
  • #2
    Addio certezze: il diamante non è più il numero uno
  • #3
    Amazon abbandona Android per la pirateria
  • #4
    Steam Machine sarà la morte di PlayStation e Xbox?
  • #5
    LEFANT scatenato per il Black Friday: robot scontati fino al 72%
  • #6
    Un supercomputer rivela la vera forma dei nuclei atomici
Articolo 1 di 5
Dite addio all'hack più famoso per attivare Windows 11
Microsoft ha bloccato gli script MAS che permettevano di attivare Windows 11 senza licenza, inasprendo la lotta alla pirateria software.
Immagine di Dite addio all'hack più famoso per attivare Windows 11
20
Leggi questo articolo
Articolo 2 di 5
Windows: 10 cose che il 99% delle persone non conosce
La storia di Windows è costellata di eventi, curiosità ed easter egg, ma siete sicuri di conoscerli tutti? Vi racconto 10 curiosità che in pochi conoscono!
Immagine di Windows: 10 cose che il 99% delle persone non conosce
9
Leggi questo articolo
Articolo 3 di 5
DJI Neo 2: il selfie drone tascabile diventa quasi perfetto | Test & Recensione
La nostra prova del nuovo drone ultra-compatto di DJI: miglioramenti significativi, ma anche limiti da considerare.
Immagine di DJI Neo 2: il selfie drone tascabile diventa quasi perfetto | Test & Recensione
4
Leggi questo articolo
Articolo 4 di 5
Gli affari sulle CPU ci sono già! AMD conviene ora più che mai
Solitamente si aspetta il Black Friday di Amazon per fare qualche affare sull'hardware. Oggi è Aliexpress a proporre le migliori occasioni.
Immagine di Gli affari sulle CPU ci sono già! AMD conviene ora più che mai
Leggi questo articolo
Articolo 5 di 5
Lenovo valorizza il ThinkPad X1 al Black Friday con un coupon personalizzato
Fino al 20 novembre, Lenovo fa in modo che il suo ThinkPad X1 sia tra i notebook più convenienti di tutta l'offerta Black Friday.
Immagine di Lenovo valorizza il ThinkPad X1 al Black Friday con un coupon personalizzato
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.