image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di In calo da ottobre, ora questo SSD a 35€ è più interessante che mai In calo da ottobre, ora questo SSD a 35€ è più interessa...
Immagine di ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione ASUS ROG NUC 2025, potenza desktop in formato mini | Test & ...

CriticGPT è il terrore dei programmatori: come funziona il nuovo modello di OpenAI?

OpenAI ha appena presentato CriticGPT, un modello creato appositamente per aiutare a identificare e rilevare errori nel codice prodotto da ChatGPT.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marco Silvestri

a cura di Marco Silvestri

Editor

Pubblicato il 03/07/2024 alle 10:35

CriticGPT è il nuovo strumento di OpenAI progettato per identificare errori nel codice generato da ChatGPT. Questo strumento basato su GPT-4 è pensato per aiutare i formatori di IA a individuare errori in modo più rapido ed efficiente rispetto a quanto farebbero senza l'ausilio dell'intelligenza artificiale.

Secondo quanto dichiarato da OpenAI:

"...quando le persone ricevono aiuto da CriticGPT per revisionare il codice di ChatGPT, ottengono risultati migliori nel 60% dei casi rispetto a coloro che non ricevono aiuto. Stiamo iniziando a integrare modelli simili a CriticGPT nel nostro ciclo di etichettatura RLHF, fornendo ai nostri formatori un'assistenza AI esplicita".

OpenAI intende utilizzare il metodo del Reinforcement Learning from Human Feedback (RLHF) per rendere ChatGPT più "utile e interattivo". Un aspetto integrale di questo processo è raccogliere confronti dai formatori AI basandosi su come valutano diverse risposte di ChatGPT rispetto ad altre.

CriticGPT aiuterà a migliorare le capacità di ragionamento di ChatGPT, riducendo allo stesso tempo le allucinazioni o la generazione di risposte e informazioni errate. Con il progredire di ChatGPT, diventa sempre più difficile identificare errori nel codice che produce. CriticGPT è principalmente addestrato per identificare e scrivere critiche evidenziando le inesattezze nelle risposte di ChatGPT. Anche se non è sempre totalmente preciso e la stessa OpenAI ne ha messo in evidenza gli episodi di allucinazioni, questo strumento ha già una grande utilità nell'ambito della formazione dei modelli IA.

Secondo i report, CriticGPT migliorerà le competenze dei formatori, mettendo a loro disposizione tecniche di critica più complete. La combinazione di una mente umana e di CriticGPT sembra essere preferita e più accurata nel fornire critiche dettagliate e precise.

Sempre secondo le scoperte di OpenAI:

 "...le critiche di CriticGPT sono preferite dai formatori rispetto a quelle di ChatGPT nel 63% dei casi su bug naturali, in parte perché il nuovo critico produce meno 'pignolerie' (piccole lamentele inutili) e allucina meno problemi".

Pixabay
intelligenza artificiale

C'è ancora molto lavoro da fare

Tuttavia, CriticGPT è ancora in fase di sviluppo e presenta alcune limitazioni. OpenAI ha sottolineato i seguenti punti critici:

  • CriticGPT è stato addestrato su risposte ChatGPT che sono abbastanza brevi. Per supervisionare agenti futuri, saranno necessari metodi capaci di aiutare i formatori a comprendere compiti lunghi e complessi.
  • I modelli continuano ad avere allucinazioni e talvolta i formatori commettono errori di etichettatura dopo aver visto tali allucinazioni.
  • Talvolta gli errori reali possono essere distribuiti in diverse parti di una risposta. Attualmente, il lavoro si concentra sugli errori che possono essere individuati in un unico punto, ma in futuro sarà necessario affrontare anche errori dispersi.
  • CriticGPT può aiutare solo fino a un certo punto: se un compito o una risposta è estremamente complessa, anche un esperto con aiuto del modello potrebbe non essere in grado di valutarla correttamente.

In futuro, OpenAI intende migliorare CriticGPT incrementando i dati di RLHF per l'addestramento di GPT-4. In un report separato, i ricercatori di Oxford hanno sfruttato l'entropia semantica per valutare la qualità e il significato degli output generati, determinando la qualità delle risposte e individuando tracce di allucinazioni.

Con l'avanzare della tecnologia, i modelli IA diventano sempre più avanzati, sofisticati e capaci di gestire compiti complessi. In prospettiva, le previsioni del CEO di NVIDIA, Jensen Huang, rispetto alla possibilità che il coding diventi obsoleto in un futuro non troppo distante sembrano sempre più concrete. Detto questo c'è ancora molta strada da fare prima che i chatbot sostituiscano i programmatori umani.

Fonte dell'articolo: www.windowscentral.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Tornano le ricariche gratis per chi compra Tesla
  • #2
    Luminosità e contrasto: la "terza via" per un televisore ideale
  • #3
    Huawei lancia nuovi PC con CPU e OS cinesi proprietari
  • #4
    Scoperto il trucco mentale per recuperare i ricordi
  • #5
    ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
  • #6
    Fusa la prima rete quantistica a 18 nodi: svolta dalla Cina
Articolo 1 di 5
ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
Un mini PC che racchiude prestazioni gaming di alto livello in appena 3 litri di volume, con processore Intel e GPU NVIDIA RTX 5080.
Immagine di ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
16
Leggi questo articolo
Articolo 2 di 5
In calo da ottobre, ora questo SSD a 35€ è più interessante che mai
Offerta SSD Integral 480GB SATA III: velocità fino a 540 MB/s in lettura, ideale per PC e laptop a 34,98€
Immagine di In calo da ottobre, ora questo SSD a 35€ è più interessante che mai
Leggi questo articolo
Articolo 3 di 5
iOS 26.2 svela il misterioso Apple Creator Studio
Apple sviluppa Creator Studio, una piattaforma emersa dal codice iOS 26.2 beta che potrebbe unificare gli strumenti creativi professionali dell'azienda.
Immagine di iOS 26.2 svela il misterioso Apple Creator Studio
3
Leggi questo articolo
Articolo 4 di 5
NVIDIA, dopo il danno la beffa: AMD può esportare in Cina
Mentre NVIDIA combatte ancora per poter esportare Blackwell in Cina, AMD ottiene le licenze per gli acceleratori Instinct MI308.
Immagine di NVIDIA, dopo il danno la beffa: AMD può esportare in Cina
2
Leggi questo articolo
Articolo 5 di 5
Google ottiene il via libera per acquisire Wiz
L’acquisizione porta in Google tecnologie nate per proteggere ambienti multicloud complessi, sempre più centrali nelle aziende moderne.
Immagine di Google ottiene il via libera per acquisire Wiz
2
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.