image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di La nuova CPU di Intel torna al passato per sfidare AMD La nuova CPU di Intel torna al passato per sfidare AMD...
Immagine di Github da record, ma la celebrazione diventa un meme globale Github da record, ma la celebrazione diventa un meme globale...

Pokémon Rosso usato come benchmark per un modello IA (ed è pure bravo)

Pokémon in veste di tester: Anthropic utilizza i mostriciattoli tascabili per valutare le prestazioni del suo nuovo modello IA Claude 3.7 Sonnet.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Giulia Serena

a cura di Giulia Serena

Editor

Pubblicato il 25/02/2025 alle 15:05

L'azienda di intelligenza artificiale Anthropic ha testato il suo ultimo modello AI, Claude 3.7 Sonnet, sul videogioco classico Pokémon Rosso per Game Boy. Il test è stato annunciato in un post sul blog dell'azienda pubblicato lunedì.

Anthropic ha dotato il modello di memoria di base, input dei pixel dello schermo e funzioni per premere i pulsanti e navigare nel gioco, permettendogli di giocare a Pokémon in modo continuativo. Una caratteristica unica di Claude 3.7 Sonnet è la sua capacità di "pensiero esteso", che gli consente di ragionare su problemi complessi applicando più potenza di calcolo e impiegando più tempo.

Questa capacità si è rivelata utile in Pokémon Rosso. Mentre una versione precedente del modello, Claude 3.0 Sonnet, non era riuscita nemmeno a lasciare la casa iniziale del gioco, Claude 3.7 Sonnet è riuscito a sconfiggere tre capipalestra e ottenere le relative medaglie. Insomma, mica male per un'intelligenza artificiale.

Immagine id 50074
Crediti: Anthropic (https://www.anthropic.com/news/claude-3-7-sonnet)

Anthropic non ha specificato quante risorse di calcolo siano state necessarie per raggiungere questi traguardi, né quanto tempo abbia impiegato il modello. L'azienda ha solo dichiarato che sono state eseguite 35.000 azioni per arrivare all'ultimo capopalestra affrontato.

Sebbene Pokémon Rosso possa sembrare un test poco significativo per noi esseri umani, in realtà c'è una lunga tradizione nell'uso dei videogiochi come benchmark per l'intelligenza artificiale. Negli ultimi mesi sono emerse diverse nuove applicazioni e piattaforme per testare le capacità di gioco dei modelli AI su titoli che vanno da Street Fighter a Pictionary. Questi test permettono di valutare in modo pratico e misurabile le capacità di ragionamento, pianificazione e decision-making dei sistemi di intelligenza artificiale in ambienti interattivi complessi.

Fonte dell'articolo: techcrunch.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Cade l'ultimo baluardo delle RAM DDR4: ora è davvero finita
  • #2
    Migliori condizionatori portatili senza tubo (giugno 2025)
  • #3
    Rischio incendio per 1 milione di power bank Anker, ecco quali
  • #4
    Ora potete giocare alla PS3 su (quasi) tutti gli smartphone
  • #5
    Space Marine Master Edition è un flop, totalmente bocciato su Steam
  • #6
    PlayStation 6 avrà un approccio diverso, ecco cosa cambierà
Articolo 1 di 5
Github da record, ma la celebrazione diventa un meme globale
La piattaforma di sviluppo collaborativo più utilizzata al mondo ha raggiunto una pietra miliare storica questa settimana.
Immagine di Github da record, ma la celebrazione diventa un meme globale
Leggi questo articolo
Articolo 2 di 5
La nuova CPU di Intel torna al passato per sfidare AMD
Intel punta a riconquistare il dominio del PC gaming economico con una nuova proposta che guarda al passato per sfidare AMD
Immagine di La nuova CPU di Intel torna al passato per sfidare AMD
3
Leggi questo articolo
Articolo 3 di 5
Huawei si prepara a colpire NVIDIA dove fa più male
Un brevetto svela l'imminente risposta della Cina alle restrizioni americane, concretizzando le previsioni di Jensen Huang, il, CEO di NVIDIA.
Immagine di Huawei si prepara a colpire NVIDIA dove fa più male
5
Leggi questo articolo
Articolo 4 di 5
AMD lancia in segreto una CPU "budget" che non possiamo avere
La piattaforma AM4 continua a resistere sul mercato, dimostrando una longevità sorprendente nel panorama tecnologico attuale.
Immagine di AMD lancia in segreto una CPU "budget" che non possiamo avere
Leggi questo articolo
Articolo 5 di 5
L'IA ci farà perdere a il lavoro? Tranquilli, NVIDIA ha detto di no
La guerra fredda dell'IA si manifesta in uno scontro pubblico fra due delle sue figure più importanti: Jensen Huang di NVIDIA e Dario Amodei di Anthropic
Immagine di L'IA ci farà perdere a il lavoro? Tranquilli, NVIDIA ha detto di no
1
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.