image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di PC workstation di fascia alta per la modellazione 3D | 2025 PC workstation di fascia alta per la modellazione 3D | 2025...
Immagine di L'alternativa a DLSS e FSR migliora ancora: perché non la state usando? L'alternativa a DLSS e FSR migliora ancora: perché non la s...

Addio matematica, ora l'IA si testa con Super Mario Bros

Ricercatori del Hao AI Lab di San Diego hanno usato Super Mario Bros. per i benchmark di alcune intelligenze artificiali.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale

Pubblicato il 04/03/2025 alle 16:21

Valutare le capacità dell'intelligenza artificiale è sempre più complicato, ma un team di ricercatori potrebbe aver trovato la soluzione definitiva: far giocare i modelli AI a Super Mario Bros. L'Hao AI Lab dell'Università della California a San Diego ha infatti sostituito i tradizionali test matematici e logici con una sfida che mette alla prova abilità ben diverse, come la coordinazione, i riflessi e il pensiero strategico in tempo reale. L'esperimento solleva una domanda provocatoria: se un'intelligenza artificiale non riesce a saltare sopra un Goomba, possiamo davvero fidarci delle sue capacità nel mondo reale?

L'Hao AI Lab ha sviluppato GamingAgent, un framework personalizzato che permette ai modelli linguistici di controllare Mario attraverso la generazione di codice Python. Durante i test, le AI ricevevano istruzioni basilari come "Salta sopra quel nemico" insieme a screenshot che mostravano lo stato del gioco in tempo reale.

Nonostante Super Mario Bros. possa apparire come un semplice platform bidimensionale, la ricerca ha rivelato che questo classico videogioco Nintendo rappresenta una sfida sorprendentemente complessa per i sistemi di intelligenza artificiale. Il gioco richiede infatti la pianificazione di sequenze di movimenti elaborate e l'adattamento istantaneo delle strategie in base agli ostacoli che si presentano.

Il podio dei modelli AI

Il podio di questa particolare regala ha dato delle conferme, ma ha anche sorpreso. Claude 3.7 di Anthropic, che aveva già dimostrato le sue capacità su Pokemon, si è dimostrato il campione indiscusso, esibendo riflessi impressionanti, concatenando salti precisi ed evitando abilmente i nemici. Anche il suo predecessore, Claude 3.5, ha mostrato prestazioni notevoli nel navigare il Regno dei Funghi.

La vera sorpresa è arrivata dai modelli definiti "reasoning", ossia dedicati al ragionamento, come GPT-4o di OpenAI e Gemini 1.5 Pro di Google, che hanno faticato significativamente nonostante la loro reputazione di eccellenza nel ragionamento logico. Questi sistemi, progettati per elaborare informazioni complesse, si sono trovati in difficoltà di fronte alle esigenze di reazione rapida del gioco.

Questione di millisecondi, non di QI

I ricercatori dell'Hao Lab hanno identificato un fattore critico che spiega questi risultati: il timing. Nel mondo di Super Mario Bros., anche un minimo ritardo decisionale può risultare fatale, mandando il protagonista dritto in un baratro o contro un nemico.

L'analisi suggerisce che i modelli più deliberativi impiegano troppo tempo per calcolare le loro mosse successive, un lusso che il gameplay in tempo reale semplicemente non concede. Questa osservazione solleva interrogativi interessanti su quali capacità siano realmente importanti per l'AI in diversi contesti applicativi.

Un test non convenzionale, ma illuminante

Utilizzare videogiochi retrò per valutare l'intelligenza artificiale rappresenta certamente più un esperimento ludico che una seria metodologia di valutazione. Le capacità di un'AI di completare il primo livello di Super Mario Bros. hanno poca rilevanza diretta per le sue applicazioni nel mondo reale.

Tuttavia, osservare modelli sofisticati che arrancano in quello che per molti umani è un passatempo offre spunti preziosi sulle attuali limitazioni dell'AI. Il divario tra intelligenza logica e intelligenza pratica diventa evidente quando i sistemi devono affrontare sfide che richiedono coordinazione e decisioni rapide.

Per chi fosse interessato a sperimentare personalmente, l'Hao AI Lab ha reso disponibile il proprio framework GamingAgent su GitHub, permettendo agli sviluppatori di testare vari modelli linguistici in ambienti di gioco simili, aprendo così nuove prospettive sulla valutazione delle capacità dell'intelligenza artificiale.

Fonte dell'articolo: www.techspot.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    5 condizionatori portatili da tenere d'occhio in vista del Prime Day
  • #2
    5 ventilatori da tenere d'occhio in vista del Prime Day
  • #3
    Vendete draghi su Etsy? Potete cominciare a cambiare lavoro
  • #4
    Huawei si prepara a colpire NVIDIA dove fa più male
  • #5
    Con sorpresa di nessuno, Xbox Game Pass aumenta di prezzo (ancora)
  • #6
    La nuova CPU di Intel torna al passato per sfidare AMD
Articolo 1 di 5
L'alternativa a DLSS e FSR migliora ancora: perché non la state usando?
Il nuovo Lossless Scaling riduce il carico sulla GPU del 50% e migliora ancora la qualità dell'immagine grazie a miglioramenti all'architettura.
Immagine di L'alternativa a DLSS e FSR migliora ancora: perché non la state usando?
7
Leggi questo articolo
Articolo 2 di 5
PC workstation di fascia alta per la modellazione 3D | 2025
Una configurazione di fascia molto alta pensata per chi lavora nel campo della modellazione 3D, ma che può essere usata anche in altri ambiti.
Immagine di PC workstation di fascia alta per la modellazione 3D | 2025
1
Leggi questo articolo
Articolo 3 di 5
Intel ha un piano per battere AMD: una CPU con 52 core
Intel prepara la nuova architettura Nova Lake per sfidare i processori Zen 6 di AMD nella prossima battaglia tecnologica tra i giganti dei chip.
Immagine di Intel ha un piano per battere AMD: una CPU con 52 core
6
Leggi questo articolo
Articolo 4 di 5
Windows non si sblocca più col volto? Ecco perché
L'ultimo aggiornamento di Windows ha introdotto una modifica che sta interessando milioni di utenti: Windows Hello non funziona più al buio.
Immagine di Windows non si sblocca più col volto? Ecco perché
Leggi questo articolo
Articolo 5 di 5
Il Mac Mini non si accende? Apple ve lo ripara... gratis
Un difetto tecnico ha colpito una specifica categoria di Mac Mini immessi sul mercato da Apple nel corso del 2024, mobilitando l'azienda per una soluzione.
Immagine di Il Mac Mini non si accende? Apple ve lo ripara... gratis
1
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.