Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Switch 2 gli cancella 20 anni di progressi su Pokémon: fan completamente devastato Switch 2 gli cancella 20 anni di progressi su Pokémon: fan ...
Immagine di Con sorpresa di nessuno, Xbox Game Pass aumenta di prezzo (ancora) Con sorpresa di nessuno, Xbox Game Pass aumenta di prezzo (a...

Gemini è uno di noi, panico se i Pokémon stanno per morire

L'ultima generazione di intelligenza artificiale di Google mostra comportamenti simili allo stress umano quando gioca ai videogiochi.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Luca Zaninello

a cura di Luca Zaninello

Managing Editor

Pubblicato il 18/06/2025 alle 11:11

La notizia in un minuto

 Google e Anthropic stanno testando i loro modelli di IA Gemini e Claude facendoli giocare ai classici videogiochi Pokémon per Game Boy, ottenendo risultati tanto divertenti quanto scientificamente rilevanti. Gemini 2.5 Pro mostra un comportamento quasi umano andando letteralmente nel panico quando i suoi Pokémon stanno per essere sconfitti, il che causa un degrado nelle sue capacità di ragionamento e decisioni peggiori sotto stress. Anche Claude ha dimostrato logiche curiose, tentando persino una sorta di "suicidio videoludico" per superare ostacoli. Questi esperimenti, trasmessi in diretta su Twitch, offrono una finestra trasparente sui processi decisionali delle IA e dimostrano come osservare l'intelligenza artificiale nei videogiochi possa rivelare molto di più sui loro meccanismi rispetto ai tradizionali test di benchmarking. 
Riassunto generato con l'IA. Potrebbe non essere accurato.

La competizione tra le grandi aziende di intelligenza artificiale per il dominio del settore si combatte su molti fronti, ma pochi si sarebbero aspettati che uno di questi fosse la regione di Kanto, l'ambientazione dei primi, iconici videogiochi Pokémon.

In una bizzarra ma illuminante serie di esperimenti, Google e Anthropic stanno mettendo alla prova i loro modelli di punta, rispettivamente Gemini e Claude, facendoli giocare ai classici titoli per Game Boy di oltre 25 anni fa. I risultati sono tanto divertenti quanto scientificamente rilevanti, e l'ultimo report di Google DeepMind aggiunge un dettaglio quasi umano: Gemini 2.5 Pro va nel panico quando i suoi Pokémon sono sul punto di essere sconfitti.

Questo stato di "panico simulato", come descritto nel documento, provoca un "degrado qualitativamente osservabile nella capacità di ragionamento del modello". In pratica, quando la situazione si fa critica, l'IA inizia a prendere decisioni peggiori, proprio come farebbe un essere umano sotto stress. Un comportamento affascinante e al contempo leggermente inquietante, che sta offrendo ai ricercatori una nuova prospettiva sul funzionamento di queste complesse tecnologie.

L'analisi comparativa delle IA, nota come "benchmarking", è spesso considerata un'arte dubbia, capace di fornire dati decontestualizzati sulle reali abilità di un modello. Tuttavia, un numero crescente di ricercatori ritiene che osservare un'intelligenza artificiale mentre naviga le sfide di un videogioco possa rivelare molto di più sui suoi processi decisionali.

Questa frontiera della ricerca è diventata anche un piccolo fenomeno di intrattenimento. Negli ultimi mesi, due sviluppatori indipendenti hanno lanciato su Twitch i canali "Gemini Plays Pokémon" e "Claude Plays Pokémon". Su queste dirette streaming, chiunque può osservare in tempo reale i tentativi, spesso goffi e lenti, delle IA di completare un gioco che un bambino di dieci anni potrebbe finire in una frazione del tempo. L'aspetto più interessante è la trasparenza del processo: accanto alla schermata di gioco, viene mostrato il "ragionamento" del modello, una traduzione in linguaggio naturale del modo in cui l'IA valuta un problema e formula una risposta.

Immagine id 60967

È proprio grazie a questa finestra sulla sua "mente" che è stato possibile identificare il panico di Gemini. Il report di Google afferma: "Nel corso della partita, Gemini 2.5 Pro si trova in varie situazioni che inducono il modello a simulare 'panico'". Questo non si traduce in urla digitali, ma in un improvviso blocco nell'uso di strumenti e abilità a sua disposizione, portando a un gameplay meno efficace.

"Questo comportamento si è verificato in un numero sufficiente di casi distinti che i membri della chat di Twitch hanno attivamente notato quando sta accadendo", si legge nel documento.

Gemini non è l'unica IA a mostrare comportamenti bizzarri. Anche Claude, il suo rivale sviluppato da Anthropic, ha esibito una logica curiosa e fallace. Bloccato all'interno della grotta del Monte Luna, Claude ha notato un pattern: quando tutti i Pokémon di un allenatore vengono sconfitti, il giocatore "perde i sensi" e si risveglia in un Centro Pokémon. Da qui, l'IA ha formulato un'ipotesi tragicamente errata: se avesse intenzionalmente fatto sconfiggere tutta la sua squadra, sarebbe stata trasportata magicamente oltre la grotta, al Centro Pokémon della città successiva.

Il gioco, però, non funziona così. Si viene riportati all'ultimo Centro Pokémon visitato, non a quello geograficamente più vicino. Gli spettatori hanno così assistito, con un misto di orrore e divertimento, al tentativo dell'IA di attuare una sorta di "suicidio" videoludico per superare un ostacolo, fallendo miseramente.

Nonostante queste evidenti lacune, che dimostrano come la strada verso un'intelligenza generale sia ancora lunga, i modelli IA eccellono in compiti specifici. Con l'uscita di Gemini 2.5 Pro, l'IA è in grado di risolvere puzzle complessi con una precisione impressionante. Con un minimo aiuto umano, il modello ha creato degli "agenti specializzati" – istanze di Gemini orientate a compiti specifici – per risolvere gli enigmi delle rocce sulla Via Vittoria, uno degli ostacoli più difficili del gioco.

"Con solo un prompt che descrive la fisica dei massi e una descrizione di come verificare un percorso valido, Gemini 2.5 Pro è in grado di risolvere al primo tentativo alcuni di questi complessi enigmi", sottolinea il report.

Il fatto che Gemini abbia partecipato attivamente alla creazione di questi strumenti risolutivi ha portato Google a ipotizzare che i modelli futuri potrebbero essere in grado di svilupparli in totale autonomia. Chissà, forse un giorno Gemini imparerà a auto-programmarsi un modulo "stai calmo", superando l'ansia da prestazione e dimostrando, ancora una volta, di essere stranamente uno di noi.

Fonte dell'articolo: techcrunch.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    5 condizionatori portatili da tenere d'occhio in vista del Prime Day
  • #2
    5 ventilatori da tenere d'occhio in vista del Prime Day
  • #3
    Con sorpresa di nessuno, Xbox Game Pass aumenta di prezzo (ancora)
  • #4
    Switch 2 gli cancella 20 anni di progressi su Pokémon: fan completamente devastato
  • #5
    ROG Xbox Ally: data di uscita e prezzo trapelati online
  • #6
    I giocatori PC hanno vinto contro PlayStation
Articolo 1 di 5
Con sorpresa di nessuno, Xbox Game Pass aumenta di prezzo (ancora)
Microsoft potrebbe aumentare i prezzi di Xbox Game Pass nel breve periodo, almeno secondo quanto emerso da una stringa di codice inserita recentemente.
Immagine di Con sorpresa di nessuno, Xbox Game Pass aumenta di prezzo (ancora)
10
Leggi questo articolo
Articolo 2 di 5
Switch 2 gli cancella 20 anni di progressi su Pokémon: fan completamente devastato
Possessori di Switch 2 segnalano perdita salvataggi Pokémon: raccomandano di usare Pokémon Home prima del trasferimento dati sulla nuova console.
Immagine di Switch 2 gli cancella 20 anni di progressi su Pokémon: fan completamente devastato
17
Leggi questo articolo
Articolo 3 di 5
Il più importante sito di MOD al mondo è stato venduto
La storia di uno dei pilastri fondamentali del gaming su PC ha raggiunto un punto di ripartenza in seguito a un gesto inaspettato del suo creatore.
Immagine di Il più importante sito di MOD al mondo è stato venduto
1
Leggi questo articolo
Articolo 4 di 5
Broken Arrow è lo strategico in tempo reale dell'estate, numeri pre-lancio da record
Broken Arrow è ora disponibile: l'RTS più desiderato su Steam con oltre 300 unità militari, battaglie tattiche moderne e multiplayer 5v5 nel Baltico.
Immagine di Broken Arrow è lo strategico in tempo reale dell'estate, numeri pre-lancio da record
Leggi questo articolo
Articolo 5 di 5
Switch 2 ti penalizza se giochi troppo
Switch 2 spegne automaticamente la vibrazione dei controller quando rileva un uso prolungato del rumble per preservare la durata della batteria.
Immagine di Switch 2 ti penalizza se giochi troppo
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.