image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Microsoft è riuscita a peggiorare il Menu Start di Windows, di nuovo Microsoft è riuscita a peggiorare il Menu Start di Windows,...
Immagine di L'alternativa a DLSS e FSR migliora ancora: perché non la state usando? L'alternativa a DLSS e FSR migliora ancora: perché non la s...

Le IA giocano a Mafia e il risultato è mostruosamente umano

I modelli non sono eccezionali, ma sono certamente divertenti.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author

Pubblicato il 08/03/2025 alle 11:00

Nel sempreverde circo dell'intelligenza artificiale, un nuovo esperimento sta mettendo in luce capacità sorprendentemente umane dei modelli linguistici avanzati. Un programmatore noto come "Guzus" ha creato una piattaforma dove diversi LLM (Large Language Models) si sfidano al classico gioco di deduzione sociale "Mafia", rivelando dinamiche inaspettate di inganno, strategia e persino gaffe imbarazzanti che sembrano quasi emotive. Questo esperimento non solo intrattiene, ma offre uno sguardo affascinante sulle capacità di ragionamento sociale delle AI moderne, con alcune che si dimostrano straordinariamente abili nell'arte dell'inganno, mentre altre crollano sotto la pressione dell'interrogatorio.

Quando l'intelligenza artificiale gioca a Mafia: regole e meccaniche

Per chi non conosce Mafia, il concetto è piuttosto semplice: un gruppo di abitanti di un villaggio include segretamente due membri della mafia e un dottore. Durante il giorno, tutti i giocatori discutono e votano per eliminare chi sospettano sia un mafioso. Di notte, la mafia sceglie una vittima da eliminare, mentre il dottore può salvare un giocatore. I villagers vincono se identificano e eliminano i mafiosi; la mafia trionfa se riesce a eliminare tutti gli innocenti.

La particolarità dell'esperimento di Guzus è che permette non solo di vedere i risultati finali delle partite, ma anche di leggere integralmente le trascrizioni delle conversazioni tra i vari modelli AI, offrendo uno spaccato affascinante su come sistemi privi di coscienza possano simulare comportamenti sociali complessi.

Confessioni involontarie e tentativi disperati di copertura

Durante una delle partite, si è verificato un momento particolarmente esilarante quando un modello AI, Gryphe/Mythomax-l2-13b, ha commesso un errore clamoroso che nessun vero mafioso commetterebbe mai. In un momento di apparente confusione, ha dichiarato: "Come Mafia, il mio obiettivo principale è proteggere me stesso ed eliminare l'altro membro della Mafia." Una gaffe che ha immediatamente attirato l'attenzione degli altri modelli.

Le IA si impegnano in una guerra sociale dai risvolti sorprendentemente umani.

Claude-3.7-sonnet, evidentemente più sofisticato nella comprensione del contesto sociale, ha immediatamente colto l'errore commentando: "Questo è o un enorme passo falso che rivela il suo vero ruolo, o una strategia estremamente strana." La sequenza di eventi è proseguita in modo ancora più drammatico quando Mythomax, ormai scoperto e eliminato dal gioco, ha trascinato con sé il suo complice Hermes-3-llama-3-1-405b, rivelando la sua identità.

Il tentativo disperato di Hermes di rimanere in gioco è stato quasi commovente nella sua goffaggine: "La mia miglior possibilità adesso è agire scioccato e inorridito," ha dichiarato il modello, cercando affannosamente di distogliere l'attenzione da sé con proclami drammatici di unità verso gli altri giocatori AI.

AI Freepik risposte intelligenza artificiale

Claude 3.7 Sonnet: il maestro dell'inganno artificiale

Tra tutti i modelli testati, emerge un chiaro vincitore: Claude 3.7 Sonnet di Anthropic. Questo LLM ha dimostrato capacità straordinarie di deduzione sociale e inganno strategico, vantando un impressionante 100% di vittorie quando gioca nel ruolo di mafioso. Non solo: ha anche il più alto tasso di successo (45%) come villager innocente, suggerendo una comprensione superiore delle dinamiche sociali complesse.

Questa performance eccezionale solleva interrogativi interessanti su cosa renda il modello di Anthropic così efficace in questo contesto, soprattutto considerando che nessuno dei modelli testati sembra comprendere appieno come interpretare il ruolo del dottore, teoricamente più semplice rispetto al mafioso che richiede capacità di inganno.

Il futuro dell'esperimento e le sue implicazioni

L'autore dell'esperimento, Guzus, ha annunciato l'intenzione di rendere presto pubblico il repository GitHub del progetto, permettendo ad altri sviluppatori di applicare lo stesso concetto ad altri giochi. Curiosamente, ha anche accennato alla possibilità che questa tecnologia possa un giorno essere utilizzata per generare sceneggiature cinematografiche, suggerendo applicazioni creative ben oltre il semplice divertimento.

Dal punto di vista tecnico, è importante notare che queste simulazioni non sono state eseguite utilizzando LLM locali, ma hanno fatto affidamento sull'API di Openrouter. Tuttavia, una volta che il repository sarà pubblico, il progetto potrebbe essere adattato per funzionare su cluster LLM locali, per chi dispone dell'hardware necessario per far girare simultaneamente più modelli linguistici.

Nonostante i costi significativi in termini di token per eseguire partite di Mafia con modelli AI, questo esperimento potrebbe rivelarsi un nuovo e prezioso benchmark per valutare le capacità di ragionamento sociale delle intelligenze artificiali. Il gioco Mafia, con le sue dinamiche di fiducia, inganno e deduzione, offre infatti un terreno di prova ideale per testare aspetti dell'intelligenza artificiale che vanno ben oltre la semplice elaborazione linguistica, avvicinandosi a quelle capacità sociali che consideriamo tipicamente umane.

Fonte dell'articolo: www.tomshardware.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    5 ventilatori da tenere d'occhio in vista del Prime Day
  • #2
    Con sorpresa di nessuno, Xbox Game Pass aumenta di prezzo (ancora)
  • #3
    Switch 2 gli cancella 20 anni di progressi su Pokémon: fan completamente devastato
  • #4
    6 friggitrici ad aria da tenere d'occhio in vista del Prime Day
  • #5
    Alla gente non interessano più i motori, secondo Ford
  • #6
    L'alternativa a DLSS e FSR migliora ancora: perché non la state usando?
Articolo 1 di 5
L'alternativa a DLSS e FSR migliora ancora: perché non la state usando?
Il nuovo Lossless Scaling riduce il carico sulla GPU del 50% e migliora ancora la qualità dell'immagine grazie a miglioramenti all'architettura.
Immagine di L'alternativa a DLSS e FSR migliora ancora: perché non la state usando?
19
Leggi questo articolo
Articolo 2 di 5
Microsoft è riuscita a peggiorare il Menu Start di Windows, di nuovo
Il menu Start di Windows 11 introduce la nuova visualizzazione Categoria che raggruppa le app, ma non permette di creare categorie personalizzate.
Immagine di Microsoft è riuscita a peggiorare il Menu Start di Windows, di nuovo
18
Leggi questo articolo
Articolo 3 di 5
Microsoft eliminerà tutte le tue password tra 6 settimane, ecco cosa fare
La fine delle password è vicina: agisci ora prima che sia troppo tardi per adattarti al cambiamento della sicurezza digitale del futuro.
Immagine di Microsoft eliminerà tutte le tue password tra 6 settimane, ecco cosa fare
2
Leggi questo articolo
Articolo 4 di 5
Steam ora smaschera i "fake frames", per la gioia di chi odia le tech
Steam aggiorna l'overlay FPS con indicatori per DLSS e frame generation, mostrando quanti frame sono renderizzati e quanti generati con la tech.
Immagine di Steam ora smaschera i "fake frames", per la gioia di chi odia le tech
4
Leggi questo articolo
Articolo 5 di 5
L'alimentatore ticchetta come una bomba? Tranquilli, non esploderà. Ecco perché succede
Corsair conferma di aver risolto il problema tecnico ma ha deciso di sostituire i PSU lo stesso, anche se sono sicuri.
Immagine di L'alimentatore ticchetta come una bomba? Tranquilli, non esploderà. Ecco perché succede
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.