Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Care aziende, più agenti IA non garantiscono risultati migliori
Business
Immagine di Antipirateria assurda, cosa succede se Cloudflare lascia l'Italia? Antipirateria assurda, cosa succede se Cloudflare lascia l'I...
Immagine di Competenze essenziali per il mercato del lavoro nel 2026 Competenze essenziali per il mercato del lavoro nel 2026...

Care aziende, più agenti IA non garantiscono risultati migliori

Secondo una ricerca di Google e MIT sistemi singoli spesso risultano più efficienti per task sequenziali e tool-heavy

Avatar di Antonino Caffo

a cura di Antonino Caffo

Editor @Tom's Hardware Italia

Pubblicato il 29/12/2025 alle 13:20 - Aggiornato il 30/12/2025 alle 08:03

La notizia in un minuto

  • Una ricerca di Google e MIT rivela che aggiungere più agenti AI non migliora automaticamente i risultati: quando un singolo agente supera il 45% di successo, ulteriori agenti tendono a degradare le prestazioni invece di potenziarle
  • L'overhead di coordinamento rappresenta il principale limite dei sistemi multi-agente, con perdite di efficienza fino a sei volte superiori in ambienti complessi e costi che crescono esponenzialmente oltre i quattro agenti
  • L'architettura del team determina l'affidabilità: i sistemi centralizzati riducono gli errori fino al 66,8% rispetto a quelli indipendenti, dove gli errori vengono amplificati di 17,2 volte

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'entusiasmo per i sistemi multi-agente nell'intelligenza artificiale potrebbe essere prematuro. Una ricerca condotta da Google e MIT smonta il mito secondo cui aggiungere più agenti AI a un sistema garantisca automaticamente risultati migliori, rivelando invece dinamiche complesse dove spesso "meno è più". Lo studio, che ha analizzato 180 configurazioni diverse attraverso cinque architetture e tre famiglie di modelli linguistici, offre una prospettiva inedita su quando conviene davvero investire in architetture complesse piuttosto che affidarsi a soluzioni più semplici ed economiche.

I ricercatori hanno identificato un punto di svolta critico che ridefinisce l'approccio alla progettazione di sistemi intelligenti. Quando un singolo agente raggiunge un tasso di successo superiore al 45% su un compito specifico, l'aggiunta di ulteriori agenti tende a degradare le prestazioni invece di migliorarle. Questa soglia empirica rappresenta un discrimine fondamentale per le aziende che devono decidere dove allocare risorse e investimenti tecnologici.

Ti potrebbe interessare anche

youtube play
Guarda su youtube logo

La distinzione tra compiti "statici" e "agentici" emerge come elemento cruciale dell'analisi. I compiti agentici richiedono interazioni prolungate con l'ambiente, raccolta iterativa di informazioni e affinamento strategico continuo, caratteristiche ben diverse dai problemi risolvibili in un'unica sequenza di ragionamento. Applicare strategie collaborative a problemi statici, come votare sulla soluzione di un quiz di programmazione, si rivela spesso controproducente quando gli stessi approcci vengono estesi a scenari che richiedono vera agenzia.

Il fattore più sorprendente riguarda l'overhead di coordinamento nei sistemi ricchi di strumenti. Quando il budget computazionale viene diviso tra più agenti, ciascuno finisce con capacità insufficienti per orchestrare efficacemente gli strumenti disponibili rispetto a un singolo agente che mantiene un flusso di memoria unificato. Gli ambienti con più di dieci strumenti penalizzano i sistemi multi-agente con una perdita di efficienza da due a sei volte superiore rispetto alle architetture semplici.

Oltre i quattro agenti il costo della coordinazione supera rapidamente il valore del ragionamento aggiunto

L'architettura del team determina se gli errori vengono corretti o moltiplicati, un aspetto che cambia radicalmente l'affidabilità del sistema. Nei sistemi "indipendenti", dove gli agenti lavorano in parallelo senza comunicare, gli errori vengono amplificati di 17,2 volte rispetto a un singolo agente. Le architetture centralizzate, invece, contengono questa amplificazione limitandola a 4,4 volte grazie a un orchestratore che funge da collo di bottiglia per la validazione.

"L'elemento distintivo è avere un punto di controllo dedicato che intercetta gli errori prima che si propaghino all'output finale", spiega Yubin Kim, dottorando al MIT e autore principale dello studio. Per le contraddizioni logiche, l'architettura centralizzata riduce il tasso di errore del 36,4%, mentre per le omissioni contestuali la riduzione raggiunge il 66,8%. Questi dati suggeriscono che la struttura topologica della rete di agenti non è un dettaglio implementativo ma un fattore determinante per l'affidabilità.

Le implicazioni pratiche per gli sviluppatori seguono una logica precisa che rovescia molte convenzioni correnti. Prima di costruire un team di agenti, occorre analizzare la struttura delle dipendenze del compito: se il passaggio B dipende interamente dall'esecuzione perfetta del passaggio A, un sistema a singolo agente rappresenta quasi sempre la scelta migliore. Gli errori in scenari strettamente sequenziali tendono a propagarsi a cascata invece di annullarsi reciprocamente, vanificando i presunti vantaggi della collaborazione.

Il principio del "non aggiustare ciò che funziona" assume particolare rilevanza in ambito aziendale. Partire sempre con un benchmark su singolo agente permette di identificare rapidamente i casi in cui l'aggiunta di complessità genererebbe solo costi aggiuntivi senza valore corrispondente. Quando un compito non può essere facilmente decomposto e il singolo agente supera la soglia del 45% di successo, insistere con architetture multi-agente significa sprecare risorse.

Xin Liu, ricercatore presso Google e coautore dello studio, introduce però una sfumatura importante per chi opera in contesti aziendali. "Le imprese dovrebbero investire in entrambi gli approcci", ha dichiarato. "Modelli base migliori alzano la soglia di partenza, ma per compiti con naturale decomponibilità e potenziale di parallelizzazione, il coordinamento multi-agente continua a fornire valore sostanziale indipendentemente dalla capacità del modello". L'esempio citato riguarda un benchmark finanziario dove il miglioramento ha raggiunto l'80,9%.

La "regola del 4" stabilisce un limite pratico alle dimensioni efficaci dei team. Lo studio ha riscontrato che team efficaci si limitano attualmente a circa tre o quattro agenti, oltre i quali l'overhead comunicativo cresce in modo super-lineare con un esponente di 1,724. Questo significa che il costo della coordinazione supera rapidamente il beneficio derivante dal ragionamento aggiunto, rendendo controproducenti gli sciami massicci di agenti nonostante il loro fascino intuitivo.

La topologia deve corrispondere all'obiettivo specifico quando un sistema multi-agente risulta necessario. Per compiti che richiedono alta accuratezza e precisione, come analisi finanziarie o programmazione, il coordinamento centralizzato risulta superiore perché l'orchestratore fornisce un livello di verifica indispensabile. Per compiti esplorativi, come la navigazione web dinamica, il coordinamento decentralizzato eccelle permettendo agli agenti di esplorare simultaneamente percorsi differenti.

Guardando al futuro, i limiti attuali potrebbero non rappresentare barriere permanenti ma vincoli degli attuali protocolli di comunicazione. Kim identifica diverse innovazioni promettenti: protocolli di comunicazione sparsa che superino la densità attuale di 0,39 messaggi per turno, dove messaggi aggiuntivi creano ridondanza anziché informazione nuova; decomposizione gerarchica che sostituisca gli sciami piatti con strutture di coordinamento annidate; progettazione asincrona che riduca l'overhead di blocco; e routing consapevole delle capacità che mescoli strategicamente modelli di diversa potenza.

Per l'architetto aziendale che deve prendere decisioni oggi, i dati parlano chiaro: team più piccoli, intelligenti e strutturati vincono sulla quantità bruta. La standardizzazione metodologica dello studio, che ha eliminato variabili confondenti equiparando strumenti, strutture dei prompt e budget di token, garantisce che le conclusioni derivino effettivamente dalle architetture di coordinamento piuttosto che da differenze implementative. Questa chiarezza metodologica rende i risultati immediatamente applicabili in contesti produttivi, offrendo finalmente un framework quantitativo per prevedere le prestazioni dei sistemi agentici su compiti non ancora affrontati.

Le notizie più lette

#1
NordVPN vs Cyberghost: qual è la migliore?
1

Hardware

NordVPN vs Cyberghost: qual è la migliore?

#2
Competenze essenziali per il mercato del lavoro nel 2026

Business

Competenze essenziali per il mercato del lavoro nel 2026

#3
Rockstar conferma per errore i leak di GTA 6

Videogioco

Rockstar conferma per errore i leak di GTA 6

#4
Core Ultra 9 290K Plus supera Ryzen 9 9950X3D nei primi benchmark
4

Hardware

Core Ultra 9 290K Plus supera Ryzen 9 9950X3D nei primi benchmark

#5
Il meglio del CES 2026, fra IA, robotica e apparente noia
2

CES 2026

Il meglio del CES 2026, fra IA, robotica e apparente noia

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Ti potrebbe interessare anche

Competenze essenziali per il mercato del lavoro nel 2026

Business

Competenze essenziali per il mercato del lavoro nel 2026

Di Valerio Porcu
Antipirateria assurda, cosa succede se Cloudflare lascia l'Italia?

Business

Antipirateria assurda, cosa succede se Cloudflare lascia l'Italia?

Di Valerio Porcu
Mollo Windows e passo a Linux: c'è una tendenza tra i giornalisti tech?

Business

Mollo Windows e passo a Linux: c'è una tendenza tra i giornalisti tech?

Di Valerio Porcu
L'IA di Musk ha chiesto scusa per aver spogliato delle minorenni

Business

L'IA di Musk ha chiesto scusa per aver spogliato delle minorenni

Di Pasquale Viscanti e Giacinto Fiore
Il CFO diventa architetto della resilienza mentre l'economia del prompt divora i margini

Business

Il CFO diventa architetto della resilienza mentre l'economia del prompt divora i margini

Di Valerio Porcu
Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.