Secondo un nuovo studio pubblicato da Anthropic, l'azienda creatrice di Claude, l'utilizzo dei suoi modelli potrebbe incrementare la crescita della produttività del lavoro negli Stati Uniti di un 1,8% annuo per il prossimo decennio.
È il sogno di ogni CFO e la promessa luccicante di ogni pitch commerciale della Silicon Valley: l'intelligenza artificiale generativa è pronta a raddoppiare la velocità dell'economia americana. Ma che lo studio sia affidabile e realistico, è ancora da dimostrare.
I numeri snocciolati nel report sono impressionanti, quasi vertiginosi. Analizzando oltre 100.000 conversazioni di lavoro reali (anonimizzate), i ricercatori hanno calcolato che l'IA riduce il tempo necessario per completare un compito standard dell'80%. Tradotto in valuta, questo risparmio di tempo equivarrebbe a circa $55 di costi lavorativi per ogni singolo task completato con successo. Settori come lo sviluppo software e la data analysis sarebbero in prima linea in questa rivoluzione dell'efficienza. Sulla carta, è lo scenario perfetto. Ma la carta, come sappiamo, non sempre sopravvive alla prova della realtà.
L'oste, il vino e il bias del venditore
C'è un vecchio adagio che mette in guardia dal chiedere all'oste se il vino è buono. In questo caso, l'oste non solo ci sta servendo il vino, ma ha anche scritto la recensione gastronomica. A ci ha aggiunta l’aura scientifica del “secondo uno studio”, che è sicuramente uno studio ben realizzato ma resta pur sempre costruito su un conflitto di interessi.
Un possibile problema metodologico risiede nella fonte dei dati: analizzare le conversazioni di chi già utilizza Claude significa osservare un campione di early adopters motivati e tecnologicamente alfabetizzati, ignorando completamente le frizioni, le resistenze e i fallimenti che caratterizzano l'adozione in scenari aziendali tradizionali. Dire che l'IA "fa risparmiare l'80% del tempo" basandosi su task riusciti è come calcolare la velocità media del traffico in autostrada contando solo le Ferrari in sorpasso.
I casi di studio come questo abbondano ma mancano ancora, in questa narrazione, studi indipendenti e casi d'uso validati da terze parti non coinvolte nella vendita del software. Il report di Anthropic assume un mondo "senza attrito", dove l'integrazione è istantanea e le competenze dei lavoratori sono statiche. Nella realtà operativa delle PMI o delle grandi corporation, l'introduzione di un LLM comporta tempi morti per il prompt engineering, la verifica delle allucinazioni (il tempo speso a correggere l'IA non viene spesso contabilizzato come "costo") e le sfide di compliance legale. Insomma, quel +80% potrebbe diventare parecchio più modesto una volta che si prendono in considerazione tutte le variabili
Siamo di fronte a un classico caso di marketing travestito da ricerca empirica? Probabilmente sì. L'IA generativa offre indubbiamente vantaggi di scalabilità e velocità, come abbiamo spesso sottolineato, ma accettare acriticamente le stime di produttività fornite dai vendor è un errore strategico che un manager oculato non può permettersi.
La tecnologia va testata sul campo, misurando il ROI sui propri processi specifici, non sulle proiezioni macroeconomiche di chi ha tutto l'interesse a venderci la licenza. Sicuramente la promessa di risparmi è allettante, ma la cautela è sempre raccomandabile prima di fare grossi investimenti.