La corsa verso l'intelligenza artificiale sta portando molte aziende a credere che i modelli più grandi e generalisti garantiscano automaticamente risultati migliori, ma questa convinzione potrebbe rivelarsi un errore costoso. Una recente analisi pubblicata su Harvard Business Review dimostra come ChatGPT e modelli simili, pur eccellendo in compiti generici, vengano sistematicamente superati da sistemi AI specializzati quando si tratta di applicazioni specifiche per settore. La differenza non è marginale: si tratta di una questione che può determinare il successo o il fallimento di progetti aziendali strategici.
Quando la specializzazione batte la versatilità
L'esperienza sul campo racconta una storia diversa rispetto alle promesse del marketing tecnologico. Amber Nigam, CEO di Basys.ai, e John Glaser, dirigente presso Harvard Medical School, hanno sviluppato sistemi di intelligenza artificiale generativa per compagnie assicurative sanitarie americane. Il loro compito era automatizzare le decisioni su quali trattamenti medici dovessero essere coperti dalle polizze dei pazienti. I risultati hanno evidenziato una differenza fondamentale tra approcci generalisti e specialistici.
Prendiamo il caso di un paziente oncologico che necessita di chemioterapia: un modello AI specializzato non si limita a recuperare informazioni, ma comprende come queste operino all'interno del framework decisionale specifico del settore sanitario. Analizza la condizione medica del paziente, considera fattori come malattie renali terminali o referral per cure palliative, e applica la logica clinica e assicurativa appropriata.
I modelli generalisti come ChatGPT, Claude e Gemini affrontano lo stesso problema cercando pattern storici nelle decisioni precedenti delle compagnie assicurative. Questo approccio basato sul riconoscimento di schemi, tuttavia, perde completamente la logica clinica e normativa sottostante che dovrebbe guidare queste decisioni, specialmente nei casi più complessi. È come confrontare un traduttore automatico con un interprete specializzato in terminologia legale durante un processo.
La svolta concettuale per i ricercatori è arrivata quando hanno smesso di cercare di adattare il pensiero umano alla logica computazionale, invertendo completamente la prospettiva. Hanno addestrato i loro agenti AI generativi a seguire il modo in cui i clinici leggono le cartelle mediche: comprendendo la struttura dei documenti, navigando tra sezioni e sottosezioni, identificando i risultati rilevanti nel contesto appropriato.
La realtà aziendale oltre l'entusiasmo
Secondo un rapporto PYMNTS Intelligence, le aziende stanno già adattando i sistemi AI generativi alle loro necessità strategiche specifiche. Le compagnie nei settori tecnologico e manifatturiero utilizzano prevalentemente l'AI per design di prodotti e generazione di idee - casi d'uso generalisti. Al contrario, le aziende di servizi impiegano l'AI generativa per scopi più mirati come il miglioramento del posizionamento strategico o la generazione accelerata di insights analitici.
Nonostante la valutazione positiva dell'efficacia dell'AI generativa, i dirigenti aziendali riconoscono che richiede ancora una supervisione umana estesa. Tutto l'entusiasmo potrebbe quindi riflettere più la rapidità con cui le aziende stanno trovando applicazioni utili e precise, piuttosto che una reale maturità della tecnologia.
Per evitare investimenti sbagliati, gli autori dello studio suggeriscono di porre tre domande cruciali ai fornitori di soluzioni AI. La prima riguarda la trasparenza del ragionamento: il sistema può spiegare chiaramente il proprio processo decisionale? I modelli generalisti spesso forniscono risposte superficiali o opache, mentre i sistemi specializzati devono dimostrare come utilizzano i criteri decisionali e citare standard o precedenti.
La seconda questione concerne la collaborazione con esperti del dominio: il fornitore lavora a stretto contatto con professionisti del settore e si adatta ai cambiamenti normativi? Una collaborazione approfondita garantisce che i modelli incorporino framework professionali in evoluzione, non regole obsolete.
Infine, è essenziale valutare la scalabilità della soluzione attraverso diversi domini, evitando soluzioni puntuali isolate e optando per architetture che integrino logica professionale e possano espandersi in nuove aree come finanza, diritto o ingegneria.