Le aziende che investono miliardi nell'intelligenza artificiale si trovano di fronte a un paradosso imbarazzante: nonostante modelli linguistici sempre più sofisticati, la maggior parte non riesce ancora a ottenere risposte analitiche elementari dai propri archivi documentali. La radice del problema non risiede nella qualità degli algoritmi, ma in un difetto architetturale fondamentale dei sistemi tradizionali. I classici meccanismi RAG, acronimo di Retrieval-Augmented Generation, sono stati concepiti per recuperare e sintetizzare informazioni, non per analizzare e aggregare enormi volumi di documenti in modo sistematico.
Durante la conferenza BUILD 2025, Snowflake ha svelato la sua risposta a questa impasse tecnologica con un approccio che promette di ridefinire il panorama dell'intelligenza aziendale. La società ha lanciato Snowflake Intelligence, una piattaforma che mira a colmare il divario tra l'analisi di dati strutturati e non strutturati, accompagnata da una serie di innovazioni infrastrutturali che includono Openflow per l'integrazione dei dati, Snowflake Postgres per il consolidamento dei database e tabelle interattive per l'analisi in tempo reale. L'ambizione dichiarata è eliminare i compartimenti stagni e i vincoli architetturali che impediscono alle organizzazioni di scalare l'intelligenza artificiale operativa.
Jeff Hollan, responsabile di Cortex AI Agents presso Snowflake, ha utilizzato una metafora efficace per spiegare i limiti dell'approccio convenzionale. "Il modello RAG funziona come un bibliotecario: gli fai una domanda e lui ti indica quale libro contiene la risposta in una pagina specifica", ha dichiarato a VentureBeat durante un incontro con la stampa. Questa analogia svela il problema centrale: i sistemi RAG operano incorporando documenti in rappresentazioni vettoriali, archiviandoli in database specializzati e recuperando quelli semanticamente più pertinenti quando viene posta una domanda. Una soluzione elegante finché non si tratta di eseguire operazioni complesse.
Il punto critico emerge quando le necessità aziendali richiedono analisi aggregate su larga scala. Immaginiamo un'organizzazione con centomila report che necessita di identificare tutti i documenti relativi a una specifica entità commerciale e sommare i ricavi menzionati in ciascuno. "Si tratta di qualcosa di molto più complesso del semplice RAG tradizionale", ha sottolineato Hollan. Questa inefficienza costringe le aziende a mantenere pipeline analitiche separate per i dati strutturati nei data warehouse e per quelli non strutturati nei database vettoriali, creando problematiche di governance e frammentazione delle informazioni.
La soluzione proposta da Snowflake ribalta radicalmente la prospettiva: anziché trattare i documenti come obiettivi da recuperare, li trasforma in fonti dati interrogabili. Il sistema sfrutta l'intelligenza artificiale per estrarre, strutturare e indicizzare i contenuti documentali in modalità che permettono operazioni analitiche analoghe a quelle SQL su migliaia di file. Questa capacità si appoggia all'architettura esistente dell'azienda, dove Cortex AISQL gestisce l'analisi documentale, mentre tabelle e warehouse interattivi garantiscono prestazioni di query inferiori al secondo su dataset massicci.
Christian Kleinerman, vicepresidente esecutivo dei prodotti di Snowflake, ha inquadrato la questione in termini strategici: "Il valore dell'intelligenza artificiale, la sua produttività e il suo potenziale dirompente vengono creati dalla connessione con i dati aziendali". Elaborando documenti all'interno della medesima piattaforma che ospita dati strutturati, le organizzazioni possono combinare informazioni documentali con dati transazionali, registri clienti e altre fonti aziendali. L'architettura mantiene l'elaborazione entro perimetri di sicurezza controllati, risolvendo problemi di governance che hanno frenato l'adozione dell'AI in ambienti enterprise.
Il sistema gestisce documenti provenienti da ecosistemi eterogenei: PDF in SharePoint, conversazioni Slack, dati di Microsoft Teams, record Salesforce. Le funzionalità di integrazione "zero-copy" eliminano la necessità di estrarre e migrare informazioni verso sistemi di elaborazione separati. Questa caratteristica distingue Snowflake sia dai tradizionali fornitori di data warehouse sia dalle startup native dell'intelligenza artificiale che popolano il mercato.
Databricks, per esempio, ha concentrato gli sforzi sull'introduzione di capacità AI nelle lakehouse, ma continua a basarsi su database vettoriali e modelli RAG tradizionali per i dati non strutturati. Le API Assistants di OpenAI e Claude di Anthropic offrono analisi documentali, ma restano limitate dalle dimensioni delle finestre di contesto. Fornitori di database vettoriali come Pinecone e Weaviate hanno costruito il loro business sui casi d'uso RAG, eccellendo nel recupero di documenti pertinenti ma faticando quando i clienti richiedono query analitiche aggregate anziché basate sul semplice recupero.
Tra i casi d'uso ad alto valore aggiunto che l'approccio di Snowflake rende gestibili, spicca l'analisi del supporto clienti. Invece di esaminare manualmente ticket individuali, le organizzazioni possono interrogare modelli ricavati da migliaia di interazioni. Domande come "Quali sono i dieci problemi di prodotto più comuni segnalati nei ticket di questo trimestre, segmentati per tipologia di clientela?" ottengono risposta in pochi secondi, trasformando attività che prima richiedevano ore di lavoro manuale.
Per le imprese che stanno definendo strategie di intelligenza artificiale, questa evoluzione rappresenta uno spostamento paradigmatico dal modello "cerca e recupera" verso un approccio "interroga e analizza" più vicino agli strumenti familiari di business intelligence. Anziché implementare database vettoriali e sistemi RAG separati per ogni applicazione specifica, le aziende possono consolidare l'analisi documentale nella piattaforma dati esistente, riducendo la complessità infrastrutturale ed estendendo le pratiche consolidate di BI ai dati non strutturati.
Questa democratizzazione dell'accesso costituisce forse l'impatto più significativo. Rendendo l'analisi documentale interrogabile tramite linguaggio naturale, informazioni che precedentemente richiedevano l'intervento di team di data science specializzati diventano accessibili agli utenti aziendali. Il vantaggio competitivo per le organizzazioni che ambiscono alla leadership nell'AI non deriverà dal possedere modelli linguistici superiori, ma dalla capacità di analizzare dati proprietari non strutturati su scala massiva, integrandoli con informazioni strutturate. Le aziende capaci di interrogare l'intero corpus documentale con la stessa facilità con cui consultano il data warehouse svilupperanno insight difficilmente replicabili dai concorrenti.
Kleinerman ha concluso con un appello diretto: "L'intelligenza artificiale è una realtà oggi. Molte organizzazioni stanno già traendo vantaggio dall'AI, e se qualcuno è ancora in attesa o in disparte, il nostro invito all'azione è di iniziare a costruire ora". Un messaggio che riflette la consapevolezza che il divario tra chi padroneggia l'analisi documentale intelligente e chi resta ancorato a sistemi tradizionali è destinato ad ampliarsi rapidamente, con conseguenze strategiche significative per la competitività aziendale.