Molti Chief Information Officer italiani tengono d'occhio con interesse una nuova tendenza nel mondo dell'intelligenza artificiale generativa: la Retrieval Augmented Generation (RAG). Questa tecnologia, rispetto ai tradizionali Large Language Model, offre un controllo maggiore sulla privacy dei dati e garantisce un'output più pertinente. Ma come funziona esattamente e quali sono le sue applicazioni all'interno del mondo aziendale?
Tecnologie RAG: una promessa per l'AI generativa
Come riportato da una ricerca di McKinsey, i Large Language Model (LLM) hanno certamente compiuto passi da gigante nel generare contenuti, ma non sempre sono la soluzione ideale per aumentare l'efficienza e la produttività aziendale, soprattutto perché si basano su informazioni disponibili al fornitore tecnologico. I sistemi RAG, invece, si formano direttamente sulle informazioni aziendali, creando una base di dati più specifica e potenzialmente più utile per l'azienda. La tecnica RAG si basa su un processo in due fasi: recupera informazioni rilevanti da un dataset prestabilito e poi usa queste informazioni per generare una risposta più accurata e contestualizzata.
Questo tipo di sistemi operano sul livello semantico piuttosto che sintattico, ossia eseguono più una ricerca che dei ragionamenti. Tuttavia, questo non sminuisce i loro vantaggi, come la possibilità di addestrare il modello a estrarre le risposte e la flessibilità nel modificare il modo in cui viene interrogato l'LLM.
Applicazioni pratiche della RAG
Aumentare l'efficienza e l'efficacia delle attività aziendali è l'obiettivo principale di molte organizzazioni che stanno sperimentando l'intelligenza artificiale generativa. Un esempio in questo senso è Save the Children, che sta lavorando su progetti che utilizzano l'IA per migliorare, tra le altre cose, l'apprendimento dell'italiano per ragazzi con background migratorio e la gestione dei sinistri utilizzando l'IA e applicando metodologie RAG.
Il team del CIO Lorenzo Catapano (che supervisiona non solo l'IT della Ong, ma anche la parte innovazione intesa come gestione del processo di innovazione dell’organizzazione e la strategia sui dati come asset strategico per prendere decisioni adeguate) ha avviato delle sperimentazioni con l’intelligenza artificiale generativa con due obiettivi: aumentare l’efficienza (quindi risparmiare su tempi e costi) e aumentare l’efficacia (ovvero migliorare l’impatto delle attività).
Anche l'Università Vita-Salute San Raffaele ha trovato applicazioni pratiche alla tecnologia RAG, intesa come soluzione per superare la difficoltà di ricerca di contenuti e informazioni all'interno dei vari repository dell'istituto.
Il futuro della RAG
Secondo McKinsey, una delle evoluzioni future più interessanti della tecnologia RAG è rappresentata dai "RAG basati su agenti". Questi strumenti, infatti, permettono ai sistemi RAG di adattarsi in modo flessibile ed efficiente ai contesti mutevoli e alle esigenze degli utenti, rispondendo meglio a input più complessi.
Un esempio è un agente RAG per la sicurezza informatica. Il processo di questo agente si articola in passaggi distinti. Inizialmente, l'agente esegue un'analisi dei log, scrutando i file di log del server applicativo. In questa fase, cerca attivamente potenziali indicatori di compromissione o schemi d'attacco. È addestrato a riconoscere una varietà di anomalie, dai tentativi di accesso falliti alle richieste sospette, elementi che potrebbero segnalare un'attività malevola in corso. Successivamente, per ogni schema d'attacco identificato, l'agente procede con la consultazione della knowledge base. Questa risorsa interna, implementata come un database vettoriale, contiene una vasta gamma di misure di sicurezza pertinenti a diverse categorie di vulnerabilità. È qui che l'agente attinge alle informazioni necessarie per formulare risposte appropriate.
Basandosi sulle informazioni recuperate da questa knowledge base, l'agente passa alla generazione di raccomandazioni specifiche. Si tratta di informazioni che possono variare, includendo suggerimenti per modifiche alla configurazione del server, la necessità di aggiornamenti del codice o altre misure di mitigazione che possano neutralizzare le vulnerabilità identificate.
Un aspetto cruciale che distingue questo agente è la sua consapevolezza organizzativa. È profondamente informato sulle best practice di sicurezza specifiche dell'organizzazione e, di conseguenza, le sue raccomandazioni sono sempre allineate con le politiche e i vincoli interni. Questa contestualizzazione è fondamentale per garantire che le soluzioni proposte non solo siano efficaci, ma anche in armonia con le strategie di sicurezza esistenti.
Stanno inoltre emergendo modelli LLM addestrati specificamente per l'uso con la RAG. Questi sono personalizzati per soddisfare le esigenze delle attività RAG, come il recupero rapido dei dati da un vasto insieme di informazioni. Anche la crescente standardizzazione dei modelli software sottostanti potrebbe interessare i CIO, rendendo le implementazioni RAG progressivamente più facili da costruire e distribuire.