Sachin Gupta è Vice President of Product e General Manager of Infrastructure as a Service presso Google Cloud. Entrato in Google nel 2020, coordina i settori Product e UX attraverso SysInfra, Compute, Networking e Storage, oltre alla gestione dei prodotti per l'espansione geografica di Google Cloud, l'ingegneria dell'affidabilità dei siti e i team dell'infrastruttura tecnica.

Lo abbiamo intervistato al Google Next ’24 per fare il punto della situazione sul presente e il futuro di Google nell’ambito del cloud e dell’intelligenza artificiale.

Molte aziende trovano difficoltà a capire come ottenere il massimo dall'adozione del cloud e ora devono affrontare l'implementazione dell'IA generativa e dell'apprendimento automatico nei loro modelli di business. Quali consigli potreste offrire a riguardo?

Operando in Google Cloud da quasi quattro anni, ho avuto l'opportunità di interagire con un'ampia gamma di clienti. E un elemento centrale è estrarre valore dai propri dati.

Al cuore di questo processo c'è l'analisi, la sfida di armonizzare i silos di dati e la necessità di modernizzare le applicazioni oltre i confini degli ambienti legacy. È essenziale rimanere aggiornati con le ultime evoluzioni e l'IA generativa, in particolare, ha il potenziale di moltiplicare il valore che possiamo ricavare dai dati.

L'essenza sta nell'incoraggiare i clienti ad adottare soluzioni moderne e ottimizzate, che comprendono sia il cloud pubblico che quello on-premise, per stimolare l'innovazione, arricchire l'esperienza utente, minimizzare i costi e integrare le nuove tecnologie nelle loro strutture applicative. Sebbene l’IA abbia aumentate la velocità con cui accadono le cose, i principi fondamentali di aggregazione dei dati, analisi e modernizzazione rimangono invariati.

Molti esperti ritengono che l'open source rappresenti la direzione futura per lo sviluppo dell'intelligenza artificiale. Qual è la sua opinione in merito e quali implicazioni comporta ciò per l'infrastruttura AI?

Ritengo che sia necessario essere aperti a tutte le soluzioni offerte alle imprese e a ciò che sviluppiamo in Google. Prendiamo, per esempio, il settore dei chip: proponiamo le nostre TPU (Tensor Processing Units) di ultima generazione, ma al contempo collaboriamo con NVIDIA per utilizzare le più recenti GPU.

Parlando di database, forniamo il nostro sistema per la ricerca vettoriale, AlloyDB, tuttavia, siamo aperti all'integrazione con altri sistemi come Elastic o altri database. Sul fronte dei modelli, presentiamo le nostre soluzioni come Gemini, ma abbiamo anche collaborazioni con Anthropic e con modelli open source come Lama.

L'apertura e la possibilità di scelta a ogni livello sono fondamentali. È altresì vitale garantire che ogni strato dell'infrastruttura sia attentamente considerato e ottimizzato, affinché l'intera soluzione sia efficace per l'utente finale.

L'obiettivo è liberare i clienti dalla preoccupazione di orchestrare queste componenti, consentendo loro di concentrarsi sull'integrazione dei loro dati, sullo sviluppo delle applicazioni desiderate e sull'estrazione di insight significativi mediante l'impiego dell'intelligenza artificiale.

Quali sono i mercati che si distinguono nell'adozione dell'intelligenza artificiale?

Non mi sento di affermare che esistano differenze sostanziali tra le regioni, come l'Europa e gli Stati Uniti, nell'adozione dell'IA. Dalla nostra esperienza in Google Cloud, abbiamo osservato casi d'uso di intelligenza artificiale su scala globale, che abbracciano l'Europa, l'Asia-Pacifico e le Americhe.

Cosa state facendo per conformarvi alla crescente richiesta di sovranità dei dati nei paesi di tutto il mondo?

Per rispondere alla crescente esigenza di sovranità dei dati e ai requisiti normativi correlati, mettiamo a disposizione dei nostri clienti un'offerta di servizi cloud tra le più complete. Attualmente, disponiamo di infrastrutture cloud in 40 nazioni diverse, con l’intenzione di espanderci ulteriormente.

In queste regioni, forniamo ai clienti avanzati strumenti di controllo, permettendo loro di gestire autonomamente le chiavi di cifratura, di assicurare che i dati rimangano all'interno della regione prescelta e di limitare l'accesso ai soli soggetti autorizzati, grazie anche all'uso di tecnologie come il confidential computing. Ciò garantisce che i dati siano protetti in modo efficace, anche durante l'esecuzione.

Abbiamo implementato un set estensivo e articolati di controlli in queste aree. In alcuni paesi, come la Francia, collaboriamo con partner locali, ad esempio Thales, per gestire i nostri data center, rispettando così i requisiti di sovranità nazionale. Inoltre, disponiamo di una soluzione denominata Google Distributed Cloud, pensata per situazioni che richiedono un isolamento completo, come per enti governativi o settori fortemente regolamentati, quali le banche centrali o le aziende energetiche.

Questo sistema è progettato per operare in modo completamente autonomo, senza alcuna connessione a internet o a Google Cloud, assicurando un ambiente cloud completamente isolato.

Ci occupiamo dell'installazione dei nostri server direttamente nei data center dei clienti, e tutto ciò è gestito da loro o dai partner che hanno selezionato. Ad esempio, in Belgio e in Lussemburgo, collaboriamo con partner come Proximus, che si occupa dell'implementazione e della gestione del Google Distributed Cloud, che funziona autonomamente senza necessità di connessione a Internet.

In tale contesto forniamo una soluzione completa, che include tutta l'infrastruttura e i servizi di Vertex AI, consentendo lo sviluppo di applicazioni basate su intelligenza artificiale generativa e la modernizzazione dei sistemi. Utilizziamo anche Kubernetes con GKE per garantire un funzionamento ottimale in queste condizioni isolate.

La nostra rete di partnership, che include realtà come T-Systems in Germania e Thales in Francia, si sta costantemente espandendo per assicurare che, in un numero sempre maggiore di paesi, i clienti possano avere accesso a un'infrastruttura cloud privata e completamente isolata, in linea con le loro esigenze specifiche.

La sostenibilità è un tema cruciale per i data center. Potrebbe illustrare come Google sta affrontando questa sfida?

Google si posiziona come un’azienda leader nel campo della sostenibilità, avendo adottato un approccio proattivo e trasparente riguardo al nostro impegno per la neutralità del carbonio e agli obiettivi di eliminazione totale delle emissioni di carbonio.

Poniamo particolare attenzione nel modo in cui progettiamo e realizziamo i nuovi data center, privilegiando l'uso di energia pulita e rinnovabile. Manteniamo un elevato livello di trasparenza con i nostri clienti: attraverso specifiche API, offriamo loro la possibilità di monitorare la percentuale di energia rinnovabile utilizzata e di visualizzare le proprie metriche di sostenibilità, basandosi sulla distribuzione dei carichi di lavoro nelle diverse regioni di Google Cloud.

I nostri clienti hanno la capacità di analizzare il proprio consumo energetico, consentendo loro di identificare opportunità di efficienza, come la disattivazione di infrastrutture non utilizzate o la migrazione dei carichi di lavoro verso regioni più conformi ai nostri obiettivi di sostenibilità, assicurando così prestazioni migliorate.

Siamo anche impegnati in obiettivi di sostenibilità decisamente ambiziosi, progettando e realizzando soluzioni che permettono ai nostri clienti di avere una visione chiara e completa per il raggiungimento dei loro traguardi ambientali.

Sam Altman ha dichiarato che le attuali fonti di energia saranno insufficienti a soddisfare la domanda energetica creata dalle intelligenze artificiali che bisognerà passare quanto prima alla fusione nucleare. Fantascienza o realtà?

Non credo che oggi si possa etichettare più nulla come pura fantascienza, vista la rapidità con cui progredisce la tecnologia. Tuttavia è innegabile che stiamo assistendo a un'espansione senza precedenti nell'infrastruttura di Machine Learning. Ni poniamo l’accento sull'efficienza e sull'ottimizzazione: l'obiettivo è massimizzare l'utilizzo e le prestazioni dell'infrastruttura esistente, evitando tempi morti o attese inutili.

Stiamo implementando soluzioni come il raffreddamento a liquido per sfruttare al massimo le capacità delle nostre infrastrutture. Inoltre, l'efficienza energetica e le prestazioni del silicio sono prioritarie, come dimostra la nostra nuova CPU ARM che riduce il consumo energetico del 60%.

Ci stiamo insomma muovendo verso un panorama di innovazioni significative, mentre per quanto riguarda i data center e la gestione energetica, non solo stiamo ampliando la nostra rete ma collaboriamo attivamente con fornitori di energia e governi a livello globale per incrementare l'uso di fonti rinnovabili e ridurre le emissioni di carbonio, rispondendo così in modo concreto e sostenibile alle crescenti necessità energetiche.

Quali sono i casi d'uso dell'intelligenza artificiale che avete trovato più interessanti tra i vostri clienti?

Ho notato un crescente interesse per l'impiego della nostra tecnologia applicata ai dati privati dei clienti. Un esempio è nel settore farmaceutico, dove le aziende gestiscono vasti archivi di dati sensibili, inclusi i dati sui pazienti.

Queste informazioni sono cruciali per facilitare la collaborazione e accelerare la ricerca, ma molti clienti esitano a spostarle sul cloud pubblico per questioni di riservatezza. Qui entra in gioco il valore del Google Distributed Cloud, che permette di processare questi dati in modo sicuro e privato.

Abbiamo poi osservato una varietà di applicazioni, in particolare nella predizione degli esiti. E anche se potrebbe sembrare un campo già esplorato, la gestione logistica dimostra tuttora un potenziale enorme. Pensiamo alle flotte di veicoli o agli aerei: interpretare i petabyte di dati generati per ottimizzare la manutenzione e la gestione delle parti è fondamentale. L'uso dell'intelligenza artificiale e delle capacità generative per orchestrare la supply chain e la logistica, rappresenta una forza trasformativa.

E ancora: al di là del settore consumer, dove le innovazioni come quelle integrate in Google Workspace sono già ben conosciute e apprezzate, il nostro lavoro con clienti aziendali e governativi rivela una ricca varietà di applicazioni pratiche per l'IA generativa. Questo è particolarmente vero per quelle organizzazioni che richiedono un ambiente cloud privato e distribuito, e alle quali Google Distributed Cloud offre soluzioni su misura.

Quale delle vostre soluzioni ritenete vi renda particolarmente orgogliosi per il valore che è in grado di apportare ai clienti di Google?

Sono particolarmente fiero della nostra abilità nell'estendere l'IA generativa ovunque, un concetto che ha guidato il nostro percorso fin dall'inizio. Questo approccio ci permette di non escludere nessun cliente, dato o processo lavorativo.

Il nostro obiettivo è garantire che ogni cliente possa rispettare le proprie esigenze di resilienza, conformità normativa e riduzione della latenza, avvalendosi contemporaneamente delle avanzate capacità dell'IA generativa. Raggiungiamo questo obiettivo attraverso una sinergia tra il nostro cloud pubblico e il Google Distributed Cloud, che insieme offrono una soluzione integrata e completa.

Quali ritiene siano le principali barriere all'adozione dell'intelligenza artificiale e dell'IA generativa nelle aziende, e come sta intervenendo Google Cloud per superarle?

Ritengo che nell'ambito dell'IA generativa emergano principalmente due o tre sfide significative. La prima riguarda la necessità, specialmente nel contesto aziendale, di evitare le cosiddette "allucinazioni" dell'IA, ovvero la generazione di informazioni non veritiere.

È fondamentale che le aziende possano fare affidamento sull'accuratezza dei dati generati dall'IA, dato che queste informazioni influenzano decisioni critiche e l'interazione con i clienti. Adottiamo le tecnologie più per garantire l'affidabilità necessaria nelle applicazioni aziendali.

Il secondo grande tema è la sicurezza e la privacy: è essenziale che ciò che viene inserito nei modelli rimanga confidenziale e di proprietà dell'azienda. Abbiamo implementato rigidi controlli per assicurare che i dati dei clienti restino protetti e riservati, anche all'interno del cloud pubblico.

Ciò significa che quando un modello viene addestrato con un volume significativo di dati, solo l'azienda che li possiede ha accesso ai risultati generati. Mantenere un ambiente di dati sicuro e trarre le migliori conclusioni dai modelli di IA sono le chiavi per superare le barriere all'adozione dell'IA generativa nel settore aziendale.

Ciò che emerge da questo Next ’24 è che Google propone un pacchetto di soluzioni cloud di grande verticalità e, al tempo stesso, orizzontalità. Cosa vi manca per battere Amazon e Microsoft in questo ambito?

L'evento di questi giorni ha messo in evidenza l'entusiasmo dei nostri clienti, sottolineando come non siamo affatto nuovi nel panorama dell'intelligenza artificiale; anzi, Google ne è stato un pioniere e ha lavorato intensamente in questo settore per anni.

Ora che il mercato sta guadagnando dinamismo, credo fermamente nella nostra leadership nell'IA. E la nostra offerta, completa e ottimizzata, sta già attraendo una quota significativa di startup nel settore dell'IA, che hanno scelto Google Cloud, dimostrando il nostro impatto e la nostra forza innovativa.

Tuttavia, non si tratta solo delle startup: numerose aziende riconoscono il valore che stiamo portando e di stare beneficiando delle nostre innovazioni per risolvere sfide sempre più complesse.

Con la crescente rilevanza dell'IA, stiamo vivendo uno slancio notevole. Slancio che è alimentato dalla nostra capacità di fornire soluzioni end-to-end, mantenendo un approccio aperto ma altamente ottimizzato in ogni aspetto. Il che ci mette in una posizione unica per competere sul mercato.