Next ’24: Google Cloud accelera sull’intelligenza artificiale

Thomas Kurian, CEO di Google Cloud, apre la conferenza di Las Vegas con una serie di importanti annunci.

Avatar di Stefano Silvestri

a cura di Stefano Silvestri

Lo scorso anno, il mondo stava solo cominciando a considerare il potenziale trasformativo dell'IA generativa per le imprese. Oggi, questa trasformazione è ben avviata. Per Google, però, l'obiettivo rimane invariato: rendere l'IA accessibile a tutti per migliorare la vita della più ampia platea possibile di professionisti.

A ricordarlo è Thomas Kurian, CEO di Google Cloud, che ha così aperto Next ’24, l’esposizione globale di ispirazione, innovazione ed educazione che si terrà questa settimana in quel di Las Vegas.

Kurian ha poi ricordato che grazie all’offerta IA di Google, che include Gemini, Vertex AI e molto altro ancora, sia i clienti che i partner stanno sviluppando agenti di intelligenza artificiale sempre più sofisticati al servizio dei propri clienti e a supporto dei dipendenti.

Gli agenti per i clienti possono facilitare le interazioni con le aziende su canali quali web, mobile, call center e punti vendita, e possono farlo sia col testo che con la voce. Best Buy, ad esempio, utilizza Gemini per assistere i clienti nella risoluzione di problemi coi computer portatili, nella riprogrammazione delle consegne e in altre funzioni. IHG Hotels & Resort, invece, introdurrà una funzionalità di pianificazione dei viaggi basata sull'intelligenza artificiale generativa.

 Gli agenti per i dipendenti contribuiscono invece a migliorare la produttività e la collaborazione. Ad esempio, Etsy utilizza Vertex AI per ottimizzare i propri modelli di raccomandazioni di ricerca e annunci, mentre Dasa, in Brasile, aiuta i medici a individuare più rapidamente i risultati rilevanti nei test clinici. 

Thomas Kurian ha quindi ricordato l’importanza degli agenti creativi a supporto dei designer e dei team di produzione. Vertex AI è una soluzione di intelligenza artificiale sviluppata da Google Cloud, ed è pensata per agevolare e velocizzare il processo di creazione, addestramento e gestione dei modelli di IA.

Canva utilizza Vertex per il suo strumento Magic Design for Video, che consente agli utenti di creare video coinvolgenti in pochi secondi. Carrefour lo sfrutta invece per creare campagne di marketing su vari social network in tempi rapidi.

 Con queste premesse, Thomas Kurian è passato ad anticipare le novità di prodotto che verranno presentate in queste ore al Google Cloud Next '24.

 Infrastrutture ottimizzate e scalabili con l'IA 

L’efficacia dell'intelligenza artificiale generativa dipende fortemente dall'infrastruttura di supporto. Sotto questo punto di vista, Google sottolinea il suo impegno ricordando i passi significativi che sta compiendo per assistere i propri clienti con ogni tipo di architettura tecnologica. 

Thomas Kurian ricorda la collaborazione con NVIDIA per lo sviluppo di A3 mega, una nuova istanza di GPU che, grazie all'uso delle GPU H100, raddoppia la larghezza di banda rispetto alle versioni precedenti, rendendola adatta per carichi di lavoro più impegnativi. 

A ciò s’aggiunge Confidential A3, progettata per aumentare la sicurezza dei dati sensibili e dei processi IA, sia in fase di training che di inferenza. Quest’ultimo, lo ricordiamo, è il processo mediante cui un modello già addestrato viene utilizzato per fare previsioni o prendere decisioni basate su nuovi dati non visti durante la fase di addestramento. 

Google guarda poi al futuro annunciando l'arrivo dei chip Grace Blackwell di NVIDIA su Google Cloud. Previsti per l'inizio del 2025, si presenteranno in due varianti: B200 per il training e servizi mainstream, e GB200 NVL72 per i modelli di intelligenza artificiale di prossima generazione. 

Quindi è stato il turno delle TPU v5p, l'ultima generazione delle unità di elaborazione tensoriale (TPU) sviluppate da Google, pensata per accelerare specificamente i carichi di lavoro legati all'intelligenza artificiale. Queste unità, che supportano anche Kubernetes Engine (GKE), promettono prestazioni quattro volte superiori rispetto alla generazione precedente. È da notare che l'utilizzo di GPU e TPU è cresciuto di oltre il 900% nell'ultimo anno su GKE. 

Per accelerare ulteriormente il training delle IA, Google innoverà anche l'archiviazione, con nuove funzionalità di caching in Cloud Storage FUSE e Parallelstore, che posizionano i dati più vicini alle TPU o GPU dei clienti. Hyperdisk ML, il nuovo servizio di archiviazione a blocchi, promette invece di ridurre i tempi di caricamento dei modelli fino a 3,7 volte rispetto alle alternative esistenti. 

Google ha anche migliorato il Dynamic Workload Scheduler con nuove funzioni che offrono maggiore controllo ed efficienza nella gestione delle risorse. Come ad esempio la modalità calendario per fissare l’orario di inizio dei lavori; o l’opzione di flessibilità di avvio, per una gestione più efficiente delle risorse per la distribuzione degli incarichi di formazione e di inferenza. 

Infine, Google s’impegna a portare  l'IA direttamente nei luoghi dove i dati vengono creati e utilizzati, ossia all'Edge, agli ambienti air-gapped (dove i computer o le reti sono isolate fisicamente da altre reti ritenute non sicure, se non da Internet), a Google Sovereign Cloud e Cross-Cloud. 

L'intenzione è di abilitare l'intelligenza artificiale ovunque attraverso Google Distributed Cloud (GDC), consentendo ai clienti di scegliere l'ambiente, la configurazione e i controlli che meglio si adattano alle loro esigenze azindali specifiche.

Come ad esempio fa Orange, un operatore di telefonia mobile che utilizza l'IA su GDC per potenziare le prestazioni della rete e migliorare l'esperienza utente, mantenendo al contempo i dati all'interno dei confini nazionali dove opera.

 Le novità di Google nel Cloud 

Google annuncia una serie di innovazioni che promettono di migliorare non solo il modo in cui le aziende accedono e utilizzano l'intelligenza artificiale, ma anche la sicurezza e l'efficienza energetica. 

Una delle mosse più significative è l'introduzione delle GPU di Nvidia all'interno della piattaforma Google Distributed Cloud (GDC). Ciò permetterà di supportare configurazioni sia connesse che isolate (air-gapped), ampliando le possibilità per l'esecuzione efficiente di modelli di intelligenza artificiale in una varietà di ambienti. 

Parallelamente, la tecnologia Google Kubernetes Engine (GKE), già adottata dalle principali aziende del settore IA su Google Cloud, sarà anch’essa resa disponibile su GDC. Questo estende ulteriormente le capacità di gestione e scalabilità delle applicazioni in ambienti cloud distribuiti. 

Google vuole poi rendere disponibili su GDC diversi modelli di intelligenza artificiale aperti, tra cui Gemma e Llama. Questi saranno operativi in ambienti edge, air-gaped e connessi, ampliando le opportunità d’implementazione dell'IA in scenari diversificati. 

Un'altra novità è l'integrazione della tecnologia Vector Search su GDC. Questa funzionalità è progettata per migliorare la ricerca e il recupero di informazioni, ottimizzando la gestione di dati privati e sensibili con latenze minime. 

Rispondendo alla crescente domanda di soluzioni cloud sovrane per soddisfare requisiti normativi stringenti, Google propone GDC in una configurazione completamente air-gaped, con piena survivability e la gestione diretta da parte di Google o di partner selezionati. Questa soluzione offre alle aziende un controllo totale sui loro dati, assicurando al contempo la capacità di adattarsi rapidamente a eventuali cambiamenti nelle normative. 

Oltre all'intelligenza artificiale, Google sottolinea l'importanza dell'ottimizzazione e della sostenibilità per tutti i carichi di lavoro eseguiti nel cloud. In questa ottica, introduce nuove opzioni di calcolo, tra cui Google Axion, la sua prima CPU basata su Arm destinata ai data center, che promette un incremento prestazionale fino al 50% e un'efficienza energetica fino al 60% superiore rispetto alle attuali soluzioni basate su x86. 

Le novità includono anche due nuove serie di macchine virtuali, N4 e C4; forme native di macchine bare-metal nella famiglia C3; infine, la disponibilità generale di Hyperdisk Advanced Storage Pools, e altro ancora. 

Infine, Google estende la residenza dei dati per l'IA generativa a 11 nuovi paesi, tra cui l'Italia, offrendo ai clienti maggiore controllo sulla localizzazione dei loro dati e facilitando il rispetto dei requisiti normativi globali. 

Queste iniziative rafforzano la posizione di Google nell'innovazione cloud e nell'intelligenza artificiale, e  offrono alle aziende gli strumenti per navigare l'evoluzione tecnologica con maggiore sicurezza, efficienza e sostenibilità. 

L’importanza degli agenti Vertex AI 

Vertex AI di Google è una piattaforma di machine learning basata su cloud che semplifica lo sviluppo, l'addestramento e l'implementazione di modelli di intelligenza artificiale. Aiuta le aziende e gli sviluppatori a costruire modelli di intelligenza artificiale personalizzati e su larga scala, offrendo una serie completa di strumenti che coprono l'intero processo, dalla gestione dei dati alla distribuzione finale del modello. 

Ebbene, Google Cloud ha annunciato un'importante espansione nella sua offerta di modelli Vertex AI, mettendo sul tavolo una gamma ancora più ampia di strumenti avanzati per l'elaborazione e l'analisi dei dati. Ciò rappresenta un salto qualitativo nell'accessibilità e nella personalizzazione dell'intelligenza artificiale, grazie a oltre 130 modelli sia proprietari che di terze parti. 

Tra le novità più significative c'è Gemini 1.5 Pro, che si distingue per la sua capacità di gestire due diverse dimensioni di finestre contestuali: 128k token o 1 milione di token. Questa caratteristica rende Gemini 1.5 Pro uno strumento estremamente potente per l'elaborazione di grandi volumi di dati, come un'ora di video, undici ore di audio, codici sorgente con più di 30.000 linee o testi lunghi oltre 700.000 parole. 

Inoltre, viene introdotta la nuova famiglia di modelli Claude 3 di Anthropic, che si posiziona all'avanguardia nel settore e che è già generalmente disponibile per i clienti su Vertex AI. Un'altra aggiunta è CodeGemma, una versione ottimizzata di Gemma, progettata specificamente per casi d'uso legati alla codifica, come la generazione di codice e l'assistenza al codice, ampliando le possibilità per gli sviluppatori software. 

La tecnologia text-to-image più avanzata di Google è Imagen 2, che introduce funzionalità avanzate di creazione di immagini, compresa la capacità di generare immagini animate e gif. Questo strumento si arricchisce anche di funzionalità di editing fotografico come l'inpainting e l'outpainting, oltre a nuove opzioni di sicurezza come il digital watermarking, reso possibile grazie a SynthID di Google DeepMind, ora disponibile per le immagini generate da Imagen 2. 

Quando si parla di IA, col termine “grounding” ci si riferisce alla capacità di un’intelligenza artificiale di collegare i concetti simbolici, astratti o linguistici a esperienze concrete nel mondo reale. In altre parole, è la sua capacità di dare significato ai simboli in relazione al mondo fisico e alle nostre interazioni con esso. 

Fatta questa premessa è più facile spiegare che Vertex AI estenderà le sue capacità di grounding in due modi. Da un lato, il grounding dei modelli nella Ricerca Google consente di combinare i modelli di base di Google con l'accesso a informazioni aggiornate e di alta qualità, migliorando notevolmente la completezza e l'accuratezza delle risposte. Dall'altro, anche i dati aziendali possono essere utilizzati per collegare i modelli a database di Google come AlloyDB e BigQuery. 

Le nuove funzionalità di Machine Learning Operations come gli Strumenti di Prompt Management, l'Automatic side-by-side e le Funzionalità di Rapid Evaluation, migliorano ulteriormente il processo di sviluppo, facilitando la valutazione e l'ottimizzazione dei modelli. 

Infine, Vertex AI Agent Builder rappresenta un punto di svolta nella creazione e implementazione di agenti di intelligenza artificiale generativa, combinando modelli di base, la Ricerca Google e altri strumenti in una console integrata che semplifica lo sviluppo di soluzioni IA complesse. 

Con queste innovazioni, Google Cloud non solo semplifica lo sviluppo e l'implementazione di soluzioni basate sull'intelligenza artificiale, ma apre anche nuove strade per l'assistenza al codice orientata alle imprese con Gemini Code Assist, promettendo un impatto significativo sulla produttività degli sviluppatori e sulla qualità del codice prodotto. 

Combinare il meglio dell'IA coi dati aziendali 

L’impegno di Google Cloud a innovare il modo in cui le aziende utilizzano l'intelligenza artificiale, appare evidente. Così come lo è il fatto che l’obiettivo è abilitare la fusione tra la potenza dell'IA e i dati aziendali, in modo sicuro e privato. 

Per riuscirci Google pone enfasi sulla integrazione dell’intelligenza artificiale di Gemini in BigQuery, che trasforma l'approccio dei team che si occupano di dati nella preparazione, scoperta, analisi e gestione delle informazioni. Questa nuova funzionalità, accompagnata dal BigQuery Data Canvas, propone un'interfaccia intuitiva simile a un blocco note, arricchita da capacità di elaborazione in linguaggio naturale e visualizzazioni integrate, attualmente disponibili in anteprima. 

Gemini trova applicazione anche nei database, semplificando la migrazione sicura dei dati dai sistemi legacy a soluzioni cloud moderne come AlloyDB, un servizio di database offerto da Google Cloud, progettato specificamente per applicazioni che richiedono elevate prestazioni, scalabilità e affidabilità. 

Nel contesto di Looker, una piattaforma di business intelligence e analisi dei dati, Google introduce in anteprima alcune funzionalità che permettono una più facile integrazione degli agenti di dati nei flussi di lavoro aziendali, insieme a nuove capacità di IA generativa integrate con Google Workspace. 

L’IA al servizio della sicurezza informatica

La sicurezza informatica trarrà beneficio dall'IA generativa, in grado di potenziare gli agenti di sicurezza fornendo assistenza in ogni fase. Le soluzioni nel portfolio di sicurezza di Google Cloud mirano a rendere i risultati più efficaci e a consentire alle aziende di considerare Google come un'estensione del proprio team di sicurezza

Un esempio è l’utilizzo di Gemini nella Threat Intelligence, che è in grado di effettuare analisi approfondite del comportamento degli attori delle minacce grazie alla capacità di esaminare campioni di codice molto estesi, comprendendo meglio le reali intenzione di alcune parti di codice.

Gemini trova poi applicazione anche nelle Security Operation con la capacità di trasformare il linguaggio umano in allerte, suggerire gli interventi opportuni e orientare gli utenti utilizzando una chat interattiva.

 Inoltre, Gemini nel Security Command Center riassume gli avvisi critici, offrendo raccomandazioni per la risoluzione di potenziali vulnerabilità in attacchi simulati.

 Gli effetti di Google Workspace sulla produttività

L'aumento della produttività è al centro delle nuove proposte di Google Workspace, con Gemini che si integra in strumenti come Gmail, Documenti e Fogli. Tra le novità, Google Vids emerge come una soluzione innovativa per la creazione di contenuti video professionali, fornendo un assistente unico per scrittura, produzione ed editing di video.

L’ applicazione permette anche di definire il voiceover, scegliendo tra le voci fuori campo preimpostate.

Accessibile da un browser, Google Vids si affiancherà agli strumenti di Google Workspace e sarà lanciato su Workspace Labs a giugno, e promette di trasformare chiunque in un abile narratore nel contesto professionale.

Google vuole introdurre anche un componente aggiuntivo per le riunioni e la messaggistica basato sull'IA, che offre funzionalità come la presa di appunti automatizzata, la sintesi delle chat e la traduzione in tempo reale, a un costo di $10 per utente al mese

Farà la sua comparsa anche un nuovo componente aggiuntivo per la sicurezza basato sull’IA che consente agli amministratori di Workspace di classificare e proteggere automaticamente i file e i dati sensibili, integrando la privacy e controlli personalizzati per la prevenzione della perdita di dati, anche questo al prezzo di $10 al mese per utente.