Intel presenta l'acceleratore Gaudi 3 per l'addestramento e l'inferenza dell'IA

In occasione dell'Intel Vision 2024, Intel ha annunciato l'acceleratore Gaudi 3 che rappresenta un passo avanti significativo nella formazione e nell'inferenza dell'IA.

Avatar di Marina Londei

a cura di Marina Londei

Editor

In occasione di Intel Vision 2024, Intel ha annunciato Gaudi 3, il nuovo acceleratore di intelligenza artificiale che promette prestazioni superiori a quelle di Nvidia. Prodotto con processo produttivo a 5nm, l'acceleratore velocizzerebbe le fasi di addestramento e inferenza dal 35% al 60% rispetto ai competitor.

“Grazie al silicio, l’innovazione avanza a un ritmo senza precedenti e ogni azienda sta rapidamente adottando intelligenza artificiale. Intel sta portando l’intelligenza artificiale in ogni parte dell’azienda, dal PC al data center fino all’edge" ”, ha affermato Pat Gelsinger, CEO di Intel.

"Le nostre ultime piattaforme Gaudi, Xeon e Core Ultra offrono un insieme coerente di soluzioni flessibili su misura per soddisfare le mutevoli esigenze dei nostri clienti e partner e sfruttare le immense opportunità che si presentano per il futuro".

Il nuovo Gaudi 3

Gaudi 3 alimenterà i sistemi di intelligenza artificiale contando su decine di migliaia di acceleratori collegati tramite Ethernet. Intel promette una potenza di calcolo quattro volte superiore per BF16 e un'ampiezza di banda della memoria superiore di 1,5 rispetto al predecessore. 

Gaudi3 è pensato per supportare l'addestramento e l'inferenza dell'IA per aziende globali che vogliono implementare la tecnologia su larga scala. 

Comparato a Nvidia H100, Gaudi 3 promette un time-to-train più veloce in media del 50% sui modelli Llama2 con parametri 7B e 13B e sul modello GPT-3 con 175B di parametri. Il throughput di inferenza supererà invece l'H100 del 50% in termini di prestazioni medie e del 40% in termini di efficienza energetica media dell'inferenza dell'inferenza tra i parametri Llama 7B e 70B e i modelli di parametri Falcon 180B.

Gaudi 3 offre un software aperto community based e reti Ethernet standard. L'acceleratore permette alle imprese di scalare velocemente da singolo nodo fino a cluster con migliaia di nodi. 

Gaudi 3 sarà disponibile per gli OEM a partire dal secondo trimestre del 2024.

Le soluzioni di IA di Intel creano valore per i clienti

Nel corso dell'evento Intel ha condiviso la propria strategia per la realizzazione di sistemi di IA aperti e scalabili, comprensivi di hardware, software, framework e strumenti. L'obiettivo è creare un ecosistema ampio e aperto di attori del settore IA e di offrire soluzioni che soddisfano le esigenze GenAI specifiche dell’azienda.

Il progetto include produttori di apparecchiature, fornitori di database, integratori di sistemi e fornitori di software e servizi per consentire alle aziende di accedere a partner e soluzioni dell'ecosistema che già conoscono e di cui si fidano.

Tra i nomi principali che si sono affidati ai prodotti e ai servizi di di Intel per implementare soluzioni di IA generativa ci sono Bosch, IBM, Roboflow, Landing AI, Infosys e IFF. 

Intel ha inoltre annunciato collaborazioni con Google Cloud, Thales e Cohesity per sfruttare le capacità informatiche riservate di Intel nelle proprie istanze cloud. Ciò include Intel Trust Domain Extensions, IntelSoftware Guard Extensions e il servizio di attestazione di Intel.

In collaborazione con Anyscale, DataStax, Huggung Face, KX Systems, MariaDB, MinIO, Qdrant, Red Hat, Redis, SAP, SAS, VMware, Yellowbrick e Zilliz, Intel ha annunciato l'intenzione di creare una piattaforma aperta per l’Enterprise IA. L’iniziativa mira a sviluppare sistemi aperti e multi-vendor che offrano facilità di implementazione, abilitati dalla generazione retrieval-augmented. Questa consente di abilitare le grandi fonti di dati proprietarie delle aziende che funzionano su soluzioni standard e sicure basate su Intel Xeon con funzionalità LLM aperte.

Inizialmente la compagnia rilascerà implementazioni di riferimento per le pipeline di IA generativa su soluzioni basate su Intel Xeon e Gaudi, pubblicherà un quadro concettuale tecnico e continuerà ad aggiungere capacità infrastrutturale in Intel Tiber Developer Cloud per lo sviluppo dell'ecosistema e la convalida di RAG e pipeline future. 

Gli altri annunci di Intel

Intel ha anche annunciato il nuovo brand di processori Xeon 6, pensato per migliorare le prestazioni delle attuali soluzioni di intelligenza artificiale generativa che sfruttano i dati proprietari delle aziende per produrre risultati di business specifici. 

Del nuovo brand fanno parte gli Intel Xeon 6 con E-core che promettono un miglioramento delle prestazioni per watt di 2,4 volte e densità rack migliore di 2,7 volte rispetto ai processori Intel Xeon di seconda generazione. 

Nel brand troviamo anche gli Intel Xeon 6 con P-core che incorporano il supporto software per il formato dati MXFP4, il quale riduce la latenza del token successivo fino a 6,5 volte rispetto allo Xeon di quarta generazione che utilizza FP16, con la possibilità di eseguire 70 miliardi di modelli Llama-2 con parametri7.

Gli Intel Xeon 6 con i nuovi Efficient-core (E-core) saranno disponibili a partire da questo trimestre, mentre gli Xeon 6 con performance Performance-core arriveranno subito dopo gli E-core.

Intel ha inoltre aggiornato la propria roadmap per edge e connettività con i processori Intel Core Ultra che offrono nuove funzionalità per la produttività, la sicurezza e la creazione di contenuti.

La famiglia di processori client Intel Core Ultra di nuova generazione (nome in codice Lunar Lake), promette più di 100 operazioni TOPS di piattaforma al secondo e più di 45 TOPS di unità di elaborazione neurale per i prossimi PC di IA di nuova generazione.

La compagnia ha anche presentato il nuovo silicio edge per le famiglie di processori Intel Core Ultra, Intel Core e Intel Atom, e GPU Intel Arc, destinati a mercati chiave tra cui vendita al dettaglio, produzione industriale e assistenza sanitaria. 

Infine, intel ha introdotto una serie di soluzioni Ethernet ottimizzare per l'IA capaci di supportare addestramento e inferenza di modelli sempre più vasti, con dimensioni che si espandono di un ordine di grandezza in ogni generazione. Le soluzioni includono Intel AI NiC (scheda di interfaccia di rete), chiplet di connettività IA per l'integrazione in XPU, sistemi basati su Gaudi e una gamma di progetti di interconnessione AI di riferimento soft e hard per Intel Foundry.

"Gli annunci di Intel a Vision 2024 sottolineano l'impegno dell'azienda nel rendere l'intelligenza artificiale accessibile, aperta e sicura per le aziende di tutto il mondo" ha comunicato l'azienda di Santa Clara. "Con queste nuove soluzioni e collaborazioni, Intel è pronta ad aprire la strada alla rivoluzione dell’intelligenza artificiale, sbloccando un valore senza precedenti per le aziende di tutto il mondo".