Non esiste solo NVIDIA: Intel Gaudi 2 va fortissimo nell’IA generativa

Nuovi benchmark mettono in luce la competitività di Intel Gaudi 2, che offre lo stesso rapporto prezzo/prestazioni di NVIDIA H100.

Avatar di Marco Pedrani

a cura di Marco Pedrani

Managing Editor

L'intelligenza artificiale è dominata da NVIDIA, ma l'azienda di Huang non è l'unica a offrire prodotti competitivi: Intel ha svelato i risultati ottenuti nel benchmark MLPerf dal proprio acceleratore Gaudi 2 e dalle CPU Xeon Emerald Rapids, mostrano un rapporto prezzo/prestazioni al pari, o perfino migliore, di quello di NVIDIA H100. 

Un elemento che rende Gaudi 2 senza dubbio molto competitivo e interessante per le aziende votate all'IA generativa. Intel da tempo sta perfezionando le performance dei suoi acceleratori per AI attraverso il framework OneAPI; secondo i risultati di MLPerf, le soluzioni di Intel sono molto competitive in Stable Diffusion e Llama-70B, dove Gaudi 2 riesce perfino a superare H100 in determinati carichi di IA generativa.

Per eseguire i test Intel ha usato una configurazione con 8 acceleratori Gaudi 2, confrontati con 8 NVIDIA H100, paragonando le prestazioni in FP8 e INT8; mentre le GPU H100 di NVIDIA dimostrano prestazioni superiori, con aumenti notevoli sia nel server che nella generazione offline, è nel rapporto prezzo/prestazioni che gli acceleratori Intel Gaudi 2 eccellono, risultando così molto competitivi. 

Questo posizionamento vantaggioso è rafforzato dalla recente collaborazione di Intel con Qualcomm e Google, mirata a sfidare il dominio di NVIDIA CUDA nell'IA attraverso OneAPI. Ciò potrebbe portare a ulteriori ottimizzazioni e miglioramenti, specialmente con l'arrivo degli acceleratori IA Gaudi 3 e dei chip Falcon Shores di prossima generazione.

Oltre agli acceleratori, Intel ha condiviso i risultati ottenuti in MLPerf v4.0 per la sua famiglia di CPU Xeon di 5ª generazione, denominate Emerald Rapids. Questi risultati delineano significativi miglioramenti rispetto alla generazione precedente, con guadagni che possono arrivare fino al 1.9x e un incremento medio del 42% in una varietà di carichi di lavoro.