Nvidia non vuole mollare la Cina, si inventa nuove GPU per aggirare i divieti

Nvidia potrebbe presto inserire tre nuovi modelli "depotenziati" e creati per superare le restrizioni.

Avatar di Luca Rocchi

a cura di Luca Rocchi

Managing Editor

Secondo quanto riportato in rete, Nvidia è al lavoro su tre nuove unità di elaborazione grafica progettate per applicazioni di intelligenza artificiale (IA) e calcolo ad alte prestazioni (HPC) mirate al mercato cinese. Questa mossa è motivata dalla necessità di conformarsi ai rigidi requisiti di esportazione degli Stati Uniti. Le nuove GPU saranno progettate sulle architetture Ada Lovelace e Hopper, secondo le informazioni trapelate.

Le tre nuove GPU in questione sono denominate HGX H20, L20 PCle e L2 PCle, e sono già destinate ai produttori di server cinesi, secondo quanto emerso. Tuttavia, le informazioni su HGX H20 sono ancora non ufficiali, come mostrato da una diapositiva pubblicata da HKEPC, che suggerisce una memoria HBM3 da 96 GB basata sull'architettura Hopper. 

In termini di prestazioni, l'HGX H20 offre 1 FP64 TFLOPS per HPC, in contrasto con i 34 TFLOPS offerti dalla H100. Per quanto riguarda FP16/BF16 TFLOPS, l'HGX H20 raggiunge i 148, mentre la H100 arriva a 1.979 TFLOPS. È importante notare che la GPU di punta di Nvidia, la H100, potrebbe essere ridotta nel prezzo a causa delle restrizioni statunitensi, rendendo l'HGX H20 una scelta più economica. Le GPU AI e HPC PCIe L20 e L2 sembrano derivare dalle GPU AD102 e AD104 di Nvidia e sono destinate agli stessi mercati dei prodotti L40 e L40S.

Negli ultimi due anni, gli Stati Uniti hanno applicato restrizioni severe sulle esportazioni di hardware ad alte prestazioni verso la Cina; le restrizioni mirano a impedire alle entità cinesi di costruire supercomputer con prestazioni superiori a 100 PetaFLOPS FP64 entro uno specifico volume. Per adeguarsi a tali regole, Nvidia ha dovuto apportare modifiche alle sue GPU A800 e H800.

Le recenti restrizioni, applicate a novembre 2023, richiedono licenze di esportazione per tutto l'hardware che raggiunge determinate prestazioni di elaborazione totale e/o densità di prestazioni, senza distinzioni sulla connettività inter-GPU. Di conseguenza, le nuove GPU HGX H20, L20 PCle e L2 PCle avranno non solo connettività NVLink ridotta, ma anche prestazioni inferiori.

Un elemento interessante è il recente lancio delle GPU AI e HPC A800 e H800 da parte di Nvidia negli Stati Uniti, rivolte a implementazioni e workstation AI aziendali su scala ridotta. Questo può essere visto come un modo per smaltire l'inventario, ora che non è più possibile venderle a entità cinesi senza una licenza di esportazione da parte del governo degli Stati Uniti.