NVIDIA Grace CPU Superchip: 144 core ARM per battere AMD EPYC

NVIDIA punta a scalzare la supremazia delle CPU in ambito data center partendo con il suo NVIDIA Grace CPU Superchip, dotato di 144 core ARM.

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Editor

In occasione della GTC 2022, Jensen Huang, CEO di NVIDIA, ha presentato il Grace CPU Superchip a 144 core, il primo chip ARM costituito solo da core CPU dell'azienda progettato per i data center.

Grace CPU Superchip è costituito da due chip da 72 core collegati tra loro tramite NVLink-C2C, fornendo una connessione coerente da 900 GB/s che li fonde in un'unica unità da 144 core. Inoltre, il Superchip, basato su ARM v9 Neoverse, supporta le Scalable Vector Extensions (SVE), istruzioni SIMD che aumentano le prestazioni e funzionano in modo simile ad AVX.

Grace CPU Superchip consuma un picco di 500W sia per le due CPU che per la memoria a bordo. Si tratta di un consumo decisamente competitivo per il mercato data center, soprattutto se messo a confronto con i suoi diretti concorrenti, come i processori AMD EPYC. Ognuna delle due CPU ha accesso ad otto package LPDDR5X e il dispositivo viene fornito con 396MB di cache on-chip, sebbene non sia stato specificato se la cache sia condivisa o dedicata per ogni singola CPU. Grace CPU Superchip offre fino a 1TB/s di larghezza di banda, mentre le memorie LPDDR5X ECC sono distribuite in 16 package per un totale di 1TB.

Passando ai benchmark, NVIDIA ha affermato che la CPU Grace Superchip è 1,5 volte più veloce nel benchmark SPECrate_2017_int_base rispetto ai due precedenti processori EPYC Rome 7742 a 64 core che utilizza nei suoi sistemi DGX A100. L’azienda ha basato questa affermazione su una simulazione pre-silicon che prevede la CPU Grace con un punteggio di 740+ (370 per chip). L'attuale generazione di chip EPYC Milan è in grado di raggiungere punteggi che vanno da 382 a 424 a testa, il che significa che i chip x86 di fascia più alta saranno comunque più potenti, ma l’efficienza rimane un grosso vantaggio della soluzione NVIDIA.

Le due CPU Grace comunicano attraverso l’interfaccia NVLink Chip-to-Chip (C2C), che supporta la coerenza della memoria a bassa latenza, permettendo ai dispositivi collegati di lavorare sullo stesso pool di memoria simultaneamente. NVIDIA ha asserito che NVLink-C2C può fornire fino a 25 volte più efficienza energetica ed è 90 volte più efficiente nell'area rispetto al PCIe 5.0 PHYs che l’azienda usa attualmente, supportando fino a 900 GB/s di throughput o superiore. Inoltre, questa interfaccia supporta protocolli standard del settore come CXL e AMBA Coherent Hub Interface (CHI) di ARM, nonché vari tipi di connessioni.

Il supporto per AMBA CHI è importante e Neoverse supporta Arm Coherent Mesh Network (CMN-700) che legherà insieme i progetti N2 con interfacce intelligenti ad alta larghezza di banda e bassa latenza ad altri additivi della piattaforma, come DDR, HBM e varie tecnologie di accelerazione, utilizzando una combinazione di protocolli standard del settore, come CCIX, CXL e PCIe.

Grace CPU Superchip è destinato a compiti come hyperscale computing, cloud, data analytics, HPC e carichi di lavoro AI. Il prodotto supporterà l'intero stack CUDA di NVIDIA ed eseguirà l'intera gamma di applicazioni proprietarie, tra cui NVIDIA RTX, NVIDIA AI, HPC e Omniverse. Le spedizioni inizieranno nella prima metà del 2023.