Lo scorso mese, Nvidia aveva annunciato la sua prossima generazione di GPU Ampere A100, nello specifico la versione SXM4, destinata alle applicazioni scientifiche e data center. Ora, il colosso di Santa Clara ha annunciato la variante PCI-Express 4.0 della suddetta, dotata dello stesso processore grafico e VRAM.

Announcing the NVIDIA A100 PCIe Tensor Core GPU, enabling server makers to deliver a diverse range of #datacenter solutions for compute-intensive workloads. https://t.co/FkQB5NP8Kv #ISC20 @NVIDIADC — NVIDIA (@nvidia) June 22, 2020

La differenza principale risiede nella connettività. Lo slot PCIe 4.0 permette di inserire questa variante nella maggior parte dei PC, anziché in sistemi appositamente progettati. Ciò consente un facile aggiornamento delle infrastrutture server esistenti o l’installazione in workstation per uso scientifico. Insomma, passare da Volta ad Ampere sarà molto semplice.

“L’adozione di GPU NVIDIA A100 nelle offerte dei principali produttori di server è incredibile e ha superato di molto le nostre previsioni. Le nuove soluzioni Ampere consentiranno ai nostri clienti di scegliere le opzioni migliori per migliorare la produttività dei propri data center e un basso costo totale di proprietà“, ha dichiarato Ian Buck, VP e GM di Accelerated Computing presso NVIDIA.

Questa flessibilità ha però un costo. La variante PCIe 4 della GPU Ampere A100 ha un TDP significativamente più basso, 250W, rispetto a quello dell’SXM4, che vanta un TDP di 400W. Nvidia ha dichiarato che ciò comporterà una riduzione delle prestazioni del 10% nei carichi di lavoro single-GPU. Lo scaling multi-GPU è limitato a due schede video connesse tramite NV-Link, ma la società ha dichiarato che nei carichi di lavoro distribuiti su 8 GPU (grazie a NVSwitch), le performance calano fino al 33%.

Sembra che gran parte della potenza aggiuntiva della variante SXM venga usata per l’interconnessione tra le schede, considerato un calo per GPU del solo 10% di fronte a consumi inferiori del 37,5%. Vale la pena aggiungere che l’erogazione di energia è anche molto più semplice su SXM, poiché l’alimentazione arriva attraverso un connettore mezzanine. Al contrario, la variante da 250W riceve fino a 75W dallo slot x16, e il resto da connettori PEG a 8 o 6 pin.

Consumi e TDP a parte, le schede grafiche sono pressoché identiche. La variante PCIe 4.0 ospita 6912 CUDA core (108 Streaming Multiprocessor) e 432 Tensore core in un die di 826 mm², nonostante sia stata fabbricata con il processo produttivo a 7nm di TSMC. La GPU è ancora affiancata da cinque stack di VRAM HBM2 (per una capacità totale di 40GB) operanti con un bus a 5120 bit per una larghezza di banda di ben 1,6TB/s.