Nvidia Tesla P100 PCI Express arriva entro fine anno

La Tesla P100, scheda acceleratrice con GPU Pascal GP100, sarà disponibile anche con interconnessione PCI Express e in una variante con 12 GB di memoria HBM2.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Durante la GPU Technology Conference dello scorso aprile Nvidia aveva annunciato la scheda acceleratrice Tesla P100. All'evento l'azienda si concentrò sulla variante con interconnessione NVLink, un bus di nuova generazione che dovrebbe consentire a GPU e CPU di condividere i dati con un bandwidth aggregato di 20 GB/s.

nvidia tesla p100 01

Nel corso della prima giornata dell'International Conference for High Performance Computing la casa di Santa Clara ha annunciato l'esistenza di una variante di Tesla P100 con interconnessione PCI Express. La scheda è basata sulla stessa GPU GP100 con 3584 CUDA core e 224 unità texture (sebbene il chip contenga, nella sua massima espressione 3840 CUDA core e 240 unità texture), prodotta a 16 nanometri FinFET e accompagnata da memoria HBM2.

nvidia tesla p100 02

La differenza con la proposta NVLink riguarda, in primo luogo, le frequenze di lavoro. A causa delle restrizioni al TDP dovute agli ambienti PCI Express, Nvidia ha dovuto ridurre il TDP della scheda da 300 a 250 watt. Per farlo l'azienda ha abbassato la frequenza di lavoro massima da 1480 a 1300 MHz.

nvidia tesla p100 03

Clicca per ingrandire

Il risultato è che le prestazioni della scheda acceleratrice scendono a 18,7 teraflops per i calcoli half-precision (tipici del deep learning), a 9,3 teraflops per quelli a singola precisione e a 4,7 teraflops in doppia precisione. Di conseguenza, mentre la versione di Tesla P100 con NVLink è destinata ad applicazioni "large scale", il modello con interconnessione PCI Express guarda al mondo delle workstation che devono gestire carichi meno probanti ma comunque complessi - tipici del deep learning.

NVIDIA Tesla con GP GP100
  Tesla P100

(NVLink)

Tesla P100

(PCIe, 16 GB)

Tesla P100

(PCIe, 12GB)

Stream Processor 3584 3584 3584
Freq. base 1328 MHz ? ?
Freq. boost 1480 MHz 1300 MHz 1300 MHz
Freq. memoria 1,4 Gbps HBM2 1,4 Gbps HBM2 1,4 Gbps HBM2
Bus 4096 bit 4096 bit 3072 bit
Bandwidth memoria 720 GB/s 720 GB/s 540 GB/s
VRAM 16 GB 16 GB 12 GB
Cache L2 4 MB 4 MB 3 MB
Half Precision 21,2 TFLOPS 18,7 TFLOPS 18,7 TFLOPS
Single Precision 10,6 TFLOPS 9,3 TFLOPS 9,3 TFLOPS
Double Precision 5,3 TFLOPS 4,7 TFLOPS 4,7 TFLOPS
GPU GP100 GP100 GP100
Numero transistor 15.3B 15.3B 15.3B
TDP 300W 250W 250W
Form Factor Mezzanine PCIe PCIe
Raffreddamento ? Passivo Passivo
Processo produttivo TSMC 16 nm FinFET TSMC 16 nm FinFET TSMC 16 nm FinFET
Architettura Pascal Pascal Pascal

Infine, mentre la Tesla P100 NVLink sarà disponibile solo con 16 GB di memoria HBM2, la soluzione PCIe arriverà sul mercato in due versioni, con 16 GB oppure 12 GB di memoria HBM2. Quest'ultima ha un bus a 3072 bit anziché 4096 bit e un bandwidth di 540 GB/s rispetto ai 720 GB/s della soluzione con più memoria. La disponibilità di questa scheda acceleratrice è fissata per il quarto trimestre di quest'anno.

Zotac GeForce GTX 1070 Founders Edition Zotac GeForce GTX 1070 Founders Edition
ePRICE

Palit GeForce GTX 1080 GameRock Palit GeForce GTX 1080 GameRock
ePRICE