Nvidia Tesla P40 e Tesla P4, nate per il deep learning

Nvidia ha presentato due nuove schede acceleratrici destinate ai server per il deep learning e l'analisi dati. Tesla P40 e Tesla P4 sono basate sulle GPU GP102 e GP104.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Nvidia amplia la linea di schede acceleratrici Tesla con le nuove Tesla P40 e Tesla P4, sostitute delle soluzioni M4 e M40 basate su architettura Maxwell.

nvidia tesla

Clicca per ingrandire

Le due proposte seguono la Tesla P100, basata su GPU GP100, adottando però due GPU differenti, rispettivamente GP102 e GP104. Il primo è il core grafico che in ambito gaming è alla base della scheda video Titan X, mentre il secondo lo ritroviamo nelle GTX 1080 e 1070.

nvidia tesla p40

Clicca per ingrandire

A bordo della Tesla P40 ci sono 3840 unità shader, un numero maggiore rispetto alla Tesla P100 che ne offre 3584, tuttavia le GPU sono architetturalmente diverse: solo il GP100 può sfruttare la più veloce memoria HBM2 ed eseguire calcoli a piena velocità con operazioni full-precision (FP64) e half-precision (FP16).

La Tesla P40 ha una potenza di picco con calcoli in virgola mobile a singola precisione (FP32) di circa 12 TFLOPs. La memoria, ben 24 GB di tipo GDDR5, assicura un bandwidth di 346 GB/s. Il TDP della scheda è di 250 watt.

La Tesla P4 è basata sulla massima configurazione del core grafico GP104, quindi ha 2560 unità shader e può raggiungere una potenza di calcolo di 5,5 TFLOPs a singola precisione.

nvidia tesla p4

Clicca per ingrandire

La GPU opera a quasi 1,1 GHz, una frequenza non molto elevata, ma Nvidia ha voluto fare della Tesla P4 una scheda efficiente con un TDP massimo dichiarato di 75 watt. Il GP104 è affiancato da 8 GB di memoria GDDR5 per un bandwidth di 192 GB/s.

  Tesla P40 Tesla P4 Tesla M40 Tesla M4
CUDA Core 3840 2560 3072 1024
Freq. Base 1303 MHz 810 MHz 948 MHz 872 MHz
Freq. Boost 1531 MHz 1063 MHz 1114 MHz 1072 MHz
Freq. memoria 7,2 Gbps GDDR5 6 Gbps GDDR5 6 Gbps GDDR5 5,5 Gbps GDDR5
Bus memoria 384-bit 256-bit 384 bit 128 bit
VRAM 24GB 8GB 12GB/24GB 4GB
Single Precision (FP32) 12 TFLOPS 5,5 TFLOPS 7 TFLOPS 2,2 TFLOPS
INT8 47 TOPS 22 TOPS ? ?
TDP 250W 50W-75W 250W 50W-75W
GPU GP102 GP104 GM200 GM206

Secondo Nvidia le prestazioni rispetto alle soluzioni precedenti, nei tipici carichi dell'analisi dati e del deep learning, sono nettamente superiori, con una differenza fino a quattro volte a favore della Tesla P40 rispetto alla M40.

Le due nuove schede arriveranno sui server di Dell, Hewlett Packard Enterprise, Lenovo, Quanta, Wistron, Inventec e Inspur, con la Tesla P40 disponibile da ottobre e la P4 da novembre.

GeForce GTX 1060 3GB GeForce GTX 1060 3GB
ePRICE

GeForce GTX 1060 6GB GeForce GTX 1060 6GB
ePRICE

GeForce GTX 1070 GeForce GTX 1070
ePRICE