Benchmark: CUDA e OpenCL

Test della Quadro M6000 di Nvidia, basata sulla nuova GM200, nota anche come Big Maxwell. Questa GPU offre 3072 CUDA core, affiancati da 12 GB di memoria GDDR5.

Avatar di Tom's Hardware

a cura di Tom's Hardware

3DS MAX 2013 e Iray

Abbiamo mantenuto la nostra scena di rendering poco complessa in modo deliberato. Nel nostro test le prestazioni della Quadro M6000 si sono dimostrate leggermente migliori di quelle della vecchia K6000, ma riteniamo ci sia margine per una possibile ottimizzazione.

Octane 2.7

Nel caso di Octane, la differenza era all'incirca la stessa e questo ha illustra una determinata tendenza. Abbiamo usato l'ultima versione del nostro benchmark, quindi i valori di vecchie pubblicazioni non sono comparabili.

Blender 2.73

Abbiamo deliberatamente scelto una dimensione delle tile di 256 x 256 pixel, perché questo si è dimostrato ottimale per i risultati nel rendering basato sulla GPU. La Quadro M6000 emerge come un chiaro vincitore.

CUDA: FluidMark

I test sintetici sono sempre un po' sospetti, ma il risultato riflette solo ciò che è già emerso in una gamma di altri test: la Quadro M6000 domina sul resto delle soluzioni Nvidia.

OpenCL vs. CUDA: ratGPU

La migliore implementazione CUDA non è l'unico motivo per cui la Quadro M6000 ha un punteggio così alto.

OpenCL rendering: Luxmark 2.0

Abbiamo testato tre livelli di complessità. In precedenza la FirePro W9100 con GPU Hawaii era il metro di paragone, ma ora è Maxwell al vertice della catena alimentare.

OpenCL: singola precisione (FP32)

La potenza di calcolo coinvolta in singola precisione è enorme, fino a quando l'implementazione è fatta in modo perfetto. La Quadro M6000 riesce a fare ombra alla K6000 e in alcuni casi persino a sfidare e battere la FirePro W9100. I due esempi seguenti illustrano un'implementazione ottimale e una mediocre.

OpenCL: doppia precisione (FP64)

La Quadro M6000 può fare molto, ma non tutto. I calcoli in virgola mobile a doppia precisione è qualcosa in cui Maxwell è generalmente debole. Il rapporto tra FP64 e FP32 è teoricamente di 1:32. Nvidia ha fatto una scelta chiara: chi ha bisogno di elevata potenza con calcoli FP64 deve acquistare una scheda acceleratrice Tesla.