Nvidia Quadro M6000 alla prova: GM200 Big Maxwell per il settore professionale

Test della Quadro M6000 di Nvidia, basata sulla nuova GM200, nota anche come Big Maxwell. Questa GPU offre 3072 CUDA core, affiancati da 12 GB di memoria GDDR5.

Avatar di Igor Wallossek

a cura di Igor Wallossek

Introduzione

I software CAD/CAE sulle workstation stanno sempre più beneficiando della potenza di calcolo superiore delle GPU, dato che molti di questi flussi di lavoro possono essere eseguiti insieme sullo stesso sistema. Questo permette a progettazione e simulazione in tempo reale di fondersi con una maggiore efficienza - a patto di usare la giusta scheda video.

La nuova scheda video professionale di punta, la Quadro M6000, è basata sul chip GM200 che rappresenta l'architettura Maxwell nella sua forma più complessa. La stessa GPU della GTX Titan X. Nvidia punta molto su questo prodotto per coprire più mercati possibili, dalla progettazione all'architettura, dalla visualizzazione di contenuti all'intrattenimento.

Risoluzioni come l'Ultra HD/4K (3840 x 2160 pixel) rappresentano un nuovo campo che deve essere padroneggiato per l'hardware grafico professionale, in quanto offre ai creatori di contenuti una prospettiva totalmente nuova quanto a design e presentazione del prodotto finale. C'è un valore aggiunto, persino in 2D, senza parlare degli alti livelli di dettaglio in 3D.

Diverso tempo fa AMD ha presentato la FirePro W9100 e la FirePro W8100, soluzioni molto potenti, specialmente nel segmento 4K. La mossa ha messo Nvidia in difficoltà perché la Quadro K6000 non era così efficiente, in particolare per lavorare con materiale ad alta risoluzione a risoluzione nativa e in tempo reale. Cose come i filtri su video e foto e la codifica di contenuti ad alta risoluzione richiedono molta potenza di calcolo e un'implementazione ottimale.

Anche avere diverse opzioni di connettività è importante: con il Quadro Scalable Visual Solutions (SVS), Nvidia offre la possibilità di controllare più monitor o un cluster di visualizzazione multi-nodo. Con Quadro Sync potete collegare fino a quattro M6000 - ossia connettere fino a 16 dispositivi in uscita in una catena ininterrotta. Per due schede in SLI, tuttavia, avete ancora bisogno di due schede Quadro, e non è possibile fare il mix con prodotti consumer.

Nvidia ha anche lavorato a stretto contatto con iRay e a breve saranno offerti interessanti plugin per vari programmi come Autodesk Maya, 3ds Max, Revit, Rhino e Cinema. Questi plugin saranno gratuiti per gli utenti 4D Quadro, mentre "gli utenti casalinghi" potranno acquistarli nell'Nvidia Shop.

È interessante anche la nuova modalità di rendering "Fast Interactive". Abilita un vero rendering in tempo reale nel viewports calcolato dalla Quadro M6000 - questo include anche un lavoro ottimizzato nell'uso di più GPU.

Anche gli aspetti che guardano al futuro forniscono un ulteriore valore aggiunto, come Nvidia Quadro Visual Computing Appliance (VCA), un efficiente renderizzatore cloud.

Prima di iniziare con i test effettivi, facciamo un veloce confronto dei dati principali – teorici - della Quadro M6000 con il proprio predecessore e con la top di gamma di AMD.

  Nvidia

Quadro K6000

Nvidia

Quadro K6000

AMD

FirePro W9100

Archittetura Maxwell Kepler Hawaii
Compute Unit 3072 CUDA core 2880 CUDA core 2816 stream processor
Prestazioni FP32 (SP) 7 TFLOPS 5.2 TFLOPS 5.24 TFLOPS
Prestazioni FP64 (DP) n.a. (Ratio 1:32) 1.73 TFLOPS 2.62 TFLOPS
Memoria GDDR5 12 GB 12 GB 16 GB
Bus 384 bit 384 bit 512 bit
Bandwidth memoria 317.4 GB/s 288 GB/s 320 GB/s
ECC:
Bandwidth PCI Express 32 GB/s 32 GB/s 32 GB/s
Num max. schermi 4 4 6
4K2K Display @30 Hz 4 2 6
4K2K Display @60 Hz 4 2 3
Consumi (misurati): 222 Watt con grafica

245 Watt sotto massimo carico

187 Watt con grafica

202 Watt sotto massimo carico

245 Watt con grafica

260 Watt sotto massimo carico

Il GM200 integra sei GPC (Graphics Processing Clusters), due più del GM204. Con quattro Streaming Multiprocessors per GPC, si tratta di un totale di 24 SMM integrati nella GPU. Moltiplicando questo dato per i 128 CUDA core integrati in ogni SMM si ottengono 3072 CUDA core, che sono le unità totali presenti in questa GTX Titan X. Otto unità texture per SMM portano ad avere un totale di 192 TMU.

Come gli SMM che si trovano in GM204, GM200 offre fino a 96 KB di memoria condivisa e 48KB di cache texture/L1, raddoppiando quanto offerto dal primo chip Maxwell, il GM107, integrato sulle schede GTX 750 Ti. Gli altri elementi dell'architettura, invece, sono simili; ogni SMM è suddiviso in quattro blocchi, ognuno con il proprio buffer istruction, warp scheduler e un paio di unità dispatch.

In realtà, gran parte di questi elementi sono legati alla precisione con calcoli in doppia precisione (FP64) che sono ancora un trentaduesimo della velocità con calcoli a singola precisione (FP32), anche se il GM200 è il miglior esponente della famiglia Maxwell.