GK110 su GTX Titan: calcoli generici

Test - Benchmark della Nvidia GeForce GTX Titan, scheda video basata su chip GK110 e venduta a circa mille euro. Test a singola GPU, SLI e three-way SLI. È migliore di quattro GK104 messe insieme?

Avatar di Tom's Hardware

a cura di Tom's Hardware

GK110 su GTX Titan: calcoli generici

Uno dei punti più deludenti della GeForce GTX 680 riguarda le prestazioni con calcoli generici. La GPU GK104 è stata progettata con in mente i videogiochi, e questo è il motivo per cui ognuno dei suoi blocchi SMX ha solo otto unità FP64. GK110 ha invece 64 CUDA core FP64 per SMX, per un totale di 896.

Nvidia però limita di default queste unità a un ottavo della frequenza - non per fare uno sgarbo a qualcuno, ma per offrire un margine termico superiore in modo da aumentare le frequenze. Questo è il motivo per cui se volete che la scheda sfoderi il suo pieno potenziale nei calcoli generici, dovete toccare uno switch nei driver. Così facendo, per quanto abbiamo avuto modo di vedere finora, si disabilita il GPU Boost, vincolando la scheda alla sua frequenza base.

SiSoftware Sandra 2013

Iniziamo dando uno sguardo a SiSoftware Sandra 2013, e al modulo GP Processing che usa OpenCL:

La Radeon HD 7970 GHz Edition raggiunge grandi risultati in FP32. Ignoriamoli però un attimo e confrontiamo Titan a impostazioni standard con la modalità "doppia precisione" abilitata nei driver Nvidia. Da rilevare che le prestazioni FP32 scendono, in base a una riduzione rilevante della frequenza. Le prestazioni in doppia precisione, però, hanno raggiunto 1870 Mpix/s.

Convertiamo questi numeri in operazioni. Assumendo circa 11 istruzioni, la GeForce GTX Titan raggiunge circa 1,14 TFLOPS di prestazioni FP64. La Radeon HD 7970 GHz Edition si ferma a 934 GFLOPS.

Questi dati sono significativi per chi fa girare Wolfram Mathematica o alcuni altri pacchetti software che hanno bisogno di molta precisione. FP32 è molto più diffuso. Il nostro test Sandra GP mostra che AMD ha un vantaggio convincente, con 3,14 TFLOPS. Il miglior risultato di Nvidia si ha con la GeForce GTX 690, che raggiunge i 2,68 TFLOPS.

AMD non ha rivali nel modulo Cryptography, che usa OpenCL.

Il sotto-test Video Shader usa Shader Model 5.0 per generare un insieme di frattali Mandelbrot con una precisione a 32 e 64 bit. AMD ha vinto in entrambe le discipline, ottenendo una vittoria complessiva. La GeForce GTX Titan tuttavia arriva molto vicina alle prestazioni in doppia precisione della scheda Tahiti, una volta che si attiva lo switch dai driver Nvidia - anche se questo impatta sui risultati nativi in virgola mobile.

GeForce GTX Titan e Radeon HD 7970 GHz Edition offrono un bandwidth di memoria teorico identico, anche se la scheda Nvidia sembra sfruttarlo un po' di più. Al contrario, Nvidia disabilita il signaling PCI Express 3.0 sulle piattaforme Sandy Bridge-E, mentre AMD no. Questo è il motivo per cui la Radeon HD 7970 GHz Edition raggiunge maggiori velocità di trasferimento tramite l'interfaccia. Nvidia afferma che questo è un problema con il controller PCI Express di Intel che potrebbe affiorare nelle configurazioni multi-scheda, dove si verifica dello stuttering.