Recensione Nvidia Titan X 12GB Pascal GP102

Ecco GP102

Nvidia ha svelato nelle scorse settimane, un po' a sorpresa, la nuova Titan X basata su una GPU Pascal chiamata GP102. Questo core grafico ha 3584 CUDA core affiancati da 12 GB di memoria GDDR5X su un bus a 384 bit. Come potrete intuire il prezzo è alto: si parla di 1329 euro.

Il prezzo ha scatenato polemiche: si paga infatti all'incirca 70% in più di una GTX 1080 per il 40% dei CUDA core in più e un incremento del bandwidth di memoria del 50%. Sapevamo, persino prima di ricevere la scheda video, che le prestazioni non sarebbero aumentate di pari passo al costo. Nonostante tutto però non vedevamo l'ora di metterla alla prova. La GTX Titan X migliora il frame rate in 4K in modo tale da soddisfare chi non ritiene la GTX 1080 sufficiente per giocare alla massima qualità? Scopriamolo insieme.

GP102: come GP104 ma più grande

Con la GeForce GTX 1080 Nvidia ci ha presentato il chip grafico Pascal di fascia alta GP104. La GPU prendeva il posto del GM204, la soluzione di fascia alta Maxwell e cuore della GTX 980. Poiché l'architettura Pascal è stata prodotta a 16 nanometri FinFET e accoppiata a memoria GDDR5X, la GTX 1080 non ha avuto problemi a offrire oltre il 30% di prestazioni in più rispetto alla GTX 980 Ti e alla Titan X, entrambe dotate di GPU GM200 - Maxwell di fascia ultra high-end.

gp102 block diagram — GP102, diagramma a blocchi - clicca per ingrandire

Sapevamo che qualcosa di più "complesso e potente" sarebbe arrivato. Nvidia aveva già annunciato una GPU chiamata GP100 con oltre 15 miliardi di transistor, che tuttavia ha scelto di relegare al mondo del calcolo (Tesla). Per la prima volta l'azienda ha scelto di creare una GPU intermedia, un prodotto tra il GP100 e il GP104. L'azienda l'ha chiamato, senza fantasia, GP102 e architetturalmente ci troviamo davanti a un core simile al GP104, solo più grande.

Quattro Graphics Processing Clusters sono diventati sei. E a loro volta 20 Streaming Multiprocessors sono diventati 30. E con 128 CUDA core FP32 per SM, GP102 offre fino a 3840 blocchi programmabili. GP102 è incredibilmente complesso - è formato da 12 miliardi di transistor - e per migliorare le rese Nvidia ha disabilitato due SM sulla sua Titan X, riducendo il numero di CUDA core attivi a 3584. Dato che ogni SM ospita anche 8 unità texture, abbiamo un totale di 224 TMU.

Le specifiche della GTX Titan X indicano un base clock di 1417 MHz, con una frequenza tipica in GPU Boost di 1531 MHz. Questo permette alla scheda di offrire una potenza FP32 di oltre 10,1 TFLOPs, all'incirca il 23% in più di una GTX 1080. Il maggior potenziale di shading/texturing di GP102 ha richiesto un ribilanciamento. Perciò il back-end del chip è cresciuto fino a includere 12 controller di memoria a 32 bit, ognuno legato a otto ROPs e 256 KB di cache L2 (come in GP104), portando a un totale di 96 ROPs e 3MB di cache condivisa. Questo ci restituisce un bus aggregato a 384 bit, che Nvidia ha popolato con 12 GB della stessa GDDR5X a 10 Gbps che troviamo sulla GTX 1080.

Il bandwidth di memoria teorico della scheda è 480 GB/s (contro i 320 GB/s della GTX 1080, un aumento del 50%), anche se il throughput effettivo potrebbe essere più alto tenendo conto dei miglioramenti alla compressione delta color dell'architettura Pascal.

Perché si continuano a usare le GDDR5 quando AMD ci ha mostrato più di un anno fa i benefici della HBM? Possiamo solo immaginare che durante la fase di progettazione di GP102 Nvidia non fosse sicura della disponibilità di HBM2, e così ha scelto di puntare sul sicuro con le GDDR5. GP100 rimane l'unica GPU nella sua linea a supportare HBM2.

GPU	Titan X (GP102)	GeForce GTX 1080 (GP104)	Titan X (GM100)
SM	28	20	24
CUDA Core	3584	2560	3072
Base Clock	1417 MHz	1607 MHz	1000 MHz
GPU Boost Clock	1531 MHz	1733 MHz	1075 MHz
GFLOPs (Base Clock)	10,157	8228	6144
Texture Unit	224	160	192
Texel Fill Rate	342,9 GT/s	277,3 GT/s	192 GT/s
Memoria	12 GB	8 GB	12 GB
Data rate memoria	10 Gb/s	10 Gb/s	7 Gb/s
Bandwidth memoria	480 GB/s	320 GB/s	336.5 GB/s
ROPs	96	64	96
Cache L2	3MB	2MB	3MB
TDP	250W	180W	250W
Transistor	12 miliardi	7,2 miliardi	8 miliardi
Dimensione die	471 mm²	314 mm²	601 mm²
Processo produttivo	16nm	16nm	28nm

È interessante vedere come Nvidia, apparentemente all'ultimo minuto, abbiamo scelto di distanziare la Titan X dalla famiglia GeForce. La pagina dedicata su geforce.com parla della scheda video definitiva. Non della scheda video da gioco definitiva. Malgrado questa scelta di marketing, la Titan X dovrebbe essere più che valida nel gaming.

La decisione dell'azienda di svelare la scheda durante un evento sull'intelligenza artificiale a Stanford evidenzia il focus sul deep learning. A tal fine, mentre FP16 e FP64 sono tristemente lenti su GP104 (e per estensione su GP102), entrambi i processori supportano INT8 a 4:1, portando a 40,6 TOPS alla frequenza base della Titan X.