Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

Com'è fatta la GPU Nvidia TU104 Turing

In modo simile al TU102 anche il TU104 è prodotto da TSMC con processo a 12 nanometri FinFET. Il suo minor numero di transistor, pari a 13,6 miliardi, porta ad avere un die più piccolo di 545 mm2. Già, piccolo ma per modo di dire. TU104 è comunque più grande di GP102 (471 mm2) e ha una dimensione simile al GK110 del 2013 a bordo della GeForce GTX Titan.

gpu tu104 turing diagramma

Clicca per ingrandire

TU104 è realizzato con gli stessi blocchi fondamentali del TU102; ne ha solo di meno. Gli Streaming Multiprocessors hanno ancora 64 CUDA core, otto Tensor core, un RT core, quattro unità texture, 16 unità load/store, 256 KB di spazio di registro e 96 KB di cache L1/memoria condivisa. I TPC sono ancora formati da due SM e un PolyMorph geometry engine. Qui però troviamo quattro TPC per GPC e sei GPC in tutto il processore. Perciò un TU104 completamente abilitato ha 48 SM, 3072 CUDA core, 384 Tensor core, 48 RT core, 192 unità texture e 24 PolyMorph engine.

Un backend allo stesso modo limitato nelle risorse alimenta le risorse di calcolo tramite otto controller di memoria a 32 bit GDDR6 (256 bit totali) collegati a 64 ROPs e 4 MB di cache L2.

TU104 perde anche un collegamento NVLink, il che lo limita a un collegamento x8 e 50 GB/s di throughput bidirezionale.

Specifiche tecniche TU104 a bordo della RTX 2080

Dopo aver visto la RTX 2080 Ti offrire prestazioni rispettabili in Battlefield V in Full HD con ray tracing attivo non possiamo che domandarci se la RTX 2080 abbia sufficiente potenza per mantenere frame rate giocabili con il ray tracing attivo.

geforce rtx 2080

Clicca per ingrandire

Un TU104 completo è limitato a 48 RT core rispetto ai 68 del TU102. Poiché però Nvidia ha spento un TPC di TU104 per creare la GeForce RTX 2080, si perdono un altro paio di RT core (insieme a 128 CUDA core, otto TMU, 16 Tensor core e così via).

  GeForce RTX 2080 FE GeForce GTX 1080 FE
Architettura (GPU) Turing (TU104) Pascal (GP104)
CUDA core 2944 2560
Potenza FP32 di picco 10.6 TFLOPS 8.9 TFLOPS
Tensor Core 368 -
RT Core 46 -
Unità texture 184 160
Freq. base GPU 1515 MHz 1607 MHz
Freq. GPU Boost 1800 MHz 1733 MHz
Memoria 8GB GDDR6 8GB GDDR5X
Bus 256-bit 256-bit
Bandwidth memoria 448 GB/s 320 GB/s
ROPs 64 64
Cache L2 4MB 2MB
TDP 225W 180W
Numero transistor 13,6 miliardi 7,2 miliardi
Dimensione die 545 mm² 314 mm²
Supporto SLI Sì (x8 NVLink) Sì (MIO)

La GeForce RTX 2080 conta quindi su 46 SM con 2944 CUDA core, 368 Tensor core, 46 RT core, 184 unità texture, 64 ROPs e 4 MB di cache L2. 8 GB di memoria GDDR6 a 14 Gbps su un bus a 256 bit spostano 448 GB/s di dati, aggiungendo oltre 100 GB/s di bandwidth rispetto alla GTX 1080.

Le RTX 2080 di riferimento e la Founders Edition hanno una frequenza base di 1515 MHz. Il modello overcloccato di Nvidia ha un GPU Boost a 1800 MHz, mentre la specifica di riferimento è 1710 MHz. Le prestazioni di calcolo di picco FP32 arrivano a 10,6 TFLOPs, un valore che pone la GeForce RTX 2080 Founders Edition dietro la GeForce GTX 1080 Ti (11,3 TFLOPS), ma ben davanti alla GeForce GTX 1080 (8,9 TFLOPS).

Come già visto per la RTX 2080 Ti, anche nel caso della RTX 2080 il modello Founders Edition, più veloce, richiede più energia. Il suo TDP di 225 W è 10 W più alto della GeForce RTX 2080 di riferimento e 45 W sopra alla GeForce GTX 1080.