Due GPU GF110 a piena potenza

La GeForce GTX 590 di Nvidia è una scheda basata su due GPU GF110 su un unico PCB.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Due GPU GF110 a piena potenza 

Nvidia voleva usare assolutamente due processori grafici GF110 al massimo della potenza, e così è stato. Come probabilmente già saprete (GeForce GTX 580 e GF110: GTX 480 è solo un ricordo), un chip GF110 completo ha quattro Graphics Processing Clusters, ognuno con quattro Streaming Multiprocessors. Troverete 32 CUDA core in ogni SM, per un totale di 512 core per GPU. Ogni SM offre inoltre quattro unità texture, per un totale di 64 in un solo chip. C'è anche un PolyMorph Engine per SM, anche se come abbiamo visto in passato, l'approccio di Nvidia alla parallelizzazione della geometria non scala sempre bene.

Architettura della GPU GF110 - clicca per ingrandire

Il back-end della GPU è formato da sei partizioni ROP, ognuna in grado di instradare otto integer pixel a 32 bit alla volta, aggiungendo fino a 48 pixel per clock. Un bus di memoria aggregato di 384 bit è divisibile in un sestetto d'interfacce a 64 bit, e troverete 256 MB di memoria GDDR5 per ognuno. Questo porta ad avere fino a 1,5 GB di memoria per GPU, quindi ecco da dove nascono i 3 GB della GeForce GTX 590.

Nvidia ha collegato i due chip GF110 della GTX 590 con un bridge NF200, che prende una singola interfaccia PCI Express 2.0 a 16 linee e la moltiplica per avere due canali a 16 linee - uno per ogni GPU.

 

GeForce GTX 590

GeForce GTX 580

Radeon HD 6990

Radeon HD 6970

Radeon HD 6950

Processo produttivo

40 nm TSMC

40 nm TSMC

40 nm TSMC

40 nm TSMC

40 nm TSMC

Die

2 x 520 mm²

520 mm²

2 x 389 mm²

389 mm²

389 mm²

Transistor

2 x 3 billion

3 billion

2 x 2.64 billion

2.64 billion

2.64 billion

Frequenza core

607 MHz

772 MHz

830 MHz

880 MHz

800 MHz

Stream Processor / CUDA Core

1024

512

3072

1536

1408

Potenza di calcolo

2.49 TFLOPS

1.58 TFLOPS

5.1 TFLOPS

2.7 TFLOPS

2.25 TFLOPS

Unità texture

128

64

192

96

88

Texture Fillrate

77.7 Gtex/s

49.4 Gtex/s

159.4 Gtex/s

84.5 Gtex/s

70.4 Gtex/s

ROP

96

48

64

32

32

Pixel Fillrate

58.3 Gpix/s

37.1 Gpix/s

53.1 Gpix/s

28.2 Gpix/s

25.6 Gpix/s

Memoria

2 x 1.5 GB GDDR5

1.5 GB GDDR5

2 x 2 GB GDDR5

2 GB GDDR5

2 GB GDDR5

Frequenza memoria

853 MHz

1002 MHz

1250 MHz

1375 MHz

1250 MHz

Bandwidth

2 x 163.9 GB/s

(384-bit)

192 GB/s (384-bit)

2 x 160 GB/s (256-bit)

176 GB/s (256-bit)

160 GB/s (256-bit)

TDP

365 W

244 W

375 W

250 W

200 W

Che cosa è cambiato dalla GTX 480 con chip GF100 al GF110?

La GPU è in gran parte la stessa. Non rappresenta un cambiamento come quello visto dal GF100 al GF104, dove gli Shader Multiprocessors erano stati riorientati per migliorare le prestazioni a prezzi popolari (leggasi: più potenza di texturing). L'enfasi qui rimane sul calcolo. Effettivamente ci sono solo due cambiamenti: filtering full-speed FP16 ed efficienza Z-cull migliorata.

GF110 può eseguire il texture filtering FP16 in un solo ciclo di clock (in modo simile al GF104), mentre GF100 richiede due cicli. Nella applicazioni texturing-limited, questo miglioramento si traduce in incrementi prestazionali. I passi avanti nel culling danno al GF110 un vantaggio nei titoli che soffrono di molto overdraw, aiutando a massimizzare il bandwidth di memoria disponibile. In un'ottica di confronto clock per clock, Nvidia afferma che questi miglioramenti hanno un impatto positivo di circa il 14 percento.

Clicca per ingrandire

Stiamo parlando di due GPU prodotte a 40 nanometri e che raggiungono 3 miliardi di transistor ciascuna. Con un'area di 520 millimetri quadrati, il GF110 è molto più grande di una soluzione AMD Cayman, che misura 389 mm² ed è composta da un massimo di 2,64 miliardi di transistor.

È bello avere tutte queste risorse, moltiplicate per due, sulla GeForce GTX 590. Tuttavia mentre la GTX 580 lavora a 772 MHz per il core e 1002 MHz per la memoria, le GPU della GTX 590 sono state rallentate a 607 MHz, mentre la memoria lavora a 853 MHz.

Il risultato è che le prestazioni di questa scheda non sono al livello di due GTX 580. Questo, però, potrebbe essere un bene. Dopotutto la Radeon HD 6970 è il contendente della GTX 570; la GTX 580 occupa una fascia tutta sua. Quindi, anche se la Radeon HD 6990 è in grado di raddoppiare - quasi - le prestazioni della scheda AMD a singola GPU più veloce, la GeForce GTX 590 non deve fare la stessa cosa per essere competitiva al prezzo di 600/650 euro stabilito da AMD.

Sappiamo quello che ha dovuto fare AMD per avere la scheda grafica più veloce al mondo. Come ha risposto Nvidia?