Due GPU GF110 a piena potenza
Nvidia voleva usare assolutamente due processori grafici GF110 al massimo della potenza, e così è stato. Come probabilmente già saprete (GeForce GTX 580 e GF110: GTX 480 è solo un ricordo), un chip GF110 completo ha quattro Graphics Processing Clusters, ognuno con quattro Streaming Multiprocessors. Troverete 32 CUDA core in ogni SM, per un totale di 512 core per GPU. Ogni SM offre inoltre quattro unità texture, per un totale di 64 in un solo chip. C'è anche un PolyMorph Engine per SM, anche se come abbiamo visto in passato, l'approccio di Nvidia alla parallelizzazione della geometria non scala sempre bene.
Architettura della GPU GF110 - clicca per ingrandire
Il back-end della GPU è formato da sei partizioni ROP, ognuna in grado di instradare otto integer pixel a 32 bit alla volta, aggiungendo fino a 48 pixel per clock. Un bus di memoria aggregato di 384 bit è divisibile in un sestetto d'interfacce a 64 bit, e troverete 256 MB di memoria GDDR5 per ognuno. Questo porta ad avere fino a 1,5 GB di memoria per GPU, quindi ecco da dove nascono i 3 GB della GeForce GTX 590.
Nvidia ha collegato i due chip GF110 della GTX 590 con un bridge NF200, che prende una singola interfaccia PCI Express 2.0 a 16 linee e la moltiplica per avere due canali a 16 linee - uno per ogni GPU.
GeForce GTX 590 | GeForce GTX 580 | Radeon HD 6990 | Radeon HD 6970 | Radeon HD 6950 | |
---|---|---|---|---|---|
Processo produttivo | 40 nm TSMC | 40 nm TSMC | 40 nm TSMC | 40 nm TSMC | 40 nm TSMC |
Die | 2 x 520 mm² | 520 mm² | 2 x 389 mm² | 389 mm² | 389 mm² |
Transistor | 2 x 3 billion | 3 billion | 2 x 2.64 billion | 2.64 billion | 2.64 billion |
Frequenza core | 607 MHz | 772 MHz | 830 MHz | 880 MHz | 800 MHz |
Stream Processor / CUDA Core | 1024 | 512 | 3072 | 1536 | 1408 |
Potenza di calcolo | 2.49 TFLOPS | 1.58 TFLOPS | 5.1 TFLOPS | 2.7 TFLOPS | 2.25 TFLOPS |
Unità texture | 128 | 64 | 192 | 96 | 88 |
Texture Fillrate | 77.7 Gtex/s | 49.4 Gtex/s | 159.4 Gtex/s | 84.5 Gtex/s | 70.4 Gtex/s |
ROP | 96 | 48 | 64 | 32 | 32 |
Pixel Fillrate | 58.3 Gpix/s | 37.1 Gpix/s | 53.1 Gpix/s | 28.2 Gpix/s | 25.6 Gpix/s |
Memoria | 2 x 1.5 GB GDDR5 | 1.5 GB GDDR5 | 2 x 2 GB GDDR5 | 2 GB GDDR5 | 2 GB GDDR5 |
Frequenza memoria | 853 MHz | 1002 MHz | 1250 MHz | 1375 MHz | 1250 MHz |
Bandwidth |
2 x 163.9 GB/s (384-bit) | 192 GB/s (384-bit) | 2 x 160 GB/s (256-bit) | 176 GB/s (256-bit) | 160 GB/s (256-bit) |
TDP | 365 W | 244 W | 375 W | 250 W | 200 W |
Che cosa è cambiato dalla GTX 480 con chip GF100 al GF110?
La GPU è in gran parte la stessa. Non rappresenta un cambiamento come quello visto dal GF100 al GF104, dove gli Shader Multiprocessors erano stati riorientati per migliorare le prestazioni a prezzi popolari (leggasi: più potenza di texturing). L'enfasi qui rimane sul calcolo. Effettivamente ci sono solo due cambiamenti: filtering full-speed FP16 ed efficienza Z-cull migliorata.
GF110 può eseguire il texture filtering FP16 in un solo ciclo di clock (in modo simile al GF104), mentre GF100 richiede due cicli. Nella applicazioni texturing-limited, questo miglioramento si traduce in incrementi prestazionali. I passi avanti nel culling danno al GF110 un vantaggio nei titoli che soffrono di molto overdraw, aiutando a massimizzare il bandwidth di memoria disponibile. In un'ottica di confronto clock per clock, Nvidia afferma che questi miglioramenti hanno un impatto positivo di circa il 14 percento.
Clicca per ingrandire
Stiamo parlando di due GPU prodotte a 40 nanometri e che raggiungono 3 miliardi di transistor ciascuna. Con un'area di 520 millimetri quadrati, il GF110 è molto più grande di una soluzione AMD Cayman, che misura 389 mm² ed è composta da un massimo di 2,64 miliardi di transistor.
È bello avere tutte queste risorse, moltiplicate per due, sulla GeForce GTX 590. Tuttavia mentre la GTX 580 lavora a 772 MHz per il core e 1002 MHz per la memoria, le GPU della GTX 590 sono state rallentate a 607 MHz, mentre la memoria lavora a 853 MHz.
Il risultato è che le prestazioni di questa scheda non sono al livello di due GTX 580. Questo, però, potrebbe essere un bene. Dopotutto la Radeon HD 6970 è il contendente della GTX 570; la GTX 580 occupa una fascia tutta sua. Quindi, anche se la Radeon HD 6990 è in grado di raddoppiare - quasi - le prestazioni della scheda AMD a singola GPU più veloce, la GeForce GTX 590 non deve fare la stessa cosa per essere competitiva al prezzo di 600/650 euro stabilito da AMD.
Sappiamo quello che ha dovuto fare AMD per avere la scheda grafica più veloce al mondo. Come ha risposto Nvidia?