GF110: Nvidia fa il lifting a Fermi
Come abbiamo scritto nella pagina precedente il GF110 è una GPU di stampo evolutivo, che ha le proprie fondamenta nel GF100 e quindi i cambiamenti in gioco sono ridotti. Parliamo nuovamente di un chip a 40 nanometri con circa 3 miliardi di transistor.
La GPU è in gran parte la stessa. Non rappresenta un cambiamento come quello visto dal GF100 al GF104, dove gli Shader Multiprocessors erano stati riorientati per migliorare le prestazioni a prezzi popolari (leggasi: più potenza di texturing). L'enfasi qui rimane sul calcolo. Effettivamente ci sono solo due cambiamenti: filtering full-speed FP16 ed efficienza Z-cull migliorata.
Tutte le unità sul GF110 sono attive, finalmente - clicca per ingrandire
GF110 può eseguire il texture filtering FP16 in un solo ciclo di clock (in modo simile al GF104), mentre GF100 richiede due cicli. Nella applicazioni texturing-limited, questo miglioramento si traduce in incrementi prestazionali. I passi avanti nel culling danno al GF110 un vantaggio nei titoli che soffrono di molto overdraw, aiutando a massimizzare il bandwidth di memoria disponibile. In un'ottica di confronto clock per clock, Nvidia afferma che questi miglioramenti hanno un impatto positivo di circa il 14 percento.
GeForce GTX 580 | GeForce GTX 480 | GeForce GTX 470 | |
---|---|---|---|
Graphics Processing Cluster (GPC) | 4 | 4 | 4 |
Streaming Multiprocessor (SM) | 16 | 15 | 14 |
CUDA Core | 512 | 480 | 448 |
Texture Unit | 64 | 60 | 56 |
ROP Unit | 48 | 48 | 40 |
Frequenza core | 772 MHz | 700 MHz | 607 MHz |
Frequenza shader | 1544 MHz | 1401 MHz | 1215 MHz |
Frequenza memoria | 1002 MHz (4008 MT/s) | 924 MHz (3696 MT/s) | 837 MHz (3348 MT/s) |
Memoria | 1.5 GB GDDR5 | 1.5 GB GDDR5 | 1.25 GB GDDR5 |
Bus | 384-bit | 384-bit | 320-bit |
Bandwidth | 192.4 GB/s | 177.4 GB/s | 133.9 GB/s |
Fillrate | 49.4 GTexels/s | 42.0 GTexels/s | 34.0 GTexels/s |
Manufacturing Process | 40 nm TSMC | 40 nm TSMC | 40 nm TSMC |
Dimensione | Dual-slot | Dual-slot | Dual-slot |
Uscite video | 2 x DL-DVI, 1 x mini-HDMI | 2 x DL-DVI, 1 x mini-HDMI | 2 x DL-DVI, 1 x mini-HDMI |
Parte del passaggio dal GF100 al GF110 coinvolge un lavoro di riprogettazione del chip. Ci sono differenti tipi di transistor che un architetto può usare per costruire un circuito integrato, a seconda delle proprietà che vuole comunicare. Gli ingegneri di Nvidia sono tornati indietro al design del GF100 e hanno volutamente modificato molto del chip, implementando transistor più lenti con meno dispersione di corrente in parti meno sensibili per quanto riguarda i tempi e transistor più rapidi, con una dispersione elevata in altre aree.
Il risultato è stato un risparmio energetico abbastanza significativo da consentire a Nvidia non solo di attivare il sedicesimo Shader Multiprocessor disabilitato nel design originale (aggiungendo 32 CUDA core, quattro unità texture e un motore geometrico PolyMorph), ma anche di aumentare le frequenze. Mentre la GeForce GTX 480 ha frequenze per core/shader/memoria di 700/1401/924 MHz, la GeForce GTX 580 ha una frequenza di 772 MHz per il core, 1544 MHz per gli shader e 1002 MHz per la memoria (che si traducono in 4008 MHz). Detto questo il GF110 offre specifiche tecniche vicine a quelle che abbiamo visto nel GF100. Include 512 CUDA core completamente funzionanti, 64 unità texture e 16 engine PolyMorph.
Il back-end indipendente non cambia affatto, a parte la frequenza più elevata della memoria. Ci sono ancora sei partizioni ROP, ognuna associata a un'interfaccia di memoria a 64 bit (per un totale di 384 bit). Ogni partizione è capace di offrire fino a otto pixel integer a 32 bit alla volta, raggiungendo complessivamente 48 pixel per clock.
###old515###old