Schede Grafiche

GF110: Nvidia fa il lifting a Fermi

Pagina 3: GF110: Nvidia fa il lifting a Fermi

GF110: Nvidia fa il lifting a Fermi

Come abbiamo scritto nella pagina precedente il GF110 è una GPU di stampo evolutivo, che ha le proprie fondamenta nel GF100 e quindi i cambiamenti in gioco sono ridotti. Parliamo nuovamente di un chip a 40 nanometri con circa 3 miliardi di transistor.

La GPU è in gran parte la stessa. Non rappresenta un cambiamento come quello visto dal GF100 al GF104, dove gli Shader Multiprocessors erano stati riorientati per migliorare le prestazioni a prezzi popolari (leggasi: più potenza di texturing). L’enfasi qui rimane sul calcolo. Effettivamente ci sono solo due cambiamenti: filtering full-speed FP16 ed efficienza Z-cull migliorata.

Tutte le unità sul GF110 sono attive, finalmente – clicca per ingrandire

GF110 può eseguire il texture filtering FP16 in un solo ciclo di clock (in modo simile al GF104), mentre GF100 richiede due cicli. Nella applicazioni texturing-limited, questo miglioramento si traduce in incrementi prestazionali. I passi avanti nel culling danno al GF110 un vantaggio nei titoli che soffrono di molto overdraw, aiutando a massimizzare il bandwidth di memoria disponibile. In un’ottica di confronto clock per clock, Nvidia afferma che questi miglioramenti hanno un impatto positivo di circa il 14 percento.

  GeForce GTX 580 GeForce GTX 480 GeForce GTX 470
Graphics Processing Cluster (GPC) 4 4 4
Streaming Multiprocessor (SM) 16 15 14
CUDA Core 512 480 448
Texture Unit 64 60 56
ROP Unit 48 48 40
Frequenza core 772 MHz 700 MHz 607 MHz
Frequenza shader 1544 MHz 1401 MHz 1215 MHz
Frequenza memoria 1002 MHz (4008 MT/s) 924 MHz (3696 MT/s) 837 MHz (3348 MT/s)
Memoria 1.5 GB GDDR5 1.5 GB GDDR5 1.25 GB GDDR5
Bus 384-bit 384-bit 320-bit
Bandwidth 192.4 GB/s 177.4 GB/s 133.9 GB/s
Fillrate 49.4 GTexels/s 42.0 GTexels/s 34.0 GTexels/s
Manufacturing Process 40 nm TSMC 40 nm TSMC 40 nm TSMC
Dimensione Dual-slot Dual-slot Dual-slot
Uscite video 2 x DL-DVI, 1 x mini-HDMI 2 x DL-DVI, 1 x mini-HDMI 2 x DL-DVI, 1 x mini-HDMI

Parte del passaggio dal GF100 al GF110 coinvolge un lavoro di riprogettazione del chip. Ci sono differenti tipi di transistor che un architetto può usare per costruire un circuito integrato, a seconda delle proprietà che vuole comunicare. Gli ingegneri di Nvidia sono tornati indietro al design del GF100 e hanno volutamente modificato molto del chip, implementando transistor più lenti con meno dispersione di corrente in parti meno sensibili per quanto riguarda i tempi e transistor più rapidi, con una dispersione elevata in altre aree.

Il risultato è stato un risparmio energetico abbastanza significativo da consentire a Nvidia non solo di attivare il sedicesimo Shader Multiprocessor disabilitato nel design originale (aggiungendo 32 CUDA core, quattro unità texture e un motore geometrico PolyMorph), ma anche di aumentare le frequenze. Mentre la GeForce GTX 480 ha frequenze per core/shader/memoria di 700/1401/924 MHz, la GeForce GTX 580 ha una frequenza di 772 MHz per il core, 1544 MHz per gli shader e 1002 MHz per la memoria (che si traducono in 4008 MHz). Detto questo il GF110 offre specifiche tecniche vicine a quelle che abbiamo visto nel GF100. Include 512 CUDA core completamente funzionanti, 64 unità texture e 16 engine PolyMorph.

Il back-end indipendente non cambia affatto, a parte la frequenza più elevata della memoria. Ci sono ancora sei partizioni ROP, ognuna associata a un’interfaccia di memoria a 64 bit (per un totale di 384 bit). Ogni partizione è capace di offrire fino a otto pixel integer a 32 bit alla volta, raggiungendo complessivamente 48 pixel per clock.

###old515###old

Pagina 3: GF110: Nvidia fa il lifting a Fermi

Indice