I blocchi della costruzione

GF100 è il chip di Nvidia basato su architettura Fermi con supporto DirectX 11.

Avatar di Tom's Hardware

a cura di Tom's Hardware

I blocchi della costruzione

Perché sospettiamo che GF100 supererà il predecessore di un margine così elevato? Basta osservare le architetture. Fortunatamente, il progetto di GF100 è derivato da GT200, che è stato derivato a sua volta dalla coppia G80/G92. Se avete già familiarità con le precedenti generazioni di chip Nvidia, dovreste capire senza troppi problemi la nuova architettura.

Il blocco fondamentale rimangono gli stream processor, reclamizzati come CUDA core. GF100 ne ha 512, rispetto ai 240 del chip GT200. Così, se pensiamo a un confronto a pari frequenze, potremmo avere oltre il doppio delle prestazioni della GeForce GTX 285, senza pensare ad altre ottimizzazioni. Tuttavia, Nvidia si è preoccupata delle debolezze del chip GT200 nella progettazione di GF100 e sostiene che sono state risolte nel nuovo chip con un intervento sull'architettura. In realtà, Nvidia afferma che le prestazioni con i giochi attuali sono circa due volte quelle del GT200 con anti-aliasing 8x attivo.

Quattro GPC in GF100, ognuno con Quattro SM - cliccare sull'immagine per ingrandirla

Graphics Processing Clusters, GPC

GT200 integra 10 Texture Processing Clusters (TPC), ognuno dotato di tre Streaming Multiprocessors (che a loro volta sono formati da 8 stream processor e 8 unità texture address/filtering). Questa organizzazione si evolve nel nuovo chip per includere una più elegante collezione di risorse, da un motore raster a funzione fissa fino a quattro di questi Streaming Multiprocessors.

Questi blocchi sono divisi in Graphics Processing Clusters (GPC), sostituendo il concetto di TPC attraverso l'integrazione di funzionalità che precedentemente esistevano all'interno del TPC. Ora, un GPC ha il proprio motore raster che s'interfaccia con fino a quattro di SM, ogni SM integra 32 CUDA core e quattro unità texture dedicate (insieme a ciò che Nvidia definisce come dual scheduler/dispatcher e 64KB di cache configurabile/memoria condivisa). GF 100, nella configurazione completa, integra quattro GPC.

16 Streaming Multiprocessors (SM) in un GF100 pienamente operativo - cliccare sull'immagine per ingrandirla

Stando ai numeri, GT200 ha più unità texture di GF100 (otto per TPC, fino a 10 TPC per GPU controlle quattro unità texture per SM, fino a 16 SM). Tuttavia, il punto cruciale riguarda l'efficienza maggiore: ogni unità texture calcola un indirizzo e quattro sample per clock.

Il risultato è che GF100 raggiunge prestazioni superiori, secondo Nvidia.