Non solo un'architettura di calcolo

GF100 è il chip di Nvidia basato su architettura Fermi con supporto DirectX 11.

Avatar di Tom's Hardware

a cura di Tom's Hardware

Non solo un'architettura di calcolo

Prima della presentazione di GF100, abbiamo raccolto molte chiacchiere sul fatto che questa sarebbe stata l'opportunità per togliere enfasi al ruolo della grafica in favore del GPU computing. Sebbene i rappresentanti di Nvidia siano i primi a esprimere preoccupazione per questo "mito", l'azienda è da condannare per la sua diffusione.

L'architettura Fermi è stata svelata alla GPU Technology Conference, una manifestazione di Nvidia nello scorso settembre. In quel frangente vennero discussi solo i dettagli relativi alle capacità di calcolo, ponendo l'accento (appunto) sul GPU computing.

 

Nvidia, in questo momento, vuole far sapere a tutti che non ha smesso di dedicarsi al miglioramento delle prestazioni grafiche. L'architettura GPC, l'enfasi sulla geometria e il supporto completo DirectX 11 sostengono questa affermazione. Tuttavia, è facile vedere in GF100 un chip in cui l'azienda cerca di trovare l'equilibrio tra calcolo e grafica, dai clear nods al calcolo in virgola mobile a doppia precisione, all'architettura della cache del chip.

Ognuno dei 16 SM integra la propria cache L1/memoria condivisa da 64 KB, che può essere configurata anche come 16KB di memoria condivisa/48KB di cache L1, o viceversa. GT200 integra 16 KB di memoria condivisa per SM così da mantenere i dati in memoria locale il più possibile, riducendo il bisogno di rivolgersi al frame buffer. Espandendo questo insieme di memoria e rendendolo quasi dinamicamente configurabile, Nvidia risolve problemi grafici e di calcolo allo stesso tempo. In uno scenario di calcolo della fisica o ray tracing, per esempio, non avete meccanismi d'indirizzamento prevedibili, quindi la piccola cache condivisa e la grande cache L1 aiutano a migliorare l'accesso alla memoria. Questa possibilità sarà visibile quando gli sviluppatori inizieranno a vantaggiarsi di DirectCompute all'interno dei loro titoli.

  GT200 GF100 Benefici
Cache Texture L1 (Per Quad) 12KB 12KB Filtering Texture
Cache L1 Load/Store No 16/48KB utile in physics/ray-tracing
Memorica condivisa totale 16KB 16/48KB Riuso maggiore dei dati tra i thread
Cache L2 256KB (solo lettura texture) 768KB (tutti i client leggono/scrivono) Prestazioni di calcolo, texture coverage

A disposizione ci sono anche 765 KB di cache L2, un quantitativo significativamente maggiore e più funzionale della cache texture in sola scrittura da 256 KB del chip GT200. Dato che è unificata, la cache L2 di GF100 rimpiazza la cache texture L2, la cache ROP e la FIFO sul chip, in modo che ogni client possa leggere o scriverci. Questa è un'altra area dove le prestazioni di calcolo sono al centro delle preoccupazioni di Nvidia. Tuttavia, le prestazioni di gioco dovrebbero vedere un beneficio poiché gli SM lavorano sugli stessi dati che faranno meno viaggi verso la memoria.

GF100 rappresenta un grado passo in avanti per quanto riguarda ciò che possono fare gli sviluppatori di terza parti dal lato calcolo. Tuttavia è sorretto dal fatto che ci sono DirectCompute e OpenCL, che anche AMD supporta entrambe le API e che il modo in cui avremo giochi più realistici è attraverso l'abilitazione da parte degli sviluppatori del GPU Computing nei loro titoli.

Il Ray Tracing, usato in concomitanza con la rasterizzazione o da solo, voxel rendering, particelle idrodinamiche e AI path-fiding sono tutte applicazioni potenziali di quello che potrete vedere grazie alla possibilità dei nuovi calcoli via hardware. Il Ray Tracing, usato in concomitanza con la rasterizzazione o da solo, voxel rendering, particelle idrodinamiche e AI path-fiding sono tutte applicazioni potenziali di quello che potrete vedere grazie alla possibilità di effettuare nuovi calcoli via hardware.