NVLink, molto più che un'evoluzione dello SLI

TU102 e TU104 sono le prime GPU desktop di Nvidia ad avere l'interconnessione NVLink anziché l'interfaccia Multiple Input/Output (MIO) per il supporto SLI.

nvlink bridge

La prima mette a disposizione due collegamenti x8, MIO è limitata a uno. Ogni collegamento NVLink garantisce un bandwidth bidirezionale fino a 50 GB/s. Perciò la RTX 2080 Ti può offrire fino a 100 GB/s tra due schede mentre la RTX 2080 la metà.

Che vi sia un collegamento oppure due, lo SLI tramite NVLink funziona solo con un paio di GeForce RTX con almeno uno slot vuoto tra loro per garantire il flusso d'aria. Ufficialmente le GPU Pascal supportavano un massimo di due schede. Tecnicamente però era possibile farne lavorare fino a quattro in una manciata di benchmark. Con le nuove proposte potete acquistare il vostro bridge NVLink per connettere più schede. Sul sito di Nvidia sono disponibili soluzioni in grado di coprire tre e quattro slot.

nvlink capabilities
Clicca per ingrandire

Alcuni dei problemi dell'ultima generazione erano causati dai limiti di bandwidth tra i bridge SLI. Rispetto all'originale interfaccia SLI con il suo collegamento MIO da 1 GB/s, l'implementazione Pascal arrivava a circa 4 GB/s, sufficienti per garantire che la seconda scheda restituisca il frame renderizzato alla prima scheda in tempo per avere un frame rate fluido su un monitor 4K a 60 Hz. Non sarebbe però stato sufficiente per i 120 Hz o superiori.

Persino nella configurazione con singolo collegamento il nuovo NVLink può spostare dati così rapidamente da permettere lo SLI su uno schermo 8K. Pilotare tre monitor 4K a 144 Hz in modalità Surround non è un problema. Due collegamenti x8 hanno il throughput necessario per schermi 8K in Surround.

La domanda però è una: a chi interessa? AMD e Nvidia hanno fatto un lavoro così buono negli ultimi anni nel frenare le configurazioni multi-GPU che oggi sono poche le persone che realizzano configurazioni con più schede. In passato lo SLI o il CrossFire erano usati da chi voleva ottenere alte prestazioni comprando schede di fascia medio-bassa.

Nvidia ha messo un freno a questa pratica rimuovendo il supporto dai modelli di fascia bassa. Adesso anche la RTX 2070 è priva di connettore NVLink. I vecchi giochi DX11 funzionano comunque bene su due schede e una manciata di giochi DX12 sfruttano l'explicit multi-adapter. Ma il fatto che sviluppatori come EA DICE stiano puntando su funzioni come il ray-tracing in tempo reale e ignorando il multi-GPU dice molto sul futuro dello SLI.

Alcune persone di Nvidia ci hanno detto che avranno di più da dire in merito in futuro. Per ora, il supporto di NVLink su GeForce RTX 2080 Ti e 2080 è una novità di cui tenere conto, in particolare perché è possibile avere frame rate giocabili in 4K con G-Sync.

Pagina precedente

Mesh Shading: primo passo per avere più oggetti a schermo

I miglioramenti all'architettura si dividono comunemente tra cambiamenti che influenzano il gaming odierno e nuove caratteristiche che richiedono supporto dai titoli futuri. Almeno al lancio, le schede GeForce RTX saranno giudicate principalmente per i primi. I giochi attuali sono ciò che possiamo "quantificare".

E anche se i veterani del settore hardware hanno la propria opinione su cosa significhi il ray tracing in tempo reale per un'esperienza di gioco immersiva, siamo in questo ambito da così tanto tempo che sappiamo che non si può consigliare un prodotto sulle promesse di ciò che garantirà.

mesh shader nvidia
Clicca per ingrandire

L'architettura di Turing, tuttavia, include alcune funzionalità grafiche avanzate dal grande potenziale, ma non ancora accessibili. Mesh shader, ad esempio, accresce l'attuale pipeline grafica DirectX 11/12, laddove le CPU sono responsabili di calcolare i livelli di dettaglio, occuparsi degli oggetti che non sono in vista e fare draw call per ogni oggetto. Fino a un certo punto le CPU vanno bene per quei compiti. Ma in scene complesse con centinaia di migliaia di oggetti, hanno difficoltà a tenere il passo.

Usando invece un mesh shader, gli sviluppatori di giochi possono scaricare il calcolo del LOD (distanza del dettaglio) e l'eliminazione di oggetti non in vista a un task shader, che rimpiazza gli stadi vertex shader e hull shader. Poiché un task shader è più generale di un vertex shader, più specializzato, è in grado di prendere una lista di oggetti dalla CPU e farli passare tramite un programma di calcolo che determina dove gli oggetti sono localizzati, quale versione di ogni oggetto usare in base al LOD e se un oggetto deve essere eliminato prima di passarlo nella pipeline.

Shading a velocità variabile

Oltre a ottimizzare il modo in cui Turing processa la geometria, Nvidia supporta anche un meccanismo per scegliere la velocità alla quale i pixel sono ombreggiati (shading) in diverse parti di una scena per migliorare le prestazioni. Naturalmente l'hardware può comunque fare lo shading di ogni singolo pixel di un modello 1x1. Ma l'architettura facilita anche opzioni 2x1 e 1x2, insieme a blocchi 2x2 e 4x4.

full rate shading
Shading a piena velocità - clicca per ingrandire
content adaptive shading color coded
Content-adaptive shading, codificato con i colori - Clicca per ingrandire
content adaptive shading final output
Content-adaptive shading, risultato finale - Clicca per ingrandire

Nvidia ha illustrato diversi casi in cui uno shading a velocità variabile è funzionale - non bisogna applicarlo ovunque influenzando negativamente la qualità d'immagine. Il primo è definito "content-adaptive shading", dove le parti meno dettagliate di una scena non cambiano così tanto e possono essere ombreggiate a velocità inferiore.

Esiste una build di Wolfenstein II con ombreggiatura a tasso variabile attiva. In questa build potete attivare la visualizzazione della velocità di shading per osservare come gli oggetti complessi non sono affatto influenzati da questa tecnologia, mentre le aree a minor frequenza sono ombreggiate a una risoluzione inferiore. Un numero di passaggi intermedi facilita una maggiore velocità.

Immaginiamo che gli sviluppatori di giochi che cercheranno di sfruttare lo shading a velocità variabile adattandolo al contenuto (content-adaptive) daranno priorità alla qualità rispetto alle prestazioni. Ci piacerebbe tuttavia vedere questa soluzione abilitata come opzione selezionabile in modo che le terze parti possano fare confronti tra la funzione abilitata e disabilitata.

pattern
Clicca per ingrandire

Lo shading "motion-adaptive" è un'altra interessante applicazione della tecnologia di ombreggiatura a velocità variabile di Nvidia, dove gli oggetti che passano rapidamente sono percepiti a una risoluzione inferiore rispetto a qualsiasi soggetto su cui ci stiamo concentrando. In base al vettore di movimento di ogni pixel, gli sviluppatori di giochi possono determinare quanto aggressivamente ridurre la velocità di shading e applicare gli stessi modelli visti nell'esempio sul content-adaptive. Farlo in modo corretto richiede un accurato modello di risposta in frequenza per garantire che vengano usate le giuste velocità quando ci si muove, si accelera, si rallenta.

Nvidia ha presentato una demo di Wolfenstein II con content e motion-adaptive shading abilitati. L'aumento prestazionale attribuito allo shading a velocità variabile in quel titolo è stato nell'ordine del 15%, ma solo perché il gioco girava già a frame rate elevati. Su una scheda video più lenta con un gioco più esigente, sarebbe possibile andare oltre il 20%. Cosa più importante, non c'è un calo percepibile della qualità d'immagine.

Anche se Nvidia non ha detto molto su come queste funzionalità hardware saranno usate dagli sviluppatori, si può assumere che la demo di Wolfenstein II funzionasse sotto Vulkan usando le estensioni dell'API e che Nvidia stia lavorando con Microsoft per l'integrazione nelle DirectX. Fino ad allora esporrà la funzionalità Adaptive Shading tramite l'SDK NVAPI, che permette accesso diretto alle caratteristiche della GPU più di quanto permesso da DirectX e OpenGL.

Continua a pagina 10

Pubblicità

AREE TEMATICHE