Architettura RDNA, il cuore delle schede video Navi

Vediamo le principali novità dell'architettura RDNA, Radeon DNA, delle schede video Navi. Un'architettura che nasce con un unico obiettivo: migliorare le prestazioni in gaming.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Il cuore delle schede video Radeon RX 5700 XT e 5700, parte della famiglia Navi, è l'architettura RDNA, ovvero Radeon DNA. David Wang, vicepresidente senior del Radeon Technologies Group, ci ha spiegato che il nome deriva dalla volontà di comunicare una nuova ripartenza di AMD nel campo grafico, con il DNA a rappresentare non solo la creazione, ma anche un progetto in continua evoluzione.

RDNA è un'architettura pensata esplicitamente per il gaming, laddove la precedente GCN (Graphics Core Next) aveva un più ampio respiro. Ah, piccolo inciso: AMD ha detto che GCN non è destinata a morire, anzi ha intenzione di migliorarla ulteriormente per destinarla al settore HPC e al machine learning.

Tornando al nuovo progetto, RDNA punta a garantire prestazioni, efficienza, un'ampia gamma di funzionalità e soprattutto mira a essere scalabile, coprendo più settori, dal cloud fino al mobile. Insomma, un'architettura capace di scalare da pochi watt fino a centinaia. Tassello fondamentale nel raggiungimento di questo traguardo è il processo produttivo a 7 nanometri di TSMC, lo stesso applicato alle CPU Ryzen 3000 e agli EPYC di seconda generazione.

La prima novità dell'architettura riguarda la Compute Unit, totalmente riprogettata affinché gestisca le informazioni in modo più efficiente e veloce. L'obiettivo di AMD era quello di migliorare anzitutto le prestazioni single-thread.

Perciò AMD ha anzitutto raddoppiato la velocità nella gestione delle istruzioni inserendo il doppio delle unità scalari e degli scheduler. La nuova architettura può inoltre emanare una singola istruzione per ciclo di clock e può adottare due modalità operative - Wave 32 e Wave 64 - per un uso migliore della ALU. In precedenza AMD usava solo Wave64.

Due CU possono inoltre lavorare di concerto come un unico work group processor tramite in concetto di "resource pooling". Ciò significa ad esempio che 64 thread possono essere raggruppati come due istruzioni Wave32 ed essere eseguiti in un unico ciclo di clock.

Quali sono i benefici di tutti questi cambiamenti? Una minore latenza di esecuzione (la GPU viene usata di più), il miglioramento delle prestazioni single-thread e una maggiore efficienza nella gestione della cache.

E arriviamo proprio alla cache. AMD RDNA ha una nuova gerarchia multi livello della cache che è pensata per ridurre la latenza, aumentare il bandwidth e contenere i consumi. Il nuovo progetto prevede l'introduzione della cache L1 (512KB in totale) e un raddoppiamento del bandwidth load per quanto riguarda la cache L0 fino alla ALU.

Un altro elemento importante in RDNA è il miglioramento dell'algoritmo di compressione Delta Color (DCC, Delta Color Compression) che permette un uso più efficace della banda a disposizione. Adesso gli shader possono leggere o scrivere i dati compressi del colore e anche il display engine può leggere queste informazioni senza decomprimerle.

Il terzo elemento su cui si è concentrata AMD è quello di snellire la pipeline grafica, in modo da ottenere prestazioni per clock e una frequenza elevate. Per farlo AMD si è concentrata molto sul clock gating al fine di contenere i consumi (uno dei problemi di Vega) e ha ridotto i livelli di logica per garantire frequenze più alte. Insieme questi due elementi contribuiscono a un miglioramento prestazionale del 10% circa rispetto a GCN.

Tutto questo ha permesso ad AMD di ottenere un miglioramento del 50% per quanto concerne le prestazioni per watt rispetto una GPU Vega 10, un passo avanti del 25% delle prestazioni per clock e prestazioni per area 2,3 volte maggiori. Ulteriori dettagli sull'effettiva configurazione delle schede video (transistor, numero di CU, frequenze, ecc.) in questo articolo.

Al momento l'architettura RDNA non supporta il ray tracing in tempo reale nei videogiochi, non ha unità dedicate a tale compito, anche se i creatori di contenuti e gli sviluppatori possono lavorare tanto con le schede GCN quanto con quelle RDNA sulla tecnologia di rendering tramite ProRender e Radeon Rays.

La prossima generazione di RDNA, che probabilmente vedremo il prossimo anno con la vociferata GPU Navi 20, introdurrà l'accelerazione in hardware del ray tracing. Nel frattempo, AMD sta già lavorando a RDNA 2, che sarà sviluppata sulla base del processo produttivo a 7 nanometri di seconda generazione (7nm+).

A tutto questo si aggiunge il supporto alle memorie GDDR6, che garantiscono prestazioni più alte della generazione precedente, e chiaramente il PCI Express 4.0, standard che raddoppia il bandwidth e su cui AMD ha puntato molto in questa generazione supportandolo ovunque, dalle CPU alla piattaforma fino alle GPU.

L'azienda ha anche rinnovato il Radeon Display Engine per garantire il supporto agli ultimi standard e risoluzioni: si parla di HDMI 2.0b e DisplayPort 1.4 con Display Stream Compression 1.2a che consente di gestire con un singolo cavo il 4K a 240 Hz, il 4K HDR a 120 Hz e l'8K HDR a 60 Hz.

Soffermiamoci un attimo su Display Stream Compression 1.2a: questa tecnologia permette ai monitor 4K di lavorare a refresh rate oltre 120 Hz senza la necessità di fare un subsampling cromatico.

Finora il funzionamento a 3840x2160 e 144 Hz richiedeva un sacrificio sul fronte della qualità dell'immagine per rimanere all'interno del bandwidth della DisplayPort. In alternativa si poteva passare a 120 Hz con profondità colore a 8 bit. E nel caso vi foste ritrovati a usare un monitor HDR, bisognava passare a 98 Hz per una profondità colore a 10 bit.

Ora, con il beneficio di una compressione quasi lossless, AMD permette di gestire monitor 4K fino a 120 Hz o display 8K fino a 60 Hz tramite un singolo cavo e senza preoccuparsi di eventuali compromessi.

L'unico elemento da ricordare è che anche il monitor deve supportare DSC affinché il tutto funzioni. AMD ha annunciato che arriverà sul mercato un 43 pollici DisplayHDR1000 di Asus con risoluzione nativa 3840x2160 e refresh rate a 144 Hz con supporto a DSC per il funzionamento con un singolo cavo.

Da segnalare infine che le nuove schede video hanno un Radeon Media Engine migliorato, con prestazioni superiori del 40% rispetto alla generazione precedente, per soddisfare tutto il pubblico che fa streaming e non solo. La GPU è in grado di gestire la decodifica tramite VP9 in 4K90 o 8K24.

Per quanto riguarda la decodifica in H.264 sono citate 1080p600 o 4K150, mentre per la codifica AMD indica 1080p360 o 4K90. Sul fronte H.265 invece AMD indica una decodifica a 1080p360, 4K90 o 8K24, mentre sul fronte della codifica si parla di 1080p360 o 4K60.