Hot topics:
40 minuti

Recensione AMD Radeon Vega RX 64 8GB

Test della scheda video Radeon Vega RX 64, nuova soluzione di gamma nell'offerta grafica di AMD.

Recensione AMD Radeon Vega RX 64 8GB

Radeon RX Vega 64 con Vega 10, la nuova top di gamma AMD

L'ultima scheda grafica di fascia alta AMD è stata presentata ben 26 mesi fa. Era la R9 Fury X, e si scontrava direttamente contro la 980 TI e la Titan X, le due schede video più potenti di allora. La Fury X è migliorata nel tempo grazie a driver ben ottimizzati e API DirectX 12 che hanno aiutato gli sviluppatori di giochi a sfruttare l'architettura Graphics Core Next al massimo delle sue potenzialità.

Oggi la presentazione ufficiale della Radeon RX Vega rappresenta il ritorno di AMD nel mercato del gaming di fascia alta, come afferma l'azienda stessa. Ma per diretta ammissione, questa non sarà una lotta per strappare a Nvidia la corona delle massime prestazioni. Piuttosto la Radeon RX Vega 64 sfida la GeForce GTX 1080, sia per prestazioni che per prezzo.

radeon rx vega intro
Radeon RX Vega 64 - clicca per ingrandire

Sappiamo già molto sulla Radeon RX Vega 64. AMD ha rilasciato varie informazioni nelle scorse settimane, in modo da creare hype tra gli appassionati. Se vi siete persi qualcosa, vi consigliamo di leggere questo articolo e quest'altro.

Specifiche tecniche

  AMD Radeon RX Vega 64 Liquid AMD Radeon RX Vega 64 AMD Radeon RX Vega 56
Stream Processor 4096
(64 CU)
4096
(64 CU)
3585
(56 CU)
Texture Unit 256 256 224
ROPs 64 64 64?
Freq. base 1406 MHz 1247 MHz 1156 MHz
Freq. boost 1677 MHz 1546 MHz 1471 MHz
Freq. memoria 1,89 Gbps HBM2 1, 89 Gbps HBM2 1,6 Gbps HBM2
Bus 2048 bit 2048 bit 2048 bit
Memoria 8 GB 8 GB 8 GB
Transistor 12,5 miliardi 12,5 miliardi 12,5 miliardi
TDP 345W 295W 210W
Processo produttivo 14nm 14nm 14nm
Architettura GCN 5 GCN 5 GCN 5
GPU Vega 10 Vega 10 Vega 10
Prezzo $699 (Radeon Pack) $499 $399

Radeon RX Vega 64, caratteristiche principali

Come la GPU Fiji della R9 Fury X, la Radeon RX Vega 64 ha quattro shader engine, ognuno con il proprio geometry processor e rasterizer. Sempre come Fiji, ci sono 16 Compute Unit per ogni Shader Engine, e ogni CU ha 64 Stream Processor e quattro unità texture. Moltiplicate il tutto e avrete un totale di 4096 Stream Processor e 256 unità texture.

vega10
Clicca per ingrandire

Le frequenze di clock sono invece più alte. Laddove Fiji si fermava a 1050 MHz, il processo produttivo FinFET LPP a 14 nm di GlobalFoundries, nonché ottimizzazioni mirate a raggiungere alte frequenze, hanno permesso alla GPU Vega 10 della Radeon RX Vega 64 di operare al clock di base di 1247 MHz, per poi salire in Boost a 1546 MHz. Ovviamente la potenza di calcolo FP32 specificata da AMD, cioè di 12,66 TFLOPS, è calcolata nella condizione migliore, quindi alla frequenza più alta. Se dovessimo considerare invece il caso conservativo, questo numero scende a 10,2 TFLOPS, un numero che è ugualmente il 20% superiore a quanto è in grado di fare una R9 Fury X.

Il modello raffreddato a liquido porta le frequenze di base e in boost rispettivamente a 1406 MHz e 1677 MHz. Stiamo parlando di un overclock del 13% della frequenza base e dell'8% circa di quella in Boost, numeri che portano la potenza massima a 13,7 TFLOPS. Il TDP passa invece da 295W a 345W, un incremento di ben il 17%. In entrambi i casi siamo oltre i 250W della GeForce GTX 1080 Ti, che non è nemmeno nel mirino della Vega 64.

Modello Raffreddamento Modalità BIOS Profilo energetico
RX Vega Power Saver Balanced Turbo
Aria Primario 165W 220W 253W
Secondario 150W 200W 230W
Liquido Primario 198W 264W 303W
Secondario 165W 220W 253W

AMD sa che sta spingendo la Vega 64 oltre il suo bilanciamento - detto sweet spot - per quanto riguarda l'efficienza. La nostra scheda raffreddata ad aria si presenta con due file BIOS, e ognuno supporta tre profili energetici. Il BIOS primario con impostazione Balanced è accompagnato da un power limit della GPU di 220W. Passare a Power Saver riduce il power limit a 165W, mentre Turbo lo innalza a 253W. Passando al secondo BIOS vediamo che Power Saver scende a 150W, Balanced a 200W e Turbo a 230W. Apprezziamo il maggiore controllo offerto da AMD, ma bisogna anche dire che la maggior parte degli appassionati non è in cerca di un modo per depotenziare un prodotto da 500 dollari. Stiamo lavorando a un articolo in cui esploreremo gli effetti di ognuna di queste impostazioni su consumi, prestazioni e rumorosità.

Ogni Shader Engine di Vega 10 è dotato di quattro render back-end in grado di gestire 16 pixel per ciclo di clock, per un totale di 64 ROP. Questi render back-end attingono alla cache L2, che ora è di 4 MB, il doppio rispetto ai 2 MB di Fiji (a sua volta il doppio di Hawai). Questo dovrebbe evitare che la GPU "finisca" la memoria HBM2 troppo spesso, riducendo la dipendenza di Vega 10 dalla memoria esterna. Siccome le frequenze di clock possono essere maggiori fino al 60% circa rispetto a Fiji, mentre il bandwidth della memoria scende a 28 GB/s, una cache più capiente dovrebbe aiutare a prevenire i colli di bottiglia.

Il graphics architect e corporate fellow di AMD, Mike Mentor, ci ha anche detto che tutta la SRAM su Vega 10 supera 45MB. Il chip è composto da 12,5 miliardi di transistor, dislocati su una superficie di 486 millimetri quadrati. Stiamo parlando di dimensioni e quantità maggiori rispetto al GP102 di Nvidia.

L'adozione della memoria HBM2 permette a Nvidia di dimezzare il numero di stack di memoria sull'interposer rispetto a Fiji, tagliando il bus aggregato di memoria da 4096 a 2048 bit. E scompare il limite dei 4 GB della Radeon R9 Fury X: la RX Vega 64 non ha problemi a offrire 8 GB di memoria usando 4-hi stack (la Frontier Edition arriva a 16 GB). Un data rate di 1,89 Gb/s definisce un bandwidth massimo di 484 GB/s, alla pari con quanto è in grado di fare la GTX 1080 Ti dotata di GDDR5X a 11 Gb/s.

Aspetto e connettori

La RX Vega 64 pesa 1066 grammi, il che la rende 16 grammi più pesante della Frontier Edition. La scheda ha una lunghezza di 26,8 cm, una profondità di 10,5 cm e uno spessore di 3,8 cm. Questo la rende una vera e propria scheda dual-slot, anche se il backplate aggiunge altri 0,4 cm sul retro.

radeon rx vega 64 01
Clicca per ingrandire
radeon rx vega 64 02
Clicca per ingrandire

Sia la copertura che il backplate sono fatti di alluminio nero anodizzato, il che permette alla scheda di restituire una sensazione di qualità. La superficie texturizzata è stata raggiunta usando una semplice formazione a freddo che ha preceduto l'anodizzazione dell'alluminio. Tutte le viti sono state verniciate in nero opaco. Il logo rosso Radeon sulla parte frontale è stato stampato.

radeon rx vega 64 03
Clicca per ingrandire
radeon rx vega 64 04
Clicca per ingrandire

La parte superiore della scheda è dominata da due connettori PCIe a 8 pin e il logo Radeon che s'illumina. C'è anche uno switch BIOS che permette l'accesso a un BIOS ottimizzato per consumi molto più bassi, che rende la scheda più silenziosa, fresca e certamente un po' più lenta.

radeon rx vega 64 05
Clicca per ingrandire
radeon rx vega 64 06
Clicca per ingrandire

La fine della scheda è chiusa e include fori di montaggio che sono più comuni sulle schede video workstation. Per quanto riguarda le uscite troviamo tre DisplayPort e una HDMI 2.0. Assente il DVI, ed è una scelta saggia dato che permette al flusso d'aria caldo di uscire senza intoppi dalle apposite feritoie.

Architettura Vega e HBM2

Vega rappresenta una nuova generazione di GPU per AMD, con oltre 200 cambiamenti e miglioramenti che la separano dalla precedente implementazione dell'architettura GCN.

vega 01
Clicca per ingrandire

HBM2: architettura di memoria scalabile

Sia AMD che Nvidia stanno lavorando in molti modi per ridurre l'overhead legato al processore, massimizzare il throughput per alimentare la GPU con abbastanza dati daaggirare i colli di bottiglia esistenti - in particolare quelli che emergono con insiemi di dati molto voluminosi. Avvicinare più capacità alla GPU e farlo in modo efficiente dal punto di vista dei costi è sembrato essere lo scopo della Radeon Pro SSG. Con Vega AMD sembra avanzare di un altro passo in tale direzione con una gerarchia di memoria più flessibile.

Non è un segreto che Vega usi memoria HBM2. AMD chiama questo insieme di memoria "on package" - in precedenza noto come frame buffer - con il nome high-bandwidth cache. HBM2 equivale quindi a high-bandwidth cache. Perché? Perché l'ha deciso AMD.

vega 02
Clicca per ingrandire

No davvero, perché? Secondo Joe Macri, corporate fellow e product CTO, la visione dietro HBM era di avere maggiori prestazioni di memoria il più vicino possibile alla GPU. Si voleva inoltre che memoria di sistema e archiviazione fossero disponibili al processore grafico. Nel contesto di questa gerarchia di memoria allargata è logico pensare all'HBM2 come una cache ad alto bandwidth per le tecnologie più lente. Al fine di non creare troppa confusione, continueremo a chiamarla HBM2.

Dopotutto l'HBM2, in sé e per sé, rappresenta un grande passo avanti. Con un incremento della capacità fino a otto volte per stack verticale rispetto alla HBM di prima generazione, risponde ai dubbi sollevati dagli appassionati circa la longevità della Radeon R9 Fury X. Inoltre, un raddoppio di bandwidth per pin aumenta nettamente il throughput potenziale.

vega 03
Clicca per ingrandire

Questo è il cambiamento che ci aspettiamo impatti maggiormente sui videogiocatori per quanto concerne il sottosistema di memoria di Vega. AMD, inoltre, dà al controller high-bandwidth cache (non più un semplice controller di memoria) accesso a uno spazio di indirizzamento virtuale enorme, ben 512TB, per grandi dataset.

Cercando di capire come potrebbe essere usata la gerarchia di memoria allargata di Vega, AMD ci ha spiegato che Vega può spostare pagine di memoria in modo molto più preciso usando tecniche programmabili multiple. Può ricevere la richiesta di recapitare i dati e recuperarli tramite un trasferimento DMA mentre la GPU passa a un altro thread, continuando il lavoro senza stalli. Il controller può ottenere il dato su richiesta ma anche riportarlo in modo predittivo. L'informazione nella HBM può essere replicata nella memoria di sistema come una cache inclusiva, o l'HBCC può mantenere una sola copia per risparmiare spazio. Tutto questo è gestito in hardware, quindi è rapido e avviene con un overhead contenuto.

Nuova pipeline geometrica programmabile

La GPU Hawaii (Radeon R9 290X) integrava alcuni notevoli miglioramenti rispetto a Tahiti (Radeon HD 7970), uno dei quali era un front end più corposo con quattro geometry engine anziché due. La successiva GPU Fiji (Radeon R9 Fury X) ha mantenuto la stessa configurazione four-way Shader Engine. Tuttavia, grazie alle novità dell'architettura GCN di terza generazione, vi furono progressi anche nel tessellation throughput. Più di recente la GPU Ellesmere (Radeon RX 480/580) ha implementato una manciata di tecniche per ottenere ancora di più dalla configurazione a quattro engine, incluso un Primitive Discard Accelerator.

vega 04
Clicca per ingrandire

AMD ha promesso lo scorso anno un throughput geometrico di picco di Vega pari a 11 poligoni per clock, 2,75 volte in più rispetto ai quattro della generazione precedente. Questo dato giunge dall'uso di un nuovo stadio "primitive shader" aggiunto alla pipeline geometrica. Anziché usare hardware a funzione fissa, il primitive shader usa un insieme di shader per il suo funzionamento.

vega 05
Clicca per ingrandire

AMD ha descritto il tutto in modo simile all'accesso a un compute shader per il processo della geometria della scena, in quanto è leggero e programmabile, ma con l'abilità di scartare primitive a un tasso elevato. La funzionalità del primitive shader include molto di ciò che possono fare gli stadi DirectX vertex, hull, domain e geometry shader, ma è più flessibile sul contesto che porta e l'ordine nel quale il lavoro è completato.

vega 06
Clicca per ingrandire

Il front-end beneficia anche di un migliorato workgroup distributor, responsabile per il bilanciamento del carico sull'hardware programmabile. AMD ha spiegato che questa miglioria deriva dalla collaborazione con gli sviluppatori di console e di questo sforzo ora beneficeranno i giocatori su PC.

La Next-Generation Compute Unit (NCU)

Creando molte GPU Pascal, Nvidia è chirurgica sulla segmentazione. Il processore più grande e costoso GP100 offre una potenza di picco FP32 di 10,6 TFLOPS (se usate la frequenza GPU Boost). Un rapporto 1:2 di core FP64 porta a una potenza con calcoli a doppia precisione di 5,3 TFLOPs. E il supporto per calcolo/archiviazione half precision garantisce fino a 21,2 TFLOPs. I chip più consumer GP102 e GP104 offrono naturalmente prestazioni FP32 massime, ma Nvidia ha deliberatamente frenato i calcoli FP64 e FP16 in modo che non si possano usare schede a basso costo per impieghi scientifici o altro.

vega 07
Clicca per ingrandire

AMD, al contrario, sembra voler offrire di più a tutti. Il blocco base Compute Unit, con 64 shader IEEE 754-2008, rimane invariato rispetto al passato. Ora però è chiamato NCU, o Next-Generation Compute Unit, riflettendo il supporto a nuovi tipi di dati. Con 64 shader e un picco di due operazioni/ciclo in virgola mobile, si ottiene un massimo di 128 operazioni a 32 bit per ciclo di clock. Con calcoli FP16 quel numero passa a 256 operazioni a 16 bit per clock. AMD afferma persino che può fare fino a 512 operazioni a 8 bit per ciclo di clock. I calcoli a doppia precisione sono differenti - AMD non sembra aver problemi ad ammettere che stabilisce la velocità FP64 in base all'indirizzo di mercato del prodotto.

vega 08
Clicca per ingrandire

L'introduzione di questa flessibilità giunge dal mondo delle console. Dopotutto sappiamo che PS4 Pro può usare l'half-precision per raggiungere una potenza fino a 8,4 TFLOPs - il doppio delle prestazioni con operazioni a 32 bit. Forse questo sviluppo è legato alle aspirazioni di AMD nel settore del machine learning, e porta a prodotti come la Radeon Instinct MI25 che punta a sottrarre mercato a Nvidia. A ogni modo console, datacenter e giocatori PC ne beneficeranno tutti.

vega 09
Clicca per ingrandire

AMD afferma anche che le NCU sono ottimizzate per frequenze più elevate. L'azienda ha anche implementato buffer instruction più ampi per mantenere occupate le Compute Unit.

Pixel Engine di nuova generazione

Diamo un'occhiata a quello che AMD chiama Draw Stream Binning Rasterizer, che si suppone sia un supplemento alla ROP tradizionale e come tale dovrebbe migliorare le prestazioni e ridurre i consumi.

C'è ancora un grande punto di domanda su questa caratteristica. Colleghi che lavorano per altre testate hanno svolto dei test e nessuno ha registrato alcun miglioramento prestazionale rilevante. La ragione, come ci è stato recentemente confermato, è che DSBR è attualmente disabilitato e sarà reso disponibile in un futuro aggiornamento driver.

vega 10
Clicca per ingrandire

Di massima, una cache bin on-chip permette al rasterizzatore di raccogliere i dati una sola volta per primitive sovrapposte, e poi fare lo shading dei pixel una sola volta tagliando i pixel non visibili nella scena finale.

vega 11
Clicca per ingrandire

AMD ha cambiato fondamentalmente la sua gerarchia della cache, rendendo i render back-end dipendenti dalla L2.

vega 12
Clicca per ingrandire

Nelle architetture prima di Vega AMD aveva un accesso di memoria pixel e texture non coerente, il che significava che non c'era un punto condiviso da sincronizzare per ogni stadio della pipeline. Nell'esempio del texture baking, dove una scena veniva renderizzata verso una texture per l'uso successivo e poi rivisitata nuovamente tramite l'array shader, il dato doveva essere pescato tramite la memoria off-die. Ora l'architettura ha un accesso coerente, che secondo AMD aumenta le prestazioni in particolare con applicazioni che usano il deferred shading.

SPOILER: il nuovo driver non ha fornito i grandi miglioramenti prestazionali promessi. Un aggiornamento BIOS, dei driver o forse nulla - potremmo vedere una di queste cose in futuro. Rimaniamo con il confortante pensiero che Fiji e Hawaii, proprio come il buon vino, hanno impiegato un po' di tempo a raggiungere il loro pieno potenziale. Qual è la situazione attuale? Guardate i test nelle prossime pagine.

Continua a pagina 2
AREE TEMATICHE
Vuoi ricevere aggiornamenti su #Schede video?
Iscriviti alla newsletter!