Hot topics:
News su SMAU 2017
36 minuti

Recensione AMD Radeon Vega Frontier Edition 16GB

Test della Radeon Vega Frontier Edition, la prima scheda video con GPU Vega di AMD.

Recensione AMD Radeon Vega Frontier Edition 16GB

Vega Frontier, a cavallo di due mondi

Radeon Vega Frontier Edition 16GB

 
Radeon Vega Frontier Edition 16GB

Di recente AMD ha portato sul mercato una scheda "tuttofare" chiamata Radeon Vega Frontier Edition. La casa di Sunnyvale la propone come un prodotto professionale della famiglia Radeon Pro destinato a "data scientist, ingegneri e designer".

Dato che siamo ancora in attesa delle schede Vega per i gamer, in arrivo a brevissimo, proviamo la Vega Frontier in una serie di scenari, compresi i giochi - ambito a cui la scheda si presta, secondo la stessa AMD, ma per cui non è nata.

La scheda è messa a confronto con soluzioni da gioco e professionali di AMD e Nvidia, tra cui troviamo la Quadro P6000, che è circa tre volte più costosa della Frontier Edition.

radeon vega frontier 01
Clicca per ingrandire

La scheda

La Radeon Vega FE ha un peso di 1050 grammi e si estende per 28,6 centimetri. Ha una profondità di 10,5 centimetri, mentre lo spessore di 3,5 centimetri la rende una scheda dual-slot (il backplate posteriore aggiunge ulteriori 0,4 centimetri).

radeon vega frontier 02
Clicca per ingrandire
radeon vega frontier 03
Clicca per ingrandire

Copertura e backplate sono di un alluminio anodizzato blu che trasmette un'alta qualità al tatto. Tutte le viti sono invece verniciate di nero. Il logo Radeon stampato sulla copertura e il logo cubico sono gli unici elementi di colore differente. La scheda segue un tema simile alle altre soluzioni Pro WX di AMD, anche se il blu della Vega FE è più scuro e saturo.

radeon vega frontier 04
Clicca per ingrandire
radeon vega frontier 05
Clicca per ingrandire

La parte superiore della scheda evidenzia un paio di connettori ausiliari a 8 pin, oltre al già citato logo cubico Radeon che si illumina di giallo. È fatto in acrilico ed è incassato nella copertura della scheda.

radeon vega frontier 06
Clicca per ingrandire
radeon vega frontier 07
Clicca per ingrandire

Il finale della Radeon Vega FE è chiuso e ha fori di montaggio, una configurazione piuttosto standard per una scheda orientata al mondo workstation. Sulla parte frontale troviamo tre DisplayPort e una HDMI 2.0. L'omissione della DVI ha un senso dal punto di vista del flusso d'aria: le feritoie servono per l'espulsione dell'aria calda.

Modello Radeon Vega FE Radeon R9 Fury X Titan Xp Quadro P6000 GTX 1080 Ti
GPU Vega 10 Fiji XT GP102 (450-A1) GP102 (350-K1-A1)
Dimensione GPU 486mm² 596mm² 471mm²  471mm² 
Transistor 12,5 miliardi 8,9 miliardi 12 miliardi 12 miliardi
Frequenza GPU (Base/Boost) 1382 MHz
1600 MHz
Ignota
1050 MHz
1480 MHz
1582 MHz
1506 MHz
1645 MHz
1480 MHz
1582 MHz
Shader/SIMD 4096/64 4096/64 3840/30 3584/28
Texture Unit/ROPs 256/64 256/64 240/96 224/88
Pixel Fillrate 88.4 GPixel/s 67.2 GPixel/s 151.9 GPixel/s 144.6 GPixel/s 141.7 GPixel/s
Texture Fillrate 353.8 GTexel/s 268.8 GTexel/s 379.7 GTexel/s 361.4 GTexel/s 354.1 GTexel/s
Bus memoria 2048-bit 4096-bit 384-bit 352-bit
Tipo memoria HBM2 HBM GDDR5X GDDR5X
Bandwidth memoria 483.8 GB/s 512 GB/s 547.6 GB/s 432 GB/s 484 GB/s
Data rate memoria 1.89 Gb/s 1 Gb/s 11.4 Gb/s 9 Gb/s 11 Gb/s
Memoria 16GB 4GB 12GB 24GB 11GB
DX12 Feature Level 12_1 12_0 12_1 12_1
Connettori 2× 8-pin 2× 8-pin 6 + 8-pin 8-pin 6 + 8-pin
TDP 300W 275W <250W <225W <250W

Configurazione di prova

Sistema - Intel Core i7-6900K @4.3 GHz
- MSI X99S XPower Gaming Titanium
- Corsair Vengeance DDR4-3200
- 1x 1TB Toshiba OCZ RD400 (M.2, Sistema)
- 2x 960GB Toshiba OCZ TR150 (Archiviazione, immagini)
- be quiet! Dark Power Pro 11, 850W (PSU)
Raffreddamento - Alphacool Eisblock XPX
- Alphacool Eiszeit 2000 Chiller
- 2x Be Quiet! Silent Wings 3 PWM (simulazione case chiuso)
- Thermal Grizzly Kryonaut
Case - Lian Li PC-T70 con kit di espansione e mod
- Configurazioni: banchetto aperto, case chiuso
Monitor - Eizo EV3237-BK

Rilevazione consumi
- Contact-free DC Measurement at PCIe Slot (Using a Riser Card)
- Contact-free DC Measurement at External Auxiliary Power Supply Cable
- Direct Voltage Measurement at Power Supply
- 2x Rohde & Schwarz HMO 3054, 500MHz Digital Multi-Channel Oscilloscope with Storage Function
- 4x Rohde & Schwarz HZO50 Current Probe (1mA - 30A, 100kHz, DC)
- 4x Rohde & Schwarz HZ355 (10:1 Probes, 500MHz)
- 1x Rohde & Schwarz HMC 8012 Digital Multimeter with Storage Function
Rilevazione temperature - 1x Optris PI640 80Hz Infrared Camera + PI Connect
- Real-Time Infrared Monitoring and Recording

Rilevazione rumorosità
- NTI Audio M2211 (with Calibration File, Low Cut at 50Hz)
- Steinberg UR12 (with Phantom Power for Microphones)
- Creative X7, Smaart v.7
- Custom-Made Proprietary Measurement Chamber, 3.5 x 1.8 x 2.2m (L x D x H)
- Perpendicular to Center of Noise Source(s), Measurement Distance of 50cm
- Noise Level in dB(A) (Slow), Real-time Frequency Analyzer (RTA)
- Graphical Frequency Spectrum of Noise
Driver - Radeon: 17.20.1035
- Quadro: R381 U2 (382.05)
Sistema operativo - Windows 10 Pro (Creators Update, aggiornato)

Architettura Vega e HBM2

Vega rappresenta una nuova generazione di GPU per AMD, con oltre 200 cambiamenti e miglioramenti che la separano dalla precedente implementazione dell'architettura GCN.

vega 01
Clicca per ingrandire

HBM2: architettura di memoria scalabile

Sia AMD che Nvidia stanno lavorando in molti modi per ridurre l'overhead legato al processore, massimizzare il throughput per alimentare la GPU e aggirare i colli di bottiglia esistenti - in particolare quelli che emergono con insiemi di dati molto voluminosi. Avvicinare più capacità alla GPU e farlo in modo efficiente dal punto di vista dei costi è sembrato essere lo scopo della Radeon Pro SSG. Con Vega AMD sembra avanzare di un altro passo in tale direzione con una gerarchia di memoria più flessibile.

Non è un segreto che Vega usi memoria HBM2. AMD chiama questo insieme di memoria "on package" - in precedenza noto come frame buffer - con il nome high-bandwidth cache. HBM2 equivale quindi ad high-bandwidth cache. Perché? Perché l'ha deciso AMD.

vega 02
Clicca per ingrandire

No davvero, perché? Secondo Joe Macri, corporate fellow e product CTO, la visione dietro HBM era di avere maggiori prestazioni di memoria il più vicino possibile alla GPU. Si voleva inoltre che memoria di sistema e archiviazione fossero disponibili al processore grafico. Nel contesto di questa gerarchia di memoria allargata è logico pensare all'HBM2 come una cache ad alto bandwidth per le tecnologie più lente. Al fine di non creare troppa confusione, continueremo a chiamarla HBM2.

Dopotutto l'HBM2, in sé e per sé, rappresenta un grande passo avanti. Con un incremento della capacità fino a otto volte per stack verticale rispetto alla HBM di prima generazione, risponde ai dubbi sollevati dagli appassionati circa la longevità della Radeon R9 Fury X. Inoltre, un raddoppio di bandwidth per pin aumenta nettamente il throughput potenziale.

vega 03
Clicca per ingrandire

Questo è il cambiamento che ci aspettiamo impatti maggiormente sui gamer per quanto concerne il sottosistema di memoria di Vega. AMD, inoltre, dà al controller high-bandwidth cache (non più un semplice controller di memoria) accesso a uno spazio di indirizzamento virtuale enorme, ben 512TB, per grandi dataset.

Cercando di capire come potrebbe essere usata la gerarchia di memoria allargata di Vega, AMD ci ha spiegato che Vega può spostare pagine di memoria in modo molto più preciso usando tecniche programmabili multiple. Può ricevere la richiesta di recapitare i dati e recuperarli tramite un trasferimento DMA mentre la GPU passa a un altro thread, continuando il lavoro senza stalli. Il controller può ottenere il dato su richiesta ma anche riportarlo in modo predittivo. L'informazione nella HBM può essere replicata nella memoria di sistema come una cache inclusiva, o l'HBCC può mantenere una sola copia per risparmiare spazio. Tutto questo è gestito in hardware, quindi è rapido e avviene con un overhead contenuto.

Nuova pipeline geometrica programmabile

La GPU Hawaii (Radeon R9 290X) integrava alcuni notevoli miglioramenti rispetto a Tahiti (Radeon HD 7970), uno dei quali era un front end più corposo con quattro geometry engine anziché due. La successiva GPU Fiji (Radeon R9 Fury X) ha mantenuto la stessa configurazione four-way Shader Engine. Tuttavia, grazie alle novità dell'architettura GCN di terza generazione, vi furono progressi anche nel tessellation throughput. Più di recente la GPU Ellesmere (Radeon RX 480/580) ha implementato una manciata di tecniche per ottenere ancora di più dalla configurazione a quattro engine, incluso un Primitive Discard Accelerator.

vega 04
Clicca per ingrandire

AMD ha promesso lo scorso anno un throughput geometrico di picco di Vega pari a 11 poligoni per clock, 2,75 volte in più rispetto ai quattro della generazione precedente. Questo dato giunge dall'uso di un nuovo stadio "primitive shader" aggiunto alla pipeline geometrica. Anziché usare hardware a funzione fissa, il primitive shader usa un insieme di shader per il suo funzionamento.

vega 05
Clicca per ingrandire

AMD ha descritto il tutto in modo simile all'accesso a un compute shader per il processo della geometria della scena, in quanto è leggero e programmabile, ma con l'abilità di scartare primitive a un tasso elevato. La funzionalità del primitive shader include molto di ciò che possono fare gli stadi DirectX vertex, hull, domain e geometry shader, ma è più flessibile sul contesto che porta e l'ordine nel quale il lavoro è completato.

vega 06
Clicca per ingrandire

Il front-end beneficia anche di un migliorato workgroup distributor, responsabile per il bilanciamento del carico sull'hardware programmabile. AMD ha spiegato che questa miglioria deriva dalla collaborazione con gli sviluppatori di console e di questo sforzo ora beneficeranno i giocatori su PC.

La Next-Generation Compute Unit (NCU)

Creando molte GPU Pascal, Nvidia è chirurgica sulla segmentazione. Il processore più grande e costoso GP100 offre una potenza di picco FP32 di 10,6 TFLOPS (se usate la frequenza GPU Boost). Un rapporto 1:2 di core FP64 porta a una potenza con calcoli a doppia precisione di 5,3 TFLOPs. E il supporto per calcolo/archiviazione half precision garantisce fino a 21,2 TFLOPs. I chip più consumer GP102 e GP104 offrono naturalmente prestazioni FP32 massime, ma Nvidia ha deliberatamente frenato i calcoli FP64 e FP16 in modo che non si possano usare schede a basso costo per impieghi scientifici o altro.

vega 07
Clicca per ingrandire

AMD, al contrario, sembra voler offrire di più a tutti. Il blocco base Compute Unit, con 64 shader IEEE 754-2008-compliant, rimane invariato rispetto al passato. Ora però è chiamato NCU, o Next-Generation Compute Unit, riflettendo il supporto a nuovi tipi di dati. Con 64 shader e un picco di due operazioni/ciclo in virgola mobile, si ottiene un massimo di 128 operazioni a 32 bit per ciclo di clock. Con calcoli FP16 quel numero passa a 256 operazioni a 16 bit per clock. AMD afferma persino che può fare fino a 512 operazioni a 8 bit per ciclo di clock. I calcoli a doppia precisione sono differenti - AMD non sembra aver problemi ad ammettere che stabilisce la velocità FP64 in base all'indirizzo di mercato del prodotto.

vega 08
Clicca per ingrandire

L'introduzione di questa flessibilità giunge dal mondo delle console. Dopotutto sappiamo che PS4 Pro può usare l'half-precision per raggiungere una potenza fino a 8,4 TFLOPs - il doppio delle prestazioni con operazioni a 32 bit. Forse questo sviluppo è legato alle aspirazioni di AMD nel settore del machine learning, e porta a prodotti come la Radeon Instinct MI25 che punta a sottrarre mercato a Nvidia. A ogni modo console, datacenter e giocatori PC ne beneficeranno tutti.

vega 09
Clicca per ingrandire

AMD afferma anche che le NCU sono ottimizzate per frequenze più elevate. L'azienda ha anche implementato buffer instruction più ampi per mantenere occupate le Compute Unit.

Pixel Engine di nuova generazione

Diamo un'occhiata a quello che AMD chiama Draw Stream Binning Rasterizer, che si suppone sia un supplemento alla ROP tradizionale e come tale dovrebbe migliorare le prestazioni e ridurre i consumi.

Aleggia un grande punto di domanda su questa caratteristica. Colleghi che lavorano per altre testate hanno svolto dei test e nessuno ha registrato alcun miglioramento prestazionale rilevante. La ragione, come ci è stato recentemente confermato, è che DSBR è attualmente disabilitato e sarà reso disponibile in un futuro aggiornamento driver.

vega 10
Clicca per ingrandire

Di massima, una cache bin on-chip permette al rasterizzatore di raccogliere i dati una sola volta per primitive sovrapposte, e poi fare lo shading dei pixel una sola volta tagliando i pixel non visibili nella scena finale.

vega 11
Clicca per ingrandire

AMD ha cambiato fondamentalmente la sua gerarchia della cache, rendendo i render back-end sudditi della L2.

vega 12
Clicca per ingrandire

Nelle architetture prima di Vega AMD aveva un accesso di memoria pixel e texture non coerente, il che significava che non c'era un punto condiviso da sincronizzare per ogni stadio della pipeline. Nell'esempio del texture baking, dove una scena veniva renderizzata verso una texture per l'uso successivo e poi rivisitata nuovamente tramite l'array shader, il dato doveva essere pescato tramite la memoria off-die. Ora l'architettura ha un accesso coerente, che secondo AMD aumenta le prestazioni in particolare con applicazioni che usano il deferred shading.

Continua a pagina 2
AREE TEMATICHE
Vuoi ricevere aggiornamenti su #Schede video?
Iscriviti alla newsletter!