Recensione Nvidia GeForce GTX 1060 6GB

Test della GTX 1060, la terza scheda video basata su architettura Pascal di Nvidia. Ecco come si comporta la prima soluzione con GPU GP106.

Avatar di Igor Wallossek

a cura di Igor Wallossek

Date il benvenuto a una nuova GPU Nvidia Pascal

A 2 mesi dal debutto l'architettura Pascal si sta facendo largo nell'offerta grafica di Nvidia, coprendo più fasce di mercato. Dopo la GTX 1080, capace di offrire oltre il 30% in più delle prestazioni di una GTX 980 Ti a un prezzo inferiore, è arrivata la GTX 1070, anch'essa capace di battere la GTX 980 Ti pur costando alcune centinaia di euro in meno.

Adesso è il momento della terza scheda video Pascal, la GTX 1060. Annunciata all'inizio di questo mese, dovrebbe essere disponibile a un prezzo suggerito a partire da 234 euro più IVA, ossia circa 285 euro. La Founders Edition sarà venduta a 319 euro, ma non sarà disponibile in Italia, almeno non ufficialmente. Ribadiamo subito che questi sono i prezzi suggeriti da Nvidia, per i prezzi reali dovremo guardare i prodotti negli shop.

La GTX 1060 è basata su una nuova GPU chiamata GP106, un GP104 in formato ridotto. Secondo Nvidia la GTX 1060, pur con un TDP di 120 watt, è capace di offrire prestazioni simili alla GTX 980. Due anni fa per ottenere quel livello di prestazioni bisognava spendere almeno 550 euro.

Ecco GP106

Nvidia ha realizzato la GTX 1080 usando un GP104 completo con quattro Graphics Processing Clusters abilitati. Questo significa avere a disposizione un totale di 2560 CUDA core e 160 unità texture. La GTX 1070 si basa sulla stessa GPU ma con tre GPC attivi, per un totale di 1920 CUDA core e 120 unità texture.

gp106 block diagram
Clicca per ingrandire

La GTX 1060 scala in modo simile usando i medesimi blocchi base dell'architettura. Dalla recensione della GTX 1080: "Ogni GPC offre cinque Thread/Texture Processing Clusters e un raster engine. Entrando ulteriormente nel dettaglio, un TPC combina uno Streaming Multiprocessor e un PolyMorph engine. L'SM combina 128 CUDA core a singola precisione, un file di registro da 256 KB, 96 KB di memoria condivisa, 48 KB di cache L1/texture e otto unità texture. Allo stesso tempo la quarta generazione del PolyMorph engine include un nuovo blocco logico che è posto alla fine della pipeline geometrica e prima dell'unità raster per gestire il Simultaneous Multi-Projection".
GPU GeForce GTX 1060 (GP106) GeForce GTX 980 (GM204)
SM 10 16
CUDA Core 1280 2048
Freq. base 1506 MHz 1126 MHz
Freq. GPU Boost 1708 MHz 1216 MHz
GFLOPs (Base Clock) 3855 4612
Unità Texture 80 128
Texel Fill Rate 120.5 GT/s 144.1 GT/s
Data Rate memoria 8 Gb/s 7 Gb/s
Bandwidth 192 GB/s 224 GB/s
ROPs 48 64
Cache L2 1.5MB 2MB
TDP 120W 165W
Transistor 4,4 miliardi 5,2 miliardi
Dimensione die 200 mm² 398 mm²
Processo produttivo 16 nm 28 nm

GP106 ha due GPC, quindi è formato da un totale di 1280 CUDA core e 80 unità texture. Il chip beneficia delle stesse ottimizzazioni ai timing che hanno permesso a Nvidia di aumentare la frequenza su GP104, ed è così impostato a una frequenza base di 1506 MHz e una di GPU Boost tipico di 1708 MHz.

Anche il back-end del processore è stato ridimensionato. Sei controller di memoria a 32 bit forniscono un data path aggregato a 192 bit. Come il più grande GP104, ogni controller è associato a 8 ROPs e 256 KB di cache L2, per un totale di 48 ROPs e 1,5 MB di cache. Nvidia ha dotato la scheda di 6 GB di memoria GDDR5 a 8 GT/s, per un throughput di picco fino a 192 GB/s. Anche se questo valore è inferiore ai 224 GB/s della GTX 980, ricordate che Pascal gode di nuove tecniche lossless per usare al minimo il sottosistema di memoria, aumentando in questo modo il bandwidth usabile. Il seguente pezzo è adattato dalla recensione della GTX 1080: "La compressione delta color di GP106 punta a offrire un risparmio di 2:1 e questa modalità è presumibilmente migliorata per essere usabile con maggiore frequenza. C'è anche una nuova modalità 4:1 che copre i casi in cui le differenze per pixel sono davvero piccole e comprimibili in persino meno spazio. Infine Pascal ha una nuova modalità 8:1 che combina una compressione costante 4:1 a blocchi 2x2 con compressione 2:1 delle differenze tra i blocchi".

Ovviamente anche GP106 è prodotto con lo stesso processo 16FF+ di TSMC adottato per GP104. Mentre la GPU più grande è composta da 7,2 miliardi di transistor su un die da 314 mm2, Nvidia è riuscita a inserire 4,4 miliardi di transistor FinFET nei 200 mm2 di GP106. Il processore meno complesso, accoppiato alla minor memoria su un progetto più semplice, porta ad avere un TDP di 120 watt.

Niente SLI

three quarter shot
Notate la mancanza del connettore SLI? Nvidia consiglia la GTX 1070 e la GTX 1080 ai giocatori che vogliono più prestazioni rispetto a quelle che offre la GTX 1060 e così ha deciso di non supportare lo SLI su questa scheda.

Nvidia ha preso atto che non ci sono molti giocatori che accoppiano GPU mainstream e ha deciso di non disperdere risorse, focalizzandosi sull'ottimizzazione dello SLI sulle schede Pascal più veloci. Oltre a questa spiegazione però, c'è da dire che lo sviluppo di giochi sta prendendo una direzione differente con effetti di post processing orientati al calcolo che non sono amici dell'alternate-frame rendering. E con le DirectX 12, gli sviluppatori hanno maggiore controllo. Ciò significa che gran parte del lavoro che Nvidia fa con i driver verrà aggirato.

Abbiamo un gioco nella nostra suite che supporta più GPU tramite le DirectX 12: Ashes of the Singularity. Dopo aver aggiunto una seconda GTX 1060 abbiamo osservato il seguente miglioramento:

sli fps
sli frot
Clicca per ingrandire

sli ftoa
Clicca per ingrandire

sli ftor
Clicca per ingrandire

sli smoothness
Clicca per ingrandire

Anche se non è il tipo di scaling che siamo soliti vedere con lo SLI, un passo avanti di circa 50% non è male. Nvidia potrebbe retroattivamente abilitare lo SLI tramite PCI Express con un update dei driver. Speriamo lo faccia in futuro.

GeForce GTX 1060 Founders Edition

La GTX 1060 ha un design che ricorda quello della GTX 1070 e della GTX 1080, anche se in una versione meno costosa.

01 GTX 1060 FE Box
Clicca per ingrandire

La scheda ha una lunghezza di 25,4 centimetri, un'altezza di 10,7 centimetri e una profondità di 3,8 centimetri.
04 GTX 1060 FE Front
Clicca per ingrandire

La GeForce GTX 1060 pesa 845 grammi, quindi non è particolarmente leggera: l'uso del metallo richiede compromessi.

La copertura della scheda è un mix di alluminio e plastica, ed è piuttosto basilare, tanto che si può rimuovere in un unico pezzo. Sulla parte superiore è presente il logo "GeForce GTX", illuminato con la scheda in funzione. Il connettore PCIe a 6 pin è posizionato in modo strano, ma ne parleremo più tardi.

06 GTX 1060 FE Bottom
Clicca per ingrandire

08 GTX 1060 FE Top
Clicca per ingrandire

La parte posteriore della GeForce GTX 1060 è un po' diversa dai design precedenti. Le schede video con circuiti stampati corti hanno di solito una presa d'aria dove la soluzione di raffreddamento si spinge oltre il PCB, al fine di alimentare la ventola radiale. La GTX 1060 ha invece una copertura. Per contenere i costi la scheda non ha nemmeno il backplate.
05 GTX 1060 FE Back
Clicca per ingrandire

Nella parte posteriore troviamo tre DisplayPort certificate 1.2, ma pronte per le specifiche 1.3 e 1.4. Ci sono anche una HDMI 2.0 e un connettore dual-DVI.
07 GTX 1060 FE End
Clicca per ingrandire

 
09 GTX 1060 FE Slot Panel
Clicca per ingrandire

Sistema di raffreddamento, scheda e alimentazione

Rimuovendo la copertura ci troviamo davanti alla soluzione di raffreddamento. Nella parte superiore emerge immediatamente la strana posizione del connettore PCIe. È situato sulla parte della soluzione di raffreddamento che sporge oltre la scheda. Questa scelta ha imposto a Nvidia la presenza di cavi per la connessione ai circuiti.

01 Opened Card
Clicca per ingrandire

05 Shroud
Clicca per ingrandire

Questo progetto non è elegante e impedisce ai partner di Nvidia di realizzare schede video molto più corte usando il progetto di riferimento. La scheda è lunga solo 17,5 cm ma non ha alcun spazio per il connettore PCIe.

Il corpo del sistema di raffreddamento può essere rimosso tramite quattro viti. Troviamo un grande dissipatore in rame e, al di sotto, una cornice metallica. Il progetto chiuso delle alette di raffreddamento è una reminiscenza della GTX 1070 e dovrebbe dissipare in modo più che adeguato il calore prodotto della GPU della GTX 1060.

04 Cooler Heatsink
La cornice di raffreddamento e ritenzione ha il doppio scopo di mantenere tutto al proprio posto e raffreddare bene i convertitori di tensione e i moduli di memoria.
02 Opened Card Without Cooler
Clicca per ingrandire

Rimossa la cornice, questa deve essere capovolta per via dei cavi che connettono il connettore PCIe separato, che sono saldati permanentemente alla scheda.
05 PCB Front With Frame
Come sempre la GPU è al centro dell'attenzione. GP106 è piuttosto piccola rispetto a GP104, ma non è l'unica differenza tra la GTX 1060 e le soluzioni GTX 1070 e 1080. Diamo un'occhiata ai moduli di memoria.
06 GPU
Solo sei degli spazi disponibili sulla scheda ospitano i moduli di memoria. I moduli sono di Samsung e il loro model number è K4G80325FB-HC25. Hanno una capacità di 8 gigabit (32x 256 MBit) ciascuno e lavorano da 1,305 a 1,597 volt, a seconda della frequenza di clock. La scheda è dotata di un totale di 6 GB di memoria.

Sfortunatamente il controller PWM non è ancora accompagnato da documentazione adeguata. È realizzato da uPI Semiconductor Corp e ha un model number uP9509, il che significa che molto probabilmente è un derivato dell'uP9511P, il controller PWM che accompagna la GPU GP104. È completamente sufficiente per le tre fasi dedicate alla GPU e per la fase destinata ai moduli di memoria.

Memory
La fase dei moduli di memoria e una delle fasi della GPU assorbono energia dallo slot PCIe della motherboard. Le due fasi rimanenti della GPU raccolgono energia dal connettore PCIe. Nella prossima pagina vedremo cosa significa per la distribuzione del carico tra i canali.
PWM Controller uP9509P
Il regolatore di tensione è basato su un Dual N-Channel MOSFET, l'E6930, per fase sia per il lato alto che quello basso, il che significa che gate driver separati non sono necessari. Ciò spiega gli spazi vuoti presenti. Le tre fasi della GPU sono totalmente sufficienti. La perdita di energia a livello dei convertitori di energia è relativamente bassa. La distribuzione delle fasi ha più senso di quella vista sulla Radeon RX 480 di AMD.
VRM 6930
Salvo il connettore PCIe la GTX 1060 Founders Edition è ben progettata. In base alla bassa quantità di calore disperso l'uso di una ventola assiale non è una scelta sbagliata.