Hot topics:
News su SMAU 2017
41 minuti

Recensione Intel Core i9-7900X, arriva Skylake-X

Test del processore Intel Core i9-7900X con 10 core e 20 thread basato su architettura Skylake-X e compatibile con le scheda madre X299 con socket LGA 2066.

Recensione Intel Core i9-7900X, arriva Skylake-X

Nuova architettura, nuova piattaforma

Intel Core i9-7900X

 
Intel Core i9-7900X

La nuova serie di processori Intel Core X attraversa le famiglie Core i5, Core i7 e la nuova Core i9. Tutti i modelli sono compatibili con la nuova piattaforma LGA 2066 basata sul chipset X299. Intel ha progettato le soluzioni della serie X specificatamente per il settore HEDT (High-End Desktop), rivolgendosi come negli anni passati ai creatori di contenuti e agli appassionati delle massime prestazioni.

A seconda del modello, i Core X possono offrire solo quattro core, ma anche arrivare a 18 core / 36 thread. Intel ha inoltre introdotto diversi miglioramenti all'architettura per offrire prestazioni fino al 15% maggiori nei carichi single-thread e un incremento del 10% nei software più ottimizzati per sfruttare i thread.

Il dominio assoluto di Intel sul settore dei microprocessori è iniziato un decennio fa e, da allora, il mercato dei processori non ha visto molta competizione. Intel ha quindi rallentato il passo: non abbiamo assistito a tagli prezzo, tecnologie radicalmente nuove o un aumento sensibile del numero di core. Il ritorno alla competitività da parte di AMD, iniziato con i processori Ryzen, ha dato una scossa al settore, grazie a un maggior numero di core, SMT, prezzi competitivi e moltiplicatori sbloccati su tutti i processori.

CPU
Clicca per ingrandire

Adesso Intel sta cercando di difendere la propria offerta di punta dalla nuova gamma di soluzioni Ryzen Threadripper, potrebbe sconvolgere lo status quo con processori fino a 16 core / 32 thread e con 64 linee PCIe 3.0 su tutti i modelli.

Di certo i miglioramenti a Skylake-X non sono una reazione in fretta e furia. Sono in sviluppo da anni. A ogni modo Intel ha accelerato il passo e ha rivisto i prezzi come mai prima.

Intel Core i9-7900X
Interfaccia LGA 2066
Core / thread 10 / 20
TDP 140W
Freq. base 3,3 GHz
Freq. Turbo 4,3 GHz
Cache L3 13,75 MB
Grafica -
Memoria DDR4-2666
Controller di memoria quad-channel
Moltiplicatore sbloccato
Linee PCI Express 44

I modelli Skylake-X con più di 12 core sono ancora distanti all'orizzonte e il nostro Core i7-7440X non è arrivato in tempo in laboratorio. In questo articolo vi mostriamo le prestazioni della CPU a 10 core Core i9-7900X, ma prima guardiamo l'intera offerta.

Kaby Lake-X

Di solito i processori HEDT sono basati su un'architettura vecchia di una o due generazioni rispetto alle soluzioni mainstream. Con un modello Core i5 e uno Core i7, invece, Intel porta sulla piattaforma X299 i processori quad-core Kaby Lake-X, segnando un cambiamento rispetto al passato. Il resto della serie X è invece basata sulla precedente architettura Skylake. Anche se ciò potrebbe cambiare presto.

Mainboard 01
Clicca per ingrandire

All'inizio di quest'anno Intel ha annunciato la sua nuova strategia "Datacenter First", che vedrà i processi più recenti arrivare sui prodotti Xeon prima che su quelli desktop. Considerando che la lineup HEDT si basa su die per i datacenter riposizionati, l'offerta HEDT probabilmente vivrà una transizione verso le ultimissime architetture.

Intel ha ampliato la gamma HEDT da quattro processori a nove, ma i due modelli 14nm+ Kaby Lake-X sono un'aggiunta curiosa. Supportano solo memoria dual channel, mentre Skylake-X ha un controller quad-channel. Questo significa che potete usare solo metà degli slot DIMM con una CPU Kaby Lake-X installata.

Il numero limitato di linee PCIe porta a minori opzioni di I/O limitate. Intel ha disattivato la GPU integrata HD Graphics 630, che ora ha il compito di assorbire calore, fornendo forse più margine di overclock. A parte un piccolo incremento delle frequenze base e un TDP maggiore di 112W, i Core i5-7640X e Core i7-7740X sono simili alle controparti della serie S, l'attuale gamma mainstream. E questo vale anche per il prezzo.

Mainboard 02
Clicca per ingrandire

Accoppiare questi processori a una motherboard costosa evoca un'immagine, quella del Core i3-7350K, che per le stesse ragioni non è un processore popolare. Intel dice che i produttori di schede madre possono creare soluzioni X299 a basso costo dedicate ai modelli Kaby Lake-X, ma per ora non abbiamo visto nessuno affrettarsi a creare soluzioni per quella nicchia.

  Core i5-7640X Core i7-7740X Core i7-7800X Core i7-7820X Core i9-7900X Core i9-7920X Core i9-7940X Core i9-7960X Core i9-7980XE
Famiglia Kaby Lake-X Kaby Lake-X Skylake-X Skylake-X Skylake-X Skylake-X Skylake-X Skylake-X Skylake-X
Processo 14nm+ 14nm+ 14nm 14nm 14nm        
Core/Thread 4/4 4/8 6/12 8/16 10/20 12/24 14/28 16/32 18/36
Base Clock (GHz) 4.0 4.3 3.5 3.6 3.3 ? ? ? ?
TurboBoost 2.0 (GHz) 4.2 4.5 4.0 4.3 4.3 ? ? ? ?
TurboBoost 3.0 (GHz) NA NA NA 4.5 4.5 ? ? ? ?
Cache L3 6 8 8.25 11 13.75 ? ? ? ?
Linee PCIe 3.0 16 16 28 28 44 ? ? ? ?
Supporto di memoria Dual Channel DDR4-2666 Dual Channel DDR4-2666 Quad Channel DDR4-2400 Quad Channel DDR4-2666 Quad Channel DDR4-2666 ? ? ? ?
TDP 112W 112W 140W 140W 140W ? ? ? 165W
Socket 2066 2066 2066 2066 2066 2066 2066 2066 2066
Prezzi per mille unità $242 $339 $389 $599 $999 $1,199 $1,399 $1,699 $1,999

Skylake-X

Intel supporta memoria DDR4-2666 con tutti i processori Skylake-X, eccetto il Core i7-7800X. Ha inoltre deliberatamente disattivato ECC per dissuadere gli acquirenti di Xeon dall'adottare la piattaforma desktop.

Intel non ha pubblicato i dettagli tecnici dei modelli con più core, ma ci aspettiamo che sul fronte della memoria la situazione rimanga simile. Ci aspettiamo inoltre frequenze in calo all'aumentare del numero di core.

Core attivi 1 2 3 4 Core 5-10
Intel Core i9-7900X (GHz) Turbo Boost 4.3 4.3 4.1 4.1 4.0

Il Core i9-7900X ha la stessa implementazione TurboBoost (TB) 2.0 del suo predecessore, ma le frequenze sono notevolmente maggiori e arrivano a 4 GHz con 10 core attivi. Intel offre inoltre il supporto Turbo Boost 3.0 per sei modelli Skylake-X. L'azienda ha migliorato la tecnologia affinché sfrutti i due core più veloci con carichi leggermente parallelizzati, un passo avanti rispetto al passato, quando era supportato un solo core. TurboBoost 3.0 spinge i due core "preferiti" fino a 4,5 GHz, in accordo alle normali frequenze TB 2.0 degli altri core.

Naturalmente questo dovrebbe aumentare l'IPC, mitigando lo svantaggio dei grandi chip HEDT rispetto alle soluzioni quad-core. Attualmente il Turbo Boost 3.0 richiede un driver su alcune motherboard, ma Intel sta lavorando a un'implementazione nativa con Microsoft in Windows 10 per eliminare questa necessità.

Intel ha introdotto anche un supporto parziale AVX-512, il che significa che il portabandiera a 18 core dovrebbe essere il primo chip consumer a offrire più di un teraflop di potenza di calcolo.

L'azienda ha inoltre riprogettato la gerarchia della cache, aumentando la cache L2 e riducendo quella L3, cosa che dovrebbe migliorare le prestazioni in diversi frangenti. Fa il suo debutto la nuova architettura mesh e, come Infinity Fabric di AMD, non sempre è un elemento vincente - come vedremo nelle prossime pagine.

Intel ha ridotto il prezzo dai 1723 dollari del Core i7-6950X Broadwell-E a 1000 dollari per il Core i9-7900X Skylake-X. Pagare questa cifra è l'unico modo per avere 44 linee PCI Express 3.0. Il modello immediatamente successivo, il Core i7-7820X, ha solo 28 linee.

L'archiviazione che sta migrando verso il bus PCI Express, perciò quelle linee extra portebbero essere utili per gli SSD dato che le configurazioni multi-GPU non sono così popolari come in passato.

Intel offre inoltre una nuova tecnologia chiamata PCIe Virtual RAID on CPU (VROC) che permette di unire fino a 20 SSD in un singolo volume avviabile. La cosa più interessante è che potete creare un RAID su qualsiasi slot PCIe disponibile, mentre le precedenti implementazioni RSTe RAID richiedevano una connessione al chipset.

Aggirare il chipset elimina le normali restrizioni al bandwidth del bus DMI, ma ha un prezzo. Sfortunatamente, dovrete acquistare una chiave di aggiornamento che si collega alla motherboard per sbloccare VROC. Questa pratica è diffusa sulle motherboard server, ma probabilmente non sarà popolare tra gli appassionati. Ancora non sappiamo quanto costerà questa chiave.

Parlando di bus DMI, Intel ha rinstaurato la possibilità di overcloccare i bus DMI e PCIe. Una nuova impostazione "memory controller-PLL trim voltage" è pensata per aumentare le capacità di overclock della memoria basata sui rapporti, mentre un nuovo AVX-512 ratio offset si unisce all'AVX offset standard per controllare le temperature durante i pesanti carichi AVX.

Abbiamo incontrato alcune strane tendenze prestazionali nel corso dei test. Non vi nascondiamo che questo debutto sembra un po' affrettato e, anche se gli aggiornamenti firmware da parte dei produttori di motherboard hanno risolto molti problemi, persistono alcune stranezze. Sembra che i modelli Intel Skylake-X necessiteranno di un periodo di ottimizzazione, come i processori Ryzen di AMD. Diamo uno sguardo ai fattori che impattano sulle prestazioni di Skylake-X.

Intel Core i9-7900X Intel Core i9-7900X
   

Topologia mesh, un cambiamento necessario

Come vedrete nei test con alcuni software e giochi, alcuni risultati non si allineano alle nostre aspettative. Dato il vantaggio sul fronte delle frequenze e le nuove caratteristiche dell'architettura di Skylake-X, come la cache riprogettata e la nuova topologia 2D mesh, non ci aspettavamo che i modelli Broadwell-E avessero delle chance. Questo è però quello che è accaduto in alcuni casi. Abbiamo chiesto lumi a Intel, ecco la risposta:

...abbiamo notato che ci sono una manciata di applicazioni dove la soluzione Broadwell-E è comparabile o più veloce di quella Skylake-X. Questo scambio di posizioni è un risultato dell'architettura mesh di Skylake-X rispetto all'architettura ring di Broadwell-E.

Ogni nuova architettura richiede che i progettisti facciano compromessi ingegneristici con l'obiettivo di migliorare le prestazioni generali della piattaforma. L'architettura mesh su Skylake-X non è differente.

Mentre questi compromessi impattano una manciata di applicazioni, generalmente i nuovi processori Skylake-X offrono un IPC eccellente e miglioramenti prestazionali rilevanti lungo una varietà di applicazioni.

Ci siamo occupati della nuova architettura mesh, almeno per i dettagli che l'azienda ha reso noti, nei giorni scorsi. Date un'occhiata a quell'articolo per avere maggiori informazioni. Si tratta certamente di un grande cambiamento a un progetto già efficace, quindi non sorprende che la topologia mesh non offra ulteriori prestazioni in tutti i nostri test.

Un po' di contesto

Le interconnessioni sono il percorso che permettono ai dati di passare tra i vari componenti chiave all'interno del chip, inclusi core, cache e controller di memoria e PCIe. Influenzano latenza e consumi, che a loro volta si riflettono su prestazioni e TDP.

Il ring bus di Intel debuttò con Nehalem nel 2007 e l'HyperTransport di AMD nel 2001. Entrambi le tecnologie si sono evolute negli anni, ma il rapido aumento del numero di core, delle prestazioni, della cache e del throughput I/O le ha spinte al limite. Ci sono una miriade di tecniche per aumentare le prestazioni delle interconnessioni esistenti ma spesso è necessario aumentare le frequenze e di conseguenza la tensione, al fine di ottenere evidenti miglioramenti prestazionali.

03 JPG
Ring bus
04 JPG
Ring bus con tanti core, clicca per ingrandire

Il ring bus bidirezionale di Intel, nell'immagine sopra in rosso su un die Broadwell LCC (Low Core Count), serve come un buon esempio. I dati attraversano un percorso circolare per raggiungere i componenti, ma la latenza sale all'aumentare del numero di core. La seconda immagine mostra il die Broadwell HCC (High Core Count) con 24 core. Allineare tutti i core in un bus monolitico imporrebbe un penalty prestazionale troppo grande per essere una buona scelta, quindi Intel ha diviso il die più grande in due ring bus separati. Questo aumenta la complessità dello scheduling, e i buffered switch che facilitano la comunicazione tra gli anelli impongono un penalty di 5 cicli, limitando la scalabilità.

Anche il bus HyperTransport di AMD è diventato inadeguato, quindi l'azienda ha presentato Infinity Fabric con l'architettura Zen. Il design è simile a due quad-core (CCX) che comunicano su un crossbar bidirezionale a 256 bit che gestisce anche il traffico northbridge e PCIe. Condividono anche un controller di memoria. Il viaggio lungo Infinity Fabric verso gli altri quattro core dentro al secondo Core Complex (CCX) e la sua cache abbinata porta a un aumento della latenza di comunicazione.

Abbiamo parlato a fondo del progetto e misurato la sua latenza testando Ryzen 5 1600X, quindi leggete quell'articolo per avere maggiori dettagli. Abbiamo anche riscontrato che le frequenze di memoria maggiori possono migliorare le caratteristiche di latenza di Infinity Fabric, il che è probabilmente una delle ragioni chiave per l'incremento prestazionale di Ryzen con memorie capaci di assicurare transfer rate più veloci.

AMD afferma che le ottimizzazioni di software e piattaforma possono far fronte ad alcuni dei problemi prestazionali che abbiamo notato nei nostri test, e da quello che abbiamo visto è vero. Gli sforzi di AMD, e la lunga sequela di aggiornamenti BIOS, driver per il chipset e update software, hanno portato a prestazioni molto migliori di quelle registrate nella prima recensione di Ryzen 7.

Il lavoro di AMD continua, e ora tocca a Intel far fronte alle stesse problematiche.

Topologia mesh

La nuova architettura mesh di Intel ha fatto il suo debutto nei prodotti Knights Landing (Xeon Phi). La mesh consiste di righe e colonne di interconnessioni che collegano core, cache e controller di I/O. Come potete vedere, i buffered switch che influenzavano la latenza sono spariti.

L'abilità di far passare i dati tramite i core favorisce un indirizzamento tra gli elementi molto più complesso ma efficiente. Intel indica inoltre che la mesh 2D ha una tensione e una frequenza minori rispetto al ring bus, pur offrendo un bandwidth maggiore e una minore latenza.

01 JPG
Topologia mesh, clicca per ingrandire
02

Intel ha spostato i controller DDR4 a sinistra e destra sul die a 18 core HCC (High Core Count) - similmente a Knights Landing - laddove solitamente li posizionava sul fondo dei design ring bus. L'immagine del die di Skylake-X suggerisce che ci sono anche sei controller di memoria, quindi Intel ha probabilmente disattivato due controller per i chip desktop. Intel probabilmente usa il più piccolo die LCC (Low Core Count) per il Core i9-7900X, ma l'azienda non ce l'ha confermato.

Testiamo l'impatto della topologia mesh

Intel ha progettato la sua mesh 2D per aumentare la scalabilità, ma ha anche dovuto fare dei compromessi. Abbiamo usato il test Processor Multi-Core Efficiency di SiSoftware Sandra per misurare la latenza inter-core, inter-module e inter-package. Il software offre test Multi-Threaded, Multi-Core Only e Single-Threaded. Usiamo il test Multi-Threaded con l'impostazione "best pair match" (latenza più bassa).

Il test misura le prestazioni tra i core con tutte le possibili coppie di thread, e per il Core i9-7900X questo porta a 189 risultati diversi. Abbiamo usato un parser per ottenere dei dati medi.

Processore Latenza Intra-Core Latenza Core-To-Core Latenza media Core-To-Core Bandwidth di trasferimento medio
Core i9-7900X 14.5 - 16ns 69.3 - 82.3ns 75.56ns 83.21 GB/s
Core i9-7900X @ 3200 MT/s 16 - 16.1ns 76.8 - 91.3ns 83.93ns 87.31 GB/s
Core i7-6950X 13.5 - 15.4ns 54.5 - 70.3ns 64.64ns 65.67 GB/s
Core i7-7700K 14.7 - 14.9ns 36.8 - 45.1ns 42.63ns 35.84 GB/s
Core i7-6700K 16 - 16.4ns 41.7 - 51.4ns 46.71ns 32.38 GB/s

Il valore intra-core quantifica la latenza tra i thread che risiedono sullo stesso core fisico, mentre i numeri core-to-core riflettono la latenza thread-to-thread tra due core fisici. Il Core i9-7900X è da confrontare con il 10 core Core i7-6950X, ma abbiamo incluso modelli quad-core come riferimento.

Abbiamo registrato un leggero aumento della latenza intra-core e una differenza nella latenza media di 10,92ns tra i due modelli. Nonostante la maggiore latenza del Core i9, abbiamo misurato un vantaggio di 17,54 GB/s nel bandwidth di trasferimento medio - un aumento del 26,7%. Abbiamo generato il nostro primo set di risultati del Core i9-7900X con memoria DDR4-2666 ma abbiamo fatto diversi test con DDR4-3200 e notato un aumento della latenza mesh in tutti i test. Abbiamo anche registrato un bandwidth di trasferimento medio maggiore. Si tratta di risultati preliminari, e stiamo conducendo ulteriori test su latenza e giochi con memorie dotate di trasfer rate differenti e timing per un'analisi più approfondita.

Processore Latenza Intra-CCX Core-to-Core Latenza Cross-CCX Core-to-Core Latenza media Cross-CCX Bandwidth di trasferimento medio
Ryzen 7 1800X 40.5 - 82.8ns 120.9 - 126.2ns 122.96ns 48.1 GB/s
Ryzen 5 1600X 40.6 - 82.8ns 121.5 - 128.2ns 123.48ns 43.88 GB/s

I processori Ryzen di AMD hanno un'architettura decisamente diversa che porta a misure differenti. Le misure di latenza intra-core rappresentano la comunicazione tra due thread logici sullo stesso core fisico e non sono influenzate dalla frequenza della memoria.

Le misure intra-CCX quantificano la latenza tra i thread sullo stesso CCX che non risiedono sullo stesso core. In passato, abbiamo osservato leggere variazioni, ma la latenza intra-CCX non viene influenzata molto dalla velocità della memoria. Abbiamo tuttavia visto cali fino al 50% nella latenza cross-CCX, ossia la latenza tra i thread posti su due CCX separati, passando da DDR4-2333 a DDR4-3200.

Bandwidth

fabric bandwidth

Abbiamo registrato i valori del bandwidth dell'interconnessione. Il Core i9-7900X ha un grande vantaggio rispetto al predecessore Broadwell-E. I processori Ryzen affossano i modelli quad-core di Intel ma offrono un bandwidth medio molto minore rispetto alle CPU a 10 core di Intel.

Continua a pagina 2
AREE TEMATICHE
Vuoi ricevere aggiornamenti su #CPU?
Iscriviti alla newsletter!