Cache, IPC, AVX e crittografia

Test del processore Intel Core i9-7900X con 10 core e 20 thread basato su architettura Skylake-X e compatibile con le scheda madre X299 con socket LGA 2066.

Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

Intel ha ridotto la Last Level Cache (LLC/L3) condivisa ed è passata da uno schema inclusivo a uno non inclusivo (esclusivo). Gli efficienti algoritmi di caching che massimizzano l'hit rate della cache L2 sono la chiave di questo cambiamento.

Il ribilanciamento riduce la cache L3 per core a 1,375 MB; Intel l'ha inoltre modificata per operare come victime cache che riempie con i dati espulsi dalla cache L2 privata.

cache gerarchia

Clicca per ingrandire

Intel ha inoltre quadruplicato la capacità della cache L1 per core da 256 KB a 1 MB. Uno spazio di archiviazione più grande a bassa latenza dovrebbe avere un effetto positivo sulle prestazioni, anche se Intel non ha spiegato come ha implementato i cambiamenti a livello di architettura.

Latenza di cache e memoria, Bandwidth

La latenza mesh e il bandwidth hanno impatto su cache e throughput di memoria, quindi abbiamo condotto una serie di test per confrontare i modelli avvalendoci ancora una volta di SiSoftware Sandra.

Abbiamo individuato una latenza L2 leggermente superiore per il Core i9-7900X rispetto al Core i7-6950X durante il test in-page random, ma allo stesso tempo una più bassa latenza L2 nel modello di accesso sequenziale. Il test multi-threaded cache bandwidth ha evidenziato una grande differenza prestazionale in favore del Core i9-7900X.

IPC, AVX, Crittografia

A causa del tempo limitato a disposizione prima del debutto di Skylake-X, abbiamo condotto un set di test preliminare per confrontare le prestazioni IPC. È possibile che ulteriori ottimizzazioni, o un insieme più ampio di carichi variabili, esponga una differenza maggiore di quella osservata.

Abbiamo impostato una frequenza fissa di 3 GHz per tutti i test. È importante notare che Intel non ha indicato specificatamente l'IPC come fonte dei miglioramenti del 15% e del 10% nei carichi single-threaded e multi-threaded. L'azienda ha invece basato le proprie affermazioni su test dei primi sample con Spec*int_rate_base2006 (soggetti a un margine di errore di +/- 5%).

Il test single-threaded di Cinebench non ha mostrato una differenza prestazionale tra Skylake-X e Skylake-S. C'è però un miglioramento dell'1,54% su Boradwell-E. Le CPU Ryzen inseguono.

Passando al test multi-threaded di Cinebench vediamo una differenza maggiore tra i due contendenti a 10 core e il resto del gruppo. Core i9-7900X e il Core i7-6950X rimangono il punto d'interesse. Abbiamo registrato una differenza tra i due di 1,93%.

Il Core i9-7900X ha due unità AVX FMA a 256 bit per core che operano in parallelo, mentre l'architettura Zen di Ryzen divide le operazioni AVX a 256 bit tra due unità FMA per core. Intel ha disattivato una delle FMA per i modelli Skylake-X sotto i 10 core.

Di conseguenza il Core i9-7900X ha un chiaro vantaggio nel benchmark y-cruncher, che è un software single- e multi-threaded che calcola Pi usando istruzioni AVX. Abbiamo svolto i test con la versione 0.7.2.9469, che include ottimizzazioni per Ryzen.

I risultati nel test single-core SHA2-256 del Core i9 sono quasi due volte migliori di quelli dei due modelli di precedente generazione a causa delle ottimizzazioni mirate AVX2 di Intel per le prestazioni hashing. Lo stesso vantaggio lo riscontriamo anche nel test multi-threaded. Intel offre supporto AVX-512 con i processori Skylake-X, ma non usa tutte e 11 le caratteristiche nei modelli desktop. L'azienda, invece, offre un set di funzionalità specifico per segmenti di mercati diversi.

L'architettura Zen include due acceleratori crittografici AES per ogni core, quindi non sorprende vedere i Ryzen dominare i test single-core AES-256-ECB. I chip Intel si affidano al maggior numero di core per ribaltare la situazione nel carico AES ottimizzato per sfruttare i thread.