Cascade Lake, Intel sfida AMD con un processore con 112 thread

Gli Xeon Scalable "Cascade Lake" si presentano con un massimo di 56 core e 112 thread per soddisfare le esigenze del settore datacenter.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Intel ha annunciato la disponibilità entro la prima metà di quest'anno dei processori Xeon Scalable di seconda generazione, nome in codice Cascade Lake. L'annuncio è arrivato nel corso del Data-Centric Innovation Day di San Francisco. I nuovi Xeon Scalable di seconda generazione sono disponibili in 53 modelli che vedono nella serie Xeon Platinum 9200 (Cascade Lake AP) e in particolare nel Platinum 9282 il vertice dell'offerta con ben 56 core, 112 thread e 12 canali di memoria. Partiamo proprio dalla famiglia Xeon Platinum 9200.

Cascade Lake AP

Lo scorso novembre Intel annunciò l'intenzione di creare una nuova piattaforma di calcolo ad alte prestazioni e densità per il settore HPC, nome in codice Cascade Lake AP. L'impegno consisteva nell'inserire due die su un singolo package (dual-die MCM - Multi-Chip Module), raddoppiando così il numero di core e di canali di memoria per ottenere in un formato minore l'equivalente di un sistema dual-socket.

All'epoca Intel prevedeva soluzioni Cascade Lake AP con 48 core e 96 thread, ma l'azienda si è spinta oltre riuscendo a inserire 56 core e 112 thread in un singolo package. Questo è stato possibile unendo due die XCC (extreme core count) a 28 core, ognuno con sei canali di memoria. Ci troviamo di fronte a processori BGA (Ball Grid Array), saldati direttamente alle motherboard tramite interfaccia 5903-ball, venduti da Intel attraverso gli OEM.

Quest'ultimi potranno occuparsi del design dei server, ma le configurazioni di CPU e motherboard saranno prestabilite da Intel. Di conseguenza l'azienda non ha rivelato i prezzi, che tuttavia saranno altissimi, oltre i 10.000 dollari viste le caratteristiche dei processori.

Lo Xeon Scalable Platinum 9282 ha 56 core e 112 thread che operano a una frequenza di 2,6 / 3,8 GHz, 77 MB di cache L3 ed è accompagnato da un TDP di 400 watt. A seguire il modello 9242 con 48 core, 96 thread, frequenze di 2,3 / 3,8 GHz, 71,5 MB e TDP di 350 watt.

Core / Thread Base / Boost Freq. (GHz) Cache L3 TDP
Xeon Platinum 9282 56 / 112 2.6 / 3.8 77 MB 400W
Xeon Platinum 9242 48 / 96 2.3 / 3.8 71.5 MB 350W
Xeon Platinum 9222 32 / 64 2.3 / 3.7 71.5 MB 250W
Xeon Platinum 9221 32 / 64 2.1 / 3.7 71.5 MB 250W

Platinum 9222 e 9221 sono invece sostanzialmente simili, con 32 core e 64 thread, 71,5 MB di cache L2 e un TDP di 250 watt. A differenziare i due modelli sono le frequenze pari a 2,3 / 3,7 GHz nel primo caso e 2,1 / 3,7 GHz nel secondo.

Ognuna di queste CPU offre 40 linee PCI Express 3.0, anche se ogni die ne ha in realtà 64. Intel ne usa una parte per la connessione UPI (Ultra-Path Interconnect) che collega i due die all'interno del processore, mentre l'altra è dedicata alla comunicazione tra i due chip in un server dual-socket. Nel complesso questo garantisce quattro canali UPI per socket per un throughput totale di 10,4 GT/s.

Come accennato in apertura, le CPU Cascade Lake AP offrono 12 canali di memoria fino a DDR4-2933. Nel caso di una configurazione a doppio socket si parla quindi di 24 canali di memoria per 3 TB di memoria DDR4 supportata (1,5 TB per socket, il doppio dei 768 GB degli Xeon Scalable di prima generazione), con un throughput di memoria fino a 407 GB/s.

I processori Cascade Lake AP non supportano i moduli di memoria Optane DC Persistent Memory, in quanto la piattaforma è destinata ad applicazioni in cui è la potenza di calcolo e non la memoria a rappresentare il principale collo di bottiglia. Intel, inoltre, ha affermato che il modello da 400 watt necessita di un raffreddamento a liquido, mentre le altre soluzioni si possono raffreddare ad aria.

Un server dual-socket Cascade Lake AP si presenta come un server quad-socket al sistema operativo, il che significa che i quattro nodi NUMA appaiono come quattro CPU distinte. Questo può comportare problemi di latenza nell'accesso ai banchi di memoria "più lontani", ma Intel ha spiegato di aver mitigato il problema portando la latenza a 76 nanosecondi per la memoria più prossima e 130 nanosecondi per l'accesso ai moduli più "lontani".

Cascade Lake

Il resto dell'offerta Xeon Scalable di seconda generazione - disponibile da subito - è composta dalle soluzioni mainstream Cascade Lake (Cascade Lake SP), contraddistinte dai suffissi Platinum, Gold e Silver. In questo caso abbiamo un aggiornamento della piattaforma Purley, con processori basati sulla stessa architettura Skylake dei predecessori, anche se Intel afferma di essere riuscita a ottenere un incremento delle prestazioni in carichi reali del 30% rispetto alla generazione precedente.

I processori Cascade Lake e per estensione anche i modelli AP, rappresentano inoltre le prime proposte Intel per datacenter con mitigazioni direttamente nell'hardware per le classi di vulnerabilità Meltdown e Spectre, e questo dovrebbe ridurre l'impatto prestazionale di tali interventi rispetto all'azione via software. Nel complesso, tra interventi hardware e software, Intel mitiga le Varianti 2, 3, 3a, 4 e L1TF.

Per quanto riguarda le caratteristiche generali dei modelli, ritroviamo un massimo di 28 core e 56 thread, fino a 38,5 MB di cache L2, la nuova UPI (Ultra Path Interface), fino a sei canali di memoria, supporto AVX-512 e fino a 48 linee PCIe. I processori sono inoltre compatibili con lo stesso socket della generazione precedente (LGA 3647, Socket P), quindi non sarà necessario cambiare la motherboard per supportarli.

Le novità più evidenti arrivano forse dal supporto di memoria e dal processo produttivo. I nuovi chip supportano DDR4-2933 (i precedenti si fermavano a 2666 MHz) e raddoppiano la capacità supportata fino a 1,5 TB di memoria. Intel è passata inoltre al processo produttivo a 14 nm++, cosa che le ha consentito di migliorare frequenze, consumi e fare interventi mirati per aumentare la velocità delle interconnessioni fondamentali all'interno del die.

I Cascade Lake supportano inoltre la nuova suite DL Boost che aggiunge il supporto a molteplici funzionalità legate all'intelligenza artificiale, il che secondo Intel rende queste CPU "le uniche specificatamente ottimizzate per i carichi IA". La casa di Santa Clara vanta un miglioramento prestazionale di 14 volte nei carichi di inferenza, inoltre le nuove VNNI (Vector Neural Network Instructions) ottimizzano le istruzioni per i piccoli tipi di dati usati comunemente in machine learning e inferenza. Le istruzioni VNNI fondono tre istruzioni insieme per aumentare le prestazioni int8 (VPDPBUSD) e due istruzioni per incrementare quelle int16 (VPDPWSSD). Queste istruzioni AVX-512 opereranno all'interno della normale curva di tensione / frequenza AVX-512 durante le operazioni.

Per quanto riguarda l'offerta, Intel continua a segmentare le proprie proposte non solo in termini di caratteristiche tecniche ma anche di funzionalità. Intel ad esempio ha introdotto processori specializzati per determinati carichi di lavoro dotati di tecnologia Speed Select.

Questi processori consentono un controllo più preciso della frequenza operativa, assegnando per esempio determinati core a un certo carico e a una precisa frequenza in modo da ottenere le massime prestazioni. I modelli ottimizzati per il networking inoltre non hanno il Turbo Boost per eliminare gli incrementi di clock improvvisi che possono introdurre dell'inconsistenza nelle prestazioni. Un'altra segmentazione riguarda l'assenza del supporto alle DIMM Optane DC Persistent Memory da parte di alcune CPU Xeon Scalable Silver e Bronze.

Quanto ai prezzi, lo Xeon Platinum 8280 si presenta sul mercato a 10.009 dollari. La gamma Platinum si estende fino ai 3115 dollari del modello 8253, quella Gold va da 1221 a 3984 dollari e la Silver da 417 a 1002 dollari. C'è un solo modello Bronze che costa 213 dollari. Ovviamente come al solito il prezzo su mille unità non rappresenta quello che pagano le aziende più grandi del settore datacenter, dato che Intel pratica degli sconti per acquisti ingenti.

Intel Xeon Scalable di seconda generazione (Cascade Lake)
Core Frequenza base Frequenza Turbo Cache L3 TDP(W) Optane Prezzo
Xeon Platinum 8200
8280 L 28 2.7 4.0 38.50 205 $17906
8280 M 28 2.7 4.0 38.50 205 $13012
8280 28 2.7 4.0 38.50 205 $10009
8276 L 28 2.2 4.0 38.50 165 $16616
8276 M 28 2.2 4.0 28.50 165 $11722
8276 28 2.2 4.0 38.50 165 $8719
8270 26 2.7 4.0 25.75 205 $7405
8268 24 2.9 3.9 35.75 205 $6302
8260 L 24 2.4 3.9 25.75 165 $12599
8260 M 24 2.4 3.9 25.75 165 $7705
8260 24 2.4 3.9 25.75 165 $4702
8260 Y 24 2.4 3.9 35.75 165 $5320
8256 24 3.8 3.9 16.50 105 $7007
8253 L 16 2.2 3.0 35.75 165 ?
8253 M 16 2.2 3.0 35.75 165 ?
8253 16 2.2 3.0 35.75 165 $3115
Xeon Gold 6200
6262 V 24 1.9 3.6 33.00 135 $2900
6254 18 3.1 4.0 24.75 200 $3803
6252 24 2.1 3.7 35.75 150 $3665
6252 N 24 2.3 3.6 35.75 150 $3984
6248 20 2.5 3.9 27.50 150 $3072
6244 8 3.6 4.4 24.75 150 $2925
6242 16 2.8 3.9 22.00 150 $2529
6240 L 18 2.6 3.9 24.75 150 ?
6240 M 18 2.6 3.9 24.75 150 ?
6240 18 2.6 3.9 24.75 150 $2445
6240 Y 18 2.6 3.9 24.75 150 $2726
6238 L 22 2.1 3.7 30.25 140 ?
6238 M 22 2.1 3.7 30.25 140 ?
6238 22 2.1 3.7 30.25 140 $2612
6238 T 22 1.9 3.7 30.25 125 $2742
6234 8 3.3 4.0 24.75 130 $2214
6230 20 2.1 3.9 27.50 125 $1894
6230 N 20 2.3 3.5 27.50 125 $2046
6230 T 20 2.1 3.9 27.50 125 $1988
6226 12 2.8 3.7 19.25 125 $1776
6222 V 20 1.8 3.6 27.50 115 $1600
Xeon Gold 5200
5222 4 3.8 3.9 16.50 105 $1221
5220 18 2.2 3.9 24.75 125 $1555
5220 T 18 2.2 3.9 24.75 105 $1727
5220 S 18 2.7 3.9 24.75 125 $2000
5218 16 2.3 3.9 22.00 125 $1273
5218 N 16 2.3 3.9 22.00 105 $1375
5217 8 3.0 3.7 16.50 115 $1522
5215 L 10 2.5 3.4 16.50 85 $9119
5215 M 10 2.5 3.4 16.50 85 $4224
5215 10 2.5 3.4 16.50 85 $1221
Xeon Silver 4200
4216 16 2.1 3.2 16.50 100 - $1002
4215 8 2.5 3.5 16.50 85 $794
4214 12 2.2 3.2 16.50 85 - $694
4214 Y 12 2.2 3.2 16.50 85 - $768
4210 10 2.2 3.2 13.75 85 - $501
4209 T 8 2.2 3.2 11.00 70 - $501
4208 8 2.1 3.2 11.00 85 - $417
Xeon Bronze 3200
3204 6 1.9 - 8.25 85 - $213
Legenda lettere: L (Large DDR Memory Tier Support, fino a 4 TB); M (Medium DDR Memory Tier Support, fino a 2 TB); N (Networking & NFV specialized); S (Serch Value Specialized); T (Thermal & Long-Life Cycle Support); V (VM Density Value Specialized) Y (Intel Speed Select Technology)

Optane DC Persistent Memory

Intel ha ufficializzato l'arrivo delle DIMM Optane DC Persistent Memory, compatibili con la piattaforma destinata alle CPU Xeon fino a 28 core. Queste DIMM sono basate sulla memoria 3D XPoint e si inseriscono negli slot DDR4, come un normale modulo RAM, ma sono disponibili in tre capacità da 128, 256 e 512 GB permettendo di avere fino a 6,5 TB di memoria in un server dual-socket.

Intel ha progettato queste DIMM affinché facciano da ponte tra la DRAM tradizionale e l'archiviazione ad alta velocità. Questo è vero sia per quanto riguarda il funzionamento, in quanto la Optane DC Persistent Memory può essere usata sia come archiviazione che come memoria volatile, ma anche sul fronte delle prestazioni (è meno veloce di un DRAM) e del prezzo (costa meno di una DRAM). Per quanto concerne la durata, un argomento di una certa rilevanza quando si parla di memorie non volatili, Intel assicura una possibilità d'uso (con crittografia di tutti i dati) senza limiti nel corso dei cinque anni di garanzia.

Le DIMM hanno un controller come gli SSD che gestisce un abstraction layer. Le Optane DC Persistent Memory consumano più di una DRAM tradizionale, quindi per evitare problemi di throttling Intel offre un intervallo di impostazioni che va da 12 a 18 watt, con una precisione di regolazione di un quarto di watt, per ottimizzare le prestazioni e tenere a bada il calore. Le DIMM, in generale, consumano 3 volte di più di una DIMM DDR4 da 8 / 16 GB, ma a fronte di un incremento di capacità di 32 volte è un compromesso del tutto accettabile.

Le DIMM sono fisicamente ed elettricamente compatibili con lo standard della JEDEC per gli slot DIMM, ma Intel usa un protocollo proprietario per gestire la latenza irregolare che deriva dalla scrittura di dati nella memoria persistente. Intel ha dichiarato che le DIMM Optane possono condividere un canale di memoria con DIMM tradizionali, e che il sistema richiede almeno un singolo modulo di DRAM per funzionare.

La nuova tecnologia di memoria, infine, necessita di una programmazione ad hoc per esprimere le massime potenzialità in base al carico di lavoro. Per questo Intel sta lavorando con i partner nell'ecosistema al fine di garantire il giusto supporto.

Le soluzioni Optane DC Persistent Memory sono in grado di funzionare in due speciali modalità operative - App Direct mode e Memory mode. "Le applicazioni che sono state ottimizzate in modo specifico possono sfruttare la modalità App Direct per ricevere il pieno valore dato dalla persistenza dell’informazione e dalla maggiore capacità. In modalità Memory, le applicazioni eseguite in un sistema operativo supportato o in un ambiente virtuale possono usare il prodotto come memoria volatile, sfruttando la capacità aggiuntiva resa possibile dalle dimensioni dei moduli fino a 512 GB senza dover riscrivere il software", ha concluso Intel.

La disponibilità dei moduli Optane DC Persistent Memory è attesa per giugno, momento in cui dovrebbero emergere informazioni anche sui prezzi, attualmente ignoti.