Avatar di Paul Alcorn

a cura di Paul Alcorn

Linux Compile

Abbiamo iniziato i nostri test con un test di compilazione di Linux (Kernel 4.4.2).

Lo Xeon Platinum 8280 ha un solido vantaggio sullo Xeon 8268, che è inseguito dall’EPYC 7601. Lo Xeon 8268 ottiene un buon vantaggio sullo Xeon 8176 di precedente generazione. Anche se entrambi sono processori a 28 core, lo Xeon 8268 da 205 W è un gradino sopra nell’offerta rispetto allo Xeon 8176 da 165W di precedente generazione, il che significa che questi processori non sono direttamente comparabili.

Vediamo inoltre l’impatto dei 900 MHz di vantaggio in Turbo Boost dello Xeon 6154 con 18 core sul modello 6152 da 22 core. Esaminando i test ricordate che il 6152 con 22 core è un modello da 140W, mentre il 6154 ha 18 core e un TDP di 200W.

Unix Bench 5.1.3

Unix Bench è una suite con licenza GPLv2 creata nel 1983 presso la Mondash University. Byte Magazine l’ha poi aggiornata ed espansa. Include nove test che quantificano vari aspetti delle prestazioni di sistema. Ci siamo concentrati su Dhrystone e Whetstone nello specifico. Il primo isola la gestione delle stringhe; non ci sono operazioni in virgola mobile. Whetstone misura la velocità e l’efficienza delle operazioni in virgola mobile usate solitamente nelle applicazioni scientifiche.

I Cascade Lake 6230 e 8268 offrono prestazioni integer in single-thread impressionanti, spinte da velocità Turbo Boost fino a 3,9 GHz. Il 28 core 8280 ha un leggero vantaggio figlio del bin a 4 GHz, mentre l’EPYC 7601 finisce ai piedi del gruppo.

Il vantaggio prestazionale dell’8280 non si conferma nell’interezza del test single-thread Whetstone, che vede l’EPYC 7601 davanti alla gamma Cascade Lake. Whetstone si occupa di una minuscola quantità di dati che tende a risiedere interamente nella cache L1, il che probabilmente mette l’EPYC in condizione di vantaggio a causa dei 3 MB di cache L1 (I$-2MB/D$-1MB) rispetto agli 1,5 MB di Cascade Lake (I$-768K/D$-768K). Allo stesso tempo leggere differenze nelle frequenze single-core Turbo Boost tra i modelli Cascade Lake risultano in variazioni minime tra i modelli.

Lo Xeon 8280 emerge ne test multi-thread di Whetstone, mentre l’EPYC 7601 mette a frutto i suoi 32 core, ottenendo la seconda posizione. Questo è impressionante per un processore che costa meno della metà di un Intel Xeon Scalable 8280. Lo Xeon 8268 con 24 core supera l’8176 di precedente generazione, ma ricordatevi che questi sono rispettivamente CPU da 205 e 165 watt.

NAMD Scalable Molecular Dynamics

NAMD è un carico parallelo di dinamica molecolare che sfrutta simulazioni ad alte prestazioni di grandi sistemi biomolecolari. È progettato per testare i limiti del calcolo parallelo scalando fino a 500.000 core. Il Theoretical and Computational Biophysics Group della University of Illinois di Urbana-Champaign ha sviluppato e mantiene il progetto, che ha ottenuto prestigiosi riconoscimenti.

Quest test pesantemente in virgola mobile predilige il numero di core rispetto al resto, anche se la frequenza gioca un ruolo. Non è sorprendente vedere i 28 core dello Xeon 8280 prendendo la leadership in questo carico AVX ottimizzato. L’EPYC 7601 di AMD fornisce circa il 95% delle prestazioni di quel chip, il che è comunque impressionante al prezzo a cui è venduto.

NAS Parallel Benchmarks

I NAS Parallel Benchmarks (NPB) sono un insieme di programmi sviluppato dalla NASA Advanced Supercomputing Division per valutare le prestazioni dei supercomputer paralleli. La suite caratterizza le applicazioni Computational Fluid Dynamics (CFD), e la NASA l’ha progettato per misurare le prestazioni da piccole applicazioni CFD fino a operazioni “parallele all’inverosimile”.

Il test FT interessa un’equazione differenziale parziale 3D usando la trasformata di Fourier veloce, mentre BT misura le prestazioni nella risoluzione di matrici tridiagonali a blocchi.

EPYC 7601 è chiaramente davanti a tutti nel test NASPB BT, e impressiona nel carico FT. Allo stesso tempo l’8268 con 24 core è davanti all’8280 con 28 core nel benchmark FT, probabilmente causa della sua frequenza base più alta.

Sospettiamo che uno scaling non ottimale impatti sui processori Cascade Lake, in quanto vediamo una simile differenza contenuta nel benchmark BT. L’8268 ha una frequenza base più alta dell’8280, ma altri fattori entrano in gioco, come le eccentricità dell’architettura mesh di Intel.

Redis

REmote DIctionary Server (Redis) è un popolare data structure store in memoria che è usato come database, cache e message broker. È dipendente dalle prestazioni della CPU e dal bandwidth di memoria. Redis è un software con open source (licenza BSD).

Il throughput di memoria gioca un grande ruolo in questo test, e Redis è un carico single-thread, quindi è indicativo del throughput di memoria per core e delle prestazioni. L’8280 ha il bin Turbo Boost single-core più alto del gruppo, quindi naturalmente lo troviamo al top. Il contrario è vero per l’EPYC 7601. La sua frequenze Turbo Boost è la più bassa in questo gruppo, cosa che lo regola al fondo del nostro grafico. Un database multi-thread in-memory estrarrebbe molte più prestazioni dal throughput disponibile del 7601 e dall’alto numero di core.

Open SSL

SSL (Secure Sockets Layer) è la tecnologia da scegliere per rendere sicuri link cifrati tra un server un client. È un protocollo importante per ogni livello del web.

Intel ha lavorato diligentemente sull’accelerazione di cifratura e decodificata da diversi punti. Il nostro sistema di test Intel ha la QuickAssist Technology di Intel, che aumenta le prestazioni in diverse operazioni di codifica / decodifica.