Optane vs QuantX, anteprima prestazioni sintetiche

In attesa del debutto, ecco un quadro su 3D XPoint. Ecco cosa abbiamo appreso dalle ultime presentazioni di Intel e Micron.

Avatar di Tom's Hardware

a cura di Tom's Hardware

Tutti i benchmark che vedete sono forniti dai produttori e vi consigliamo di non farci totale affidamento. Intel e Micron hanno generato questi test con le prime revisioni di 3D XPoint su prototipi, quindi i prodotti finali potrebbero essere profondamente differenti.

Prestazioni generali

Un dispositivo di archiviazione perfetto per i carichi odierni deve assicurare le massime prestazioni sotto basso carico con operazioni miste, latenza inferiore e un superbo profilo QoS. Secondo quanto affermato IMFT, 3D XPoint migliora in tutti questi frangenti.

03 (1) PNG

Clicca per ingrandire

Prima di parlare di prestazioni è importante capire la natura dei carichi di lavoro del settore client ed enterprise. Raramente la maggioranza dei carichi di lavoro raggiunge alte queue depth (QD). Persino i carichi intensi tendono a finire nelle aree ad alte QD solo per brevi periodi di tempo, per poi rientrare in intervalli più bassi.

Se misuriamo la queue depth media di un carico identico con un HDD e un SSD, quest'ultimo raggiungerà una QD media più bassa perché soddisfa le richieste in entrata più rapidamente.

I carichi consumer raramente superano QD2 e mai per molto tempo. IMFT ha progettato 3D XPoint per rispondere a questa realtà, garantendo prestazioni incredibili con QD basse. L'interfaccia impedisce al supporto di fornire prestazioni estremamente superiori a quelle che osserviamo con i moderni SSD sotto pieno carico, ma garantisce comunque prestazioni eccellenti con QD basse e un miglior comportamento con dati casuali. I migliori SSD NVMe oggi sul mercato richiedono rari carichi con alte QD per offrire le massime prestazioni, ma 3D XPoint li supera facilmente in situazioni di carico leggero.

nand vs 3dxpoint 01 PNG
nand vs 3dxpoint 02 PNG
nand vs 3dxpoint 03 PNG
nand vs 3dxpoint 04 PNG
nand vs 3dxpoint 05 PNG
nand vs 3dxpoint 06 PNG

Intel Optane batte facilmente un Intel DC P3700 a QD1 e QD8, anche se entrambi usano la stessa connessione PCIe 3.0 x4 e l'interfaccia NVMe. I prodotti basati su 3D XPoint possono fornire prestazioni persino maggiori, ma l'interfaccia rimane la principale barriera una volta eliminata la latenza interna. La latenza interna di un SSD NVMe è di circa 80 ms, mentre l'SSD Optane è vicino a 5 ms. Rimuovere la latenza interna permette alle applicazioni di raggiungere maggiori prestazioni, persino con QD basse, lasciando ricadere il problema della latenza su collegamento alla piattaforma, protocollo, driver e file system.

NVMe è l'interfaccia più leggera ed efficiente disponibile, almeno oggi, ma limita comunque le prestazioni. Intel è stata la prima a guidare un gruppo industriale di 60 aziende che ha sviluppato l'interfaccia NVMe.

Nelle sue slide Intel cita anche un QoS (Quality of Service) migliorato. QoS è un aspetto importante delle prestazioni con le applicazioni; di fatti abbiamo costruito la nostra intera configurazione di prova enterprise per misurare la variabilità prestazionale. L'interfaccia NVMe, i più efficienti processi interni alla 3D XPoint e un carico con QD bassa permettono un migliore QoS.

Prestazioni sintetiche Optane

Durante una demo all'IDF 2016 Intel ha mostrato le prestazioni di Optane. La legenda a sinistra (offuscata) raggiunge un massimo di 600.000 IOPS, quindi l'SSD Optane tocca un picco di quasi 550.000 IOPS durante un carico di lettura casuale 4K a QD64. L'asse orizzontale è basato sul tempo e notiamo una certa variazione durante i carichi di lettura.

test 01
test 03 PNG
test 04 PNG
test 05 PNG
test 02
test 06 PNG

Molti non si curano delle prestazioni con carichi misti per focalizzarsi sulle specifiche di lettura e scrittura casuale. I carichi misti però sono più importanti perché è raro imbattersi in un carico fatto per intero di letture o scritture.

Per avere una dimensione delle prestazioni di 3D XPoint abbiamo confrontato i dati di Intel con quelli degli ultimi SSD PCIe che abbiamo provato, alle prese con carichi misti. Il test inizia con un carico in lettura casuale puro a sinistra (0%), e costantemente aggiunge più dati di scrittura a passi del 10%, man mano che si procede nella prova, finendo a destra con un carico fatto al 100% di scritture. Abbiamo condotto l'intero test a un equivalente di QD32 - usiamo più thread. L'Intel DC P3700 da 1,6 TB raggiunge 150.000 IOPS con un carico misto fatto per il 70% da letture e per il 30% da scritture.

Intel ha fornito un grafico con un allineamento piuttosto diverso che mostra lo scaling con un carico misto 70/30 identico all'aumentare della QD. Intel ha registrato all'incirca le stesse 150.000 IOPS che abbiamo osservato con un DC P3700 a QD32 ma l'SSD Optane toccava 500.000 IOPS sotto le stesse condizioni. Intel ha usato un carico single-thread e raggiunto 500.000 IOPS laddove noi abbiamo usato 8 thread per estrarre 150.000 IOPS da un SSD. La prestazione di Optane è straordinaria e triplica facilmente quelle degli SSD di punta che abbiamo provato.

Il nostro grafico mette in luce un'altra caratteristica dell'SSD: le prestazioni scendono rapidamente aggiungendo al mix più scritture casuali - spostandosi verso destra. Può essere un elemento di grande differenziazione tra gli SSD, con alcuni che scendono a livelli prestazionali più bassi con l'aggiunta di un mero 10% di scritture (90/10). Intel ci ha detto che le prestazioni di 3D XPoint non scendono durante carichi misti, almeno non di un margine comparabile a quello degli SSD basati su memoria NAND.

Il nostro grafico sul carico misto avrebbe dovuto essere essenzialmente una linea piatta a 550.000 IOPS se avessimo incluso un sample di 3D XPoint. Le prestazioni con carico misto molto stabili sono forse uno dei vantaggi prestazionali più grandi della nuova tecnologia e darà risultati tangibili.

Secondo Intel, 3D XPoint ha un vantaggio di latenza di 10 volte rispetto agli SSD e uno dei parametri più importante è il carico misto QoS. Intel ha misurato una latenza di circa 3,2 ms al 99,999 percentile (misura di latenza nello scenario peggiore) con un DC P3700 a QD1. Intel Optane (in rosso) appare appena nel grafico a barre QoS.

Prestazioni sintetiche Micron QuantX

I carichi sintetici misti in lettura/scrittura 4K (70/30) di Micron sono molto più impressionanti rispetto a quelli di Optane. Sembra che i prodotti QuantX siano quasi due volte più veloci di quelli Intel, anche con la stessa connessione PCIe 3.0 x4. Gli SSD Intel raggiungono un massimo di 500.000 IOPS mentre quelli QuantX toccano 900.000 IOPS. L'SSD NAND - linea arancione - offre all'incirca 200.000 IOPS con lo stesso carico.

Micron ha incluso anche i risultati di un prototipo PCIe 3.0 con una connessione x8 che ha toccato 1,8 milioni di IOPS. La cosa interessante di QuantX è che satura la connessione x8, quindi non stiamo vedendo le massime prestazioni. Forse un'interfaccia PCIe 3.0 x16 o PCIe 4.0 riuscirà a mostrarci il limite, ma non ne siamo del tutto sicuri.

test 07
test 08 PNG
test 09 PNG
test 10

Un'altra differenza con gli SSD tradizionali è che i prodotti QuantX offrono le stesse prestazioni massime senza differenze di capacità. Di solito gli SSD offrono prestazioni differenti in base alla capacità a causa dei problemi interni legati a overprovisioning e parallelismo. Per questo motivo molti utenti acquistano più capacità di quella necessaria per avere maggiori prestazioni.

QuantX prende due piccioni con una fava, in quanto tutte le capacità offrono le stesse prestazioni massime e anche prestazioni incredibili a basse QD, anche se i modelli meno capienti offrono un minor scaling a bassa QD dietro l'interfaccia PCIe 3.0 x16. Sembra che l'unico vero svantaggio dei modelli meno capienti sia la capacità inferiore e, forse, la resistenza ma le prestazioni e lo scaling non sono più un problema.

Micron ha mostrato anche i valori di latenza per i carichi di lettura e scrittura 4K. La latenza in lettura/scrittura di QuantX è di circa 10/20 microsecondi, mentre quella di un SSD con operazioni di scrittura è di 200 microsecondi. Con le letture scende a 100 microsecondi, ma abbiamo un miglioramento di 10 volte.

Abbiamo creato un grafico con le prestazioni di Intel e Micron combinate. Intel ha affermato che i propri test sono stati condotti con un solo worker; le condizioni di test di Micron appaiono simili, anche se non ne abbiamo la certezza. Condizioni di test diverse e altri parametri potrebbero abbattere le prestazioni del prodotto di Intel, ma siamo fiduciosi che Intel abbia offerto il meglio durante la prima demo pubblica di Optane. Micron mostra uno scaling prestazionale superbo con le capacità minori, ma ciò potrebbe essere legato all'architettura unica dell'azienda. Intel potrebbe non avere lo stesso vantaggio nello scaling e il suo prototipo di Optane è solo da 140 GB. I modelli più capienti potrebbero essere più veloci.

Intel è sta già progettato al proprio ASIC, ma i risultati del test ci portano a chiederci se l'azienda non stia semplicemente riproponendo un ASIC derivato dagli SSD per questo scopo. Micron, inoltre, potrebbe impiegare nuove tecniche di gestione FTL per avere questo vantaggio. In ogni caso notiamo che QuantX offre prestazioni superiori a tutti i livelli del test.