Sulla carta, molte scelte sembrano inizialmente chiare. Un’auto sportiva all’apparenza offrirebbe prestazioni più significative rispetto ad un’utilitaria, ma i suoi limiti diventano chiari quando è il momento di portare i bambini a scuola, la spesa a casa o di ritirare i mobili da un negozio. Per la maggior parte di noi, la scelta è tra l’una o l’altra e non l’acquisto di entrambe, in modo che i limiti dell’una possano essere compensati dai “plus” dell’altra quando necessario. Nel mondo della memorizzazione dei dati, esiste un dilemma simile. Sulla carta, gli SSD sono chiaramente i vincitori, offrendo grandi prestazioni, mentre la ben nota alternativa degli HDD, sebbene più economica e in grado di offrire capacità maggiori per singolo dispositivo, è la meno appetibile delle due. Ma questo confronto teorico non tiene conto della quotidianità in cui bisogna mettersi al volante e “guidare” effettivamente queste due opzioni di archiviazione.

Negli ultimi anni lo storage basato su flash, come gli SSD, si è sviluppato per fornire enormi capacità in form factor sempre più ridotti. Non essendo meccanici, sono resistenti e robusti per essere utilizzati in laptop e in altri dispositivi portatili. Grazie alla loro tecnologia sono anche significativamente più reattivi degli HDD e in grado di fornire un throughput più elevato se confrontati nelle operazioni di input/output al secondo (IOPS). Di fatto gli HDD sono ideali per l’archiviazione di grandi quantità di dati, arrivando – al momento – a dimensioni di 16 TB per unità e con una prospettiva futura fino a 20 TB. L’introduzione dell’elio come gas utilizzato all’interno dell’unità, insieme ai continui miglioramenti della tecnologia di azionamento del mandrino e del controller del disco, fanno sì che anche altre specifiche, come il rumore, il consumo di energia e le prestazioni, siano in costante miglioramento. Tuttavia, è chiaro che gli HDD non potranno mai competere con gli SSD se si considerano solo il rumore, le prestazioni o il consumo energetico.

Con uno scontato confronto side-by-side orientato verso gli SSD, il successivo elemento importante da tenere in considerazione è il costo. I vantaggi degli SSD hanno un prezzo significativo, che attualmente arriva fino a dieci volte quello degli HDD per TB, confrontando dispositivi della stessa classe. Alcune applicazioni giustificano questa spesa, come l’unità di avvio di un server o altre applicazioni di livello 0, in cui ha senso utilizzare singole o poche unità. Questo porta però a considerare la possibilità di costruire un sistema dotato sia di SSD che di HDD in grado di offrire il meglio di entrambi i mondi, ovvero: un mix di alte prestazioni e ampie capacità di storage.

Tuttavia, su larga scala, la realtà appare diversa, soprattutto quando si lavora entro i limiti di un budget definito. La maggior parte delle applicazioni di storage devono trovare un buon equilibrio tra capacità totale e prestazioni, soprattutto nelle aree applicative di web hosting, email serving, storage tradizionale, virtuale e cloud; backup e archiviazione, fino al content delivering. Considerando un budget prefissato, Toshiba ha effettuato un’indagine per capire a che punto il passaggio agli HDD fornisca maggiori prestazioni rispetto ad un sistema basato esclusivamente su SSD enterprise (eSSD).

È stato quindi realizzato un sistema basato su otto eSSD SATA da 1,6 TB collegati a un controller Microsemi Adaptec SuperRAID in uno chassis Supermicro configurato come array RAID6 per fornire il maggior spazio di archiviazione totale possibile. Il sistema offre una capacità netta di circa 10 TB, ma con doppia parità per la protezione dei dati e le unità selezionate offrono 3DWPD (scritture su drive per giorno), il minimo consigliato per le applicazioni attive di archiviazione aziendale.

Con lo stesso budget, è stato costruito un sistema comparabile con 24 HDD SAS a 10.500 RPM, ognuno da 2,4 TB e poiché era da confrontare con gli SSD ad alte prestazioni, questi sono stati configurati in un array RAID10. Tutto ciò ha permesso allo striping parallelo RAID0 di aggregare le prestazioni, mentre il mirroring RAID1 ha fornito la protezione dei dati, anche se con un overhead del 50% per tale protezione. Il controller RAID proveniva dallo stesso fornitore dell’esempio precedente, con uno chassis JBOD 2U hot-swap di AIC, vista la maggior quantità di unità utilizzate. Questa configurazione fornisce una memoria totale di circa 30 TB.

I carichi di lavoro casuali sono stati creati utilizzando il Flexible IO tester ‘FIO’, uno strumento di synthetic benchmarking open-source per testare diversi workload nei sistemi di storage. Questo ha fornito un metodo per un confronto like with like, ovvero il più simile possibile, considerando le diverse dimensioni dei blocchi nei due sistemi. Come prevedibile, la soluzione eSSD offre prestazioni e throughput più elevati con blocchi di piccole dimensioni compresi tra 4k e 32k byte. In questo range, nelle operazioni di input/output, la soluzione HDD ha prestazioni inferiori tra 1,6 e 7 volte rispetto quella con eSSD.

Tuttavia, con blocchi di 64k byte e oltre, il maggior numero di HDD inizia a farsi sentire sulle prestazioni pur raggiungendo miglioramenti del 14% sul fronte IOPS che possono arrivare fino all’86% nel caso la dimensione dei blocchi aumentasse a 512k byte.

Naturalmente, le applicazioni del mondo reale non utilizzano blocchi di dimensioni fisse, ma anche dividendo il sistema in 20/50/20/10 con blocchi rispettivamente di 4k, 64k, 256k e 2M byte, il server HDD continua a fornire un IOPS superiore del 37% rispetto al suo equivalente eSSD.

A parità di budget, 60 HDD SATA a 7.200 RPM da 2 TB possono essere organizzati in configurazione RAID10 e fornire IOPS ancora più elevati. Rispetto alla configurazione eSSD, con blocchi da 64k byte, gli IOPS sono più alti del 69% e offrono addirittura un miglioramento del 48% rispetto al server equipaggiato con gli HDD da 10.500 RPM. Il tutto con una capacità totale di circa 60 TB, il doppio rispetto agli HDD dell’esempio precedente e sei volte quella della soluzione eSSD.

Nei data center l’attenzione al consumo energetico è sempre alta e le grandi quantità di HDD non possono ovviamente competere con la bassa richiesta di potenza degli eSSD. Tuttavia, nel complesso, la soluzione HDD non è da scartare se si considera che le prestazioni, rispetto agli eSSD, sono migliorate e che c’è molta più memoria disponibile. Tornando ai due esempi originali, la soluzione eSSD richiederebbe circa 788 kWh all’anno contro i 2.015 kWh all’anno per quella con HDD. Ipotizzando 0,07 €/kWh e un’efficienza di utilizzo dell’energia (PUE) di 1,3, la soluzione HDD richiede solo 110 € in più di costi energetici all’anno, ovvero meno di 10 € al mese.

I data center non vengono costruiti o aggiornati ogni giorno, proprio per questo chi si occupa della gestione deve tenere conto anche dei miglioramenti tecnologici che probabilmente arriveranno nel futuro. La tecnologia flash sembra muoversi rapidamente ed è per questo lecito chiedersi se gli SSD raggiungeranno un prezzo che li renda più interessanti nel breve lasso di tempo. La realtà è però che l’industria ha prodotto circa 800 EB (Exabyte – 800Mio TB) di storage HDD nel 2018, ma solo circa 100 EB di SSD.

Attualmente, i produttori di memorie flash stanno investendo per aumentare la capacità, ma le proiezioni attuali indicano che saranno necessari $100B – $200B per raddoppiare la capacità delle memorie flash esistenti. Ai tassi attuali, questo coprirà solo un quarto del consumo esistente. Con gli HDD destinati a raggiungere i 20 TB per unità nei prossimi 12-18 mesi, è chiaro che gli SSD non otterranno riduzioni significative del costo per terabyte nel prossimo futuro, né vi sarà un miglioramento significativo del loro prezzo al costo per terabyte.

È chiaro che esistono casi specifici e applicazioni in cui gli SSD hanno un netto vantaggio rispetto agli HDD, ed è probabile che queste aumentino nel tempo piuttosto che diminuire man mano che si effettua il confronto capacità/carico/prezzo. Ciò che è certo è che comunque gli HDD hanno ancora un ruolo importante da svolgere e lo avranno per molto tempo ancora. La riduzione del consumo energetico e i miglioramenti delle prestazioni – anche se limitati – favoriranno gli HDD, mentre il prezzo per terabyte e la capacità per unità sarà sempre pro gli HDD. Per concludere considerando lo stesso investimento, le prestazioni del sistema in condizioni che, per molti data center, rimarranno il core business, gli HDD possono superare in modo significativo le prestazioni degli SSD a fronte di capacità totali superiori e con minimi costi energetici aggiuntivi.