Il RAID, acronimo di Redundant Array of Independent Disks, e il NAS, ovvero Network Attached Storage, rappresentano due concetti fondamentali nello storage dei dati. Ma hanno funzionalità distinte.

Il RAID configura più dischi rigidi all'interno di un computer o di un server per potenziare le prestazioni o garantire una ridondanza dei dati in caso di guasto di un disco. Ci sono vari livelli di RAID, ciascuno dei quali offre una differente combinazione di ridondanza e performance, per capire le quali bisogna prima spiegare concetti quali striping e mirroring.

Lo striping consiste nel dividere i dati in blocchi e distribuirli sequenzialmente tra i dischi rigidi dell'array. Questa tecnica permette al sistema di leggere e scrivere dati su più dischi contemporaneamente, aumentando significativamente la velocità delle operazioni di input/output. Tuttavia, non offre ridondanza e se un disco si guasta, tutti i dati nell'array sono potenzialmente persi, poiché ogni disco contiene solo parte dell'informazione completa.

Il mirroring invece prevede che ogni dato scritto su un disco venga contemporaneamente scritto su un altro. Ciò crea una ridondanza completa, permettendo al sistema di continuare a funzionare anche se uno dei dischi fallisce. Il mirroring migliora la protezione dai guasti ma non offre le stesse performance dello striping. Inoltre, dato che ogni dato è duplicato, l'efficienza di utilizzo dello spazio di archiviazione è dimezzata.

Terminato questo excursus, torniamo a quanto accennavamo in precedenza. Il RAID 0 migliora le prestazioni mediante lo striping dei dati, mentre il RAID 1 si focalizza sulla ridondanza attraverso il mirroring dei dati su due dischi. Il RAID 10 utilizza sia il mirroring sia lo striping, offrendo un buon equilibrio tra velocità e sicurezza. In questa configurazione, i dati sono prima duplicati (mirroring) e poi distribuiti tra i dischi in striping.

Passiamo ora ai NAS: sono dispositivi collegati in rete che facilitano la memorizzazione e la condivisione di file tra più utenti, fungendo da punto di accesso centralizzato. Possono includere uno o più dischi rigidi e possono integrare una configurazione RAID per migliorare sia le prestazioni sia la sicurezza dei dati. I NAS sono progettati per essere accessibile via rete, e permettono agli utenti di recuperare file da dispositivi diversi e da varie località.

Fatte queste premesse, possiamo passare al cuore dell'articolo, ossia a una serie di test effettuati da Toshiba in laboratorio per capire come si comportano le varie configurazioni RAID con le diverse impostazioni NAS. E quindi, quali siano le migliori modalità per configurare i sistemi NAS e ottenere il massimo risultato.

Per la valutazione dei RAID, Toshiba ha focalizzato la propria attenzione sui modelli base più comuni, ossia quelli con due e quattro alloggiamenti. Il laboratorio HDD di Toshiba ha esaminato diversi sistemi NAS di vari marchi, ognuno dotato di una scheda di rete 10 GbE per eliminare eventuali colli di bottiglia nella connettività di rete. Ciascun NAS è stato testato impiegando due e quattro dischi rigidi enterprise MG08ADA400E da 4 TB di Toshiba.

Nel sistema sono stati memorizzati 6 TB di dati e sono state misurate le prestazioni relative alla scrittura sequenziale di blocchi da 1 MB, alla lettura sequenziale di blocchi da 1 MB e alla lettura casuale, nonché al carico di lavoro misto di lettura e scrittura su un set di blocchi di diverse dimensioni. Inoltre, sono state valutate le configurazioni che utilizzano controller RAID hardware e controllo RAID software.

Sia con due che con quattro dischi, il RAID hardware si è rivelato il metodo di gestione più comune ed efficace. Tuttavia, è possibile gestire interamente i sistemi RAID anche tramite software, beneficiando di funzionalità di archiviazione avanzate come snapshot, backup e altro ancora.

I controller RAID hardware Broadcom MegaRAID 9560-8i e Adaptec SmartRAID 3204-8i di Microchip sono tra i più utilizzati sul mercato per sistemi che supportano fino a otto drive. Per quanto riguarda le soluzioni di storage basate su software, è stato esaminato il Zettabyte File System (ZFS) gestito dal software Open-E JovianDSS.

Le prestazioni sequenziali dei sistemi NAS configurati con RAID sono generalmente inferiori rispetto a quelle ottenute con i controller RAID hardware, mentre le prestazioni in accesso casuale sono comparabili a quelle del ZFS senza l'uso di cache.

Le prestazioni sequenziali , lo ricordiamo, si riferiscono alla velocità con cui i dati vengono scritti o letti in sequenza su un dispositivo di archiviazione. Le prestazioni casuali, invece, si riferiscono alla capacità di un sistema di accedere a dati memorizzati in posizioni casuali sul dispositivo di archiviazione, piuttosto che in sequenza. Sono cruciali per applicazioni che necessitano di recuperare rapidamente piccoli blocchi di dati da diverse parti dell'archiviazione.

I sistemi NAS configurati con RAID possono dunque non essere all'altezza dei controller RAID hardware in termini di operazioni sequenziali ma sono comunque competitivi nel gestire accessi ai dati casuali, paragonabili alle prestazioni del ZFS senza l'uso di tecniche di caching.

Nel confronto tra RAID5 e RAID10, si nota che il RAID5 supera il RAID10 di circa il 20% in velocità sequenziale, mentre il RAID10 ha una prestazione migliore del 20% in carichi di lavoro casuali o misti.

La maggior parte dei sistemi NAS è ancora equipaggiata con interfacce da 1GbE o 2,5GbE. Per ottenere prestazioni sequenziali superiori a 200 MB/s è necessaria un'interfaccia da almeno 10GbE. Utilizzando un'interfaccia da 1GbE, la velocità sequenziale si riduce a circa 100 MB/s, che è inferiore a quella di un singolo HDD. Con un'interfaccia da 2,5GbE, la velocità massima raggiungibile sale a 250 MB/s, adeguata a una configurazione RAID1 a due bay. Solo con un'interfaccia da 10GbE si possono superare queste velocità.

Quando si parla di configurare le reti per gestire grandi quantità di dati, non tutte le soluzioni sono adatte a ogni situazione. Per esempio, se si dispone di una connessione di rete che raggiunge i 10 gigabit al secondo (10GbE) o più, allora si possono esplorare configurazioni che ottimizzino la velocità sequenziale. Tuttavia, per le reti più lente, da 1GbE o 2,5GbE, una configurazione RAID1 con solo due hard disk è più che sufficiente. Se il carico di lavoro richiede molti accessi ai dati in modo casuale, allora quattro dischi in RAID10 possono offrire una velocità fino a 1,5 volte superiore.

Rainer W. Kaese, Senior Manager di Business Development HDD presso Toshiba Electronics Europe GmbH, sottolinea che nella scelta delle configurazioni di storage di rete, sia che si tratti di sistemi RAID o NAS, è cruciale considerare diversi fattori come il volume di dati necessario, il tipo di carico di lavoro e le limitazioni dell’infrastruttura di rete.

Dopo aver condotto numerosi test, Toshiba raccomanda le seguenti configurazioni RAID per i NAS. Il RAID1, con due dischi di grande capacità, è perfetto per i sistemi NAS economici usati in ambienti domestici e piccole imprese con connessioni di rete da 1GbE o 2,5GbE. Questa configurazione, che duplica i dati su due dischi, offre una soluzione semplice ed efficace per chi ha esigenze di base.

Impiegando invece quattro dischi, il RAID5 è l'ideale per sistemi di archiviazione che gestiscono principalmente carichi di lavoro sequenziali e offre un'efficienza di archiviazione del 75%. È la scelta ottimale per chi necessiti di una grande capacità di storage e desidera una rapida ripresa del sistema in caso di guasto di un disco.

Combinando striping e mirroring su quattro dischi, il RAID10 è raccomandato per gestire carichi di lavoro misti o casuali. Questa configurazione, pur offrendo una minore efficienza di archiviazione del 50%, è ideale per server locali che affrontano carichi di lavoro variabili e si avvalgono di controller RAID hardware o soluzioni software.

Ogni opzione ha specifici punti di forza e contesti ideali di applicazione; quindi, è essenziale scegliere in base alle proprie necessità di archiviazione e alla velocità della rete disponibile.