IT Pro

Archiviazione dati efficiente e low-cost: i tre fattori chiave

Il tema dell'archiviazione dei dati si propone all'attenzione del mondo IT con nuovi paradigmi. I punti salienti di questo cambiamento ci sono stati illustrati da Emily Ford, senior product marketing manager presso Nexsan by Imation. Sebbene le prestazioni siano sempre state uno dei punti cruciali di un’infrastruttura storage vincente, osserva Ford, ci sono tre fattori chiave che ora le ripropongono come elemento chiave.

Il primo è la virtualizzazione, che ha creato un contesto in cui un singolo server supporta un numero elevato di server virtuali, su ognuno dei quali girano le proprie applicazioni. Il risultato è che sono generate molte più operazioni di I/O sullo storage e di conseguenza aumenta il bisogno di velocità. 

E18: soluzione per l'archiviazione ibrida iad alta efficienza in ambienti virtualizzati

Il secondo è la necessità di analizzare ed elaborare i dati di grandi archivi. Ciò ha portato alla necessità di avere una bassa latenza e ad una crescita esponenziale dei dati da conservare nel lungo periodo.

Il terzo è che i progressi tecnologici hanno ridotto il prezzo medio dei dispositivi ad alte prestazioni, rendendoli accessibili a chiunque.

Individuare i dati realmente importanti

A fronte di questi fattori uno studio di The INI Group ha però evidenziato che solo il 5-10% dei dati di un'azienda richiedono realmente alte prestazioni, quindi la vera sfida consiste nel riuscire ad individuare questi dati.

L'obiettivo di un amministratore IT dovrebbe quindi consistere nel rimuovere le necessità non reali per concentrarsi sui veri colli di bottiglia per analizzare e ottimizzare l’accesso alle banche dati, senza dimenticare però che l’erogazione di alte prestazioni deve tenere conto del costo e della gestione dell’infrastruttura.

NST6000MC, la soluzione per l'Unified Hybrid Storage

Quello che deriva da queste considerazioni, osserva Ford, è che l'archiviazione ibrida è diventata lo strumento più potente per gestire la sistematica crescita di dati e le richieste di prestazioni elevate. 

Le linee guida per uno storage efficiente

Per archiviazione ibrida si intende uno storage che utilizza SSD e HDD all’interno di un unico sistema. Gli HDD forniscono grandi capacità ad un costo ragionevole per Terabyte, mentre gli SSD garantiscono bassa latenza e alte prestazioni di IOPS. Ideare una soluzione di massima può essere semplice, realizzarla e passarla in produzione può esserlo di meno. Alcune considerazioni si impongono, spiega Ford:

  • Non tutti i sistemi di archiviazione ibrida sono uguali: alcuni fornitori continuano a montare unità a stato solido in sistemi convenzionali, mentre altri progettano nuovi sistemi ottimizzati per questa tecnologia, ma ci vogliono ben più di alcune unità a stato solido per creare un sistema ibrido: servono funzionalità software specifiche e la capacità di gestire dinamicamente i dati tra SSD e HDD, con tecniche di caching o tiering.
  • Le tecnologie di caching ibride garantiscono l'efficienza: il ‘Data Path’ del caching è breve e sicuro, e le tecniche di caching ibrido consentono la scalabilità del caching in lettura e in scrittura oltre la capacità della memoria ultraveloce DRAM attraverso l’utilizzo di dischi SSD. Il caching in lettura usa algoritmi in grado di prevedere quali dati copiare in modo proattivo da SSD a HDD in modo da velocizzare l’I/O. 
  • Ottimizzare il caching delle scritture: per creare un sistema di archiviazione ibrido in grado di supportare una varietà di carichi di lavoro, è importante che il sistema possa sostenere il carico di scritture ad alte prestazioni per database, la VDI e le applicazioni essenziali simili. Nell'eseguire tale operazione, il fattore chiave è la capacità di trasferire i dati dalla cache di scrittura al più lento HDD in modo efficiente, così che il sistema non superi la sua capacità di cache. Per farlo, un approccio efficiente consiste nell'aggregazione delle scritture di cache e nel loro trasferimento nell'archivio HDD in modo sequenziale.
  • La personalizzazione del caching: la caratteristica più importante dei sistemi ibridi è la possibilità di personalizzare l'utilizzo delle cache di lettura, consentendo di decidere come sfruttare al meglio le unità SSD. Ad esempio, un hypervisor che elabora vari flussi di I/O delle VM indirizzerà pesanti carichi di lavoro casuali sull'archivio HDD e si avrà una latenza più lunga e tempi di risposta ridotti per le VM, ma con una cache di lettura personalizzata, posizionata prima dell'unità HDD, sarà possibile eliminare questo collo di bottiglia, aumentando così le prestazioni del volume. 
  • Infrastruttura di archiviazione di back end: nell'archiviazione l'attenzione si focalizza sulle prestazioni in quanto permettono alle applicazioni di rispondere in modo istantaneo. Le migliori soluzioni ibride offrono molto da un punto di vista pratico: densità e risparmio di spazio, scalabilità della capacità senza interruzioni, risparmio di energia e raffreddamento, capacità di elaborare lo scaricamento, il tutto con livelli di TCO e costi sostenibili.

I sistemi di archiviazione ibrida sono ora molto diffusi e quello pensato correttamente sarà in grado di soddisfare tutte queste esigenze in modo trasparente e cost-effective. Sarà interessante, conclude Ford, osservare come le loro funzionalità si tradurranno in vantaggi per le aziende e quanto velocemente saranno adottati dalle organizzazioni di tutto il mondo.