Cloud ed Oggetti nel futuro dello storage

Lo storage ad oggetti è il prossimo step per la realizzazione di ambienti aperti, flessibili e sicuri. NetApp ne illustra gli aspetti salienti

Avatar di Giuseppe Saccardi

a cura di Giuseppe Saccardi

Lo scenario che si delinea per lo storage registra una costante crescita dei dati. Questo in attesa del diffondersi dell'IoT, che potrebbe trasformare la crescita in una vera e propria alluvione e far sfuggire di mano la situazione a chi non si sia preparato in tempo.

Ma, quando si parla di storage non è solo questione di performance, si devono  prendere in esame altri aspetti quali il numero di file memorizzati, la corretta allocazione dei file soprattutto se contenenti dati sensibili, come garantire la leggibilità dei dati memorizzati per lunghi periodi di tempo, come garantire la conformità alle norme pubbliche o aziendali di governance, come migrare i dati da una generazione hardware alla successiva. E non ultimo come affrontare il problema dei costi.

Lo storage ad oggetti 

Il problema nel suo complesso non è di facile soluzione ma a risolverlo ci ha provato NetApp e ci ha provato approcciando il problema  partendo da un nuovo punto di vista con una soluzione basata sullo storage ad oggetti.

Prima di entrare nel dettaglio della soluzione proposta da NetApp vediamo  con l'aiuto di Ingo Fuchs, Senior Manager di NetApp responsabile di storage a oggetti, di cosa si tratta.

Un insight nello storage a oggetti

Quella a oggetti, spiega il manager, è  una tecnologia diversa dal tradizionale file storage e dallo storage a blocchi. Tramite essa i dati vengono organizzati in container di dimensione variabile riferiti come "oggetti" che vengono memorizzati in namespace flat estesi anche in diverse ubicazioni.

Ciascun oggetto contiene sia dati (sequenza non interpretata di byte) che metadati (e cioè un ID univoco e espandibile di attributi che descrivono l'oggetto). Detto altrimenti lo storage a oggetti, semplifica Fuchs,  è simile a un parcheggio di un albergo in cui non occorra conoscere la posizione della propria vettura, ma è sufficiente consegnare il biglietto al valletto e attendere la riconsegna del veicolo.

Lo storage a oggetti fornisce container flessibili e metadati espandibili che permettono una gestione efficiente anche di miliardi di file.

Il vantaggio offerto da questo approccio consiste nella possibilità di utilizzare riferimenti e query sui dati in base a qualsiasi attributo. A differenza poi dei biglietti dei parcheggi degli alberghi, che può essere smarrito, esistono diversi metodi per individuare il "biglietto" giusto o per determinare il livello di sicurezza desiderato. 

I tag di identificazione consentono l'indicizzazione di quantità di file molto superiori rispetto alle possibilità di un file system, in modo da rendere lo storage a oggetti una soluzione ideale per lo storage enterprise distribuito in aree estese e caratterizzato da un numero di file sull'ordine dei miliardi.

Tre   le tendenze che stanno  facendo aumentare l'interesse per lo storage a oggetti:

  • Incremento  della quantità di dati non strutturati. La gestione dei dati a oggetti agevola il posizionamento intelligente dei dati per soddisfare requisiti di performance, conservazione, disponibilità, posizionamento e longevità.
  • Necessità di creare e utilizzare dati decentralizzati. Il modello "un data center primario e uno di DR" sta lasciando spazio a un approccio basato su diversi siti, in cui utenti, carichi di lavoro e dati si trovano a distanze più ravvicinate.
  • Il cloud ibrido offre nuove opzioni per il bilanciamento di costi e performance..

Storage ad oggetti e StorageGRID Webscale

Veniamo alla soluzione. StorageGRID Webscale è una piattaforma di storage di livello enterprise che supporta lo storage ad oggetti e la realizzazione di infrastrutture storage software defined. Supporta usando un namespace singolo, evidenzia NetApp, miliardi di oggetti e decine di petabyte di storage distribuiti in diverse posizioni.

Progettata per infrastrutture di cloud ibrido e  dati always-on, StorageGRID Webscale fornisce il supporto nativo delle applicazioni cloud mediante le API S3 e CDMI. Un motore dinamico delle policy consente poi di ottimizzare disponibilità, performance e costi di ciascun oggetto dati memorizzato.

Al core della soluzione c'è un motore dinamico delle policy che consente la definizione delle policy in base a numerosi criteri, fra cui:

  • Latenza e disponibilità delle risorse
  • Requisiti di conservazione dei dati
  • Requisiti di geolocalizzazione
  • Costi di rete (compreso il calcolo dei costi del link di rete)

In pratica, consente di valutare gli oggetti in base a criteri come metadati personalizzati di applicazioni e utenti, metodo di acquisizione, dimensioni e ora dell'ultimo accesso, con la possibilità di applicare policy per definire:

  • Posizionamento geografico di un oggetto
  • Tipologia dello storage impiegato per la memorizzazione  (SSD, HDD o nastro)
  • Numero delle copie di un oggetto
  • Policy di conservazione che comprendono modifiche del posizionamento con il passare del tempo, grado dello storage, numero di copie ed eliminazione 

I metadati degli oggetti contengono le posizioni di memorizzazione, il numero di copie effettuate ed eventuali campi personalizzati, con la possibilità di aggiungere nuovi campi in base ai cambiamenti dei requisiti. I metadati vengono poi distribuiti nell'intero ambiente di StorageGRID Webscale per aumentare scalabilità e resilienza e accelerare i tempi di recupero.

Architettura di StorageGRID Webscale

Dal punto di vista del suo utilizzo StorageGRID Webscale, ritiene NeAtpp,  è un prodotto ideale per repository di dati web, archivi di dati e repository multimediali. Questo perché anche se ciascuno di questi casi di utilizzo presenta requisiti differenti, è una soluzione in grado di adattarsi alle diverse esigenze.