RapidRAID al posto di RAID per archiviazione sicura e veloce

di Manolo De Agostini, venerdì 03 agosto 2012 alle 11:35

Un gruppo di ricercatori di Singapore sta affrontando il tema dell'archiviazione su moltissimi dischi, come avviene nei datacenter. RapidRAID dovrebbe ridurre l'uso delle risorse di rete e calcolo preservando l'affidabilità.

RapidRAID al posto di RAID. Secondo quanto riportato da The Register, un gruppo di ricercatori di Singapore ha proposto un nuovo modo per proteggere l'integrità dei dati in sistemi di archiviazione distribuita. RapidRAID offre una protezione dei dati massima ma consuma meno risorse (di rete, calcolo, etc) rispetto agli approcci esistenti.

Attraverso il RAID, acronimo di Redundant Array of Independent Disks, si possono replicare dati su più hard disk, in modo da non perdere informazioni se un disco dovesse rompersi. Ci sono più livelli di RAID che servono per rispondere a diverse esigenze di affidabilità e rapidità. 

L'incremento del volume di dati immagazzinati in questi sistemi ha portato all'introduzione dei cosiddetti "erasure code" (codice di correzione delle cancellazioni), alternativa alla replicazione e particolarmente adatti all'archiviazione nei datacenter, dove vecchi insiemi di dati a cui si accede raramente possono essere codificati, mantenendo le repliche unicamente per gli ultimi dati.

Gli erasure code consentono la frammentazione di dati su un ampio insieme di dischi, prima che i dati desiderati siano riassemblati usando i frammenti provenienti da molteplici fonti. "Molti recenti studi considerano la progettazione di nuovi erasure code focalizzati sull'archiviazione per migliorare la riparabilità. Al contrario, il nostro lavoro affronta la migrazione dalla replicazione alla codifica", scrivono i ricercatori ad accompagnamento del documento.

"Proponiamo una nuova strategia di pipelined coding che distribuisce il carico di rete e di una codifica single-object tra differenti nodi, velocizzando l'archiviazione di object multipli. Presentiamo inoltre codici RapidRAID, una famiglia di erasure code all'interno di una pipeline i quali offrono maggiore velocità di archiviazione senza compromettere l'affidabilità dei dati o gli overhead nell'archiviazione".

Nel documento i ricercatori offrono "una vera implementazione dei codici RapidRAID e benchmark delle prestazioni usando sia cluster di 50 nodi che un insieme di 16 istanze Amazon EC2. I codici RapidRAID riducono il tempo di codifica single object fino al 90%, mentre quando più object sono codificati simultaneamente la riduzione è fino al 20%". Secondo i ricercatori – il cui lavoro è chiaramente dedicato a risolvere i problemi esistenti in grandi datacenter – c'è ancora molto da fare per far sì che RapidRAID possa essere ritenuto adeguato per sistemi che richiedono più di due copie di dati.

Argomenti interessanti

 

Commenti dei lettori (8)

LEWIS 03/08/2012 12:01
+6
nonostante una certa preparazione, dell'articolo non ci ho capito nulla. Qualche ingegnoso ingegnere mi aiuta?
Twentyone 03/08/2012 12:10
0
In pratica un sistema RAID più veloce attraverso erasure code differenti
exedes 03/08/2012 12:30
0
La chiave per capire questo articolo è : Singaporean researchers have proposed a new way to protect the integrity of data in distributed storage Stiamo parlando di dischi distribuiti relativamente a servizi cloud principalmente.

L'articolo in pratica dice che associando i frammenti di dati a dei metadati possono essere "spalmati" su un piu' ampio e distribuito set di dischi.

Questa tecnica e' utilizzata anche da i file system di google e azure per garantire l'integrità dei dati.

La parte sotto penso che riguardi (letta veloce) un sistema per distribuire il carico della codifica di questi metadati che sono creati partendo dai frammenti di informazioni.
xhogan89x 03/08/2012 12:34
0

 Originariamente inviata da Twentyone

In pratica un sistema RAID più veloce attraverso erasure code differenti


adesso è chiarissimo
eaman 03/08/2012 12:46
0
Il gioco del giorno potrebbe essere cercare di decifrare cosa sia questo affare:

Magari e' un block device (un supporto di storaggio) distribuito in rete (tipo un LVM con gli extents sui singoli PV in rete, ma che che fa lo stripe anche dei metadati) in cui invece che mantenere le copie complete si tengono solo le differenze (tipo un revision control system, o gli snapshot dei file system moderni).
Solo che invece che avere i metadati per singolo file (tipo i vecchi inodes) tiene i metadati per i singoli frammenti (extents che chiama oggetti) che sono anche essi distribuiti. Poi per ripescare i file i metetadati (e immagino i checksums per controllarne la validita' piu' qualche algoritmo per pescarli in modo piu' veloce dai supporti ridondanti) non vengono elaborati da un punto centrale ma calcolati dai nodi, cosi' come l'assemblamento delle singole patch (oggetti) che vengono elaborate dai nodi e non presentate ai client da un server?

Poi ci sarebbe la storia dellgli erasure codi differenti, che sara' una evoluzione di un file system tipo log che non prevede la modifica dei dati (la rescrittura, li rende cancellati e basta).
Io ci ho provato...
sugigi 03/08/2012 13:53
0
Amici di Tom's lasciate stare l'ambito storage enterprise o rischiate di scatenare ulteriore confusione in quelle persone che di storage già ci capiscono poco... ve lo dico da persona che lavora nella configurazione di queste soluzioni, tra quelle proprietarie dei vari brand (vedi come HP fa Networked RAID o la deduplica di DataDomain che è diversa da quella degli altri e via via così)e quelle relegate ai laboratori per HPC alla fine tutto questo "trambusto" si traduce in una incredibile "fuffa" che a parità di soluzioni cosa comporta? Purtroppo il discorso è molto complicato e tutte le grosse aziende già applicano al proprio interno di queste innovazioni, ahimè, senza standard definiti tranne quelli di interfacciamento (qualcuno del settore ricorda o ha mai sentito la disputa sul FCoE Cisco vs. quello di HP?).

Bye!
LiloLilo 03/08/2012 14:33
0

 Originariamente inviata da sugigi

Amici di Tom's lasciate stare l'ambito storage enterprise o rischiate di scatenare ulteriore confusione in quelle persone che di storage già ci capiscono poco... ve lo dico da persona che lavora nella configurazione di queste soluzioni, tra quelle proprietarie dei vari brand (vedi come HP fa Networked RAID o la deduplica di DataDomain che è diversa da quella degli altri e via via così)e quelle relegate ai laboratori per HPC alla fine tutto questo "trambusto" si traduce in una incredibile "fuffa" che a parità di soluzioni cosa comporta? Purtroppo il discorso è molto complicato e tutte le grosse aziende già applicano al proprio interno di queste innovazioni, ahimè, senza standard definiti tranne quelli di interfacciamento (qualcuno del settore ricorda o ha mai sentito la disputa sul FCoE Cisco vs. quello di HP?).

Bye!

E perchè? A me interessa e penso anche a molti altri...e poi ne ho visti di cosiddetti specialistoni IT in giacca e cravatta raccontare minkiate che tu non hai idea
sugigi 03/08/2012 15:19
+1

 Originariamente inviata da LiloLilo

E perchè? A me interessa e penso anche a molti altri...e poi ne ho visti di cosiddetti specialistoni IT in giacca e cravatta raccontare minkiate che tu non hai idea



hai ragionissima ma lascia stare gli """"specialisti"""" millantati, lavoro in distribuzione e ne sento tutti i giorni... suggerivo semplicemente che i temi ambito Storage\Server non sono sicuramente il piatto forte di Tom's, dove si fa ottima informazione su altri temi, ma le innovazioni ambito enterprise avvengono costantemente e senza standardizzazione... c'è rischio al chi ce l'ha più lungo, quindi meglio avere dati "certi" e misurabili vs. qualcosa di standard... sarei curioso di capire a cosa serve questo esercizio dato che non è spiegato il campione di riferimento utilizzato... 20%, 30% rispetto a cosa? Quale storage? Quanta cache? Quanti flash drives?
Devi essere collegato scrivere un commento!

Accesso utenti

Nome utente:
Password:
Continua a seguirci!
Informazioni su Tom's Hardware
Tom's Hardware fa parte di Bestofmedia Network
Copyright ©2013 Bestofmedia. Tutti i diritti riservati
P.Iva 04146420965
Clicca per i dettagli