Passaggio a vuoto per i dati sull'affidabilità degli hard disk di Backblaze

Backblaze non ha pubblicato di dati sull'affidabilità degli hard disk usati nei suoi StoragePod nel terzo trimestre a causa di un'utility che potrebbe aver falsato i dati.

Avatar di Marco Silvestri

a cura di Marco Silvestri

Editor

Backblaze, azienda statunitense che si occupa di cloud storage, ha pubblicato il suo report trimestrale riguardante l'affidabilità degli hard disk in uso nei suoi sistemi proprietari (Storage Pod). 

A differenza di quanto fatto finora, l'azienda ha deciso di non condividere le statistiche riferite al terzo trimestre 2019 (30 luglio - 30 settembre) rendendo però disponibili i dati aggiornati relativi all'intero periodo di vita degli hard disk.

Secondo quanto dichiarato da Andy Klein, direttore marketing di Backblaze, i dati raccolti nel corso del terzo trimestre 2019 potrebbero essere compromessi a causa di un nuovo algoritmo usato dall'azienda al fine di aumentare la frequenza dei controlli svolti sulle singole unità.

"Questa volta presenteremo solo la tabella relativa ai malfunzionamenti dei dischi rigidi nel loro intero periodo di vita...Per quanto concerne la tabella del terzo trimestre, i dati che di solito usiamo per creare quel report potrebbero essere stati influenzati indirettamente da uno dei nostri programmi che si occupa di svolgere i controlli di integrità dei dati. Anche se non crediamo che i dati a lungo termine siano stati influenzati abbiamo pensato fosse giusto farvelo sapere", ha detto Klein.

Backblaze ha deciso di intensificare i test di integrità dei dati contenuti negli hard disk nel terzo trimestre per tenere conto del crescente numero di unità con maggiore spazio di archiviazione implementate di recente. Secondo quanto dichiarato da Klein, aumentando la frequenza dei controlli svolti sulle singole unità potrebbe essersi verificato un "picco artificiale" dei guasti rilevati nel terzo trimestre.

"Il numero di guasti del disco nel corso della vita utile di un dato modello di unità non dovrebbe aumentare. Nella migliore delle ipotesi, abbiamo spostato leggermente i guasti".

In sostanza, dato l'aumento del numero dei controlli, è possibile che il software abbia rilevato guasti che sarebbero emersi nei mesi successivi, influenzando sia la percentuale di guasti annuali che i risultati relativi al trimestre in analisi.

Tuttavia non ci sono certezze a riguardo, si tratta piuttosto di una misura preventiva come testimoniano le parole di Klein: "I livelli di guasto trimestrali non sono molto diversi da quelli dei trimestri precedenti, ma non ci siamo sentiti a nostro agio nel pubblicarli in questo momento, dato quanto detto finora".

I dati riportati da Backblaze fanno riferimento a un totale di 115.151 hard disk contenuti in quattro datacenter situati in due continenti. Di quest,i 2098 vengono utilizzati come unità d'avvio e i restanti 113.053 sono impiegati per l'archiviazione dati. Come sempre, dalle statistiche sono esclusi gli hard disk usati per le operazioni di prova e i modelli presenti in meno di 60 unità, numero minimo contenuto in ciascuno Storage Pod.

Se si osservano le statistiche generali il tasso di guasti riguardante l'intero periodo di vita degli hard disk è leggermente aumentato, passando dall'1,7% del secondo trimestre all'1,73% alla fine del terzo trimestre.

Le prime cinque posizioni sono occupate dalle unità HGST che compiono un grande balzo in avanti e si affermano come le più affidabili, con tassi di malfunzionamento annui al di sotto dell'1% su tutti gli hard disk da 4,8 e 12 TB. Il primato attuale appartiene all'HGST HMS5C4040ALE640 da 4 TB con una percentuale di unità malfunzionanti dello 0,51%.

L'unità Toshiba MG07ACA14TA da 14TB, che guidava la classifica nello scorso trimestre, si trova in tredicesima posizione malgrado  il tasso di guasti annuali sia sceso dal precedente 0,78% allo 0,74%.

Le unità Seagate occupano la parte centrale della classifica: il modello ST4000DM000, presente in ben 19,330 unità, occupa il sesto posto con un totale di 3724 unità malfunzionanti su 19330 analizzate in 50.839,992 giorni di servizio.

È interessante notare che nella classifica appaiono più hard disk del segmento enterprise rispetto ai report precedenti basati quasi unicamente su prodotti consumer. Il motivo di questa scelta è stato spiegato dallo stesso Andy Klein in risposta a un commento sul post originale:

"Acquistiamo le unità a stock a prezzi negoziati. Man mano che aumentano le quantità, la differenza di costo per TB tra hard disk per consumatori e per imprese si assottiglia a tal punto da far subentrare altri fattori, come la garanzia (2 vs 5 anni), il consumo energetico, l'accesso alle impostazioni del firmware e cosi via. Quindi non abbiamo cambiato idea rispetto all'acquisto di unità per i consumatori piuttosto che per le imprese, piuttosto è l'economia a essere cambiata".

Backblaze ha dichiarato di voler tornare a fornire dati trimestrali già dagli ultimi tre mesi dell'anno. Per garantire una continuità con i dati raccolti negli anni precedenti ed evitare di falsare le statistiche, l'azienda ha deciso che in futuro le unità analizzate verranno divise in due gruppi: un gruppo sarà costituito dagli hard disk sottoposti ai "controlli accelerati" di integrità dei dati, l'altro sarà costituito dalle unità entrate in funzione dopo che la frequenza dei controlli sarà stata nuovamente ridotta.

Una volta ottenuti i dati dai due gruppi sarà possibile, confrontandoli, verificare se l'aumento della frequenza di controllo ha effettivamente creato anomalie nei dati del terzo trimestre 2019. Se volete dare un'occhiata ai report precedenti pubblicati da Backblaze potete consultare il sito dell'azienda a questo indirizzo.