Il valore del dato e la sua governance
Se cresce in azienda la capacità di comprendere l'importanza del dato e il suo valore, resta importante, dall'altro lato, ridurre il più possibile il costo della sua gestione. Esigenze particolari, in tal senso, derivano dal fatto che i Big Data, tipicamente, vanno a braccetto con gli Analytics e che si tratta perlopiù di dati non strutturati.
Per questo motivo, il costo di gestione connesso a tali progetti è solo in parte dovuto allo storage management, ma più in generale va considerato nel complesso della Data Governance.
Il processo di governance dell'informazione comprende Data Management, Decision Management e Analytics Management. Questi ultimi due ambiti sono più vicini al business, riguardando, il primo, l'allineamento dei processi IT con le regole di business, affinché vengano impostati correttamente i workflow per l'integrazione dei processi decisionali.
L'Analytics Management, invece, concerne la gestione strutturata degli asset analitici prodotti dagli utenti di business, comprendente la messa in esercizio dei modelli analitici e il monitoraggio delle loro performance nel tempo. Sono due ambiti fondamentali per la riuscita di progetti legati alle soluzioni analitiche e ancor di più nel caso dei Big Data.
Il valore dei processi di Data Management è spesso più difficile da far comprendere al top management, ma altrettanto fondamentale. Lo è per garantire l'accesso a qualsiasi dato in ogni formato, integrare i dati provenienti da fonti diverse e asincrone, governare i processi di estrazione e qualità del dato e fornire una certificazione univoca delle entità (la cosiddetta "single view" o "master data" di cliente, fornitore, cittadino o quant'altro riguarda il dato) in tutti i sistemi.
Centralizzare in maniera univoca tutti i dati aziendali è fondamentale e può essere opportuno anche integrarvi elementi provenienti da fonti esterne all'azienda, a seconda delle esigenze di business, cioè di quello che si vuole ottenere dalla successiva analisi dei dati.
Imperativamente propedeutica per la certificazione del dato è l'eliminazione dei dati duplicati: avere un dato certificato, sapendo da dove e quando è stato estratto e che sia unico, è un vantaggio per le imprese in termini di attendibilità delle analisi e permette ovviamente di ottenere risparmi, minimizzando lo spazio storage utilizzato e gli sforzi per la gestione del dato stesso.