IBM: nei Big Data nuove opportunità

Per rispondere alle sfide di Big Data e soddisfare i requisiti di velocità, volume e varietà richiesti dalla Business Analytics, IBM si affida a InfoSphere BigInsights edizione della tecnologia open source Hadoop, InfoSphere Streams un "engine" per l'analisi continuativa di grandi volumi di dati in streaming e alle appliance data warehouse Netezza.

Avatar di Riccardo Florio

a cura di Riccardo Florio

Secondo le stime degli analisti il mercato dei Big Data quest'anno varrà quasi 7 miliardi di dollari e per il 2015 si prevede un raddoppio, con crescite del 40% all'anno. Numeri importanti che IBM conta di sfruttare mettendo a disposizione soluzioni, tecnologie, servizi e progetti.

Il tema dei Big Data entra in gioco quando si affrontano progetti in cui le caratteristiche delle informazioni da trattare sono tali da mettere in difficoltà la tecnologia IT attualmente disponibile. Caratteristiche dei dati che è possibile ricondurre alle cosiddette tre "v" ovvero velocità, volume e varietà.

Le tecnologie IBM per i Big Data

IBM ha predisposto una strategia e una gamma di soluzioni specifiche per rispondere a queste sfide.

"Big Data non è ancora un mercato pienamente maturo - ha osservato Raffaele Bella, manager of Information Management, Business Analytics & Process Optimization del Software Group di IBM Italia - ma IBM ha diversi elementi distintivi rispetto ad altri vendor nell'affrontare questi temi. Innanzitutto, quello di approcciarsi ai Big Data come a un'infrastruttura di progetto di livello corporate; abbiamo la possibilità di farlo perché la nostra offerta copre tutte le esigenze aziendali anche quelle spesso trascurate. Per esempio IBM fornisce le soluzioni per affrontare la Data Governance che è un tema essenziale; quando si deve gestire un grande volume di dati è essenziale porre attenzione agli aspetti di governance legati alla qualità, alla gestione e alla sicurezza".

Raffaele Bella, manager of Information Management, Business Analytics & Process Optimization - Software Group IBM Italia

IBM dispone di componenti tecnologiche in grado di indirizzare le problematiche di volume, velocità e varietà. Per far fronte alle esigenze di gestire grandi volumi di dati IBM si appoggia alla tecnologia open source Hadoop di cui ha realizzato un'edizione denominata IBM InfoSphere BigInsights che prevede modifiche indirizzate a garantire un'affidabilità adatta alle esigenze corporate, a incrementare l'efficienza e a migliorare gli aspetti di data security. Su questa base IBM ha sviluppato una serie di strumenti di analisi dei dati che rendono fruibili i Big Data presenti su Hadoop.

Un secondo componente dell'offerta IBM a supporto dei Big Data è InfoSphere Streams, un "engine" sviluppato nei laboratori IBM per l'analisi continuativa di grandi volumi di dati in streaming, che risponde in modo efficace alle sfide di velocità e varietà. Rispetto ad approcci tradizionali che prevedono la memorizzazione dei dati all'interno di un repository e la successiva fase di analisi, questa soluzione analizza i dati "on the fly", applicando una serie di trasformazioni analitiche prima di arrivare alla fase di memorizzazione. Questo consente di memorizzare solo le informazioni che potrebbero essere utili.

Il terzo componente distintivo di IBM è fornito dalle appliance data warehouse Netezza che dispongono di una tecnologia specializzata e ottimizzata per gestire query complesse su grandi volumi di dati strutturati e destrutturati. Inoltre, il database di Neteeza è privo di indici: una caratteristica che riduce in modo drastico le operazioni di manutenzione rispetto a data warehouse tradizionali. Infine IBM ha nel suo portafoglio prodotti l'intera gamma di soluzioni Cognos che interviene per le operazioni di Business Intelligence di tipo più tradizionale.

"La soluzione IBM per i Big Data contribuisce a conseguire diversi benefici – ha proseguito Bella -. Riduce la latenza dei dati e di conseguenza il tempo intercorrente tra il momento in cui sono acquisiti i dati dei clienti e a quello in cui viene fornito il risultato dell'analisi. Permette di gestire complessità e costi legati ai Big Data attraverso sistemi multi-clustered e fornisce accurati risultati di marketing. Infine abilitare una crescita scalabile incrementando progressivamente la velocità e la complessità della piattaforma analitica".