Avatar di Antonino Caffo

a cura di Antonino Caffo

Amazon ha annunciato che AWS Lake Formation, un servizio completamente gestito che facilita la costruzione, la sicurezza e la gestione dei data lake, è disponibile a livello globale.

I clienti con istanze gestite negli Stati Uniti, Asia ed Europa possono trarre vantaggio dallo strumento che dovrebbe ampliare ulteriormente il mercato dei data lake.

«I nostri clienti ci dicono che Amazon S3 è il luogo ideale per ospitare i loro data lake, motivo per cui AWS vanta più data lake di chiunque altro, nell'ordine delle decine di migliaia e in crescita ogni giorn».

«Ecco perché abbiamo creato AWS Lake Formation, in modo che i clienti possano dedicare più tempo all'apprendimento e all'innovazione dei propri dati, piuttosto che trasferirli semplicemente da qualche parte» ha riferito il vicepresidente di database, analisi e machine learning di AWS, Raju Gulabani».

Lake Formation, annunciata lo scorso novembre alla conferenza AWS RE:Invent, automatizza una serie di passaggi tipicamente coinvolti nella creazione di un insieme di dati, tra cui la raccolta, la pulizia, la deduplicazione e la catalogazione delle informazioni, con la loro ottimizzazione.

Utilizzando Lake Formation, gli utenti portano i dati in un lake da una serie di fonti, utilizzando modelli predefiniti, quindi definiscono le politiche per governare l'accesso di diversi gruppi all'interno dell'organizzazione, mentre le informazioni vengono automaticamente classificate e preparate.

Oltre a ciò, Lake Formation fornisce una dashboard centralizzata da cui gli amministratori possono gestire le politiche di accesso ai dati, la governance e il controllo sopra menzionati su più motori di analisi, oltre a un catalogo di ricerca che descrive i set di dati disponibili e il loro utilizzo.

E nei prossimi mesi, consentirà agli ingegneri di analizzare i dati all'interno di tali set, sfruttando servizi di machine learning AWS, inclusi (ma non solo) Amazon Redshift, Amazon Athena e AWS Glue, Amazon EMR, Amazon QuickSight e Amazon SageMaker.

Tra le prime aziende a usare AWS Lake Formation ci sono Panasonic Avionics Corporation, Accenture, la piattaforma di moda e lifestyle online Zalando,Quantiphi, Life360, il gigante dei prodotti per la cura degli occhi Alcon e la società biotecnologica Amgen.

Il mercato globale dei data lake dovrebbe raggiungere i 12,01 miliardi di dollari entro il 2024, secondo Advanced Market Analytics. Anche altri big lo sanno: Microsoft offre la propria soluzione gestita in Azure Data Lake, mentre Google vanta una suite di strumenti: Cloud Datalab, Dataproc e Dataflow.