Amazon Web Services annuncia AWS Glue DataBrew

Uno strumento dedicato ai data scientists e data analysts che fornisce sia interfacce basate su codice che visive

Avatar di Antonino Caffo

a cura di Antonino Caffo

Amazon Web Services ha annunciato la disponibilità generale di AWS Glue DataBrew, un nuovo strumento di preparazione dei dati visivi che consente ai clienti di pulire e normalizzare i dati senza scrivere codice. Dal 2016, i data engineer utilizzano AWS Glue per creare, eseguire e monitorare i lavori di estrazione, trasformazione e caricamento (ETL).

AWS Glue fornisce interfacce visive e basate su codice e ne ha notevolmente semplificato l'estrazione, l'orchestrazione e il caricamento dei dati nel cloud per i clienti. Gli analisti di dati e gli scienziati dei dati desideravano un modo più semplice per pulire e trasformare questi dati, ed è ciò che offre DataBrew, con un servizio che consente l'esplorazione e la sperimentazione dei dati direttamente da data lake, data warehouse e database AWS senza scrivere codice.

AWS Glue DataBrew offre ai clienti oltre 250 trasformazioni predefinite per automatizzare le attività di preparazione dei dati (ad esempio il filtraggio di anomalie, standardizzazione dei formati e correzione di valori non validi) che altrimenti richiederebbero giorni o settimane di scrittura di trasformazioni codificate a mano. Una volta preparati i dati, i clienti possono iniziare immediatamente a utilizzarli con AWS e servizi di analisi e machine learning di terze parti per eseguire query sui dati e addestrare modelli di machine learning. Non ci sono impegni o costi iniziali per utilizzare AWS Glue DataBrew e i clienti pagano solo per la creazione e l'esecuzione di trasformazioni sui set di dati.

Come spiega AWS: «La preparazione dei dati per l'analisi e l'apprendimento automatico implica diverse attività necessarie e dispendiose in termini di tempo, tra cui l'estrazione dei dati, la pulizia, la normalizzazione, il caricamento e l'orchestrazione dei flussi di lavoro su larga scala. Per estrarre, orchestrare e caricare i dati su larga scala, i data engineer e gli sviluppatori esperti in SQL o in linguaggi di programmazione possono utilizzare adesso AWS Glue».

Con AWS Glue DataBrew gli utenti finali possono accedere ed esplorare visivamente qualsiasi quantità di dati all'interno della propria organizzazione direttamente dal proprio Amazon Data Lake Simple Storage Service (S3), Amazon Data Warehouse e Amazon Aurora e Amazon Database Relational Database Service (RDS). I clienti possono scegliere tra oltre 250 funzioni integrate per combinare, ruotare e trasporre i dati senza scrivere codice.

«I clienti AWS utilizzano i dati per l'analisi e il machine learning a un ritmo senza precedenti. Tuttavia, questi clienti ci dicono regolarmente che i loro team dedicano troppo tempo alle attività indifferenziate, ripetitive e banali associate alla preparazione dei dati» ha affermato Raju Gulabani, VP di Database and Analytics, AWS.

«I clienti amano la scalabilità e la flessibilità dei servizi di preparazione dei dati basati su codice come AWS Glue, e potrebbero anche trarre vantaggio dal consentire agli utenti aziendali, agli analisti di dati e ai data scientist di esplorare visivamente e sperimentare i dati in modo indipendente, senza scrivere codice. AWS Glue DataBrew presenta un'interfaccia visiva di facile utilizzo che aiuta gli analisti di dati e i data scientist di tutti i livelli tecnici a comprendere, combinare, pulire e trasformare i dati».