Gestire l’infrastruttura IT nell’era del multicloud

Steve Tack, Senior Vice President di Dynatrace, ha commentato i risultati di un’interessante ricerca sottolineando i punti critici nella gestione di una moderna infrastruttura cloud.

Avatar di Dario Orlandi

a cura di Dario Orlandi

Una nuova ricerca pubblicata da Dynatrace è stata lo spunto per una chiacchierata con Steve Tack, Senior Vice President Product Management, che ha approfondito la visione del mercato da parte dell’azienda, le sfide del prossimo futuro e le nuove soluzioni pensate proprio per rispondere al mutamento del panorama It.

Il Global Cio Report 2022 sottolinea infatti come lo spostamento verso gli ambienti multicloud abbia reso complessi e inefficaci gli approcci tradizionali al monitoraggio dell’infrastruttura It. Il report sottolinea, infatti, come il 99% delle aziende di grandi dimensioni utilizzino già oggi un ambiente multicloud, e tutte stiano pianificando di adottare standard aperti di osservabilità nell’arco dei prossimi due anni.

Steve Tack ha commentato questi risultati sottolineando come il sondaggio faccia emergere la grande quantità di cambiamenti che stanno avvenendo in questo momento. Ci sono almeno un paio di fattori che stanno spingendo in questa direzione: l'adozione di tecnologie hyperscale e la diffusione crescente di Kubernetes sono driver tecnologici che hanno incrementato la complessità che le organizzazioni devono affrontare.

Contemporaneamente, anche l’organizzazione e la topologia dei team stanno cambiando: stiamo passando un tradizionale dipartimento IT allo sviluppo dei team DevOps e altre evoluzioni simili. Ci sono diverse ottime ragioni per abbracciare questi cambiamenti, come la maggiore velocità richiesta nell’implementazione di nuove applicazioni e nuovi servizi.

Gestire la complessità

Il progresso sta però superando la capacità umana di affrontare la complessità: e proprio qui Dynatrace ha concentrato la sua attenzione dal punto di vista della ricerca e sviluppo. Il problema non è solo l’osservabilità da un punto di vista passivo, presentando i dati come si è sempre fatto storicamente. L’obbiettivo è guidare l'analisi e fornire risposte che consentano ai clienti di guidare l'automazione.

Secondo la ricerca, le soluzioni tradizionali più gettonate sono OpenTelemetry (54%), Prometheus (52%) e Jaeger (47%), ma un’ampia maggioranza degli intervistati (61%) sostiene che i punti ciechi nell’osservabilità della struttura stanno diventando sempre più problematici e pongono un freno alla trasformazione digitale delle aziende.

Il 57% degli intervistati dichiara che la configurazione e la gestione manuale degli strumenti di monitoraggio sta diventando insostenibile negli ambienti multicloud dinamici e nelle infrastrutture basate su Kubernetes.

Secondo la ricerca, i team IT dedicano quasi la metà del loro tempo a lavoro manuale di routine, necessario per mantenere attiva l’infrastruttura; queste difficoltà operative si ripercuotono sulla produttività e sulla capacità di portare innovazione e valore all’interno dell’azienda.

Steve Tack ha concentrato l’attenzione sulle aziende più grandi: queste organizzazioni hanno un patrimonio storico di strumenti e flussi di lavoro, e quindi stanno inevitabilmente stratificando nuove tecnologie nei loro ambienti.

Per questo genere di organizzazioni, il multicloud è l’approccio naturale, così come la struttura ibrida che associa strumenti remoti con flussi di lavoro gestiti ancora internamente.

La trasformazione, però, è inevitabile: tutti i clienti con cui l’azienda parla sono perfettamente consci che la sfida per loro è vitale. I clienti, specialmente le generazioni più giovani, vogliono soluzioni nuove, strumenti più intelligenti e un’esperienza digitale.

Osservabilità e sicurezza

La strategia di Dynatrace è cercare di individuare le aree in cui il cambiamento rompe gli approcci esistenti. Quando l’azienda ha deciso di offrire un nuovo approccio all’osservabilità, la convinzione profonda era che gli strumenti e i metodi di lavoro tradizionali non avrebbero più funzionato.

Perlo stesso motivo Dynatrace è entrata anche nel settore della sicurezza. Storicamente, le aziende hanno cercato di proteggere le risorse avvolgendole con strumenti di sicurezza e controllo delle connessioni. Man mano che si passa ai microservizi, con applicazioni e servizi distribuiti che attraversano i confini dei provider di servizi cloud, raggiungono le risorse locali e poi si muovono verso i clienti remoti, la tradizionale architettura basata sui firewall e gli strumenti tradizionali non funziona più.

E così, proprio come il cloud ha reso inefficaci gli approcci tradizionali all'osservabilità, ha anche infranto la sicurezza delle applicazioni. L’approccio di Dynatrace è stato quello di concentrare l’attenzione ancora una volta sull'applicazione, non cercando di isolarla fisicamente ma iniziando ad analizzarla per individuare le vulnerabilità.

Quando si gestiscono questi microservizi e che comprendono centinaia di elementi dinamici, come si può essere certi che ciò che è in esecuzione in produzione non è a rischio, o non è vulnerabile a uno zero-day? La tecnologia di Dynatrace può aiutare a capire cosa è in esecuzione in produzione, così che quando c’è un problema si possano stabilire le priorità di rischio e individuare dove siano necessarie attività di remediation.

L’azienda ha infatti introdotto recentemente non solo la capacità di analizzare e capire dove sono le vulnerabilità, ma anche bloccare attivamente gli attori delle minacce dannose e gli attaccanti che stanno cercando di sfruttare la vulnerabilità.

La nascita di Grail

Dynatrace lavora con clienti di grandi dimensioni e ha un’offerta estremamente scalabile; ma l’azienda ha notato le tendenze e individuato con lungimiranza quello che stava per succedere, continuando a reinventarsi per soddisfare le esigenze aziendali moderne.

Così è nato un nuovo progetto, circa tre anni fa, che è partito esaminando tutte le tecnologie disponibili sul mercato. Dynatrace ha notato che nessuno strumento di analisi dei dati avrebbe soddisfatto le esigenze che pensavamo i nostri clienti avrebbero avuto.

Quindi Dynatrace ha deciso di costruire una funzione, chiamata Grail, iniziando dai casi d'uso. Il primo è la gestione e l'analisi dei log: un settore che è pronto per un’innovazione capace di rompere gli schemi attuali, perché le alternative esistenti sul mercato faticano a scalare.

Una delle strade per domare la complessità è sfruttare i sistemi basati sull’intelligenza artificiale, ma questa definizione racchiude approcci molto diversi tra loro, e alcuni di essi sono davvero controproducenti secondo Dynatrace: è infatti essenziale avere in ingresso dati affidabili e completi. In caso contrario, nessuna AI potrà fare la magia e offrire risposte affidabili.

L’intelligenza artificiale implementata dall’azienda segue una filosofia diversa rispetto a quella proposta da molte altre soluzioni, che utilizzano un approccio generico basato sulla correlazione. Dynatrace ha invece creato un motore di intelligenza artificiale più deterministico per ottenere risposte dai dati.

In questo modo, quando qualcosa va storto, gli strumenti possono determinare le relazioni e compiere analisi causali. Altri potrebbero provare a imparare nel tempo, c'è uno spazio anche per gli approcci di apprendimento automatico. Ma sono troppo lenti per allenarsi in un ambiente cloud molto dinamico.

Dynatrace utilizza la topologia in tempo reale anche per la sicurezza; invece di una rilevazione delle anomalie individua i profili di rischio analizzando per esempio quali entità abbiano accesso a un archivio o siano esposte su Internet. Questo è il modo in cui l’azienda ha approcciato lo sviluppo dell’IA, mirato ai casi d'uso di osservabilità e sicurezza costruiti a partire da un disegno fondamentalmente deterministico.