Sponsored Story

Data mesh, una radicale innovazione nel data management

Da molti considerato il modello capace di rivoluzionare il mondo del data management, il data mesh implica un approccio data driven con importanti ripercussioni sull’organizzazione aziendale. Ci spiega quali Raffaele Camanzo, Business Design presso Sourcesense

Pubblicato il 05 Mag 2022

Data mesh

Nell’ambito del data analytics, per Google Trends il data mesh è stato uno dei topic del 2021. E le aspettative per l’impatto che avrà questa tecnica di accesso e gestione dei dati sono molto importanti. Tuttavia, il suo vero valore il data mesh lo deve ancora provare, anche se i presupposti per essere davvero dirompente ci sono tutti.

I quattro principi del data mesh

“Il data mesh è un approccio che si fonda su quattro principi” spiega Raffaele Camanzo, Business Design presso Sourcesense. “Domain Driven Data Ownership, Data as Product, Self-service Infrastructure e Federated Computational Governance. Questo definisce un modello radicalmente diverso rispetto a quanto fatto fino ad oggi nel data management. Oltre che sugli aspetti tecnologici, il data mesh concentra infatti l’attenzione anche sull’organizzazione e sui processi. E la componente organizzativa non solo è fondamentale, ne è parte integrante”.

Dai silos ai domini di business

Semplificando, in un tipico contesto aziendale troviamo una serie di bisogni analitici, che possono essere report, metriche, esperimenti di machine learning e così via. Per soddisfare tali bisogni si parte da una serie di fonti dati, che sono tipicamente operazionali, provenienti per esempio dall’e-commerce o dal CRM. Un team di esperti utilizza una tecnologia (o un insieme di tecnologie) per raccogliere tali dati, trasformarli e produrre i risultati richiesti, cioè sostanzialmente crea delle pipeline di ETL (Extract/Transform/Load).

Nel data mesh i tre silos (produttori, esperti di tecnologia e consumatori) perdono completamente di significato, perché l’organizzazione avviene in funzione di domini di business. “SI parla di domini nell’accezione del domain driven design – ha precisato Camanzo –. Ci sono componenti di conoscenza, di tecnica e di tecnologia che sono necessarie per affrontare in maniera efficace questo shift di paradigma. Ogni dominio contiene all’interno tutte le conoscenze di business, tecniche e sui dati specifici, per avere la capacità di erogare servizi analitici agli altri domini nella struttura organizzativa. Perciò, si passa da una responsabilità centralizzata a una decentralizzata per singolo dominio. Mentre, dal punto di vista architetturale, si passa da sistemi sostanzialmente monolitici a una struttura distribuita”.

Data as a product

Sul versante tecnico, si ha la transizione da dati come prodotti del codice a dati e codice come singola entità. Si introduce così il concetto di “data product”. Un singolo dominio contiene uno o più data product, dove il data product è l’insieme dei dati e del software per la gestione dei dati stessi. Anche sul fronte della governance, si passa da un modello di governance centralizzato a un modello federato e il più possibile automatizzato. “Si cerca di evitare di creare strutture centralizzate – ha sottolineato Camanzo – per essere in grado di scalare, di risolvere una serie di problemi che i sistemi di data management esistenti non sono riusciti a risolvere in maniera efficace. Sul piano culturale, si passa dal considerare i dati come un asset a prodotti da condividere”.

I difetti e l’inefficacia dei modelli attuali

I tech giant e i principali vendor nel mondo dei data analytics parlano di data mesh e iniziano a proporre soluzioni.

“I modelli attuali sono basati su paradigmi tecnologici, evoluti e automatizzati ma sostanzialmente monolitici e centralizzati – ha sostenuto Camanzo –, che non tengono il passo con la crescita frenetica di numero e varietà delle fonti e delle necessità da soddisfare, perché non è solo una questione tecnologica ma organizzativa, di comprensione del bisogno, di responsabilità, accuratezza del dato e di fiducia nel risultato. Tutto questo ha anche un risvolto concreto e tangibile per i decisori: l’efficacia dell’iniziativa (ROI), e molte iniziative nel data management hanno evidenziato performance decisamente insoddisfacenti, con risultati che non giustificano gli investimenti fatti.

Early adopter

Rispetto ai modelli di adozione dell’innovazione, Camanzo afferma che in tema di data mesh attualmente ci sia un livello di diffusione da early adopter. Questo sostanzialmente significa che non esistono ancora strumenti tecnologici in grado di supportare pienamente i principi della mesh. Molto va immaginato e costruito, cioè realizzato proprio sviluppando software per ottenere i risultati e seguire le indicazioni che vengono dall’approccio così com’è descritto.

Questa situazione è ulteriormente complicata dal fatto che praticamente tutte le aziende hanno già una serie di tecnologie, di strumenti e di approcci al data management. È perciò necessario avere da una parte ben chiaro cos’è il data mesh e cosa significa introdurlo all’interno di un’azienda. Dall’altra, serve avere un’idea di come avviare una transizione dallo scenario esistente a uno scenario che considera il data management con il modello del data mesh.

“Il risultato non è scontato e non è semplice – ha precisato Camanzo – e un’azienda deve valutare attentamente se le conviene considerare il data mesh oggi. È necessario capire se il modello domain oriented è adatto al proprio modello organizzativo e se l’azienda basa le proprie decision e il proprio business sui dati, quindi, sostanzialmente, se è o sta affrontando una trasformazione in data driven company. Infine, non stupirà che è imprescindibile un forte supporto a livello direzionale. Sia chiaro, non sto parlando di un’introduzione big bang e anzi ritengo che possa avere successo solo un approccio incrementale ed evolutivo che si concentri nelle prime fasi su quick win; tuttavia, senza i necessari presupposti è difficile credere che si possa passare dalla sperimentazione all’utilizzo su larga scala.

Il desiderio di sperimentare, accettando le difficoltà

Un altro aspetto fondamentale è la capacità di creare ed evolvere tecnologia, perché parti della piattaforma vanno realizzate e mantenute nel tempo. I team all’interno dei domini devono essere in grado di creare prodotti software e dati in maniera autonoma e al tempo stesso collaborare tra loro per far convergere a livello di piattaforma gli aspetti trasversali.

“Quali early adopter, bisogna avere il desiderio di sperimentare e accettare che la sperimentazione possa anche portare a un fallimento” ha concluso Camanzo. “Per un’azienda che ragiona solamente per passi consolidati, probabilmente il data mesh non è una buona soluzione oggi. Bisogna avere introdotto strumenti di ingegneria moderni. Bisogna avere dimestichezza col cloud, con l’automazione e con le tecnologie moderne. Ci deve essere una strategia di gestione dei dati con un commitment a lungo termine perché i data product all’interno dei domini sono oggetti che vanno creati ed evoluti agendo sul lungo periodo. In caso contrario, la transizione al data mesh non può funzionare”.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 3