
Le organizzazioni, nell’epoca dei big data, scelgono sempre di più una strategia data-driven per mantenere il business competitivo rispetto alla concorrenza. I dati rappresentano un vero e proprio tesoro che le imprese possono, e devono, sfruttare a proprio vantaggio per la definizione di strategie performanti e innovative.
La gestione dei dati, così come la loro archiviazione, deve essere oculata e accurata affinché il dato possa divenire un elemento di valore per l’azienda. Esistono numerose soluzioni e architetture incaricate di gestire anche enormi volumi di dati: un’organizzazione democratica ed efficiente diventa, per l’impresa moderna, un elemento differenziale in grado di assicurare ottime performance a tutte le attività.
Le aziende che scelgono un approccio ai dati obsoleto sono destinate a rimanere indietro, superate da imprese che invece implementano soluzioni quali data lake, data warehouse o data mesh. Di cosa si tratta? Quali sono i vantaggi del data mesh e come funziona questa architettura? Scopriamo nel dettaglio tutto quel che riguarda il data mesh e il suo funzionamento.
Indice dei contenuti
Il termine data mesh, relativamente nuovo, si lega a una tendenza in forte crescita negli ultimi anni. Questa architettura dati ha conquistato sempre più consensi nel giro di pochissimo tempo: da quando è stata ideata e rilasciata, ha consentito un cambio di paradigma essenziale rispetto alle architetture di gestione dei dati sin ora disponibili.
Il data mesh rappresenta l’estensione della classica architettura applicata alla gestione dei dati. Un data mesh, infatti, permette di analizzare in modo agile e scalabile dati anche molto complessi, agevolata dall’integrazione con strumenti di machine learning e intelligenza artificiale.
Il data mesh, al giorno d’oggi, è un’alternativa estremamente valida al modello del data lake, grazie alla sua struttura decentralizzata e distribuita. L’architettura del data mesh è stata progettata per supportare le imprese nel loro processo di sviluppo e di accrescimento in termini di scalabilità e agilità. Numerosi i vantaggi di un data mesh, tra cui la riduzione del time-to-market e la diminuzione dei costi relativi alla manutenzione della struttura.
Questo approccio decentralizzato alla data platform consente a ogni dominio di usufruire di un proprio storage e di una modalità intelligente di gestione di processi e dati.
Un data mesh promuove l’impiego di tecnologie native del cloud al fine di ottimizzare la scalabilità nell’ambito della gestione dei dati. Tale concetto può essere paragonato ai microservizi, utili al pubblico per comprendere al meglio l’universo del data mesh. Un’architettura dei microservizi tende ad abbinare servizi leggeri per garantire una maggiore funzionalità all’applicazione aziendale. Un data mesh utilizza domini funzionali per l’impostazione dei parametri relativi ai dati.
Per comprendere pienamente il valore di un data mesh, valutiamo adesso quali sono i vantaggi offerti da questo innovativo approccio alla gestione dei dati aziendali.
L’architettura del data mesh è stata progettata con il preciso intento di semplificare le applicazioni self-service provenienti da più fonti di dati, aumentando e velocizzando l’accesso a questi ultimi. Oltre alle figure specialistiche, quali data engineer, data scientist e sviluppatori, anche utenti meno esperti possono accedere ai dati in modo agile e semplice.
In questo modo, è possibile ridurre i colli di bottiglia operativi e i silos, soprattutto quando il data mesh viene implementato su un hub di processo DataOps. Ciò permette a qualsiasi utente di avviare un processo decisionale più rapido, performante e consapevole. Anche gli utenti più esperti e le figure specializzate giovano dei benefici del data mesh, in quanto potranno dare priorità alle attività che richiedono la loro supervisione.
Un data mesh viene strutturato perseguendo l’obiettivo di promuovere una data governance più solida. Il team incaricato di gestire l’accesso ai dati sensibili potrà usufruire di uno strumento più sicuro, agile e conforme alle normative vigenti. I dati in log possono essere osservati dal sistema in modo sicuro, affinché i revisori possano ottenere una visione globale degli accessi e sapere sempre quali utenti hanno accesso ai dati (e a quali informazioni l’utente ha avuto accesso).
Il data mesh si distingue dal classico modello di elaborazione dei dati in batch, in quanto predilige piattaforme cloud e pipeline di streaming per il processo di raccolta dei dati in realtime. L’utilizzo delle tecnologie cloud garantisce immensi vantaggi sia in termini di costi che nell’ambito dell’ottimizzazione delle risorse. Il modello di pagamento pay-per-use, infatti, permette di raggiungere un ottimo livello di trasparenza per quel che riguarda il costo dei servizi di storage. Ciò si traduce in una riduzione generale dei costi e in una gestione più elaborata e proficua di risorse e budget.
L’interoperabilità viene facilitata da un data mesh in quanto i proprietari dei dati definiscono, in anticipo, le modalità di standardizzazione dei dati (indipendenti dal dominio). Se il team di dominio definisce il proprio dataset, potrà applicare le stesse regole per consentire l’accesso ai dati tra domini, in modo più semplice e veloce.
La coerenza tra i diversi domini permette all’utilizzatore dei dati di accedere in modo più efficiente a tutte le informazioni, utilizzando le API per lo sviluppo di applicazioni in grado di soddisfare, in modo appropriato, qualsiasi esigenza di business.
Generalmente, un’infrastruttura centralizzata dei dati comporta un debito tecnico maggiore, a causa della complessità della struttura e della collaborazione indispensabile per la manutenzione del sistema. I dati, man mano che si accumulano all’interno del repository, tendono a rallentare il sistema nella sua globalità.
La distribuzione della pipeline dei dati sulla base delle proprietà del dominio permette di ridurre il debito tecnico e le sollecitazioni sul sistema di storage. È possibile, altresì, ridurre il volume delle singole richieste attraverso delle API che rendono l’accessibilità ai dati più semplice.
Un data mesh si distingue per la sua architettura, fondata sulla base di quattro concetti fondamentali:
Il data mesh risulta essere un’architettura di dati distribuita, all’interno della quale le informazioni vengono organizzate sulla base del loro dominio. Ciò permette al dato di essere più accessibile per qualsiasi utente, qualsiasi sia la sua esperienza o provenienza aziendale.
Un data lake, invece, è un ambiente di storage economicamente conveniente il quale ospita petabyte di dati strutturati, semistrutturati o non strutturati. Questa architettura viene progettata con una specifica finalità di utilizzo, strettamente legata al machine learning, alle attività di analytics di business e ad altre applicazioni di ampio respiro.
Un data mesh è un approccio architetturale innovativo ai dati: il data lake può far parte di tale approccio. Un data lake spesso viene impiegato come silos generale per dati che non hanno ancora uno scopo ben definito. Questo atteggiamento aumenta il rischio che il data lake diventi una palude di dati, all’interno della quale ci saranno lacune in termini di governance e qualità delle informazioni.
Anche il data fabric, così come il data mesh, è un nuovo concetto architetturale. La differenza tra i due, però, è molto profonda. Mentre il data mesh gestisce i dati in qualità di prodotto, affidando la definizione dei requisiti ai proprietari del dominio, un data fabric fonda il suo essere sull’automazione incentrata su una base arricchita di metadati.
Il data fabric si concentra sull’automazione:
Lo scopo è quello di creare una catena di valore delle informazioni tra fornitori e utilizzatori dei dati. Il data fabric è stato creato sulla base della nozione di “metadati attivi”, in quanto impiega grafi di conoscenza, tecnologia di intelligenza artificiale e machine learning e, infine, la semantica per la definizione degli schemi, suddivisi in differenti tipologie di metadati (social, log di sistema o altro).
L’insight viene applicato per l’automazione e l’orchestrazione della catena di valore dei dati. L’impiego di un data fabric non preclude l’utilizzo di un data mesh, anzi quest’ultimo elemento può migliorare le proprie performance se integrato in un data fabric. Il data mesh, infatti, può accedere a processi di automatizzazione di elementi fondamentali, quali il processo di creazione dei dati o l’applicazione della governance globale. Ciò si traduce in una semplificazione dei processi di orchestrazione e combinazione di più di un prodotto di dati.












