Il potenziale del data marketplace. Come governare la condivisione dei dati
Sicurezza, conformità, qualità, facilità di accesso e collaborazione tra i team. Il marketplace dei dati offre un hub trasparente per la condivisione efficiente e sicura di dati e strumenti di analisi pronti all’uso, fuori e dentro l’ecosistema aziendale
Negli ultimi anni l’importanza della governance dei dati è cresciuta nelle aziende di tutte le dimensioni sia in Europa che nel resto mondo. E questo per diverse ragioni: la prima è la complessità dei dati, causata da un numero crescente di silos che contengono i dati aziendali. I dati ora esistono all’interno e all’esterno del firewall in diversi tipi di archivi dati on premise, in più cloud, nelle applicazioni SaaS e all’edge.
Sono compresi i dati archiviati nei cloud storage, i sistemi di gestione di database relazionali (RDBMS) in cloud e on premise, i database NoSQL in cloud e on premise, l’Hadoop Distributed File System (HDFS) e altri file server. Un’altra ragione per l’aumento della priorità della governance dei dati è la quantità di legislazione in tutto il mondo a cui le imprese devono conformarsi per gestire la privacy e la sicurezza dei dati al fine di evitare violazioni dei dati. Questa legislazione può essere specifica per una regione geografica, come il GDPR nell’Unione Europea; per un paese, come le normative in Italia, Germania, Australia o Giappone; o per uno stato, come il California Consumer Privacy Act negli Stati Uniti.
Le aziende che operano a livello internazionale si trovano a dover rispettare diverse leggi sulla privacy dei dati, associate alle diverse aree in cui operano. Inoltre, gli enti regolatori di settore in specifici Paesi stanno introducendo normative specifiche per ciascun settore.
La vetrina dei dati – Quando si considerano nell’insieme la complessità dei dati, la legislazione sulla privacy dei dati e le normative specifiche di settore, si può capire perché la governance della sicurezza dell’accesso ai dati, la condivisione dei dati e l’uso dei dati è diventata così importante. Tuttavia, la condivisione dei dati sta diventando fondamentale per il successo nel business, ma la domanda è: come si può farlo in modo conforme quando si ha a che fare con un patrimonio di dati altamente distribuito e senza aumentare il rischio di non conformità? La risposta sta in un nuovo tipo di tecnologia: il marketplace dei dati. Questa terminologia è emersa negli ultimi anni, ma cosa si intende esattamente? Un marketplace dei dati è un’applicazione di catalogo dati che governa la pubblicazione, la condivisione, il consumo e l’uso di prodotti dati e analytics pronti all’uso, di alta qualità e conformi. Per applicazione di catalogo dati intendiamo che il marketplace dei dati è un’applicazione che utilizza un catalogo dati sottostante per archiviare metadati resi disponibili tramite l’applicazione del marketplace. Un marketplace dei dati è una vetrina per l’azienda che mette a disposizione prodotti dati come servizi. Ci sono molti esempi di prodotti dati, tra cui clienti, fornitori, ordini, spedizioni, pagamenti e così via. Gli attributi dei dati che compongono ciascun prodotto dati sono descritti utilizzando nomi comuni di dati di business completamente documentati in un glossario. Inoltre, esiste una completa genealogia dei metadati che spiega come sono stati creati, chi è il proprietario, chi sono i curatori dei dati e chi altro sta utilizzando il prodotto dati. Inoltre, i prodotti dati sono etichettati e organizzati per renderli facili da trovare, accedere, condividere e riutilizzare in tutta l’azienda. Ma nel marketplace dei dati non vi sono solo i prodotti dati: prodotti analitici come i report di BI, i dashboard e i modelli di machine learning vengono sempre più pubblicati per incoraggiare la condivisione.
Tipologie e vantaggi – Stiamo assistendo all’emergere di diversi tipi di marketplace di dati. I marketplace di dati pubblici sono già una realtà, per esempio, Snowflake Marketplace e Databricks Marketplace. Questi contengono prodotti dati pubblici già pronti per il business, come i dati di mercato forniti da enti finanziari come Bloomberg, Standard & Poor’s e molti altri. I marketplace di dati pubblici sono gestiti dal fornitore che li offre, quindi non rappresentano un onere per le aziende che li utilizzano, ad eccezione dei termini e le condizioni per l’utilizzo. È responsabilità del fornitore garantire che i prodotti dati siano sempre aggiornati. L’altro tipo di data marketplace è un quello interno all’intera azienda, che pubblica prodotti dati pronti per l’uso, realizzati internamente e disponibili per la condivisione in tutta l’ecosistema aziendale. Non c’è motivo per cui la stessa tecnologia di base non possa supportare sia i mercati dei dati pubblici sia quelli interni.
Ma questo è più di un semplice software che funge da vetrina per la condivisione di dati pronti per l’uso aziendale. È un software che offre la possibilità di governare completamente la condivisione di dati e prodotti analitici. Ciò significa che fornisce processi per governare molti aspetti, quali l’approvazione e la pubblicazione di prodotti dati disponibili per il consumo; la dichiarazione di proprietà dei dati e dei prodotti analitici da condividere; la creazione e la manutenzione di politiche e termini d’uso che governano la condivisione di dati; la creazione, l’instradamento e l’approvazione collaborativa delle richieste di accesso e consumo di dati e prodotti analitici da parte dei proprietari e del personale autorizzato, prima di concedere l’accesso; l’accettazione da parte del consumatore dei termini d’uso; il controllo della distribuzione di prodotti dati condivisi, soprattutto se contiene dati personali identificabili; e infine l’audit, il monitoraggio e il tracciamento dell’utilizzo di dati e prodotti analitici condivisi.
Alla ricerca di dati affidabili – La governance della condivisione dei dati è fondamentale per proteggere i dati sensibili, mantenere la sovranità dei dati e anche la sicurezza dell’accesso ai dati e la prevenzione delle perdite di dati. Il marketplace dei dati aziendali dovrebbe fornire agli utenti informazioni chiare e dettagliate sui prodotti dati affidabili disponibili all’interno dell’organizzazione. Ciò può essere fatto organizzando i prodotti dati e analitici in gruppi correlati e anche creando una tassonomia per consentire una ricerca per trovare ciò che è disponibile per l’uso. Tipicamente, un marketplace dei dati dovrebbe consentire di effettuare numerose operazioni, quali: ricercare prodotti dati tramite una casella di ricerca utilizzando termini del glossario aziendale, la ricerca sfaccettata e altri filtri come valutazioni, prodotti dati con dati sensibili anonimizzati; determinare se il dato o il prodotto analitico è di alta qualità, potendo vedere un punteggio di qualità, un vocabolario comune per spiegare il significato dei dati, la genealogia per vedere come è stato creato e la valutazione da parte degli utenti; determinare se i prodotti dati contenenti dati sensibili sono stati anonimizzati; determinare se ha un alto valore commerciale utilizzando recensioni e valutazioni; vedere le raccomandazioni di qualsiasi altro prodotto dati o analitico correlato di cui si dovrebbe essere a conoscenza; monitorare e segnalare tutte le approvazioni, i rifiuti e le consegne di condivisione dati; monitorare tutte le richieste e le condivisioni di dati per ciascun consumatore; mantenere una cronologia degli audit, con segnalazione e analisi sui modelli di consumo dei dati.
Oltre a governare la condivisione dei dati, è evidente che il marketplace dei dati si inserisce molto bene nell’implementazione di una Mesh dei Dati, dove i produttori di dati nei domini aziendali possono utilizzare software di data fabric per creare pipeline di integrazione dati che, una volta eseguite, producono prodotti dati che possono essere resi disponibili in un Data Mesh. In questo senso, il marketplace dei dati è l’interfaccia utente attraverso la quale i consumatori di dati possono trovare, richiedere accesso e consumare prodotti dati in un Data Mesh.