Snellire le Architetture dati per ridurre al minimo la copia dei dati
da Data-by-copying a Data-on-demand
Descrizione
C’è stato un tempo in cui le persone visitavano un negozio di dischi per acquistare una copia di un album da ascoltare a casa. C’è stato anche un tempo in cui le persone andavano in un negozio di video per noleggiare un DVD per averne una copia a casa e guardare il film. Non più, musica e video vengono trasmessi in streaming. Le persone non ascoltano più né guardano le copie. La musica tramite copia è stata sostituita da musica su richiesta e così il video.
Purtroppo, il mondo dei dati è rimasto invariato. I dati vengono ancora copiati, anzi più volte prima ancora di essere consumati. Molte organizzazioni sono lontane anni luce dalle Architetture dati che supportano i dati on-demand.
La maggior parte delle Architetture dati è pesante a causa della duplicazione. Così tanti dati vengono duplicati più volte. Ad esempio, i dati su un cliente specifico possono essere archiviati in un sistema transazionale, un’area di staging, un Data Warehouse, in diversi Data Mart e in un Data Lake. Anche all’interno di un database, i dati possono essere archiviati più volte per supportare diversi consumatori di dati. Inoltre, le copie ridondanti dei dati vengono archiviate in ambienti di sviluppo e test. Ma anche gli utenti business copiano i dati. Potrebbero aver copiato i dati dai database centrali a file e fogli di calcolo privati. Inoltre, le infrastrutture dati sono attualmente costituite da Data Lake, Data Hub, Data Warehouse e Data Mart. E tutti questi sistemi contengono dati sovrapposti.
Oltre a queste forme intra-organizzative di copia dei dati, si verifica una massiccia copia inter-organizzativa. Quando le organizzazioni si scambiano dati tra loro, le organizzazioni riceventi archiviano i dati nei propri sistemi, creando ancora più copie dei dati.
È tempo di Architetture dati snelle che riducano al minimo la copia dei dati. I vantaggi di ciò sono molteplici, ad esempio l’Architettura è più flessibile, migliora la produttività e la manutenzione, riduce la bassa latenza dei dati consentendo soluzioni on-demand di dati reali o quasi reali e meno soggetta a errori.
In questo seminario, Rick van der Lans spiega come progettare un’Architettura dati snella e quali soluzioni e tecnologie sono disponibili per svilupparne una. Vengono discusse le linee guida di progettazione per Architetture dati a copia zero e a copia singola e un confronto con Architetture pesanti per la duplicazione. Viene discusso come ridurre al minimo la copia all’interno dell’organizzazione e fra organizzazioni. Viene presentato l’impatto sulle Architetture Data Warehouse, Data Lake e Data Hub esistenti. Viene fornito un quadro completo della progettazione di Architetture dati snelle in progetti presi dalla vita reale.
Cosa imparerete
- Come progettare Architetture snelle di integrazione dati usando esempi
- Quali sono i veri svantaggi della creazione di troppe copie dei dati, tra cui una maggiore latenza dei dati, sincronizzazione dei dati complessa, sicurezza e privacy dei dati più complesse e costi di sviluppo e manutenzione più elevati
- In che modo la nuova tecnologia database, l’integrazione e la tecnologia Cloud possono aiutare a progettare Architetture dati snelle che contengono meno dati copiati
- Qual è l’effetto dell’applicazione della minimizzazione dei dati alle Architetture di Data Warehouse e Data Lake
- Come progettare i dati in soluzioni a copia singola
- Cosa significa l’approccio 1:1+ per le Architetture dati
- Come sostituire le soluzioni di trasferimento di file con soluzioni di dati on demand e come ridurre i flussi di dati tra organizzazioni
- Come progettare Architetture dati dal punto di vista delle specifiche di elaborazione dei dati e non dei data store
Argomenti Trattati
- Copia illimitata di dati
- Perché fare le Architetture dati snelle
- Nuove Tecnologie che permettono Architetture dati snelle
- Linee guida per la progettazione di Architetture dati snelle
- Minimizzare la copia dei dati fra organizzazioni
- Trasformare le attuali Architetture dati in Architetture dati snelle

Cost
Date
Location
