by Michael Schmitz

Novembre 2004

Il data warehouse orientato all’impresa

Perché è tempo di adottare una nuova direzione nel data warehousing?
 
Un data warehouse non può essere più considerato come un deposito di dati storici, non volatili, con difficoltà per accedere ai dettagli e con l’accesso da parte dell’impresa limitato primariamente a sommatorie di dati consolidati e distribuiti via data mart.
Attualmente, un data warehouse è gestito spesso in quasi real time e gli aggiornamenti provocano sempre modifiche dimensionali, fornendo così un contesto di transazioni e di storia degli eventi, in modo da facilitare l’accesso dell’impresa sia ai dati di dettaglio che a quelli consolidati, mediante i medesimi strumenti e strutture dei dati.
Con l’esplosione delle informazioni, le imprese non possono più pensare di memorizzare i dati secondo formati multipli, oppure di rielaborare più volte le stesse informazioni.
La figura 1 descrive l’architettura precedente con i suoi depositi informativi o repository multipli e le corrispondenti funzioni Etl (extract, transoformation and load), ovvero di estrazione, trasformazione e caricamento.
In questa architettura, l’accesso ai dati da parte dell’impresa avviene unicamente all’estrema destra della figura e il medesimo dato rimane memorizzato più volte in depositi multipli, all’interno di strutture differenti.
La persona dell’impresa per accedere ai dati di dettaglio deve spingere la ricerca verso il basso, dai data mart al warehouse, con la necessità di operare su strutture dei dati diverse (spesso sempre più complesse).
Questo approccio è obsoleto, inefficiente e risulta troppo lungo per aggiungere valore all’impresa, oltre a risultare troppo oneroso in termini di tempi di sviluppo e di costi di elaborazione. Mantenere grandi volumi di dati all’interno di strutture multiple distribuendole tra queste richiede tempo e denaro.
Ecco la necessità di utilizzare un data repository unico che immagazzini i dati in modo da supportarne l’accesso da parte dell’impresa, fornendo, nel contempo, flessibilità e manutenibilità.
Una magia? No, oggi questo può essere ottenuto in maniera molto semplice. Costruite un data base unico, mantenendo trasparenti le informazioni di dettaglio, le analisi dei dati e le strutture di consolidamento, sia per l’utente sia per gli strumenti di gestione.
Memorizzate i volumi di maggiore dimensione dei dati in maniera standard e quelli minori, invece con le rispettive gerarchie non standard. Questo fornisce manutenibilità e flessibilità, rendendo nel contempo accessibile la struttura dei dati alle persone dell’impresa e agli strumenti di ottimizzazione del database, con il raggiungimento di alte prestazioni a un costo contenuto.
La figura 2 illustra l’architettura del data warehouse accessibile da parte dell’impresa.
In questo caso, l’enfasi è sul data store a immagine unica che contiene i dati di dettaglio, le analisi e le strutture di sintesi trasparenti per l’utente e per gli strumenti di elaborazione delle informazioni.
È fondamentale, anche nella fase di implementazione di questa architettura, che tutti gli sforzi siano guidati dalle necessità dell’impresa.
 
Orientato all’impresa
Il data warehousing guidato dalle necessità dell’impresa implica che le linee guida per la costruzione del data warehouse derivino da iniziative di questa, invece di essere frutto di iniziative dell’It.
Non c’è bisogno di ricordare l’errore del vecchio concetto che diceva costruisci e in qualche modo funzionerà, troppo spesso ancora preso per buono. Un problema con questo approccio è che le decisioni relative all’architettura derivano spesso da una prospettiva di come costruirla, piuttosto che di come utilizzarla.
Incontro innumerevoli clienti, presso i quali le obiezioni dell’It circa il rendere più utilizzabile il data warehouse da parte delle persone dell’impresa sono espresse in termini di mancanza di tempo per realizzare le modifiche necessarie, oppure che tale processo richiederebbe tempi di esecuzione troppo lunghi.
La verità nuda e cruda è che se questo è il caso, non avrebbero dovuto realizzare il data warehouse, in assoluto. La buona notizia è che si tratta solo di scuse. Utilizzando metodi e schemi collaudati, unitamente a un’architettura nuova e più efficiente, avrete il tempo di realizzare il data warehouse nella giusta maniera e il processo potrà arrivare a compimento efficacemente, oltre che, probabilmente, in un tempo inferiore a quello richiesto precedentemente.
Orientato all’impresa implica anche che l’obiettivo primario della progettazione del data warehouse è l’ù’accessibilità da parte degli utenti interni.
Questo non significa che si debbano trascurare la validità dei dati, la flessibilità, la manutenibilità, ma invece che dobbiamo assicurare tutte queste caratteristiche fornendo, nel medesimo tempo, la massima accessibilità alle informazioni.
 
Accessibilità da parte dell’impresa
L’accessibilità da parte dell’impresa implica parecchie cose. In primo luogo, che le informazioni nel warehouse debbano essere memorizzate in modo da risultare direttamente fruibili da parte delle persone dell’impresa mediante i rispettivi strumenti a disposizione e che tale accessibilità non richieda particolari specializzazioni in It.
Le strutture dei dati debbono essere leggibili e comprensibili da parte degli utenti dell’impresa e risultare utili per le loro rispettive attività. Agli oggetti nel database debbono essere attribuiti nomi che facciano riferimento alla terminologia dell’impresa, in modo da risultare definiti in maniera chiara e univoca. L’accessibilità implica anche che i tempi di risposta alle singole richieste di accesso siano rapidi e prevedibili.
Un altro aspetto dell’accessibilità è il tempo necessario per rendere fruibile l’informazione. Naturalmente, quest’ultima risulterà disponibile solamente se sarà stata inserita preventivamente nel data warehouse.
La maggior parte dei progetti di realizzazione di data warehousing posseggono un notevole backlog di informazioni aziendali che, una volta rese accessibili all’interno del data warehouse, potrebbero aiutare nel processo decisorio, con un immediato effetto benefico sui risultati dell’impresa.
Sono convinto che l’uso di metodi superati e di architetture inefficienti provochi tempi di risposta molto più lenti rispetto a quanto si può ottenere utilizzando un’architettura dei dati innovativa e maggiormente orientata alle necessità degli utenti.
Ottenere l’accessibilità alle informazioni da parte dell’impresa non è necessariamente un obiettivo facilmente raggiungibile. Raggiungere la semplicità è un’arte raffinata che richiede la massima concentrazione degli sforzi.
Questa è una delle ragioni del perché sia così importante avere un data warehouse costruito su di un’architettura con solide fondamenta.
In conclusione, la nuova architettura pone l’accento sull’accessibilità alle informazioni da parte dell’impresa e su come sia possibile raggiungere tale scopo in maniera efficace e poco costosa.
L’esplosione delle informazioni ha messo a disposizione delle imprese tonnellate di dati di dettaglio, il cui accesso e utilizzo risulta troppo oneroso o addirittura impossibile. La risposta al problema del fornire l’accesso a grandi volumi di dati da parte degli utenti dell’impresa non è l’uso di una bacchetta magica, ma consiste nel fare tesoro di quanto abbiamo imparato in questo campo nel corso dei diciassette anni di data warehousing trascorsi, mettendo poi in pratica le nostre deduzioni in maniera intelligente.
Questa è la definizione di quanto indichiamo come Business AccessibleData Warehouse Architecture, ovvero architettura di data warehouse accessibile da parte degli utenti dell’impresa.