by Barry Devlin

Aprile 2010

Dalla BI a un’architettura IT di livello Enterprise

Ci si dimentica spesso che i fattori trainanti, il data warehousing prima e la Business intelligence poi, sono stati la consistenza e l’integrità delle informazioni. Gli utenti necessitavano di report e dati coerenti per offrire un valido supporto decisionale all’azienda, si doveva fare in modo che i vari dipartimenti potessero comunicare al vertice aziendale informazioni con un alto livello di consistenza.
L’It aveva necessità di lavorare su un insieme di dati integrato per evitare che all’amministratore delegato arrivassero informazioni contrastanti. Il primo articolo che descriveva un’architettura di data warehouse basata su questi requisiti fu pubblicato nel 1988 sulle pagine dell’IBM Systems Journal ed era basato sul lavoro condotto da IBM Europa nei tre anni precedenti.
A più di vent’anni di distanza l’enfasi è invece ora posta soprattutto sulla velocità e flessibilità decisionale così come sul livello di sofisticazione delle applicazioni analitiche. Una condizione che si rileva facilmente osservando l’attenzione che viene oggi posta sulla Business intelligence operazionale, sulle appliance, sui database post-relazionali, sugli ambienti stand alone dedicati e, non ultimo, sui cruscotti aziendali. Si dà per scontato che questi sistemi assicurino consistenza e integrità dei dati. L’idea è che l’utilizzo di un data warehouse garantisca la risoluzione di tutti questi aspetti. Purtroppo ciò non è sempre vero poiché l’affermazione di un modello di data warehousing distribuito ha imposto la presenza di singoli data mart e appliance che vengono alimentati da sistemi operazionali che non hanno nessuna consistenza. Ovviamente le inconsistenze emergono in un secondo momento e richiedono l’intervento dei team di sviluppo e manutenzione.
Nel frattempo anche gli sviluppatori di applicazioni operazionali sono in una fase di transizione. Ma il passaggio alla Service-oriented architecture (Soa) crea un nuovo approccio plug and play orientato al processo prevalentemente per le applicazioni operazionali, mentre le applicazioni di tipo informazionale e collaborativo ne beneficiano soltanto in un secondo momento. A mano a mano che gli utenti business si abituano al concetto che possono (o dovrebbero essere in grado di) collegare tra loro servizi esistenti in un workflow per soddisfare le proprie attività, iniziano a mettere in discussione le classi di funzione tradizionali: “Perché non è possibile legare una fase di analisi al workflow per comprendere il probabile impatto che può causare un ritardo nella spedizione? Come collegare il sistema di posta elettronica per notificare automaticamente a un cliente un problema relativo a un ordine?”. Nello stesso tempo approcci Web/enterprise 2.0 stanno dissolvendo le vecchie barriere tra funzioni operazionali, informative e collaborative reimpostando le interazioni degli utenti in un ambiente più libero e più focalizzato sulle funzioni operative degli stessi. E così, mentre crollano le vecchie barriere crollano contemporaneamente le tradizionali divisioni tra mondo operazionale, informativo e collaborativo.
Le applicazioni di call center, per esempio, sono la dimostrazione più evidente di quanto ampio sia diventato il livello di informazioni richiesto da moderni processi di business. I dati dell’ambiente di data warehouse sono necessari per tenere traccia del profilo storico del cliente, delle relazioni intercorse tra azienda e cliente. Proteste, reclami, garanzie, informazioni che hanno avuto origine da sistemi di posta elettronica o da sistemi di content management sono inoltre essenziali per comprendere la storia del prodotto e il comportamento dell’utente, così come l’accesso a sistemi operazionali continua a essere necessario per creare o aggiornare ordini o altri record. Tutta questa mole di informazioni deve essere coerente tra le diverse fonti e integrata nei modi e nei momenti opportuni. L’approccio tradizionale è stato quello di duplicare le informazioni in un’applicazione ottimizzata per le necessità dell’operatore del call center. Occorre poi tenere presente che la Soa promuove un approccio molto differente: servizi realizzati da vari dipartimenti, ufficio vendite o finance, possono essere riuniti in un workflow insieme ad altri servizi specifici attinenti al call center per soddisfare le necessità degli operatori. Ma serve fare attenzione: se le fonti da cui provengono questi dati non hanno consistenza, il call center non sarà in grado di conoscere con la dovuta accuratezza l’attuale e corrente situazione del cliente e agirà nei suoi confronti in modo inappropriato.

Le necessità di integrazione attuali e la nuova architettura

Gli effetti delle potenzialità di un approccio Soa sono evidenti, ma il tutto può avere successo se si fa riferimento a un insieme di informazioni pienamente consistente e integrato sul quale gli specifici servizi possono agire. A differenza del data warehousing questa informazione non viene archiviata in un singolo database, ma distribuita attraverso l’intera infrastruttura It. Non solo, ma l’imporsi di modalità Web/enterprise 2.0 rende evidente che la natura di questa informazione si sta espandendo da una logica dati prevalentemente tabellare e numerica – l’informazione cosiddetta hard – a un’ampia gamma di dati più complessi come informazione Web, testo, audio e immagini, vale a dire quella che viene comunemente definita informazione soft. Cosa vuol dire tutto questo? Significa che consistenza e integrità devono essere necessariamente applicate anche a questo tipo di informazione.
Così come accadde negli anni Ottanta, quando la componente business aziendale esigeva consistenza e integrità nella gestione dell’informazione e obbligò a creare una nuova architettura di data warehouse adatta ad attività di supporto decisionale, oggi la Soa e l’enterprise 2.0 ci spingono a riesaminare l’architettura It a livello generale. E la domanda chiave che viene posta è la seguente: come è possibile creare una nuova base informativa integrata e consistente per l’intera azienda?
Più semplice sarà la risposta, migliore potrà essere la soluzione. Se si vuole realizzare un set di risorse che possa garantire integrità e consistenza delle informazioni si deve interrompere la creazione di informazione ridondante e devono essere eliminate, o quanto meno sostanzialmente ridotte, le duplicazioni di dati esistenti.
Il percorso da seguire è indicato dalla stessa architettura originariamente pensata per il data warehouse: un archivio dati impostato secondo uno schema logico – il business data warehouse – modellato a livello enterprise per assicurare l’erogazione di informazione con caratteristiche di consistenza e integrità al fine di garantire un adeguato supporto decisionale. Questa semplicità si è però persa con il passare del tempo a causa dell’emergere di architetture multilivello (con più data mart alimentati da un enterprise data warehouse) create con l’intenzione di migliorare la prestazioni di database e per adeguarsi a un diverso modello di business. L’approccio originario è ancora oggi valido per far fronte alle necessità di integrazione dell’informazione in un ambiente che ha subìto nel tempo una sempre maggiore espansione.
Prima di tutto occorre modellare l’informazione adeguandosi al modello di business istituito a livello enterprise e procedere poi a un’implementazione che sia il più possibile coerente con tale modello. Questo approccio, proposto per una nuova architettura, è definito come Business Integrated Insight (BI2) e, per la prima volta, raccoglie tutte le informazioni presenti a livello enterprise – di tipo hard, soft, operazionale, informativo e collaborativo – in un singolo componente chiamato Business Information Resource (BIR). Il BIR prevede una piena modellazione sebbene ciò richieda estensioni alle tecniche correnti per supportare l’ampia gamma di dati trattati e, in particolare, per consentire la modellazione dinamica di informazione soft nel momento in cui questa viene metabolizzata a livello aziendale.
L’implementazione necessita di tecnologie che vanno al di là del database relazionale general purpose. Database di nuova generazione possono avere un ruolo fondamentale purché aspetti quali la gestione del workload, affidabilità, disponibilità e scalabilità siano soddisfatti nel modo migliore. Sono altrettanto necessarie tecnologie di database mirate specificamente al trattamento di informazione soft poiché non è da raccomandare il caricamento generalizzato di questa informazione in database relazionali. Si deve inoltre tenere presente che la duplicazione dei dati non potrà essere completamente evitata e che non esiste una tecnologia ottimizzata per tutte le necessità elaborative. Proprio per questo si deve porre sempre la massima attenzione nella gestione e controllo di tale approccio tenendo presente che i metadati diventano parte integrante del BIR e non sono da considerare un aspetto marginale.

Conclusioni

Il business attuale ha necessità di relazionarsi a un insieme di informazioni molto più ampio rispetto al passato. Poiché i processi di business sono di per sé flessibili e richiedono un’unitarietà di approccio, l’informazione deve essere il più possibile consistente e integrata. Facendo riferimento ai principi base del data warehousing si può comprendere come raggiungere questi obiettivi ed espandere l’intelligence aziendale in un’architettura più globale che permetta di ottenere un livello di conoscenza dell’intero processo delle attività di un’organizzazione.