Marzo 2013

Leonardo da Vinci aveva ragione!

Sareste disposti a vivere in un grattacielo costruito ignorando i principi architetturali fondamentali? Sareste disposti a gestire il vostro business con un database realizzato ignorando le regole e i principi fondamentali del database computing? La risposta alle prime due domande è scontata. E riguardo alla terza domanda? La risposta dovrebbe essere, ovviamente, negativa. Se – però – si deve giudicare da quanto accade, ci si accorge che, spesso, si risponde implicitamente con un sì. Come mai? Forse, semplicemente per il fatto che molte persone non sono al corrente dell’esistenza di una solida teoria scientifica. È sufficiente riflettere su alcune delle seguenti – e errate – affermazioni per renderci conto di quanto sia vero quello che abbiamo appena detto.
(Le affermazioni sono tratte dal sito web di Fabian Pascal, www.dbdebunk.com. Sono state volontariamente omesse alcune fonti per non rilevare il nome degli autori e il testo è stato modificato per renderlo più comprensibile).

«Ho già creato un database secondo la logica Entity-Attribute-Value» – Così facendo gran parte del modello logico è rappresentato in una forma dati e non come schema. In questo modo qualunque cambiamento al modello logico può avvenire senza modificare lo schema. Non solo, ma anche le stored procedure, se scritte correttamente, non devono essere cambiate. Le controindicazioni? Si deve fare uso di un codice SQL molto complesso. Ho utilizzato questa logica nei confronti di un cliente che non aveva una chiara comprensione dei propri requisiti e domandava di avere un’applicazione funzionante con una deadline precisa.

«Ritengo che i database siano dei semplici archivi, dedicati a gestire dati, non la logica di business…» – Facciamo in modo che il database sia il più semplice possibile e che invece sia l’applicazione a essere smart. Dopotutto, è l’applicazione a riflettere un processo di business mentre il database è puro storage, uno strumento di supporto all’applicazione.

«Il problema dei database relazionali è la necessità di adattare la struttura di tabella ogni qualvolta si aggiungono dati…» – Con RDF si possono riversare dati in uno store multiplo e lavorare su di essi immediatamente. Si tratta di un metodo molto più agile.

«SQL è inadeguato per gestire il modello relazionale poiché non permette di esprimere relazioni diverse da quelle definite dalla tabella» – Non è questa una limitazione del modello relazionale stesso? Credo che solo il modello entity-relationship possa fare delle distinzioni tra relazioni e dati. Una volta che si converte il modello in un modello di dati relazionali si perde quella capacità. Quanto meno questo è ciò che abbiamo appreso durante i corsi universitari sul database.

«Sono un utente Microsoft Access alle prime armi. Di solito non utilizzo chiavi primarie» – Da quanto ho letto la chiave primaria viene principalmente usata per velocizzare le operazioni di ricerca. Al momento uso solo due piccole tabelle che contengono un comune record ID. Effettuo query su queste tabelle e non mi risulta che vi siano errori. Da ciò che ho potuto costatare, riesco a ottenere dei risultati corretti. È importante utilizzare la chiave primaria o è soltanto qualcosa che sarebbe bene avere quando si lavora su grandi database?

Risposta: «La definizione di una chiave primaria non è mai necessaria, nemmeno in un grande database» – I vantaggi di una chiave primaria consistono nell’avere la sicurezza che il campo contenga solo valori unici. Questo evita la duplicazione di record. Access garantirà che la chiave primaria contenga un valore in modo tale che si possa avere una identificazione unica del record.

«I database relazionali sono essenzialmente matrici a due dimensioni con puntatori e fogli elettronici di alto livello» – E’ molto probabile che database XML o a oggetti consentano un adattamento maggiore nei confronti di architetture e modelli dati con cui si lavora quotidianamente: sono più flessibili e personalizzabili. Si è in grado di adottare principi di programmazione estrema, così come aggiungere nuovi campi, connettersi ad altri sistemi ed essere focalizzati sul modello dati e sul progetto e non sul modello del database e del possibile modello che meglio si adatta a quel database. Operazioni import-export da RDBMS sono immediate. Questi ultimi sono creati per lavorare in real-time e trarre un reale vantaggio da disegno e manutenzione di OODBMS preservando l’atomicità e i tool relazionali correnti senza sacrificare la qualità dei dati.

«Non ho mai avuto necessità che mi fosse spiegato il design di un database. Era così intuitivo, così ovvio…» – Non concepisco l’idea che possa esistere una diversa struttura di database. Non vedo l’ora di imparare qualcosa di nuovo i cui contenuti mi sono ancora del tutto estranei.

Risposta: «Dimenticate tutto ciò che sapete sui modelli dati: questa è la prima regola del data warehouse» – Per poter realizzare velocemente degli ottimi report, senza dover necessariamente contare su un team di matematici, dobbiamo fare una cosa triviale quanto insignificante. Fare tabula rasa della mentalità che considera il database come il cuore di tutto ciò che facciamo. Citando un sito web, possiamo dire di smettere di pensare il database in termini architetturali! Le applicazioni associate direttamente al database sono costose da sviluppare e manutenere. Sebbene una volta fossero considerate lo stato dell’arte sono oggi notoriamente poco sofisticate e poco adattabili.

Conclusioni – Bene, potrei spendere un sacco di tempo per contraddire tutte queste affermazioni, ma non credo sia poi così necessario. Penso che il messaggio sia sufficientemente chiaro e semplice: esiste una ignoranza diffusa. Ho un altro fatto da raccontare e che rende più forte la mia opinione. È una lettera pubblicata sul numero del luglio 2011 di Communication of ACM (Volume 54, n. 7). Nota: l’autore fa riferimento, nello specifico, a object/relational mapping e a sistemi NoSQL (un altro termine di moda privo di senso), tuttavia sono considerazioni che possono essere estese ad ambiti più ampi. Nella lettera si legge: “Object Relational Mapping e sistemi NoSQL tentano di risolvere (attraverso mezzi tecnici) un problema non tecnico. La difficoltà di molte persone nel padroneggiare il modello relazionale e, quindi, di trarre vantaggio dalla consistenza dei dati e dalla logica inferenziale è un problema di conoscenza. Invece di sfruttare in modo adeguato e chiedere ai vendor DBMS più funzionalità relazionali, molti cercano di evitarlo e sostituirlo, invocando un ritorno ai fragili e inaffidabili sistemi degli Anni 70”.
La verità è che esiste una conoscenza scientifica per risolvere il problema del database, ma non è messa in pratica. Molte persone evitano deliberatamente di applicare la teoria, come se questa non avesse possibilità di essere tradotta nel mondo reale (non rompetemi le scatole con disquisizioni filosofiche, sono una persona molto pratica!). La mia idea è tutto l’opposto. Se qualcosa non è fondato su una solida teoria, è facile che non sia praticabile.
Vorrei chiudere questo articolo citando Leonardo da Vinci e quanto scrisse a proposito cinquecento anni fa: “Coloro che non coniugano la pratica con la teoria sono come un comandante che sale sulla nave senza timone o compasso. Viaggiano senza conoscere in quale direzione stanno andando. La pratica dovrebbe invece sempre poggiare su una forte base teorica”. Leonardo aveva ragione.