CORSO DI LAUREA IN Informatica (Magistrale) PROGRAMMA DELL'INSEGNAMENTO DI Basi di Dati II (Moduli A, B) DOCENTI Donato Malerba (MODULO A), Michelangelo Ceci (MODULO B) N° ORE LEZIONI FRONTALI 64 N° CREDITI 8 N° ORE ESERCITAZIONI 0 N° CREDITI 0 N° ORE LABORATORIO 60 N° CREDITI 4 N° ORE STUDIO INDIVIDUALE 176 TOTALE CREDITI 12 PRE-REQUISITI Basi di dati OBIETTIVI FORMATIVI Acquisizione di conoscenze su: MODULO A: Progettazione delle BD: concetti generali e pratici. Progettazione concettuale e logica. Verifica dei modelli mediante la normalizzazione. MODULO B: Le basi di dati attive, Organizzazione fisica dei dati. Gestione delle Transazioni. Architetture distribuite. Basi di Dati e WEB. Strumenti di business intelligence. Il processo di scoperta nella conoscenza nelle basi di dati. Sviluppo di capacità applicative su: MODULO A: Progettazione concettuale e logica di una base di dati. MODULO B: Progettazione fisica di una Base di Dati. Progettazione di architetture di basi di dati distribuite. Progettazione di architetture di basi di dati su web. Costruzione di datawarehouse. Utilizzo di strumenti per la selezione, preleaborazione e trasformazione dei dati, e per la validazione dei pattern estratti. OBIETTIVI PROFESSIONALIZZANTI Progettazione di Concettuale e logica di una base di dati Progettazione Fisica di una Base di Dati. Progettazione Fisica di una Base di Dati distribuita. Progettazione Fisica di una Base di Dati distribuita su web. Acquisizione di competenze nello sviluppo di sistemi di business intelligence con funzionalità sia di storage (datawarehouse e data mart) che di analisi (KDD). CONTENUTO MODULO A: (4+2 CFU) 1. Metodologie e modelli per il progetto: il ciclo di vita dei sistemi informatici, una metodologia di progettazione per basi di dati, il modello entità-relazione (costrutti e documentazione degli schemi). 2. La progettazione concettuale: la raccolta e l’analisi dei requisiti, i criteri generali di rappresentazione, le strategie di progetto (top-down, bottom-up, inside-out, ibrida), qualità di uno schema concettuale, una metodologia generale. 3. La progettazione logica: analisi delle prestazioni su schemi E-R, ristrutturazione di schemi E-R (analisi delle ridondanze, eliminazione delle gerarchie, partizionamento/accorpamento di concetti, scelta degli identificatori principali), traduzione verso il modello relazionale (entità e associazioni molti a molti, associazioni uno a molti, entità con identificatore esterno, associazioni uno a uno, rappresentazione grafica delle traduzioni, traduzione di schemi complessi, tabelle riassuntive). 4. La normalizzazione: ridondanze e anomalie, dipendenze funzionali, forma normale di Boyce e Codd, proprietà delle decomposizioni (decomposizione senza perdita, conservazione delle dipendenze, qualità delle decomposizioni ), progettazione di basi di dati e normalizzazione (verifiche di normalizzazione su entità e associazioni, violazione di forme normali e ristrutturazione di schemi concettuali). LABORATORIO: Progettazione di una Base di Dati in PostgrSQL MODULO B: (4+2 CFU) 5. Le basi di dati attive. Basi di dati e sistemi a produzione. Comportamento dei trigger in un sistema relazionale. Definizione e uso dei trigger in Oracle. Caratteristiche evolute delle regole attive. Proprietà delle regole attive (terminazione, confluenza e determinismo delle osservazioni). Problemi di progettazione e realizzazione di basi di dati attive. La metodologia IDEA. Applicazioni delle basi di dati attive. 6. Architetture per l'analisi dei dati (Datawarehousing). Dati operazionali e dati decisionali. Tecnologie di Business Intelligence. Sistemi di supporto alle decisioni (DSS), Executive Information Systems (EIS) e Management Informaiton Systems (MIS). Caratteristiche di un data warehouse. Architettura di un data warehouse. Il modello multidimensionale. Schema del data warehouse: a stella, a fiocco di neve, a costellazione. OLAP e operazioni per l'analisi dei dati: drill down e roll up. ROLAP e MOLAP. Uno studio di caso: il modello relazionale di un DW per il settore agro/alimentare. 7. Tecnologia delle BD. Organizzazione fisica dei dati, concetti generali. Strutture fisiche: sequenziali e hash. Strutture fisiche: indici. B-tree. Esecuzione e ottimizzazione delle interrogazioni. Esecuzione e ottimizzazione delle interrogazioni. Gestione dei buffer. Algoritmi sui buffer. Progettazione fisica. 8. Gestione delle Transazioni. Le transazoni. Controllo della affidabilità. Il processo di restart a caldo e a freddo. Controllo della concorrenza. View serializzabilità, conflict serailizzabilità, locking a due fasi, Controllo di concorrenza basato su timestamp. Lock gerarchico. Risoluzione dello stallo. Transazioni in SQL-3. Transazioni con livelli diversi di isolamento. 9. Architetture per Basi di dati: Arichitetture distribuite. Arichitettura client-server. Basi di Dati Distribuite. Tecnologie per le basi di dati distribuite. Protocolli di commit a due fasi. Parallelismo. Basi di Dati Replicate 10 . Architetture dei Sistemi Informativi su World Wide Web. Internet e World Wide Web: richiami. Sistemi Informativi su Web. Architetture a tre livelli. Servlet e JSP. Architetture Multi-livello. EJB. Architetture e Servizi. Progettazione delle applicazioni Web. 11. Architetture per l'analisi dei dati (Knowledge discovery in databases) Scoperta di conoscenza nelle basi di dati: il processo La scoperta di conoscenza nelle basi di dati: definizione e problemi. Il processo della scoperta di conoscenza nelle basi di dati: la selezione, il preprocessing, la trasformazione, il data mining, l'interpretazione e la valutazione dei risultati. - Il passo di Data Mining. Obiettivi, task, rappresentazione del modello, la valutazione del modello, i metodi di ricerca. - La valutazione dei modelli Stima dell'accuratezza, metodi di campionamento e intervalli di confidenza, confronto di algoritmi. - La trasformazione e riduzione dei dati. Campionamento, feature selection, feature aggregation, metodi di discretizzazione. LABORATORIO: Progettazione dello schema logico di un Datawarehose/datamart. Strumenti di Data Warehousing: Mondrian, OLAP e data mining: progettazione di datawarehouse, sviluppo di funzionalità ETL, OLAP. TESTO/I ADOTTATO/I P. Atzeni, S. Ceri, S. Paraboschi & R. Torlone Basi di dati: modelli e linguaggi di interrogazione McGraw-Hill Libri Italia, 2002. P. Atzeni, S. Ceri, P. Fraternali, S. Paraboschi & R. Torlone Basi di dati: Architetture e linee di evoluzione. Seconda edizione. McGraw-Hill Libri Italia, 2007. (TESTI CONSIGLIATI) J. Wisdom & S. Ceri (Eds.), Active Database Systems, Morgan Kaufmann, 1996 Trasparenze proiettate durante le lezioni e durante le esercitazioni in laboratorio. (PROPEDEUTICITÀ OBBLIGATORIE) Nessuna (PROPEDEUTICITÀ CONSIGLIATE) Basi di Dati PROVA SCRITTA si COLLOQUIO ORALE si PROVA DI LABORATORIO no PROVE DI ESONERO PARZIALE si NUMERO PROVE ESONERO 2 MODALITÀ PROVE DI ESONERO Prova scritta / orale ANNO DI CORSO primo SEMESTRE primo DATA INIZIO LEZIONI: come da Manifesto degli Studi DATA FINE LEZIONI: come da Manifesto degli Studi