Programma
Del Corso Di
BASI DI DATI E
BASI DI CONOSCENZA
A.A. 2001/2002
Prof. Donato
Malerba
Obiettivi. Il corso
presenta i concetti e le metodologie evolute per lo sviluppo di sistemi
software orientati alla gestione sia dei dati e sia della conoscenza, nei quali
le problematiche fondamentali riguardano l’organizzazione, la manipolazione,
l’accesso a dati e conoscenza, come pure l’estrazione di conoscenza dai dati.
Il data base di riferimento è Oracle 8.
Prerequisiti: algoritmi e
strutture dati, basi di dati e sistemi informativi, ingegneria della conoscenza
e sistemi esperti.
Modalità
d’esame: prova orale e discussione di un progetto svolto su argomento
concordato con il docente (che va contattato con congruo anticipo rispetto agli
appelli di esame).
Programma del corso a.a.
2001-2002
1. Le
basi di dati attive.
Basi di dati e sistemi a
produzione. Comportamento dei trigger in un sistema relazionale. Definizione e
uso dei trigger in Oracle. Caratteristiche evolute delle regole attive.
Proprietà delle regole attive (terminazione, confluenza e determinismo delle
osservazioni). Problemi di progettazione e realizzazione di basi di dati
attive. La metodologia IDEA. Applicazioni delle basi di dati attive.
2. Le
basi di dati relazionali e a oggetti.
Modelli dei dati non in prima forma normale. Il modello relazionale a oggetti. SQL-3: tuple e oggetti, gerarchie di tipo, tipi astratti, interrogazioni con flattening e nesting. Il manifesto delle basi di dati della terza generazione. Un DBMS relazionale a oggetti: Illustra. L’implementazione a oggetti di Oracle 8: tipi di dati astratti, collezioni, oggetti riga, viste oggetto. Basi di dati a oggetti: tipi, classi, metodi, gerarchie di generalizzazione, persistenza, ridefinizioni dei metodi, ridefinizione con raffnamenti di tipo. Il manifesto delle basi di dati a oggetti. Standard ODMG per le basi di dati a oggetti: ODL e OQL. Un OODBMS: ObjectStore.
3. Le
basi di dati multimediali e spaziali.
I sistemi informatici multimediali. I dati multimediali. Gestione dei dati multimediali. Richiamo e precisione. I sistemi di recupero di informazioni testuali. Indicizzazione manuale e automatica. Creazione degli indici. Funzionalità e progetto di un IRS per dati testuali: il sistema WebClass. Funzionalità e progetto di un IRS per immagini di documenti: il sistema WISDOM++. Rappresentazione di oggetti spaziali. Estensione dello SQL per dati spaziali.
4. Basi
di dati e World Wide Web.
Richiami su Internet e
World Wide Web: nodi, indirizzi e protocolli, il World Wide Web, ancore e URL,
HTML.
L’accesso alle basi di
dati: accesso a database via common gateway interface (CGI), l’interazione
field-oriented, vantaggi e svantaggi dei DBMS Web, il servente universale.
Il Web e la basi di dati: differenze e convergenze.
5. Architetture
e modelli per l'analisi dei dati.
Dati operazionali e dati
decisionali. Tecnologie di Business Intelligence. Sistemi di supporto alle
decisioni (DSS), Executive Information Systems (EIS) e Management Informaiton
Systems (MIS). Caratteristiche di un data warehouse. Architettura di un data
warehouse. Schema del data warehouse: schema a stella e schema a fiocco di
neve. OLAP e operazioni per l'analisi dei dati: drill down e roll up. ROLAP e
MOLAP.
6. Scoperta
di conoscenza nelle basi di dati.
La scoperta di
conoscenza nelle basi di dati: definizione e problemi. Il processo della
scoperta di conoscenza nelle basi di dati: la selezione, il preprocessing, la
trasformazione, il data mining, l’interpretazione e la valutazione dei
risultati. Data mining: obiettivi, task, rappresentazione del modello, la
valutazione del modello, i metodi di ricerca. Algoritmi di data mining per
compiti descrittivi e predittivi: mining di regole di associazione, analisi di
cluster, classificazione e regressione. Valutazione dei risultati ottenuti.
Linguaggi di interrogazione per il data mining. Data Mining multi-relazionale.
Il sistema KDB2000.
7. Il DBMS Oracle 8.
Gli strumenti di Oracle
8. Creazione di database in Oracle. La progettazione concettuale mediante
Oracle Designer. Generazione del modello logico mediante Oracle Design
Transformer. Generazione di form, di interrogazioni e di trigger mediante
Oracle Developer. Creazione di tipi oggetto e interrogazioni. Le estensioni di
Oracle per trattare i tipi spaziali. Il modello dei dati spaziale. Le
operazioni spaziali. Indicizzazione spaziale e elaborazione di interrogazioni.
Interfacciamento di Oracle ad applicazioni remote.
Principali testi
e articoli di riferimento
P.
Atzeni, S. Ceri, S. Paraboschi & R. Torlone
Basi di dati: concetti,
linguaggi e architetture (2a edizione)
McGraw-Hill
Libri Italia, 1999.
Capitoli:
11.3-11.4, 12, 13, 14, Appendici A e D.
A.
Albano, G. Ghelli, R. Orsini
Basi di dati relazionali
e a oggetti
Zanichelli,
1997
Capitoli:
10, 11.1, 11.2
U. Fayyad, G. Piatesky-Shapiro, P. Smyth. From data
mining to knowledge discovery: an overview.
In U. Fayyad, G. Piatesky-Shapiro, P. Smyth, R.
Uthurusamy (Eds.), Advances in Knowledge
Discovery and Data Mining,
AAAI/MIT Press, pp. 1-35, 1996.
W.J. Frawley, G. Piatesky-Shapito, C.J. Matheus.
Knowledge discovery in databases.
In W.J. Frawley, G. Piatesky-Shapito, C.J. Matheus, Knowledge discovery in databases,
AAAI/MIT Press, pp. 1-27, 1991.
T. Mitchell
Machine
Learning
McGraw
Hill, 1997.
Capitoli
1 e 3.
D. Witten, E. Frank
Data Mining
Morgan Kaufmann, 2000
Capitoli: 2,3,4,5,6,7,8
J. Han, M. Kamber
Data mining: concepts and techniques
Morgan Kaufmann, 2001
Capitoli: 4,5,6,7,8,9
Dzeroski, S.,
Lavrac, N. (eds.)
Relational Data Mining
Springer-Verlag, Berlin (2001)
Capitoli: 1, 3, 4, 10
I testi, gli articoli e le fotocopie delle trasparenze distribuite durante le lezioni sono disponibili presso la Biblioteca del Dipartimento di Informatica.