SWAP - Semantic Web Access and Personalization Research Group

Gestione della Conoscenza d'Impresa - A.A. 2011/12
CdL in Informatica
CdL in Informatica e Tecnologie per la Produzione del Software
Sede di BARI



Docenti: Giovanni Semeraro e Leo Iaquinta



N° ORE LEZIONI FRONTALI: 56 N° CREDITI: 7

N° ORE ESERCITAZIONI: 30 N° CREDITI: 2

N° ORE STUDIO INDIVIDUALE: 119

TOTALE CREDITI: 9


PRE-REQUISITI:

Linguaggi di Programmazione. Ingegneria del Software. Basi di dati. Calcolo delle probabilità e statistica. Algoritmi e Strutture Dati.


OBIETTIVI FORMATIVI

L'obiettivo del corso è quello di fornire gli strumenti fondamentali per la gestione di sorgenti di informazioni non strutturate. Nella prima parte del corso si presentano le basi delle discipline dell’Information Filtering e dell’Information Retrieval. Nella seconda parte del corso si analizzano i livelli della pila del Semantic Web, approfondendo in particolare il livello delle ontologie e dei linguaggi per la rappresentazione della sintassi e della semantica propri del Semantic Web, ovvero XML ed RDF. Il corso fornisce le conoscenze per la realizzazione in linguaggio Java di sistemi Web-based complessi.


OBIETTIVI PROFESSIONALIZZANTI

Conoscenza degli elementi essenziali per il filtraggio ed il ritrovamento di informazioni da sorgenti non strutturate. Conoscenza dei linguaggi del Semantic Web. Conoscenza del linguaggio Java per la programmazione in grande.


CONTENUTO

1. Accesso Intelligente all’Informazione.

  1.1. Text Mining: dal testo alla conoscenza.
       - Definizione di Text Mining.
       - Il processo di Text Mining.
       - Confronto tra Text Mining, Data Mining, Information Retrieval, Data Retrieval.
       - Text Mining nell’Impresa.
  1.2. Intelligent Information Retrieval (IR).
       - Architettura di un sistema di IR.
       - Modelli di IR: confronto tra il modello booleano e quello vector space.
       - Integrazione di conoscenza lessicale nel processo di ritrovamento: WordNet.
       - Organizzazione e rappresentazione della conoscenza in WordNet: i synset, la matrice lessicale e le relazioni.
       - Metriche per la valutazione.
  1.3. Text Categorization (TC).
       - Generalità sul problema della classificazione.
       - Estensione del problema ai dati testuali: Text Categorization (TC).
       - Machine learning for TC: cenni sui metodi k-NN, Rocchio. Analisi del metodo Naive Bayes.
       - Metriche per la valutazione.
       - Casi applicativi.
  1.4. Intelligent Information Access.
       - Information Overload
       - Strategie di accesso all’informazione
       - Information Filtering
  1.5. Applicazioni.
       - Personalizzazione: apprendimento di profili utente.

2. Semantic Web.

  2.1. Ontologie e loro applicazioni nella condivisione di conoscenza.
       - Condivisione di conoscenza e riuso.
       - Motivazioni per l’uso di ontologie.
       - Ontologie e basi di conoscenza.
       - Differenti definizioni di ontologie.
       - Ontologie e concettualizzazioni.
       - Tipi di ontologie.
       - Proprietà delle ontologie.
       - Ontology engineering: cenni sulle metodologie.
       - Sviluppo di un’ontologia step-by-step.
       - Ontologie e linguaggi software.
  2.2. eXtensible Markup Language (XML). 
       - Introduzione.
       - Struttura di un documento XML.
       - Document Type Definition (DTD) e XML Schema.
       - eXtensible Style Sheet (XSL), XML Query Language (XQL).
       - Interoperabilità e protocolli di comunicazione: SOAP & Web Services.
  2.3. Resource Description Framework (RDF).
       - Ritrovamento automatico nel World Wide Web.
       - Concetti fondamentali: URI, Models, Statements, Classes, Properties, Resources.
       - RDF Schema:differenze tra validazione semantica e validazione XML–based.
       - Limiti di RDF ed RDF Schema.

3. Il linguaggio Java.

       - Introduzione e riepilogo dei concetti generali del linguaggio
       - Gestione delle eccezioni
       - Programmazione multithreading: il modello thread di Java.
       - Creazione di thread.
       - Priorità dei thread e sincronizzazione.
       - Servlet e Java Server Pages (JSP).
       - Java ed XML: JAXP e Xerces.
       - Java e Database: Java DataBase Connectivity (JDBC).
       - I socket in Java.
       - Esercitazioni.

4. Società dell'Informazione.

       - Impresa oggi come Sistema.
       - Rapporto tra Organizzazione e Conoscenza d'Impresa con le Tecnologie Informatiche. 
       - Definizione di azienda, l’Azienda come sistema, idee guida. 
       - Caratteristiche e dimensioni di una azienda. Le cinque fasi di sviluppo aziendale. 
       - Informatica come disciplina autonoma, rapporto tra Organizzazione Aziendale e Sistema Informativo.
       - Le principali tipologie di impresa.
       - Tipi di influenza bilaterale. Matrice tra fasi di sviluppo e gruppi direzionali.
       - Elementi costitutivi dell organizzazione. Analisi delle teorie organizzative   
       - Dall'organizzazione scientifica del lavoro di Taylor al modello socio-tecnico, dal modello sulla qualità e antropologico/culturale al modello basato sulla conoscenza e sul Web. 
       - Il modello degli stili di management, il modello degli stili di leadership. 
       - Le componenti base di un’organizzazione 
       - La trasformazione da "old" a "New". Vision, mission e valori. Strategie e cambiamenti. 
       - Processi aziendali. Tipologie dei processi aziendali. Identificazione dei processi. 
       - Caratteristiche dei modelli. Organizzazione per processi. Il modello del BPR (Business Process Reengineering).             
       - Il knowledge management come fattore di successo per le imprese.  


TESTO/I CONSIGLIATO/I

Per il punto 1.

Baeza-Yates, R.A., Ribeiro-Neto, B.A., Modern Information Retrieval, ACM Press/Addison-Wesley, 1999.

M. Degemmis, P. Lops, G. Semeraro, M.F. Costabile, S.P. Guida & O. Licchelli. Improving Collaborative Recommender Systems by means of User Profiles. In C.-M. Karat, J. Blom, and J. Karat (Eds.), Designing Personalized User Experiences in eCommerce, Chapter 14, 253-274, Kluwer Academic, 2004.

R. Feldman and I. Dagan, Knowledge Discovery in Textual Databases (KDT). Proc. of the 1st Int. Conf. on Knowledge Discovery (KDD-95), pp. 112-117, Montreal, 1995. Grishman, R., Information Extraction: Techniques and Challenges. Springer- Verlag, Lecture Notes in Artificial Intelligence, Rome (1997). Web: citeseer.nj.nec.com/grishman97information.html.

M. Grobelnik, D. Mladenic, and N. Milic-Frayling, Text Mining as Integration of Several Related Research Areas. Report on KDD’2000 Workshop on Text Mining, 2000. T.M. Mitchell, Machine Learning, McGraw-Hill, 1997.

T.M. Mitchell, Machine Learning, McGraw-Hill, 1997.

M. Pazzani, Machine Learning and Information Filtering on the Internet, IJCAI-97 Tutorial, Nagoya, Japan, Aug 1997.

Sebastiani F., Machine learning in automated text categorization, ACM Computing Surveys, 34(1):1-47, 2002.

Semeraro, G., Lops, P., Degemmis, M., Document/Text Mining: From Text to Knowledge, dispense.

Semeraro, G., Lops, P., Degemmis, M., Text Categorization, dispense.

vanRijsbergen, C.J., Information Retrieval, Butterworth & Co., Boston, MA, 1979. Web: http://citeseer.ist.psu.edu/vanrijsbergen79information.html

Christiane Fellbaum (Editor), WordNet: An Electronic Lexical Database. Edited by. MIT Press. ISBN 0-262-06197-X.


Per il punto 2.

Tamma, V., Ontologies and their applications in knowledge sharing, dispense. Bradley, N., The XML Companion, Addison-Wesley, 1998. Iannone, L., Palmisano, G. Semeraro, I. XML Tutorial, dispense. Capursi, D., Iannone, L., Lops, P., Semeraro, G., RDF Tutorial, dispense.


Per il punto 3.

Lewis, J., Loftus, W., Java: Fondamenti di progettazione software, Addison-Wesley, 2001. Licchelli, O., Palmisano, I., Introduzione al Linguaggio Java, dispense (2005). Naughton, P., Schildt, H., Java: La guida completa, McGraw-Hill, 1997. Horstmann, C. S., Cornell, G., Java2: I fondamenti, McGraw-Hill, 1999. Eckel, B., Thinking in Java, Prentice-Hall, December 2002. Web: http://www.mindview.net/Books/TIJ/.


Per il punto 4.

Bracchi, Motta, Processi Aziendali e Sistemi Informativi, 2001. C.Resina, Appunti delle Lezioni, 2007. P.Schgor e altri, Professione Informatica, FrancoAngeli 2007. A cura di Batini, Sistemi Informativi basati su Web, FrancoAngeli, 2006.


PROPEDEUTICITÀ OBBLIGATORIE

come da Manifesto del Corso di Studi


PROPEDEUTICITÀ CONSIGLIATE

Matematica discreta. Linguaggi di Programmazione. Algoritmi e Strutture Dati. Calcolo delle Probabilità e Statistica.


PROVA SCRITTA (si/no): si

COLLOQUIO ORALE (si/no): si

PROVA DI LABORATORIO (si/no): no

PROVE DI ESONERO PARZIALE(si/no): no

ANNO DI CORSO: 3°

SEMESTRE: 1°

DATA INIZIO LEZIONI (gg/mm/aaaa): 27/09/2011

DATA FINE LEZIONI (gg/mm/aaaa): 22/12/2011