SWAP - Semantic Web Access and Personalization Research Group

Programma Preliminare

N. ORE LEZIONI FRONTALI 56 (7 Crediti T1)
N. ORE LABORATORIO 15 (1 Credito T2)
N. ORE PROGETTO 25 (1 Credito T3)

PRE-REQUISITI
Linguaggi di Programmazione. Ingegneria del Software. Basi di dati. Calcolo delle probabilità e statistica. Algoritmi e Strutture Dati.

OBIETTIVI FORMATIVI
L'obiettivo del corso è quello di fornire gli strumenti fondamentali per la gestione di sorgenti di informazioni non strutturate. Nella prima parte del corso si presentano le basi delle discipline dell'Information Filtering e dell'Information Retrieval. Nella seconda parte del corso si analizzano i livelli della pila del Semantic Web, approfondendo in particolare il livello delle ontologie e dei linguaggi per la rappresentazione della sintassi e della semantica propri del Semantic Web, ovvero XML ed RDF. Il coso fornisce le conoscenze per la realizzazione in linguaggio Java di sistemi Web-based complessi.

OBIETTIVI PROFESSIONALIZZANTI
Conoscenza degli elementi essenziali per il filtraggio ed il ritrovamento di informazioni da sorgenti non strutturate. Conoscenza dei linguaggi del Semantic Web. Conoscenza del linguaggio Java per la programmazione in grande.

PROGRAMMA

  • Accesso Intelligente all'Informazione.
    • Text Mining: dal testo alla conoscenza.
      • Definizione di Text Mining.
      • Il processo di Text Mining.
      • Confronto tra Text Mining, Data Mining, Information Retrieval, Data Retrieval.
      • Text Mining nell'Impresa.
    • Intelligent Information Retrieval (IR).
      • Architettura di un sistema di IR.
      • Modelli di IR: confronto tra il modello booleano e quello vector space.
      • Integrazione di conoscenza lessicale nel processo di ritrovamento: WordNet.
      • Organizzazione e rappresentazione della conoscenza in WordNet: i synset, la matrice lessicale e le relazioni.
      • Metriche per la valutazione.
    • Text Categorization (TC).
      • Generalità sul problema della classificazione.
      • Estensione del problema ai dati testuali: Text Categorization (TC).
      • Machine learning for TC: cenni sui metodi k-NN, Rocchio. Analisi del metodo Naive Bayes.
      • Metriche per la valutazione.
      • Casi applicativi.
    • Intelligent Information Access.
      • Information Overload
      • Strategie di accesso all'informazione
      • Information Filtering
    • Applicazioni.
      • Personalizzazione: apprendimento di profili utente.
      • Il sistema ITem Recommender (ITR) e sue applicazioni nel campo del commercio elettronico.
      • Il sistema MultilanguagE Text Analyzer (MeTA).
  • Semantic Web
    • Ontologie e loro applicazioni nella condivisione di conoscenza.
      • Condivisione di conoscenza e riuso.
      • Motivazioni per l'uso di ontologie.
      • Ontologie e basi di conoscenza.
      • Differenti definizioni di ontologie.
      • Ontologie e concettualizzazioni.
      • Tipi di ontologie.
      • Proprietà delle ontologie.
      • Ontology engineering: cenni sulle metodologie.
      • Sviluppo di un'ontologia step-by-step.
      • Ontologie e linguaggi software.
    • eXtensible Markup Language (XML).
      • Introduzione.
      • Struttura di un documento XML.
      • Document Type Definition (DTD) e XML Schema.
      • eXtensible Style Sheet (XSL), XML Query Language (XQL).
      • Interoperabilità e protocolli di comunicazione: SOAP & Web Services.
    • Resource Description Framework (RDF).
      • Ritrovamento automatico nel World Wide Web.
      • Concetti fondamentali: URI, Models, Statements, Classes, Properties, Resources.
      • RDF Schema:differenze tra validazione semantica e validazione XML-based.
      • Limiti di RDF ed RDF Schema.
  • Società dell'Informazione.
    • Impresa oggi come Sistema.
    • Rapporto tra Organizzazione e Conoscenza d'Impresa con le Tecnologie Informatiche.
    • Definizione di azienda, L’Azienda come sistema, Idee guida.
    • Caratteristiche e dimensioni di una azienda. Le cinque fasi di sviluppo aziendale.
    • Informatica come disciplina autonoma, rapporto tra Organizzazione aziendale e Sistema Informativo
    • Le principali tipologie di impresa.
    • Tipi di influenza bilaterale. Matrice tra fasi di sviluppo e gruppi direzionali.
    • Elementi costitutivi dell organizzazione.
    • Analisi delle teorie organizzative. Dall'organizzazione scientifica del lavoro di Taylor al modello socio-tecnico, dal modello sulla qualità e antropologico/culturale al modello basato sulla conoscenza e sul WEB.
    • Il modello degli stili di management, Il modello degli stili di leadership.
    • Le componenti base di un’organizzazione
    • La trasformazione da old a New. Vision, mission e valori. Strategie e

cambiamenti. Processi aziendali.Tipologie dei processi aziendali.Identificazione dei processi. Caratteristiche dei modelli. Organizzazione per processi. Il modello del BPR (Business Process Reengineering)

  • Il knowledge management come fattore di successo per le imprese. L'Era dell'Accesso
  • Project Management: Dall'idea alla realizzazione.
  • Il linguaggio Java.
    • Introduzione e riepilogo dei concetti generali del linguaggio
    • Gestione delle eccezioni
    • Programmazione multithreading: il modello thread di Java.
    • Servlet e Java Server Pages (JSP).
    • Java ed XML: JAXP e Xerces.
    • Java e Database: Java DataBase Connectivity (JDBC).
    • I socket in Java.
    • Esercitazioni.

TESTI CONSIGLIATI

Baeza-Yates, R.A., Ribeiro-Neto, B.A., Modern Information Retrieval, ACM Press/Addison-Wesley, 1999.
M. Degemmis, P. Lops, G. Semeraro, M.F. Costabile, S.P. Guida & O. Licchelli. Improving Collaborative Recommender Systems by means of User Profiles. In C.-M. Karat, J. Blom, and J. Karat (Eds.), Designing Personalized User Experiences in eCommerce, Chapter 14, 253-274, Kluwer Academic, 2004.
R. Feldman and I. Dagan, Knowledge Discovery in Textual Databases (KDT). Proc. of the 1st Int. Conf. on Knowledge Discovery (KDD-95), pp. 112-117, Montreal, 1995.
Grishman, R., Information Extraction: Techniques and Challenges. Springer-Verlag, Lecture Notes in Artificial Intelligence, Rome (1997). Web: citeseer.nj.nec.com/grishman97information.html.
M. Grobelnik, D. Mladenic, and N. Milic-Frayling, Text Mining as Integration of Several Related Research Areas. Report on KDD�2000 Workshop on Text Mining, 2000.
T.M. Mitchell, Machine Learning, McGraw-Hill, 1997.
M. Pazzani, Machine Learning and Information Filtering on the Internet, IJCAI-97 Tutorial, Nagoya, Japan, Aug 1997.

Sebastiani F., Machine learning in automated text categorization, ACM Computing Surveys, 34(1):1-47, 2002.
Semeraro, G., Lops, P., Degemmis, M., Document/Text Mining: From Text to Knowledge, dispense.

Semeraro, G., Lops, P., Degemmis, M., Text Categorization, dispense.
vanRijsbergen, C.J., Information Retrieval, Butterworth & Co., Boston, MA, 1979. Web: http://citeseer.ist.psu.edu/vanrijsbergen79information.html
Christiane Fellbaum (Editor), WordNet: An Electronic Lexical Database. Edited by MIT Press. ISBN 0-262-06197-X.
Tamma, V., Ontologies and their applications in knowledge sharing, dispense. Bradley, N., The XML Companion, Addison-Wesley, 1998.
Iannone, L., Palmisano, G. Semeraro, I. XML Tutorial, dispense.
Capursi, D., Iannone, L., Lops, P., Semeraro, G., RDF Tutorial, dispense.
Lewis, J., Loftus, W., Java: Fondamenti di progettazione software, Addison-Wesley, 2001.
Licchelli, O., Palmisano, I., Introduzione al Linguaggio Java, dispense (2005).
Naughton, P., Schildt, H., Java: La guida completa, McGraw-Hill, 1997.
Horstmann, C. S., Cornell, G., Java2: I fondamenti, McGraw-Hill, 1999.
Eckel, B., Thinking in Java, Prentice-Hall, December 2002. Web: http://www.mindview.net/Books/TIJ/.
Bracchi, Motta, Processi Aziendali e Sistemi Informativi, 2001
C.Resina, Appunti delle Lezioni, 2007
P.Schgor e altri, Professione Informatica, FrancoAngeli 2007
A cura di Batini, Sistemi Informativi basati su Web, FrancoAngeli, 2006




PROVA SCRITTA (si/no): SI
COLLOQUIO ORALE (si/no): SI \\ PROVA DI LABORATORIO (si/no): NO \\ PROVE DI ESONERO PARZIALE(si/no): SI \\ NUMERO PROVE ESONERO: 2
MODALITA' PROVE DI ESONERO: Prova scritta
ANNO DI CORSO: III
SEMESTRE: I