12
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi e sperimentazione del componente software IBM – DB2 Information Integrator Candidato : Prof. Sonia Bergamaschi Alberto Fontanesi Anno Accademico 2003-2004 Prof. Maurizio Vincini Correlatore: Relato re:

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

Embed Size (px)

Citation preview

Page 1: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

Università degli Studi di Modena e Reggio Emilia

Facoltà di Ingegneria – Sede di ModenaCorso di Laurea in Ingegneria Informatica – Nuovo Ordinamento

Analisi e sperimentazione del componente software

IBM – DB2 Information Integrator

Candidato:

Prof. Sonia Bergamaschi

Alberto Fontanesi

Anno Accademico 2003-2004

Prof. Maurizio Vincini Correlatore:

Relatore:

Page 2: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

ContenutiContenuti

Integrazione dell’informazioneIntegrazione dell’informazione

DB2 Information Integrator DB2 Information Integrator

MOMISMOMIS

Confronto tra i toolConfronto tra i tool

ConclusioniConclusioni

Page 3: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

Integrazione dell’informazioneIntegrazione dell’informazione

Le informazioni sono memorizzate in sorgenti Le informazioni sono memorizzate in sorgenti eterogenee e distribuiteeterogenee e distribuiteLe imprese richiedono una visione unificata dei dati di Le imprese richiedono una visione unificata dei dati di loro interesseloro interesse

DB2 Information IntegratorDB2 Information Integratorpermette agli utenti di trattare dati eterogenei e distribuiti come se fossero tutti permette agli utenti di trattare dati eterogenei e distribuiti come se fossero tutti

memorizzati su un’unica sorgente, nascondendo tutte le complessità memorizzati su un’unica sorgente, nascondendo tutte le complessità derivanti dall’utilizzo d’informazioni memorizzate in differenti locazioni, derivanti dall’utilizzo d’informazioni memorizzate in differenti locazioni,

linguaggi e formati.linguaggi e formati.

Page 4: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

DB2 Information IntegratorDB2 Information Integrator

Dati

Dati

Sorgente

Sorgente

Wrapper

Server

Server

Nickname

Nickname

Nickname

Federated data server

Portafoglio prodotti:Portafoglio prodotti:DB2 Information Integrator V8.1

- Federated Data Server- Replication Server- Database Server

DB2 Information Integrator for Content V8.2

Componenti sistema federato:Componenti sistema federato:

Page 5: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

MOMISMOMIS(Mediator envirOnment for Multiple Information Sources)(Mediator envirOnment for Multiple Information Sources)

MOMIS è attualmente adottato nel progetto di ricerca europeo SEWASIE (SEmantic Webs and Agents in Integrated Economies) il cui scopo è di implementare un motore di ricerca avanzato che fornisca un accesso intelligente alle sorgenti eterogenee presenti sul Web. Per raggiungere questo obiettivo SEWASIE realizza dei SINodes (Sewasie Information nodes) i quali costituiscono la struttura di viste, chiamate Global Virtual Views (GVV), contenenti i dati delle sorgenti d’interesse.

L’insieme dei passi necessari all’ottenimento di queste GVV è supportato dall’Ontology Builder, l’interfaccia grafica di MOMIS che guida l’utente nelle varie fasi d’integrazione.

Page 6: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

Scenario sviluppatoScenario sviluppato

Tessilmoda IngromarketUsawear ProntoComuneSubforFibre2Fashion

Sinode1 Sinode2

Global Virtual View

Page 7: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

Importazione Importazione delle sorgentidelle sorgenti

Processo d’integrazione di DB2 Processo d’integrazione di DB2 Information IntegratorInformation Integrator

Definizione dei WrapperDefinizione dei Wrapper

Definizione dei ServerDefinizione dei Server

Definizione dei NicknameDefinizione dei Nickname

Realizzazione del MappingRealizzazione del Mapping

Page 8: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

Processo d’integrazione di Processo d’integrazione di MOMISMOMIS

Importazione delle sorgentiImportazione delle sorgenti

Fase di annotazioneFase di annotazione

Definizione delle relazioni lessicaliDefinizione delle relazioni lessicali

Definizione dei clusterDefinizione dei cluster

Eventuale ridefinizione del mapping propostoEventuale ridefinizione del mapping proposto

Page 9: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

MappingMapping dei datidei daticreate view enterprise asselect nome, descrizione, ' ' as

presentazione, indirizzo, email, fax, telefono,

web, url, contattifrom company_ffunionselect nome, descrizione, presentazione, indirizzo, ' ' as email, fax, telefono, ' ' as web,url, contattifrom azienda_tmunionselect nome, descrizione, ' ' as

presentazione, indirizzo, email, fax, telefono,

web, ' ' as url,contattifrom company_uw

Necessità di conoscere gli schemi delle sorgenti remote

Page 10: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

Software d’appoggioSoftware d’appoggio

DB2 IIDB2 II

DB2 DB2

MOMIS MOMIS

MySQLMySQLSQL Server SQL Server

SorgentiSorgentiSorgenti relazionaliSorgenti relazionaliXMLXMLExcelExcelDocumenti di testoDocumenti di testoVideo clipVideo clipImmaginiImmaginiContenuti WebContenuti WebE-mailE-mail……..

SQL ServerSQL ServerAccessAccessOracleOracleXMLXML

ODLODLII33

OWLOWL

Page 11: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

DB2 II DB2 II MOMIS MOMIS

SetSet d’istruzioni SQLd’istruzioni SQL Funzioni aritmetiche

Query innestate

Count (*)

Group by/ Order by

Like

Having

Indici

SELECT [DISTINCT ] { * | campi } FROM {tabelle}WHERE <criteri di selezione>[GROUP BY][ORDER BY]

Con <criteri di selezione>:=Campo - <operatore> - campo<operatore>:= > , < , <>, = o LIKE.

EsportazioneEsportazione degli ambienti creatidegli ambienti creatiEsportazione

effettuata tramite Backup del database

e successivo ripristino

Il sistema permette di esportare la GVV in un DTD XML preoccupandosi di

aggiungere i tag necessari per rappresentare le relazioni tra le mapping

tables. Da poco è stato implementato anche un modulo che permette

l’esportazione delle GVV in OWL

Page 12: Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi

ConclusioniConclusioniLa scelta fra i due software non è sempliceLa scelta fra i due software non è semplice

MOMIS sarà perfezionato grazie all’inserimento MOMIS sarà perfezionato grazie all’inserimento di nuove funzionalitàdi nuove funzionalità

Optare per MOMIS se:Optare per MOMIS se: Si deve realizzare un mapping tra i datiSi deve realizzare un mapping tra i dati

Optare per DB2 Information Integrator se:Optare per DB2 Information Integrator se: Le tipologie delle sorgenti lo rende necessarioLe tipologie delle sorgenti lo rende necessario

Si devono realizzare query complesseSi devono realizzare query complesse

Si devono effettuare scritture direttamente in DB2IISi devono effettuare scritture direttamente in DB2II