21
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione comparativa dei principali sistemi di integrazione dati commerciali rispetto al sistema MOMIS attraverso il benchmark THALIA Relatore Prof.ssa Sonia Bergamaschi Correlatore Prof. Maurizio Vincini Tesi di Laurea di Fabio Romano

Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Embed Size (px)

Citation preview

Page 1: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Università degli studi di Modena e Reggio Emilia

Facoltà di Ingegneria di Modena

Corso di Laurea Specialistica in Ingegneria Informatica

Analisi e valutazione comparativadei principali sistemi di integrazione daticommerciali rispetto al sistema MOMIS

attraverso il benchmark THALIA

Relatore Prof.ssa Sonia Bergamaschi

Correlatore Prof. Maurizio Vincini

Tesi di Laurea diFabio Romano

Page 2: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Obiettivi

1

Analisi e studio della logica e dei metodi di integrazione dei sistemi commerciali:

WebSphere Information Integrator Content Edition

Microsoft SQL Server 2005 Integrazione Services

Oracle Data Integrator

MOMIS

Valutazione tramite il benchmark THALIA

Page 3: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Data Integration System

2

DB

XML

DB virtuale

DB materializzato

2 approcci diversi:

Dati strutturati

Dati semi-strutturati

Page 4: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Classificazione dei sistemi

3

WebSphere Information Integrator Content Edition

Microsoft SQL Server 2005 Integrazione Services

Oracle Data Integrator

MOMIS

ETL (Extract, Transform,Load)

Aprroccio virtuale

Page 5: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

4

Set di 12 query con l’obiettivo di testare eterogeneità:

Raccolta di 25 fonti di dati diverse (file XML) che rappresentano i cataloghi dei corsi di diverse università mondiali

Sintattiche Semantiche

Page 6: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

5

5 query• Eterogeneità degli

attributi

3 query • Dato mancante

4 query• Eterogeneità

strutturali

12 query

Sinonimi

Semplice mapping

Tipi unione

Mapping complesso

Language Expression

Page 7: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

5

5 query• Eterogeneità degli

attributi

3 query • Dato mancante

4 query• Eterogeneità

strutturali

12 query

Valori nulli

Attributi virtuali

Incompatibilità semantica

Page 8: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

5

5 query• Eterogeneità degli

attributi

3 query • Dato mancante

4 query• Eterogeneità

strutturali

12 query

Stesso attributo in strutture differenti

Trattamento di set di valori

Il nome dell’attributo non ne descrive la semantica

Composizione di attributi

Page 9: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Microsoft Integration Services

6

Page 10: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

IBM Information Integrator

7

Page 11: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Oracle Data Integrator

8

Page 12: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

MOMIS

9

Page 13: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Confronto tra i sistemi

10

ProduttoreTipi sorgenti

datiApproccio Creazione vista

Query manager

MOMISDBGROUP-

UNIMO

Semistrutturati

e strutturati

Database virtuale(GAV)

Semiautomatica SI

IICE 8.4 IBM

Strutturati, semistrutturati,

dati multimediali

Database virtuale(LAV)

Manuale(interfaccia

grafica)NO*

Data

IntegratorOracle

Semistrutturati

e strutturati

DB materializzato

(E-LT)

Manuale(interfaccia

grafica)SI

Integration

ServicesMicrosoft

Semistrutturati

e strutturati

DB materializzato

(ETL)

Manuale(interfaccia

grafica)SI

Page 14: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Osservazioni sul confronto

11

Page 15: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Trasformazioni sui dati

12

Metodi e funzioni di trasformazione diversi per ogni sistema di integrazione:

Oracle DI Funzioni personalizzate, in base alla tecnologia DBMS utilizzata

MOMIS Funzioni like SQL92

CASE WHEN ISNUMERIC(SUBSTRING(COURSE.Times, 1, 2)) = 1 THEN CASE WHEN CAST(SUBSTRING(COURSE.Times, 1, 2) AS int) > 12 THEN CAST(CAST(SUBSTRING(COURSE.Times, 1, 2) AS integer)- 12 AS nvarchar(2)) ELSE SUBSTRING(COURSE.Times, 1, 2) END + SUBSTRING(COURSE.Times, 3, 4) + CASE WHEN CAST(SUBSTRING(COURSE.Times, 7, 2) AS int) > 12 THEN CAST(CAST(SUBSTRING(COURSE.Times, 7, 2) AS integer)- 12 AS nvarchar(3)) ELSE SUBSTRING(COURSE.Times, 7, 2) END + SUBSTRING(COURSE.Times, 9, 3) END

Page 16: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Trasformazioni sui dati

13

Metodi e funzioni di trasformazione diversi per ogni sistema di integrazione:

IBM Information Integrator

Classe Java transformer:Metodo PreProcessQuery();Metodo PostProcessQuery();

Microsoft ISFunzioni personalizzate, messe a disposizione dagli script component

Page 17: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Implementazione benchmark THALIA

15

S.I.

Sorgentidati

Sorgenti

dati

Sorgenti

dati

Sorgenti

dati

Mapping

F.d.T

Page 18: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Risultati benchmark THALIA

16

Page 19: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Costo delle licenze

17

0

2.0004.0006.0008.000

10.000

12.00014.00016.000

Costo licenze (Euro)

Oracle DI

IBM IICE 8.4 + WebSphereApplication Server

Microsoft SQL 2005*

MOMIS

Page 20: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Difficoltà d’installazione

18

0

2

4

6

8

10

Difficoltà installazione e configurazione

MOMIS

IICE 8.4

Data Integrator

Integration Services

Page 21: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Conclusioni

19