Transcript
Page 1: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Università degli studi di Modena e Reggio Emilia

Facoltà di Ingegneria di Modena

Corso di Laurea Specialistica in Ingegneria Informatica

Analisi e valutazione comparativadei principali sistemi di integrazione daticommerciali rispetto al sistema MOMIS

attraverso il benchmark THALIA

Relatore Prof.ssa Sonia Bergamaschi

Correlatore Prof. Maurizio Vincini

Tesi di Laurea diFabio Romano

Page 2: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Obiettivi

1

Analisi e studio della logica e dei metodi di integrazione dei sistemi commerciali:

WebSphere Information Integrator Content Edition

Microsoft SQL Server 2005 Integrazione Services

Oracle Data Integrator

MOMIS

Valutazione tramite il benchmark THALIA

Page 3: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Data Integration System

2

DB

XML

DB virtuale

DB materializzato

2 approcci diversi:

Dati strutturati

Dati semi-strutturati

Page 4: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Classificazione dei sistemi

3

WebSphere Information Integrator Content Edition

Microsoft SQL Server 2005 Integrazione Services

Oracle Data Integrator

MOMIS

ETL (Extract, Transform,Load)

Aprroccio virtuale

Page 5: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

4

Set di 12 query con l’obiettivo di testare eterogeneità:

Raccolta di 25 fonti di dati diverse (file XML) che rappresentano i cataloghi dei corsi di diverse università mondiali

Sintattiche Semantiche

Page 6: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

5

5 query• Eterogeneità degli

attributi

3 query • Dato mancante

4 query• Eterogeneità

strutturali

12 query

Sinonimi

Semplice mapping

Tipi unione

Mapping complesso

Language Expression

Page 7: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

5

5 query• Eterogeneità degli

attributi

3 query • Dato mancante

4 query• Eterogeneità

strutturali

12 query

Valori nulli

Attributi virtuali

Incompatibilità semantica

Page 8: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Benchmark THALIA

5

5 query• Eterogeneità degli

attributi

3 query • Dato mancante

4 query• Eterogeneità

strutturali

12 query

Stesso attributo in strutture differenti

Trattamento di set di valori

Il nome dell’attributo non ne descrive la semantica

Composizione di attributi

Page 9: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Microsoft Integration Services

6

Page 10: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

IBM Information Integrator

7

Page 11: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Oracle Data Integrator

8

Page 12: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

MOMIS

9

Page 13: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Confronto tra i sistemi

10

ProduttoreTipi sorgenti

datiApproccio Creazione vista

Query manager

MOMISDBGROUP-

UNIMO

Semistrutturati

e strutturati

Database virtuale(GAV)

Semiautomatica SI

IICE 8.4 IBM

Strutturati, semistrutturati,

dati multimediali

Database virtuale(LAV)

Manuale(interfaccia

grafica)NO*

Data

IntegratorOracle

Semistrutturati

e strutturati

DB materializzato

(E-LT)

Manuale(interfaccia

grafica)SI

Integration

ServicesMicrosoft

Semistrutturati

e strutturati

DB materializzato

(ETL)

Manuale(interfaccia

grafica)SI

Page 14: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Osservazioni sul confronto

11

Page 15: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Trasformazioni sui dati

12

Metodi e funzioni di trasformazione diversi per ogni sistema di integrazione:

Oracle DI Funzioni personalizzate, in base alla tecnologia DBMS utilizzata

MOMIS Funzioni like SQL92

CASE WHEN ISNUMERIC(SUBSTRING(COURSE.Times, 1, 2)) = 1 THEN CASE WHEN CAST(SUBSTRING(COURSE.Times, 1, 2) AS int) > 12 THEN CAST(CAST(SUBSTRING(COURSE.Times, 1, 2) AS integer)- 12 AS nvarchar(2)) ELSE SUBSTRING(COURSE.Times, 1, 2) END + SUBSTRING(COURSE.Times, 3, 4) + CASE WHEN CAST(SUBSTRING(COURSE.Times, 7, 2) AS int) > 12 THEN CAST(CAST(SUBSTRING(COURSE.Times, 7, 2) AS integer)- 12 AS nvarchar(3)) ELSE SUBSTRING(COURSE.Times, 7, 2) END + SUBSTRING(COURSE.Times, 9, 3) END

Page 16: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Trasformazioni sui dati

13

Metodi e funzioni di trasformazione diversi per ogni sistema di integrazione:

IBM Information Integrator

Classe Java transformer:Metodo PreProcessQuery();Metodo PostProcessQuery();

Microsoft ISFunzioni personalizzate, messe a disposizione dagli script component

Page 17: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Implementazione benchmark THALIA

15

S.I.

Sorgentidati

Sorgenti

dati

Sorgenti

dati

Sorgenti

dati

Mapping

F.d.T

Page 18: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Risultati benchmark THALIA

16

Page 19: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Costo delle licenze

17

0

2.0004.0006.0008.000

10.000

12.00014.00016.000

Costo licenze (Euro)

Oracle DI

IBM IICE 8.4 + WebSphereApplication Server

Microsoft SQL 2005*

MOMIS

Page 20: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Difficoltà d’installazione

18

0

2

4

6

8

10

Difficoltà installazione e configurazione

MOMIS

IICE 8.4

Data Integrator

Integration Services

Page 21: Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione

Conclusioni

19


Recommended