20
Il Sistema Integrato dei Registri @ Istat Progettazione e realizzazione di una architettura Ontology-Based Mauro Bruno, Roberta Radini, Laura Tosco Istituto Nazionale di Statistica - Istat

Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Il Sistema Integrato dei Registri@ Istat

Progettazione e realizzazione di una architetturaOntology-Based

Mauro Bruno, Roberta Radini, Laura Tosco

Istituto Nazionale di Statistica - Istat

Page 2: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Sommario

Il contesto

Il Sistema Integrato dei Registri (SIR)

Ontology Based Data Management System (OBDM)

Realizzazione del SIR attraverso un OBDM

Esempi di interrogazione del SIR

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 2

Page 3: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Il contesto

Programma di modernizzazione dell’ISTAT:

Ufficialmente approvato nel 2016

Profonda revisione della struttura organizzativa. Centralizzazione delle strutture trasversali (Informatica, Metodologia, Raccolta Dati, Diffusione)

Profonda revisione dei processi di produzione statistica

Sistema Integrato dei Registri (SIR) rappresenta uno dei pilastri della nuova architettura:

«Single logical environment to support the consistency of statistical production processes, in particular identification and estimation for the whole integrated system of units and variables»

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 3

Page 4: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Sistema Integrato dei Registri (SIR)

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 4

Registro Individui

Registro Luoghi

Registro Unità

Economiche

Registro Attività

Rappresentazione insiemistica

IndividuiUnità

Economiche

Attività

Luoghi

Rappresentazione Entità-Relazione

Page 5: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

RSB (Registro Base) contiene diverse popolazionistatistiche e il set minimo di variabili per caratterizzare le

unità statistiche

RSE (Registro Esteso) estende le informazioni di un

RSB su una popolazione specifica

RST (Registro Tematico) supporta più processi

statistici trattando alcuni temi in modo consistente e

condiviso

5

SIR: tipologie di registro

Sistema Integrato dei Registri, Mauro Bruno – Forum PA

Page 6: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

SIR: Data Architecture

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 6

Registro Base: Attività

Registro Base: Unità Economiche Registro Base: Individui e Famiglie

Registro Base: Luoghi

Registro Tematico: Relazioni di lavoro

Page 7: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

SIR: what’s missing?

Sistema integrato dei registri:

Ambiente di supporto dei processi di produzione

Permette di identificare e stimare le unità statistiche

Garantisce l’integrità dei dati a livello di record

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 7

Come accedere ai dati in modo integrato e indipendentedall’eterogeneità (semantica & tecnologica) delle fonti dati?

Ontology Based Data Management System

Page 8: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Ontology Based Data Management System (OBDM)

OBDM: Permette di accedere, integrare e gestire differenti fonti di dati

Basato su una architettura a tre livelli:

Ontologia: rappresentazione formale e concettualedel dominio di interesse

Sorgenti dati: sorgenti dei dati input generalmenteeterogenee sia dal punto di vista semantico chetecnologico

Mapping: permette di specificare le corrispondenzetra le sorgenti dati e l’ontologia

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 8

Page 9: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Ontology Based Data Management System (OBDM)

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 9

RegistroIndividui

Registro Unità Economiche

Registro Luoghi

Ontologia

Mapping

OBDM è progettato al fine di garantire l’integrità all’interno di ciascun registro (intra) e tra registri (inter)

Livello di Mapping

Mapping dellefonti dati nei

corrispondenticoncetti definitinell’ontologia

Page 10: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

OBDM: Principali caratteristiche

Caratteristiche principali di OBDM:

Trasparenza: rispetto alle sorgenti dati. Non è necessario conoscere come & dove sono memorizzati idati

Vista globale: i concetti sono definiti globalmente in modo univoco. Concetti definiti in diversi dominidevono essere modellati sull’ontologia

Consistenza: l’utilizzo di una rappresentazione formalepermette di evidenziare eventuali inconsistenzesemantiche e nei dati (funzionalità di reasoning)

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 10

Page 11: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

ODBM: Architettura

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 11

OBDM

LODM2M

DisseminationDW

Page 12: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Vantaggi di un SIR basato su OBDM

Livello ontologico:

Gestisce l’accesso al sistema offrendo servizi all’utentefinale

Permette di governare la fase di data-integration garantendo la qualità dei dati integrati (l’ontologia non è utilizzata solo a livello documentale)

Offre funzionalità di reasoning permettendo di inferirenuova conoscenza gli utenti statistici possono “scoprire” pattern impliciti che

permettono di comprendere più a fondo i dati da analizare

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 12

Page 13: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Vantaggi di un SIR basato su ontologie

Integration layer:

Permette di “virtualizzare” le sorgenti dati

Esegue interrogazioni on-the-fly

Metadati:

Formalizzazione dei metadati consentel’accoppiamento di dati & metadati

Modellazione formale consente di accedere aimetadati tramite sistemi IT

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 13

Page 14: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Esempio di interrogazione del SIR

Page 15: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Ontologia delle Relazioni di lavoro

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 15

LavoratoreIndividuo

Page 16: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Ontologia degli Individui

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 16

Individuo

Page 17: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Integrazione dati: stesso concetto

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 17

Individuo (Ontologia Individui)

Individuo (Ontologia relazioni

di lavoro)

Page 18: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Interrogazione attraverso l’ontologia

Vorremmo ottenere una risposta alla seguente domanda:

“le persone che hanno la residenza in una certa regione e classificarle per età, titolo di studio e condizioneoccupazionale”

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 18

Non è necessario conoscere come & dove sonomemorizzati i dati

Page 19: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Interrogazione attraverso l’ontologia

Sistema Integrato dei Registri, Mauro Bruno – Forum PA 19

Ontologia

Generazione di query SQL attraverso

algoritmi di query-rewriting

Mapping

RegistroIndividui

Registro Lavoro

Individui classificati sulla condizione

lavorativa

Individui che hanno la residenza

in una regione classificati per età e titolo di studio

Interrogazione (SPARQL)

Page 20: Il Sistema Integrato dei Registri @ Istat · 2017. 6. 9. · Il contesto Programma di modernizzazione dell’ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura

Grazie per la vostra attenzione!