25
1 Laura De Sandro in collaborazione con Stefania Fegatelli “Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto” Roma, 06 dicembre 2011 Innovazione nelle Indagini statistiche sui trasporti

1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Embed Size (px)

Citation preview

Page 1: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

1

Laura De Sandro in collaborazione con Stefania Fegatelli

“Il trattamento delle mancate risposte:utilizzo dei dati delle Capitanerie di porto”

Roma, 06 dicembre 2011

Innovazione nelle Indagini statistiche sui trasporti

tabanell
Arial 32 Grassetto colore testo bianco;Posizione casella di testo: 5,50 - 3Margine sinistro 0, destro 0, superiore 0, inferiore 0punto di ancoraggio del testo: alto
tabanell
sfondo della diapositiva: RGB 153 - 51 - 51
tabanell
Arial 24 Grassetto colore testo grigio RGB 221 - 221 - 221Posizione casella di testo: 5,50 - 7,10Margine sinistro 0, destro 0, superiore 0, inferiore 0punto di ancoraggio del testo: alto
tabanell
nome relatore: Arial 24 grassetto colore grigio RGB 221 - 221 - 221Posizione casella di testo 5,50 - 14,10Margine sinistro 0, destro 0, superiore 0, inferiore 0Punto di ancoraggio del testo: alto
tabanell
intervento: arial 20 grassetto colore bianco
tabanell
Arial 10 colore testo biancoPosizione casella di testo: orizzontale 5,50 verticale 18,25margini: sinistro 0, destro 0, superiore 0, inferiore 0punto di ancoraggio del testo: alto
tabanell
dimensioni altezza 0,7 larghezza 2,41posizione 0,93 - 1,16
Page 2: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

1. Esplicitazione del problema2. Trattamento Mancate Risposte3. Record Linkage4. L’ integrazione con dati delle capitanerie di porto5. Utilizzo dei mirror data

2

SOMMARIOInnovazione nelle

indagini statistiche sui trasporti

Roma, 6 dicembre 2011

Page 3: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

LA CAUSA:• Complessità organizzativa dell’indagine• Difficoltà di individuare l’universo dei rispondentiL’EFFETTO:• dichiarazioni mancanti (non pervenute o non

effettuate) di Arrivo/Partenza MANCATE RISPOSTE TOTALI

• dichiarazioni non complete di Arrivo/PartenzaL’evento nave A/P viene rilevato, ma senza dettagli

sul carico

MANCATE RISPOSTE PARZIALI

3

Esplicitazione del problema

Roma, 6 dicembre 2011

Innovazione nelle indagini statistiche sui

trasporti

Page 4: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

TRATTAMENTO MANCATE RISPOSTE

1. Utilizzo modelli delle capitanerie di porto

2. Utilizzo mirror data

4Roma, 6 dicembre 2011

Esplicitazione del problemaInnovazione nelle

indagini statistiche sui trasporti

Page 5: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

5Roma, 6 dicembre 2011

• Il metodo di IMPUTAZIONE scelto:

Record Linkage (RL) tra la base dati Istat e una fonte amministrativa

• La FONTE amministrativa UFFICIALE scelta:

il modello 61 delle CAPITANERIE DI PORTO, trasmesso all’Istat dal Ministero delle

Infrastrutture e Trasporti

Esplicitazione del problemaInnovazione nelle

indagini statistiche sui trasporti

Page 6: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Perché un Record Linkage?

Perché la nave, dichiarata in ‘arrivo (partenza)’ dall’agente marittimo, viene registrata anche in capitaneria di porto con il suo carico,

cioè con la sua merce e i suoi passeggeri

6Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 7: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Punti di forza dei modelli 61 stesso campo d’osservazione dell’indaginefornisce l’universo delle navi

arrivate/partitepermette di integrare eventuali MR, totali

e parziali, rispetto ai viaggi (navi arrivate/partite), alla merce o ai passeggeri

7

RECORD LINKAGE

Roma, 6 dicembre 2011

Innovazione nelle indagini statistiche sui

trasporti

Page 8: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Punti di debolezza dei modelli 61 non sono generati da una procedura automatizzata,

quindi non sono immediatamente trattabili da Istat

contengono informazioni aggregate con riferimento al numero di navi arrivate/partite e alle tonnellate di merce e al numero di passeggeri sbarcati/imbarcati

8Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 9: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Ipotesi di base• le unità statistiche devono essere definite allo

stesso modo nelle diverse fonti o provenire dalla stessa fonte

• le unità devono fare riferimento allo stesso collettivo statistico

• il contenuto informativo delle variabili della fonte “donatrice” deve essere identico a quello delle variabili “oggetto” di indagine

• IPOTESI SODDISFATTE!!

9Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 10: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Il match e la match key

• Tecnica di exact matching con una chiave di abbinamento che identifichi univocamente l’evento ‘nave arrivata/partita’

• Ad ogni evento (nel nostro caso l’evento nave arrivata/partita) da integrare corrisponde un solo record ‘donatore’

10Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 11: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Il match e la match key La chiave di abbinamento:

• Numero IMO (International Maritime Organization)

• mese• direzione (arrivo/partenza)• porto dichiarante• porto di origine/destinazione• zona di origine/destinazione

11Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 12: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

LA FORMALIZZAZIONEDall’insieme di tutte le coppie formate da

unità appartenenti alle fonti A e B,

A × B ={(a, b) : a є A, b є B},

si determinano due sottoinsiemi

disgiunti ed esaustivi M e u, per cui

M∩u =ø e MUu = A × B

12Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 13: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

LA FORMALIZZAZIONE• M = unità rilevate in entrambe le fonti

“match”

• u= unità rilevate in A e non presenti in B, e viceversa

“non-match”

13Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 14: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

LA FORMALIZZAZIONE• A = la base dati Istat• B = la base dati delle capitanerie di

porto;• IL RL VIENE EFFETTUATO SU SOTTOINSIEMI DELLE

2 FONTI, selezionati in base alla variabile ‘TIPO DI NAVE’, per individuare correttamente il tipo di carico da integrare

• Gli insiemi finali M ed u sono pertanto l’unione di tanti sottoinsiemi, le cui coppie contengono, in entrambe le fonti, la merce e i passeggeri da integrare

14Roma, 6 dicembre 2011

RECORD LINKAGEInnovazione nelle

indagini statistiche sui trasporti

Page 15: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

TIPI DI CARICO INTEGRATI:TIPI DI CARICO INTEGRATI:• merce in Rinfusa liquida attraverso il tipo nave

Portarinfuse liquide• merce in Rinfusa solida attraverso il tipo nave

Portarinfuse solide• merce in container attraverso tipo nave

Portacontainer• merce in traghetto attraverso il tipo nave

Traghetto• merce in Trasportatore non specializzato

attraverso l’omonimo tipo nave

15

L’integrazione della MERCEInnovazione nelle

indagini statistiche sui trasporti

Page 16: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

segue ALTRE INTEGRAZIONIsegue ALTRE INTEGRAZIONI:

Numero di passeggeri attraverso il tipo nave Traghetto-Aliscafo

Movimenti di TUTTE le NAVI Arrivate/Partite

16

L’integrazione di PASSEGGERI e NAVI

Roma, 6 dicembre 2011

Innovazione nelle indagini statistiche sui

trasporti

Page 17: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

17

L’ INTEGRAZIONE

Roma, 6 dicembre 2011

RISULTATI DEL linkage

• l’evento Nave Arrivata/Partita si rileva nei modelli 61 e non nella fonte Istat

INTEGRAZIONE MR TOTALI

Innovazione nelle indagini statistiche sui

trasporti

Page 18: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

18Roma, 6 dicembre 2011

l’evento Nave Arrivata/Partita si rileva in entrambe le fonti, ma merce, passeggeri e/o il numero di navi A/P non coincidono,

si tiene conto di quanto dichiarato nei modelli 61

INTEGRAZIONE MR PARZIALI

L’ INTEGRAZIONEInnovazione nelle

indagini statistiche sui trasporti

Page 19: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

19

ESEMPIO di integrazione delle tonn. merce

Roma, 6 dicembre 2011

RINFUSA LIQUIDAISTAT

RINFUSA LIQUIDAFonte AMM.

RINFUSA SOLIDAISTAT

RINFUSA SOLIDAFonte AMM.

TRAGHETTIISTAT

TRAGHETTIFonte AMM.

PORTACONTAINERISTAT PORTACONTAINER

Fonte AMM.

Innovazione nelle indagini statistiche sui

trasporti

Page 20: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

20

L’utilizzo dei MIRROR DATA

Roma, 6 dicembre 2011

Il Trattamento delle MR totali e parziali prevede anche una integrazione utilizzando i mirror data.

Attualmente sono utilizzate entrambe le tecniche:

- RL per l’Integrazione con i mirror data

- RL per l’Integrazione con dati amministrativi delle capitanerie di porto

Innovazione nelle indagini statistiche sui

trasporti

Page 21: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

Ogni porto può avere al massimo 2 eventi (Nave Arrivata/Partita) verificabili

per una coppia di porti AB il n. max = 4

21Roma, 6 dicembre 2011

Partenza da A per B

Arrivo in B da A

A B

L’utilizzo dei MIRROR DATAInnovazione nelle

indagini statistiche sui trasporti

Page 22: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

La chiave differisce da quella utilizzata per integrare con dati delle capit. di porto nella variabile Direzione (Arrivo/Partenza):

• Numero IMO (International Maritime Organization)

• mese• direzione (arrivo/partenza)• porto dichiarante• porto di origine/destinazione• zona di origine/destinazione

22

RL e mirror data: la match key

Roma, 6 dicembre 2011

Innovazione nelle indagini statistiche sui

trasporti

Page 23: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

23

ESEMPI DI MIRROR

Roma, 6 dicembre 2011

Olbia

Civitavecchia

Innovazione nelle indagini statistiche sui

trasporti

Page 24: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

24

ESEMPI DI MIRROR

Roma, 6 dicembre 2011

Lampedusa

Linosa

P.Empedocle

Innovazione nelle indagini statistiche sui

trasporti

Page 25: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06

25Roma, 6 dicembre 2011

a) INFORMATIZZAZIONE dei modelli 61, ad opera del Ministero delle Infrastrutture e Trasporti

b) Procedure automatiche per l’individuazione e il recupero dei ‘non rispondenti’, utilizzando anche i risultati del RL

Sviluppi futuri

Innovazione nelle indagini statistiche sui

trasporti