Upload
coman-alina
View
219
Download
0
Embed Size (px)
Citation preview
1
Maurizio VichiPresidente Società Italiana di Statistica e Dpt. Statistica Probabilità e Statistiche ApplicateUniversità “La Sapienza” di Roma
Informazione Statistica Informazione Geografica e Banche Dati Online: Sviluppi Metodologici ed Applicativi
La Statistica: tra Diffusione e Comunicazione
La Statistica tra cattiva immagine e grande successo in Italia (ma anche all’estero) • La funzione delle Statistica è in generale di acquisire informazione “soggettiva” (ovvero dati
su singoli individui) e restituire informazione “oggettiva”, (conoscenza) legata alla collettività; • Con la Società dell’Informazione (basata su radio, televisione, telefonia e internet),
l’informazione soggettiva è enormemente aumentata; • La percezione pubblica della statistica è in parte negativa. Da che dipende? • I media spesso usano informazione soggettiva e la pubblicano come oggettiva;• La gente ha una percezione di dipendenza della Statistica ufficiale dal Governo. Necessità
di favorire l’indipendenza e l’autorevolezza (credibilità);
Che cosa si può fare per migliorare l’immagine pubblica della Statistica. Due punti in discussione nel workshop: la condivisione e la diffusione dell’informazione statistica
• Organizzare l’informazione statistica online per renderla universalmente accessibile, integrabile e facile da leggere ed interpretare;
• Completare la modernizzazione della Statistica. Il Datawarehouse non è un problema informatico ma è statistico;
La comunicazione dell’informazione statistica. La Statistica non si deve fermare alle tabelle e grafici ma deve comunicare l’informazione rilevante dandone l’interpretazione oggettiva, ovvero la descrizione ed l’inferenza su ciò che è stato osservato.
• Analizziamo gli sviluppi metodologici ed applicativi che sono necessari per migliorare la condivisione e la diffusione dell’informazione statistica
2
3
SIS Sistema Informativo Statistico online Costruzione di un Sistema Informativo Statistico online Quali sono le caratteristiche generali di un SIS online Per gli aspetti di Organizzazione
Accessibilità dei dati e dei metadati online; Organizzazione dei dati per l’analisi statistica; Integrazione tra dati (modularità) mediante internet Per gli aspetti di Comunicazione Ridurre i tempi di pubblicazione dei dati; Trasparenza e certificazione (qualità dei dati); Predisposizione di strumenti statistici di elaborazione; Interpretazione oggettiva delle elaborazioni (information mining).
• UN data (http://data.un.org/) • La Divisione Statistica delle Nazioni Unite (UNSD) del DESA ha lanciato un nuovo
servizio internet che permette di trovare e scaricare una varietà di dati statistici delle agenzie delle Nazioni Unite.
• Databases• Education UNESCO UIS Data• Employment ILO Data• Energy UNSD Energy Statistics• Environment UNFCCC Greenhouse Gas Inventory• Food and Agriculture FAO Data , FAO Fertilizer Data• Health WHO Data , HIV/AIDS UNAIDS Data• Human Development UNDP Human Development Report• Indicator databases UNSD Key Global Indicators, UNSD Gender Info 2007 , UNSD Indicators on Women and Men ,UNSD Millennium
Development Goals , UNICEF The State of the World’s Children 2009• Industry UNSD Industrial Commodity Statistics• Information and Communication Technology TU Data• National Accounts UNSD Official Country Data , UNSD Estimates of Main Aggregates• Population UNSD Demographic Statistics , UNPD World Population Prospects• Refugees UNHCR Statistical Yearbook• Trade UNSD Commodity Trade Statistics• Tourism UNWTO Data
4
Basi Dati OnlineAnalizziamo tre rilevanti DB Online per esaminare le loro caratteristiche
• Eurostat (http://epp.eurostat.ec.europa.eu)• Disponibile sul sito ed esplorata con un albero
• Euroindicators database• Economy and finance Main economic indicators, National accounts (incl.GDP), Government
statistics, Financial accounts, Exchange rates, Interest rates, Monetary and other financial ,statistics, Prices , Balance of payments
• Population and social conditions Population, Health , Education and training , Labour market ,Living conditions and welfare , Crime and criminal justice ,
• Industry, trade and services Short-term business statistics , Structural business statistics ,Information society statistics , Tourism , Statistics on the production of manufactured goods ,
• General and regional statistics Regions , Urban audit , Non EU countries ,• Agriculture and fisheries Agriculture Forestry, Fisheries ,Food• External trade External trade• Transport• Environment and energy Environment ,Energy• Science and technology Science and technology
5
Basi Dati Online 2
Basi Dati Online 3• Statistics Portal OECD.Stat Extracts• General Statistics • Agriculture and Fisheries • Demography and Population • Development • Economic Projections, Education and Training • Environment • Finance • Globalisation • Health • Industry and Services • International Trade and Balance of Payments • Labour • Monthly Economic Indicators • National Accounts • Prices and Purchasing Power Parities • Productivity • Public Sector, Taxation and Market Regulation • Regional Statistics • Science, Technology and Patents • Social and Welfare Statistics • Non-member Economies • Others 6
Vista Univariata o tabellare dei DB
• In UNDATA sono riportate le serie storiche degli indicatori ed ha un motore di mappe tematiche;
• In EUROSTAT c’è una applet Java che permette di costruire tabelle;
• In OECD Portal c’è eXplorer che è uno strumento per costruire tabelle e grafici e fare confronti territoriali;
• In un SIS i dati sono logicamente strutturati in uno o più“CUBI” di informazioni:
• unità territoriali x indicatori x tempi, che sono le dimensioni tipiche di ogni fenomeno statistico con struttura complessa.
7
8
Struttura Multiway dei Dati organizzati in uno o più data-set a tre vie (Three-way Data Set) X un insieme X di I × J × K attributi relativi a: J Indicatori (variabili) misurati, (osservati, stimati) su I Unità Territoriali (oggetti geografici, aggregazioni
amministrative) osservati, K Occasioni (tempi, diverse fonti di dati)
Si ha un Cubo X o 3-Way Array
tempo k
Unità territoriale
i
x11h x12h ... x1kh
x11r x12r ... x1kK
xn11 xn21... x1JK
x111 x121 … x1k1
Indicatore j
xijk
Un insieme di indicatori economici, demegrafici, sociali
Comuni, provincie, regioni, comucap
anno, semestre, trimestre, mensile
9
Analisi statistica dei dati di un SISI dati presentano tre diverse tipologie di relazione di cui si deve tener conto
RELAZIONE TERRITORIALI, tra le unità territoriali rispetto agli indicatori in un istante di tempo (correlazione spaziale, (dis)similarità fra oggetti spaziali, vincoli di contiguità, ecc.);
TIPO DI ANALISI: Statistica per il territorio (Spaziale) Statistica per il territorio (Spaziale) ed uso dei ed uso dei GISGIS; Indici di associazione spaziale, regressione eregressione e segmentazione segmentazione vincolata al territoriovincolata al territorio.
RELAZIONE MULTIVARIATE,ovvero tra gli indicatori sulla base di unità territoriali osservate in un istante di tempo (associazione e correlazione fra variabili);
TIPO DI ANALISI : Statistica MultivariataStatistica Multivariata.. Costruzione di indicatori indicatori complessicomplessi, segmentazione del mercatosegmentazione del mercato. RegressioneRegressione tra indicatori
RELAZIONI TEMPORALI, ovvero in ciascun indicatore che si riferiscono a indicatori e/o unità territoriali (auto-correlazione temporale);
TIPO DI ANALISI: Analisi delle Serie Storiche Analisi delle Serie Storiche ed uso della modellistica per le PrevisioniPrevisioni.
10
Prima vista del SIS CONFRONTI TERRITORIALI
(sezionando verticalmente X)
Units
Variables
xn11 xn21 ...xnk1
x11r x12r ...x1kr
xi11 x121 ... xik1
x112 x122 ...x1k2occasion 1
occasion 2
occasion r
x111 x121 ...x1k1
xnk2
xik2xnkr
xikr
Unità territoriali multivariate Confronti territoriali tra indicatori in uno stesso istante di tempo(Analisi cross-section); Analisi delle posizioni relative tra le unità territoriali su indicatori ospazi fattoriali (indicatori compositi); Segmentazione del territorio in aree omogenee.
Indicatori
Tempo 1
Tempo 2
Tempo r
Unità Territoriali
11
Seconda Vista PREVISIONI STATISTICHE
(sezionando orizzontalmente X) n Serie Storiche Multiple
Occasions
Unit 1x221
x11r
x111
x211
xn11 xn21
x121 x1k1
x12r x1kr
x2k1
x21r
Unit n
Variables
xnk1
xn1r
Un insieme di dati Panel Confronti tra n Serie Storiche multivariate (Panel di dati) Analisi delle “storie” tra più unità territoriali sulla base di unset di indicatori; Previsioni su un territorio sulla base di un set di indicatori; Analisi di convergenza e divergenza territoriale;
Unità I
Unità 1
Indicatori
tempi
12
Terza vista CONVERGENZA di INDICATORI
(sezionando lateralmente X) un insieme di K Serie Storiche Multiple
Un insieme di dati Panel Confronti “storici” tra indicatori per le unità territoriali; Previsioni di indicatori in un territorio; Analisi di convergenza e divergenza degli indicatori sulterritorio;
Occasions
Units
variable 1
variable k
x112
x11r
x111
x211
x212
x21r
xn11
xn12
xn1r
Indicatore 1
Indicatore K Tempi
Unità
13
GIS- Geographical Information System
• Un GIS è un sistema orientato alla Geografia, che permette, la gestione, l’analisi e la visualizzazione di informazioni legate al territorio
Diversi modi di vedere un GIS
La vista del Database: dati geografici
Collezioni ordinate di caratteristiche vettoriali (insiemi di punti, linee e poligoni)
modelli digitali di elevazione del territorio
Collegamenti tra oggetti geografici
Terreni e altre superficie
Insiemi di dati di ricerche geografiche
altre informazioni geografiche
Altra modalità “geografica” di vedere i dati
14
Secondo e Terzo modo di vedere un GIS Dati di relazione tra gli oggetti spaziali e i dati di flusso.
Relazioni spaziali come topologie e reti sono parti cruciali di un GIS. La topologia è impiegata per gestire confini comuni tra oggetti geografici
Organizzazione tematica dei dati (livelli tematici)
15
Integrazione tra GIS e SIS
Tre tipologie di vista dei dati
Visualizzazione cartografica (tipica GIS)Gli indicatori che definiscono una serie territoriale originano un cartogramma.
Visualizzazione tabellare (tipica SIS)Tabelle unità territoriali x indicatori;Tabelle unità terrritoriali x tempi;Tabelle indicatori x tempi
Visualizza grafica (tipica SIS e GIS + cartografia)Per variabili qualitative 1 indicatore: grafico a colonne 1 indicatore x anni: grafico a colonne contrapposte
Per variabili quantitativeIstogramma 1 indicatore x anni: grafico cartesianom indicatori x anni: grafici cartesiani a confronto
16
MetadataCatalogo Dati
Basi Dati ufficiali, gestione, validazione
•GESTIONE DATI•BASE DATI RELAZIONALE•INTEGRAZIONI DI FONTI* Strumenti per il DBMS* Gestione della sicurezza * Raccolta di dati mediante
questionari interattivi * Controllo e correzione dati* Geo-processing dei dati
•PRESENTAZIONERISULTATI
* Strumenti grafici per la presentazione dei dati
* Gestione della tabelle * Geo-processing dei dati
• ANALISI DEI DATI
* Strumenti statistici per l’analisi dei dati
* Classificazione dei territori * Costruzione di indicatori
complessi* Modelli per le relazioni
tra indicatori* Geo-processing dei dati
90 89 88 87 86 85 84 83 82 81 80
86 4
20 -2 -4 -6 -8
CAFRGBGEJAPITASPAUSA
90 868380
9086 8380
908683
80
9086
8380
9086
8380
90 8683
80
90868380
90868380
Factor 1 (60%)
210-2-3
Fact
or 2
(24%
)
3
2
1
-1
-2
-4
ITASPA
GRB
FRACAN
JAP
USA
GER
0
20
40
60
80
100
1° Trim. 2° Trim. 3° Trim. 4° Trim.
y111 ... y1n1
yi11 ... yin1
yn11 ...ynn1
Warehouse cubi di dati
F RA
U SA
G RB
C AN
G ER
J AP
I TA
S PA
0
5-9
15-2
4
45-6
4
LiguriaPiemonteVenetoFriuli-Venezia GiuliaLombardia
0
500.000
1.000.000
1.500.000
2.000.000
2.500.000
3.000.000
Integrazione tra GIS e SIS: Geo Web StarterGeo Web Starter
Gestione profili utenti
Basi Datiutente
Servizio WEB -multimediale
Cartografia & Tabelle e Grafici
Confronti avanzatiDBMS archivi
Segmentazioneterritorio in areeomogenee
Modelli per serie temporali e serie spaziali
Diffusione, confronti
17
DESC FREQ PROB ANOVA1 ANOVA+ EXPER SLR MLR LOG LOGIT PROBIT GLM ANCOVA NONPAR LOGLIN TIME SURV PCA FACT CCA CA DISCR CLUST
ADE 4 • • • • • • • • •
DATAPLOT • • • • • • • • • • • • •
EASYREG • • • • • • • • • • •
GRETL • • • • • • • • • • • •
INSTAT + • • • • • • • • • • •
MACANOVA • • • • • • • • • • • • • • •
MATRIXER • • • • • • • • •
MICROSIRIS • • • • • • • • • • • •
OPENSTAT • • • • • • • • • • • • • • • •
R • • • • • • • • • • • • • • • • • • • • • • •
TANAGRA • • • • • • • • • • •
VISTA • • • • • • • • • •
WINIDAMS • • • • • • • • • •
Software Statistico (Open Source)
Software Online
• SOCR (Statistics Online Computational Resource)
• (http://www.socr.ucla.edu/) Database di risorse computazionali online
• include: • Distributions (interactive graphs and calculators), • Experiments (virtual computer-generated analogs of popular games and processes), • Analyses (collection of common web-accessible tools for statistical data analysis), • Games (interfaces and simulations to real-life processes), • Modeler (tools for distribution, polynomial and spectral model-fitting and simulation), • Graphs, Plots and Charts (comprehensive web-based tools for exploratory data analysis), • Additional Tools (other statistical tools and resources), • SOCR Wiki (collaborative Wiki resource), • Educational Materials and Hands-on Activities (varieties of SOCR educational materials), • SOCR Statistical Consulting• Statistical Computing Libraries
18