Upload
a-scuola-di-opencoesione
View
332
Download
3
Embed Size (px)
Citation preview
Per farli “parlare” cerca di capirli a pieno.
● Qual è il loro significato reale?
● Cosa definiscono?
● Quali sono le loro caratteristiche principali?
Dati Geografici
I tuoi dati potrebbero
contenere informazioni
anche di tipo geografico.
Dirti cioè qual è la misura
di un fenomeno su un
determinato territorio.
Dati Geografici
○ A quale territorio sono riferiti?
Nazionale, regionale, provinciale o
comunale?
○ Qual è il nesso tra questo territorio e il
progetto da te scelto su OpenCoesione
e che stai approfondento?
○ Quali informazioni aggiuntive potrai
raccogliere analizzando le informazioni
geografiche dei tuoi dati?
Serie storiche
I dati possono permettere
di analizzare l’andamento
di un fenomeno nel
tempo e misurarne le
variazioni (per esempio da
un mese all’altro o da un
anno all’altro).
Serie storiche / Esempi
La raccolta
differenziata dei
rifiuti è aumentata,
diminuita o rimasta
stabile?
Il fenomeno in
esame è in crescita
o in descrescita
(per esempio, di
mese in mese).
Il numero di turisti
sul un territorio è
costante di anno o
anno o ci sono delle
variazioni?
Dati qualitativi
Si tratta di dati che
definiscono le
qualità e le
caratteristiche
intrinseche di uno o
più oggetti.
Dati qualitativi / Esempi
Un esempio: Prodotti tipici trentini (da OpenData
Trentino). Sono dati dei singoli prodotti, ciascuno
viene definito per tipologia, luogo di produzione,
link di approfondimento. Si tratta di qualità
aggiungive del dato disponibili per il fruitore.
Prima di analizzare i dati è necessario
fare alcune verifiche per renderli
coerenti e sfruttarne al meglio ogni
caratteristiche. Esistono dei metodi
specifici anche in questo caso, e li
passeremo in rassegna in questo
tutorial.
La pulizia dei dati è fondamentale per
assicurarsi che siano strutturati bene
all’interno delle righe e delle colonne e
che i valori inseriti siano coerenti.
Analizzare i dati senza fare un attento
data cleaning potrebbe portare
successivamente a gravi errori o a
difficoltà ingestibili.
Controllare che gli stessi valori siano
scritti allo stesso modo. Ad esempio, è
un errore che il valore “Ambiente” sia
scritto anche “ambiente” e
“AMBIENTE”. Devono essere scritti
tutti in maniera analoga.
1
Controlla le date (se presenti): devono
essere scritte in maniera omogenea. È
un errore se alcune sono inserite in
formato numerico (esempio:
01/03/2015) e altre in formato
alfanumerico (esempio: 10 Marzo
2015). È necessario avere le date in un
solo formato.
2
Verifica la numerazione: quella italiana
è diversa dalla anglosassone. In Italia i
punti (“.”) indicano le migliaia, le
virgole (“,”) indicano i decimali. Per gli
anglosassoni è il contrario. Assicurati
che i numeri siano rappresentati
correttamente. Verifica il sistema di
numerazione su “Impostazioni foglio
di lavoro”.
3
I dati devono essere granulari, come se fossero degli atomi.
Ad esempio: se i tuoi dati hanno una colonna di luoghi e all’
interno hanno valori simili a questo - “Cologno Monzese,
provincia di Milano (Lombardia)” - è meglio dividere la
colonne in altre tre colonne (Comune + Provincia + Regione).
Così puoi analizzarli per Comune, Provincia, Regione
Dividi
Non è detto che il tuo dataset ti fornisca
tutte le informazioni necessarie. In certi
casi potresti essere tu a poterlo
arricchire, aggiungendo nuove colonne
con specifiche informazioni. In parte
potresti averlo già fatto, seguendo le
istruzioni del paragravo “DIVIDI”, ma
potrebbe anche esserci modo di
arricchire di più.
Arricchisci
Usando lo stesso esempio, dopo che hai
diviso la colonna Luogo in tre colonne
(Comune, Provincia, Regione), ti è utile
inserire Latitudine e Longitudine per
costruire una mappa. Per farlo, inserirai
due nuove colonne (, Latitudine e
Longitudine) e risalirai alle coordinate
geografiche attraverso il luogo di
riferimento.
Arricchisci / Geoconding
Latitudine Longitudine
Arricchisci / Geoconding
Puoi ricavare online le coordinate geografiche. Assicurati
che i dati siano riusabili (con OpenStreetMap si può, con
GoogleMap invece con limiti). Un tool per farlo è questo
tools.dataninja.it/geocoder/ ma ce ne sono tanti, cercali! L’
importante è che i dati siano riusabili (si può con
OpenStreetMap, non si può con GoogleMap.