23
3.4 - Osserva i tuoi dati: raffina

3.4 Osserva i tuoi dati - raffina

Embed Size (px)

Citation preview

3.4 - Osserva i tuoi dati: raffina

3.4.1 Intro: raffina i dati per usarli al meglio

I dati che hai a

disposizione

potrebbero dirti tante

cose del fenomeno

che stai osservando.

Per farli “parlare” cerca di capirli a pieno.

● Qual è il loro significato reale?

● Cosa definiscono?

● Quali sono le loro caratteristiche principali?

3.4.2 Le caratteristiche dei tuoi dati: geografiche, temporali, qualitative

Dati Geografici

I tuoi dati potrebbero

contenere informazioni

anche di tipo geografico.

Dirti cioè qual è la misura

di un fenomeno su un

determinato territorio.

Dati Geografici

○ A quale territorio sono riferiti?

Nazionale, regionale, provinciale o

comunale?

○ Qual è il nesso tra questo territorio e il

progetto da te scelto su OpenCoesione

e che stai approfondento?

○ Quali informazioni aggiuntive potrai

raccogliere analizzando le informazioni

geografiche dei tuoi dati?

Serie storiche

I dati possono permettere

di analizzare l’andamento

di un fenomeno nel

tempo e misurarne le

variazioni (per esempio da

un mese all’altro o da un

anno all’altro).

Serie storiche / Esempi

La raccolta

differenziata dei

rifiuti è aumentata,

diminuita o rimasta

stabile?

Il fenomeno in

esame è in crescita

o in descrescita

(per esempio, di

mese in mese).

Il numero di turisti

sul un territorio è

costante di anno o

anno o ci sono delle

variazioni?

Dati qualitativi

Si tratta di dati che

definiscono le

qualità e le

caratteristiche

intrinseche di uno o

più oggetti.

Dati qualitativi / Esempi

Un esempio: Prodotti tipici trentini (da OpenData

Trentino). Sono dati dei singoli prodotti, ciascuno

viene definito per tipologia, luogo di produzione,

link di approfondimento. Si tratta di qualità

aggiungive del dato disponibili per il fruitore.

3.4.3 Pulisci i tuoi dati

Prima di analizzare i dati è necessario

fare alcune verifiche per renderli

coerenti e sfruttarne al meglio ogni

caratteristiche. Esistono dei metodi

specifici anche in questo caso, e li

passeremo in rassegna in questo

tutorial.

La pulizia dei dati è fondamentale per

assicurarsi che siano strutturati bene

all’interno delle righe e delle colonne e

che i valori inseriti siano coerenti.

Analizzare i dati senza fare un attento

data cleaning potrebbe portare

successivamente a gravi errori o a

difficoltà ingestibili.

Controllare che gli stessi valori siano

scritti allo stesso modo. Ad esempio, è

un errore che il valore “Ambiente” sia

scritto anche “ambiente” e

“AMBIENTE”. Devono essere scritti

tutti in maniera analoga.

1

Controlla le date (se presenti): devono

essere scritte in maniera omogenea. È

un errore se alcune sono inserite in

formato numerico (esempio:

01/03/2015) e altre in formato

alfanumerico (esempio: 10 Marzo

2015). È necessario avere le date in un

solo formato.

2

Verifica la numerazione: quella italiana

è diversa dalla anglosassone. In Italia i

punti (“.”) indicano le migliaia, le

virgole (“,”) indicano i decimali. Per gli

anglosassoni è il contrario. Assicurati

che i numeri siano rappresentati

correttamente. Verifica il sistema di

numerazione su “Impostazioni foglio

di lavoro”.

3

3.4.4 Arricchisci

I dati devono essere granulari, come se fossero degli atomi.

Ad esempio: se i tuoi dati hanno una colonna di luoghi e all’

interno hanno valori simili a questo - “Cologno Monzese,

provincia di Milano (Lombardia)” - è meglio dividere la

colonne in altre tre colonne (Comune + Provincia + Regione).

Così puoi analizzarli per Comune, Provincia, Regione

Dividi

Non è detto che il tuo dataset ti fornisca

tutte le informazioni necessarie. In certi

casi potresti essere tu a poterlo

arricchire, aggiungendo nuove colonne

con specifiche informazioni. In parte

potresti averlo già fatto, seguendo le

istruzioni del paragravo “DIVIDI”, ma

potrebbe anche esserci modo di

arricchire di più.

Arricchisci

Usando lo stesso esempio, dopo che hai

diviso la colonna Luogo in tre colonne

(Comune, Provincia, Regione), ti è utile

inserire Latitudine e Longitudine per

costruire una mappa. Per farlo, inserirai

due nuove colonne (, Latitudine e

Longitudine) e risalirai alle coordinate

geografiche attraverso il luogo di

riferimento.

Arricchisci / Geoconding

Latitudine Longitudine

Arricchisci / Geoconding

Puoi ricavare online le coordinate geografiche. Assicurati

che i dati siano riusabili (con OpenStreetMap si può, con

GoogleMap invece con limiti). Un tool per farlo è questo

tools.dataninja.it/geocoder/ ma ce ne sono tanti, cercali! L’

importante è che i dati siano riusabili (si può con

OpenStreetMap, non si può con GoogleMap.

ESPLORA I TUOI DATI: ANALIZZA

3.5