Upload
andrea-zedda
View
147
Download
0
Embed Size (px)
DESCRIPTION
Secondo corso ddj a Cagliari
Citation preview
Data journalismFonti, tools e casi di studioCagliari 4 e 5 dicembre 2014
● raccontare una storia interessante fondata su una o più basi di dati
● approfondire determinati argomenti in maniera innovativa
● aiutare il lettore alla comprensione dei dati e delle visualizzazioni
Obiettivi del ddj
FLUSSO DI LAVORO DDJ
TROVARE E PRENDERE I
DATI
ANALIZZARE I DATI
SINTETIZZARE E RAPPRESENTARE I
DATI RACCONTARE UNA STORIA
SISTEMARE E PULIRE I DATI
LE FONTI E LA RACCOLTA
TROVARE E PRENDERE I DATI
LE FONTI E LA RACCOLTA
DATI NON PRONTI PER
ESSERE ELABORATI
DATI GIÀ PRONTI PER
ESSERE ELABORATI
LE FONTI E LA RACCOLTA
DATI NON PRONTI PER L’ELABORAZIONEsono quei dati contenuti in file destinati ad un utilizzo puramente informativo e non adatti all’elaborazione software
❏ pdf❏ pagine web❏ file strutturati ma sporchi
LE FONTI E LA RACCOLTA
PDF CON TABELLEfino a pochi anni fa erano il formato più comune. Ancora oggi sono una fonte potenzialmente ricca anche se scomoda
http://www.pdfsearchengine.net/
LE FONTI E LA RACCOLTA
PDF CON TABELLEè possibile estrarre in maniera automatica i dati anche se sono estremamente numerosi e spalmati in più pagine
http://tabula.technology/
LE FONTI E LA RACCOLTA
SCRAPING DA PAGINE WEBEstrazione di dati strutturati da un sito web per mezzo di programmi software o linguaggi informatici
https://www.kimonolabs.com
https://magic.import.io
LE FONTI E LA RACCOLTA
FILE STRUTTURATI MA SPORCHI❏ spazi vuoti❏ celle unite❏ errori di digitazione❏ maiuscole/minuscole❏ numeri digitati come testo❏ valori digitati in modo
differente (Quartu S.Elena/Quartu Sant’elena)
http://openrefine.org/
http://www.libreoffice.org/
LE FONTI E LA RACCOLTA
DATI GIÀ PRONTI PER L’ELABORAZIONEProgettati per facilitare il riuso, l’integrazione e l’analisi
❏ Fonti della statistica ufficiale (Istat, Eurostat, Banca d’italia, SISTAN..)
❏ Fonti amministrative (open data)
❏ Fonti alternative e “crowd” (wikipedia, openstreetmap...)
❏ Web e social network (twitter, google...)
LE FONTI E LA RACCOLTA
OPEN DATATHE OPEN DEFINITION:
“I dati e i contenuti aperti possono essere liberamente utilizzati, modificati e condivisi da chiunque per qualunque scopo”
LE FONTI E LA RACCOLTA
LICENZE LIBERE
❏ Tutelano l’autore del dato
❏ Tutelano l’utilizzatore dei dati
PULIZIA DEI DATI
SISTEMARE E PULIRE I DATI
PULIZIA DEI DATI
ESPLORAZIONE
PULIZIA
STANDARDIZZAZIONE
INTEGRAZIONE
PULIZIA DEI DATI
ELABORAZIONE DEI DATI
ANALIZZARE I DATI
ELABORAZIONE DEI DATI
❏ totali e subtotali❏ tabelle di contingenza❏ indici❏ medie e mediana❏ percentuali
ELABORAZIONE DEI DATI
TABELLE PIVOTConsentono di effettuare elaborazioni sintetiche su molti dati in maniera estremamente semplice
RAPPRESENTARE I DATI
SINTETIZZARE E RAPPRESENTARE
I DATI
RAPPRESENTARE I DATI
DATA VISUALIZATION
Sintetizzare le informazioni in modo da ottenere una visione d’insieme che semplifichi l’informazione e renda più immediata la comunicazione della notizia
https://datawrapper.de/
http://app.raw.densitydesign.org/
RAPPRESENTARE I DATI
RAPPRESENTAZIONI GEOGRAFICHE
Individuare la distribuzione dei fenomeni e della distribuizione dei dari nel territorio
https://cartodb.com/
https://www.mapbox.com/
RAPPRESENTARE I DATI
RAPPRESENTAZIONI DEI GRAFI
Visualizzare le connessioni tra i nodi di una rete
http://gephi.github.io/
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
mail: [email protected]: @andria_tzedda
GRAZIE