60
Datajournalistik – en introduktion Niels Erik Kaaber Rasmussen, 26/2-2014

Datajournalistik – en introduktion

Embed Size (px)

DESCRIPTION

Introduktion til datajournalistisk, blandet med eksempler og øvelser. Afholdt 26/02-2014 på RUC.

Citation preview

Page 1: Datajournalistik – en introduktion

Datajournalistik – en introduktion

Niels Erik Kaaber Rasmussen, 26/2-2014

Page 2: Datajournalistik – en introduktion

Mig, mig, mig

• Uddannelse: Statskundskab/datalogi

• Dataanalysefirma: Buhl & Rasmussen

• Arbejde: DREAM

• Fritid: Dataaktivist

• Interesser: Politik, data, it, åbenhed, EU

• Optaget af åbne data

Twitter: @nilleren

Page 3: Datajournalistik – en introduktion
Page 4: Datajournalistik – en introduktion

Det datajournalistiske felt

• Tværfagligt felt: Består af journalister, der har lært sig it, it-folk der har lært om journalistisk og designere.

• Svagt teoretisk funderet. Tendenser > teori.

• Generaliseringer ud fra eksempler

• Metode

• Videnskab?

Page 6: Datajournalistik – en introduktion

Opret egen ide til datajournalistisk mini-projekt på:

ruc2602.hackdash.org

Page 7: Datajournalistik – en introduktion

Hvad er data?

• “Factual information, especially information organized for analysis or used to reason or make decisions” (thefreedictionary.com)

• Data er ikke bare tal!

• Kan være tal, ord, lyd, billeder, metadata.

• Men data behandles kvantitativt.

Page 8: Datajournalistik – en introduktion

Hvad er journalistik?

{blank dias}

Page 9: Datajournalistik – en introduktion

Hvad er journalistik?

• “writing designed for publication in a newspaper or magazine” (Webster)

• “a method of inquiry and literary style that aims to provide a service to the public by the dissemination and analysis of news and other information” (Wikipedia)

Page 10: Datajournalistik – en introduktion

Hvad er datajournalistik?

• En metode. Den journalistiske metode kan også omfatte web- og dataarbejde.

• Et produkt. Det journalistiske produkt kan også være digitalt og udnytte digitale muligheder.

• Det journalistiske begreb udvides. Men hvordan afgrænses det?

Page 11: Datajournalistik – en introduktion

Hvad er datajournalistik?

• Dataanalyse er et centralt element i historiens tilblivelse

• Produceres af, i og for en medieorganisation

• Der skal være taget hensyn til nyhedskriterierne

• Der skal være en vinkel

• Der skal være fokus på historien

• Anvender andre præsentationsformer end tekst og billeder

Page 12: Datajournalistik – en introduktion

Dataforståelse og it-

kundskaber

Design, visuel formidling

Journalistik

Page 13: Datajournalistik – en introduktion

Dataforståelse og it-

kundskaber

Design, visuel formidling

Journalistik

Page 14: Datajournalistik – en introduktion

Flere eksempler

• Datajournalistik uden dataforståelse II –pointe: hav respekt for fagkundskab

• Datajournalistik uden journalistik II III & IIII –pointe: ikke al ting er journalistik

• Datajournalistisk uden visuel formidling –pointe: du kan gøre det bedre

Page 15: Datajournalistik – en introduktion

Fremover

• Mindre teknologi-fokus

• Noget alle kan og gør

• Flyder sammen med andre professioner

Page 16: Datajournalistik – en introduktion

Trin i arbejdsprocessen

1. Ide

2. Dataindsamling

3. Datastrukturering

4. Statistisk analyse

5. Vinkling

6. Visuel præsentation

7. Digital formidling

Page 17: Datajournalistik – en introduktion
Page 18: Datajournalistik – en introduktion

Vælg det miniprojekt du vil arbejde på i dag

ruc2602.hackdash.org

Page 19: Datajournalistik – en introduktion

Faldgrupper

• Tilgængelighed af data afgør, hvad du kigger på

• Datas opbygning afgør, hvordan du ser på data

• Teknologi afgør, hvordan du behandler og præsenterer data

• Glemmer datakvalitet og at data repræsenterer en virkelighed

Page 20: Datajournalistik – en introduktion

Hvornår er et datasæt interessant (for en journalist)?

• Nyhedskriterierne eller er data anderledes?

• Aktualitet

• Væsentlighed

• Konflikt

• Identifikation

• Sensation

Page 21: Datajournalistik – en introduktion

Hvor finder du data?

Page 22: Datajournalistik – en introduktion

Offentlige data

• Datakataloget

• DST har massere god data

• Udlandet: Publicdata.eu, Eurostat, World Bank, nationale datakataloger.

• Spørg fagpersoner

• Brug offentlighedsloven (FOI)

• Kend til PSI-direktivet

Page 23: Datajournalistik – en introduktion

Webscraping

Page 24: Datajournalistik – en introduktion

API

• DST's databank

• EU data API

• Folketinget på vej med API

• Twitter, Facebook

Page 25: Datajournalistik – en introduktion

Del dine data

• Dokumenter din fremgangsmåde: ”Sådan gjorde vi”

• Link til dine datakilder

Page 26: Datajournalistik – en introduktion

Åbne data

• Data der er frit tilgængelig og kan videreanvendes og videregives uden nogle økonomiske eller andre begrænsninger

Page 27: Datajournalistik – en introduktion

Åbne data – hvorfor?

• Gennemsigtighed

• Social og kommerciel værdi

• Deltagelse og ”empowerment”

• Vækst > civilsamfund

Page 28: Datajournalistik – en introduktion

Indhent data til jeres projekt.

Page 29: Datajournalistik – en introduktion

Indlæs data i Excel/OpenCalc/Database/R/SPSS

eller tilsvarende

Page 30: Datajournalistik – en introduktion

Dataformater

• Dataformater. Vælg (om muligt) noget du kender og forstår. Så simpelt som muligt.

• CSV, XML, JSON, TXT

Page 31: Datajournalistik – en introduktion

Åbne standarder

Page 32: Datajournalistik – en introduktion

Pivot-tabeller

Page 33: Datajournalistik – en introduktion

Basal statistik

• Deskriptiv statistik

• Korrelationsanalyse

• Regressionsanalyse

• Sandsynlighedsteori

• Stokastiske variable og sandsynlighedsfordelinger

• Stikprøveudvælgelse og stikprøvefordelinger

Page 34: Datajournalistik – en introduktion

Beskrivelse af data. Basal deskriptiv statistik

• Forstå data

• Ser tallene umiddelbart realistiske ud

Page 35: Datajournalistik – en introduktion

Få overblik over data: Find mønster i data, antal observationer,

fordeling, min, maks., middel, top 10, bund 10

Page 36: Datajournalistik – en introduktion

Pause

Page 37: Datajournalistik – en introduktion

Find historien i det valgte datasæt- vælg en vinkel

Page 38: Datajournalistik – en introduktion

Autogenererede nyheder

• Generer tekst semi-automatisk ud fra data

• Lyder mere (teknisk)avanceret end det er

• Kan gøres med simple if/hvis-funktioner i Excel

• Bliver hurtigt grammatisk og sprogligt kompliceret

Page 39: Datajournalistik – en introduktion
Page 40: Datajournalistik – en introduktion

Big data

• Big data er et begreb indenfor datalogi, der bredt dækker over indsamling, opbevaring, analyse, processering og fortolkning af enorme mængder af data.

• Eksempler: Google, marketing, Amazon, sociale medier, nyhedsovervågning

Page 41: Datajournalistik – en introduktion
Page 42: Datajournalistik – en introduktion
Page 43: Datajournalistik – en introduktion

Smalldata

Datasæt der uden videre kan opbevaresog databehandles på en almindelig pc.

Eksempel: Afstemningsresultat i FT vedsalg af DONG-aktier, omkomnebådflygtninge, klassens karakterliste.

Page 44: Datajournalistik – en introduktion

Bigdata vs. smalldata

“Size in itself doesn’t matter – what matters is having the data, of whatever size, that helps us solve a problem or address the question we have.” – Rufus Pollack OKFN

Page 45: Datajournalistik – en introduktion

Bigdata vs. smalldata

Hvis dit data ikke er interessant i små mængder, er det højst sandsynligt også uinteressant som big data.

Mønstre i metadata kan være interessante –men hav altid øje for mikro-historien.

Page 47: Datajournalistik – en introduktion
Page 48: Datajournalistik – en introduktion

Farvevalg

Vær opmærksom på:

• Kontraster

• Farveblinde

• Symbolik og signalværdi

• Æstetik

Page 49: Datajournalistik – en introduktion

Adgang forbudt

Adgang forbudt

Page 50: Datajournalistik – en introduktion
Page 51: Datajournalistik – en introduktion

http://theopenbudget.org/

Page 52: Datajournalistik – en introduktion
Page 53: Datajournalistik – en introduktion
Page 55: Datajournalistik – en introduktion

Visualiser data

Fremhæv den valgte vinkel. Præsenter data på indbydende vis.

Brug gerne eksisterende out-of-the-box værktøjer. En prototype eller til

nød en skitse er tilstrækkelig.

Page 56: Datajournalistik – en introduktion

Journalister stopper når problemet er identificeret

• Dataindsamling > datastrukturering > dataanalyse > datapræsentation > ???

• Data kan være en del af løsningen

• Når data integreres fuldt ud i en løsning er den sjældent synlig som data

• Eksempler: Trafikregulering, medieovervågning, BI, nabohjælp, skolesystemet

Page 57: Datajournalistik – en introduktion

Skridtet efter en (interaktiv) visualiseringer.

• WhatDoTheyKnow

• FixMyStreet

• WriteToThem

• Abgeordnetenwatch

• Parlamentet

• Valgtest

• ”Det mener du”

Page 58: Datajournalistik – en introduktion

Beskriv hvorledes jeres mini-projekt kan udvikles til noget mere end "bare" en (interaktiv) visualisering af en historie baseret på data

Page 59: Datajournalistik – en introduktion

Præsentation af miniprojekt

Page 60: Datajournalistik – en introduktion

Tak!

Mail: [email protected]

Twitter: @nilleren