Upload
niels-erik-kaaber-rasmussen
View
399
Download
1
Embed Size (px)
DESCRIPTION
Introduktion til datajournalistisk, blandet med eksempler og øvelser. Afholdt 26/02-2014 på RUC.
Citation preview
Datajournalistik – en introduktion
Niels Erik Kaaber Rasmussen, 26/2-2014
Mig, mig, mig
• Uddannelse: Statskundskab/datalogi
• Dataanalysefirma: Buhl & Rasmussen
• Arbejde: DREAM
• Fritid: Dataaktivist
• Interesser: Politik, data, it, åbenhed, EU
• Optaget af åbne data
Twitter: @nilleren
Det datajournalistiske felt
• Tværfagligt felt: Består af journalister, der har lært sig it, it-folk der har lært om journalistisk og designere.
• Svagt teoretisk funderet. Tendenser > teori.
• Generaliseringer ud fra eksempler
• Metode
• Videnskab?
• Kend din kommune• Kommuneindeks• Budgetter 2• Offentlighedslov, Afstemninger i EP, Afstemninger i FT.• Selskabsskat (artikel) (TV2 kort)• Firmaskat.dk• Giftgrunde• Analyse af nytårstaler• Stemmemønstre i FT• Vi kunne have ejet hele verden• Skat (DR)• New York Times• Guardian
Inspiration – et par eksempler
Opret egen ide til datajournalistisk mini-projekt på:
ruc2602.hackdash.org
Hvad er data?
• “Factual information, especially information organized for analysis or used to reason or make decisions” (thefreedictionary.com)
• Data er ikke bare tal!
• Kan være tal, ord, lyd, billeder, metadata.
• Men data behandles kvantitativt.
Hvad er journalistik?
{blank dias}
Hvad er journalistik?
• “writing designed for publication in a newspaper or magazine” (Webster)
• “a method of inquiry and literary style that aims to provide a service to the public by the dissemination and analysis of news and other information” (Wikipedia)
Hvad er datajournalistik?
• En metode. Den journalistiske metode kan også omfatte web- og dataarbejde.
• Et produkt. Det journalistiske produkt kan også være digitalt og udnytte digitale muligheder.
• Det journalistiske begreb udvides. Men hvordan afgrænses det?
Hvad er datajournalistik?
• Dataanalyse er et centralt element i historiens tilblivelse
• Produceres af, i og for en medieorganisation
• Der skal være taget hensyn til nyhedskriterierne
• Der skal være en vinkel
• Der skal være fokus på historien
• Anvender andre præsentationsformer end tekst og billeder
Dataforståelse og it-
kundskaber
Design, visuel formidling
Journalistik
Dataforståelse og it-
kundskaber
Design, visuel formidling
Journalistik
Flere eksempler
• Datajournalistik uden dataforståelse II –pointe: hav respekt for fagkundskab
• Datajournalistik uden journalistik II III & IIII –pointe: ikke al ting er journalistik
• Datajournalistisk uden visuel formidling –pointe: du kan gøre det bedre
Fremover
• Mindre teknologi-fokus
• Noget alle kan og gør
• Flyder sammen med andre professioner
Trin i arbejdsprocessen
1. Ide
2. Dataindsamling
3. Datastrukturering
4. Statistisk analyse
5. Vinkling
6. Visuel præsentation
7. Digital formidling
Faldgrupper
• Tilgængelighed af data afgør, hvad du kigger på
• Datas opbygning afgør, hvordan du ser på data
• Teknologi afgør, hvordan du behandler og præsenterer data
• Glemmer datakvalitet og at data repræsenterer en virkelighed
Hvornår er et datasæt interessant (for en journalist)?
• Nyhedskriterierne eller er data anderledes?
• Aktualitet
• Væsentlighed
• Konflikt
• Identifikation
• Sensation
Hvor finder du data?
Offentlige data
• Datakataloget
• DST har massere god data
• Udlandet: Publicdata.eu, Eurostat, World Bank, nationale datakataloger.
• Spørg fagpersoner
• Brug offentlighedsloven (FOI)
• Kend til PSI-direktivet
Webscraping
API
• DST's databank
• EU data API
• Folketinget på vej med API
• Twitter, Facebook
Del dine data
• Dokumenter din fremgangsmåde: ”Sådan gjorde vi”
• Link til dine datakilder
Åbne data
• Data der er frit tilgængelig og kan videreanvendes og videregives uden nogle økonomiske eller andre begrænsninger
Åbne data – hvorfor?
• Gennemsigtighed
• Social og kommerciel værdi
• Deltagelse og ”empowerment”
• Vækst > civilsamfund
Indhent data til jeres projekt.
Indlæs data i Excel/OpenCalc/Database/R/SPSS
eller tilsvarende
Dataformater
• Dataformater. Vælg (om muligt) noget du kender og forstår. Så simpelt som muligt.
• CSV, XML, JSON, TXT
Åbne standarder
Pivot-tabeller
Basal statistik
• Deskriptiv statistik
• Korrelationsanalyse
• Regressionsanalyse
• Sandsynlighedsteori
• Stokastiske variable og sandsynlighedsfordelinger
• Stikprøveudvælgelse og stikprøvefordelinger
Beskrivelse af data. Basal deskriptiv statistik
• Forstå data
• Ser tallene umiddelbart realistiske ud
Få overblik over data: Find mønster i data, antal observationer,
fordeling, min, maks., middel, top 10, bund 10
Pause
Find historien i det valgte datasæt- vælg en vinkel
Autogenererede nyheder
• Generer tekst semi-automatisk ud fra data
• Lyder mere (teknisk)avanceret end det er
• Kan gøres med simple if/hvis-funktioner i Excel
• Bliver hurtigt grammatisk og sprogligt kompliceret
Big data
• Big data er et begreb indenfor datalogi, der bredt dækker over indsamling, opbevaring, analyse, processering og fortolkning af enorme mængder af data.
• Eksempler: Google, marketing, Amazon, sociale medier, nyhedsovervågning
Smalldata
Datasæt der uden videre kan opbevaresog databehandles på en almindelig pc.
Eksempel: Afstemningsresultat i FT vedsalg af DONG-aktier, omkomnebådflygtninge, klassens karakterliste.
Bigdata vs. smalldata
“Size in itself doesn’t matter – what matters is having the data, of whatever size, that helps us solve a problem or address the question we have.” – Rufus Pollack OKFN
Bigdata vs. smalldata
Hvis dit data ikke er interessant i små mængder, er det højst sandsynligt også uinteressant som big data.
Mønstre i metadata kan være interessante –men hav altid øje for mikro-historien.
It-værktøjer
• Manyeyes
• Googlecharts
• Datawrapper
• Tableau
• Værktøjer til webjournalister
Farvevalg
Vær opmærksom på:
• Kontraster
• Farveblinde
• Symbolik og signalværdi
• Æstetik
Adgang forbudt
Adgang forbudt
Flere eksempler
• Udvikling i EU-lovgivning
• Befolkningsudvikling
• Supermand 50 år
• Where Does My Money Go
Visualiser data
Fremhæv den valgte vinkel. Præsenter data på indbydende vis.
Brug gerne eksisterende out-of-the-box værktøjer. En prototype eller til
nød en skitse er tilstrækkelig.
Journalister stopper når problemet er identificeret
• Dataindsamling > datastrukturering > dataanalyse > datapræsentation > ???
• Data kan være en del af løsningen
• Når data integreres fuldt ud i en løsning er den sjældent synlig som data
• Eksempler: Trafikregulering, medieovervågning, BI, nabohjælp, skolesystemet
Skridtet efter en (interaktiv) visualiseringer.
• WhatDoTheyKnow
• FixMyStreet
• WriteToThem
• Abgeordnetenwatch
• Parlamentet
• Valgtest
• ”Det mener du”
Beskriv hvorledes jeres mini-projekt kan udvikles til noget mere end "bare" en (interaktiv) visualisering af en historie baseret på data
Præsentation af miniprojekt