Upload
digisam
View
1.065
Download
3
Embed Size (px)
DESCRIPTION
Peter Krantz presentation på Riksarkivet 21 januari 2013.
Citation preview
DATA
LÄNKADE DATA
LÄNKADE ÖPPNADATA
ÖPPNADATA
Agenda
• Nyttan med öppna data• Introduktion till länkade öppna data
Några viktiga begrepp
1. Data?2. PSI?3. Öppna data?4. Öppna offentliga data?
1. Data?
• Råmaterial för digitala tjänster• Strukturerad information i form av t.ex. bilder,
text, siffror mm.
2. PSI?
• Public Sector Information – ”data från offentlig sektor”
• PSI-direktivet• PSI-lagen – Lag (2010:566) om
vidareutnyttjande av handlingar från den offentliga förvaltningen
3. Öppna data?
“Data kan kallas öppna data om vem som helst fritt får använda, återanvända och distribuera dessa med som största motprestation att ange källa eller krav på att dela data på samma sätt.”
opendefinition.org
Kan man ta betalt och kalla det öppna data?
NEJ
4. Öppna offentliga data
Offentliga data“PSI”
Öppna data
Öppna offentliga data
Utgångsläge i Sverige
• Tillgång till handlingar för vidareutnyttjande sedan 1766-ish
• Omfattande insamling och behandling av information i förvaltningen
• Elektroniskt tillgängliga informationssamlingar av hög kvalitet
• Som huvudregel får offentlig information (upprättade handlingar) fritt vidareutnyttjas
Före PSI-lagen• Tryckfrihetsförordningen (1766, 1949)• Upphovsrättslagen (1960)• Arkivlagen (1990)• Kommunallagen (1991)• Avgiftsförordningen (1992)• Personuppgiftslagen (1998)• Konkurrenslagen (2008)• Offentlighets- och sekretesslag (2009)• + ett antal registerförfattningar
Efter PSI-lagen• Tryckfrihetsförordningen (1766, 1949)• Upphovsrättslagen (1960)• Arkivlagen (1990)• Kommunallagen (1991)• Avgiftsförordningen (1992)• Personuppgiftslagen (1998)• Konkurrenslagen (2008)• Offentlighets- och sekretesslag (2009)• + ett antal registerförfattningar• PSI-lagen (2010)
Men…
• Reaktiv offentlighetsprincip• Ofta krångliga villkor för återanvändning av
information från svenska myndigheter
Nyttan med öppna data
Nyttan med data uppstår när de används
Tre huvudargument
1. Insyn i offentlig sektor2. Kommersiella möjligheter med
vidareförädling3. Flera alternativa tjänster – samarbete med
civilsamhället
Insyn i offentlig sektor
• Genom tillgång till data blir det möjligt att förstå hur myndigheter spenderar pengar och presterar.
• Förtroende för offentlig sektor.
Kommersiella möjligheter med vidareförädling
1. Värdet av ökad tillgång till offentliga data är stort. För öppna data är den potentiella nyttan ca 10 miljarder kr/år.
2. Flera företag som livnär sig på det redan idag.
EU/Graham Vickery: PSI reuse
I omvärlden…
Pricing of Public Sector Information Study
• När priset blev 0 ökade användningen av data med mellan 1 000% och 10 000%.
• Utan avgifter försvann transaktionskostnader och administration.
• Intäkter utgör ofta en mycket liten del av budgeten.
• Drastiska prissänkningar ger ibland samma intäktsnivå.
För väderdata…
I USA finns det ca 400 företag och 4000 anställda som lever på att förädla offentlig väderdata till nya tjänster. Motsvarande siffra i EU är ca 30 företag och 300 anställda.
Källa: Borders in Cyberspace - Deriving Maximum Benefitfrom Public Investment in Scientific Data Retention:http://www.authorstream.com/Presentation/Davide-45234-Weiss-presentation-Borders-Cyberspace-Deriving-Maximum-Benefitfrom-Public-Investment-presentat-Education-ppt-powerpoint/
Exempel på effekt av öppna data
Medicinera.se
Res i STHLM
• 250 000 nedladdningar• Mer än 80 000 dagliga
användare• …bara i Stockholm
Reseapplikationer Tågtider ResiSTHLM STHLM Travelling
USA: Apps for democracy
0.3 Mkr i prispengar gav 47 e-tjänster värda 18.2 Mkr
Källa: http://www.mckinsey.com/clientservice/publicsector/pdf/TG_MoG_Issue4_egov.pdf
Introduktion till länkade öppna data”Linked open data”
LOD
The Semantic Web”the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications”
Webben som en stor databas
Varför?
Varför länkade data?
• Underlag för att svara på komplexa frågor finns redan
• Men informationen är spridd över flera källor• Det tar lång tid att samla in och bearbeta den • Länkade data är ett sätt att underlätta
användning av data för att besvara komplexa frågor
Idag har vi ofta silos med data som handlar om samma ting
Organisation A Organisation B
…och olika sätt att identifiera de ting som finns
• VIAF:54154627• 498403• August_Strindberg• ” ヨハン・アウグスト・ストリンドベリ”
• …
För den som vill återanvända data är det ofta olika sätt för åtkomst
A B
VIAF:54154627 498403
SOAPXML
MS WORD
Sammantaget blir det svårt att återanvända data från flera källor
Länkade data bygger på webbens principer
Webben byggs av länkar mellan dokument
Dokument tilldelas en globalt unik adress – en URL
http://riksarkivet.se/nyheter/sbl
PROTOKOLL
Med länkade data använder man länkar som identifierare för olika ting
Länk = URI (Uniform Resource Identifier)
Fyra principer för länkade data
1. Användning av URI:er för identifierare för olika ting.
2. Användning av HTTP URI:er för dessa ting så att man kan skapa referenser och slå upp information.
3. Tillhandahållande av maskinläsbar information om ett ting när dess URI anropas. Informationen ska tillhandahållas i ett standardiserat format som t.ex. RDF.
4. Inkludera länkar till relaterade ting i den information som lämnas.
Identifierare för olika ting?
• ”August Strindberg”• ”Röda rummet”• ”Uppsala universitet”
RÖDARUMMET
http://dbpedia.org/resource/August_Strindberg
RÖDARUMMET
http://libris.kb.se/bib/8214323
http://dbpedia.org/resource/Uppsala_Universitet
Uppsala Universitet
Med länkade data använder man gemensamma standarder för att uttrycka information
semantik + struktur
HTTP, RDF, SKOS, OWL…
Samma standarder gör återanvändning enklare
A B
http://dbpedia.org/resource/August_Strindberg
Tänk om man även kunde vara överens om semantik?
fil
Vi kan tilldela identifierare även för begrepp
http://purl.org/dc/terms/creator
skapare
http://purl.org/dc/terms/creator
Kontext
"Designa alltid saker genom att beakta dem i nästa större kontext - en stol i ett rum, ett rum i ett hus, ett hus i en miljö, en miljö i en stadsplan"
Eliel Saarinen
http://thinkexist.com/quotes/eliel_saarinen/
Hur hänger våra data ihop med andras?
Länkade data kan ge fler svar
Hur går man tillväga?
Femstjärnig modell för öppna data
★ Publicera vad du har på webben med en öppen licens
★★ Publicera som strukturerad data
★★★ Använd ett öppet format (t.ex. CSV istället för Excel)
★★★★ Använd URI:er för att identifiera saker så att andra kan peka på dem
★★★★★ Länka dina data till andras för att ge kontext
http://5stardata.info/
Nyttan med data uppstår när den används