24
Connected Knowledge and Tools #1 – Seoul City 오오 오오오오오 오오오 오오오오 오오 Open Knowledge South Korea, 2015

CKAT (Connected Knowledge and Tools) #1 - Seoul City

Embed Size (px)

Citation preview

Page 1: CKAT (Connected Knowledge and Tools) #1 - Seoul City

Connected Knowledge and Tools #1 – Seoul City

오픈 데이터에서 링크드 데이터로 진화

Open Knowledge South Korea, 2015

Page 2: CKAT (Connected Knowledge and Tools) #1 - Seoul City

목차

1. Connected Knowledge and Tools #1 - Seoul City 2. Linked Data 서비스 플랫폼

- 시스템 아키텍처

- 시각화 도구

3. Linked Data 모델링

- 행정구역 모델링 사례

- 참고 문헌

2

Page 3: CKAT (Connected Knowledge and Tools) #1 - Seoul City

1. Connected Knowledge and Tools #1 - Seoul City

오픈 데이터에서 링크드 데이터로 진화

( https://github.com/Open-Knowledge-Korea/ )

Page 4: CKAT (Connected Knowledge and Tools) #1 - Seoul City

열린 데이터의 품질 및 접근성의 향상을 통한 활용성 증가필요성

- 서로 다른 데이터셋 사이의 관계 정의 어려움- 서로 다른 유형의 데이터를 연결 및 통합하기 어려움

- 상세한 정보보다 단순한 메타데이터 리스트를 제공하고 있음- 이종의 데이터셋에 존재하는 동일한 값을 구분하기 어려움

- 한글 데이터는 한국어를 이해하는 사용자로 접근이 제한- 도시 중심의 오픈 데이터 공개 통한 협력 가능성 제한

321 단편적인 데이터 연결되지 않은 데이터 접근이 제한된 데이터

4

Page 5: CKAT (Connected Knowledge and Tools) #1 - Seoul City

데이터 사이의 의미적 연결을 통한 Data Enrichment 실현목표

개별 데이터셋과 외부 데이터 연결을 통한 데이터 표현력 향상1* 서울시 열린 데이터 사이의 연결 관계 구축을 통한 데이터 활용성 증가* Linked Data 와 연결을 통한 데이터 항목의 상세 정보 및 관련 정보 확보* 콘텐트 생산 및 유지 비용 감소

웹 표준 기반 열린 데이터셋의 의미적 연결 관계 구축2* 서로 다른 형식의 데이터셋을 웹 표준에 기반하여 표현 및 통합할 수 있음* 새로운 데이터셋을 연계하기 위한 수정 비용 최소화 및 확장 용이성 확보* 타기관 데이터셋과 연계 및 통합을 위한 데이터모델 확보

데이터 영문 변환 및 Linked Data 적용을 통한 접근성 확대3* 비한국어 사용자의 데이터 접근성 향상을 통한 데이터 활용 사례의 다변화* 세계 도시와 데이터 공개 전략 및 사례 공유를 할 수 있는 기반 확보* 서울 열린 데이터와 외부 오픈 데이터의 연계를 통한 데이터 레퍼런스 역할 확보

5

Page 6: CKAT (Connected Knowledge and Tools) #1 - Seoul City

2. Linked Data 서비스 플랫폼오픈 데이터에서 링크드 데이터로 진화

( https://github.com/Open-Knowledge-Korea/ckat-seoul-web )

Page 7: CKAT (Connected Knowledge and Tools) #1 - Seoul City

데이터 분석 및 변환 Linked Data 시스템 구현

구축 방법 및 범위

데이터 모델링 데이터 상세화

열린 데이터 광장의 데이터를 RDF (Linked Data) 로 변환

1 2 3 4

- 문화재 데이터- 문화시설 데이터- 지하철 데이터- 행정구역 데이터- Excel to RDB

- 공통 항목 추출- RDF 어휘 검토 및 공통 어휘 추출- 온톨로지 모델링- 온톨로지 명세서 개발- Named Entity URI 설계 규칙 명세서 개발

- Linked Data 설계- SameAs 관계 도출 * 동일한 관계 표현- seeAlso 관계 도출 * 추가 정보 표현- 데이터 연결 * 내부 데이터 간 연계 * 외부 데이터 연계

- RDF 데이터 유효성 검사- RDF 파일 생성- SPARQL Endpoint 구현- Visualization 구현

수행 기간 : 1 주 수행 기간 : 3 주수행 기간 : 3 주 수행 기간 : 3 주

총 10 주7

Page 8: CKAT (Connected Knowledge and Tools) #1 - Seoul City

8

Page 9: CKAT (Connected Knowledge and Tools) #1 - Seoul City

9

Page 10: CKAT (Connected Knowledge and Tools) #1 - Seoul City

Seoul City 프로젝트 결과 https://github.com/Open-Knowledge-Korea/ckat-seoul-web

산출물

10

- 다양한 옵션에 따라 데이터를 탐색할 수 있는 도구

- 데이터 사이의 의미적 관계를 시각적으로 보여주는 도구

- 시범사업에서 구축한 데이터를 질의 /검색하는 인터페이스

321 시맨틱 관계 탐색 패싯 네비게이션 시맨틱 질의 /검색

Page 11: CKAT (Connected Knowledge and Tools) #1 - Seoul City

시각화 도구 1서비스

11

1) 시맨틱 관계 탐색 : http://lod.datahub.kr/projects/seoul/relFinder/ad/

Page 12: CKAT (Connected Knowledge and Tools) #1 - Seoul City

12

2) 패싯 네비게이션 : http://lod.datahub.kr/projects/seoul/relFinder/ad/

시각화 도구 2서비스

Page 13: CKAT (Connected Knowledge and Tools) #1 - Seoul City

13

3) 시맨틱 질의 검색 : http://lod.datahub.kr/projects/seoul/endpoint/ad

시각화 도구 3서비스

Page 14: CKAT (Connected Knowledge and Tools) #1 - Seoul City

3. Linked Data 모델링오픈 데이터에서 링크드 데이터로 진화

( https://github.com/Open-Knowledge-Korea/ckat-ontology/ )

Page 15: CKAT (Connected Knowledge and Tools) #1 - Seoul City

구축절차모델링

데이터셋 선정

15

1* 서울시 열린데이터 광장에서 모델링 대상 데이터셋 선정 ( 문화시설 )* 문화재청 , 행정구역 모델링 추가

데이터셋 항목 검토 및 매핑2* 데이터셋의 개별 항목과 온톨로지 ( 클래스 , 속성 ) 의 매핑 관계 검토* 외부 어휘의 재사용 여부 및 범위 결정* 어휘와 데이터셋 항목 매핑

URI 체계 결정 및 온톨로지 설계 완료3* 클래스 , 속성 , 인스턴스 URI 체계 결정* 온톨로지 모델링

Page 16: CKAT (Connected Knowledge and Tools) #1 - Seoul City

구축 범위모델링

16

- 서울시 열린데이터광장 데이터 중 시범과제에 적합한 데이터셋 선정 ( 문화시설 ) - 문화재청 데이터와 행정구역 데이터 통합을 위한 모델링 실시

문화재(

문화재청 )

문화시설(

열린데이터광장 )

행정구역

Page 17: CKAT (Connected Knowledge and Tools) #1 - Seoul City

모델링 주안점 ( 방향 )모델링

17

표현력 보다는 기존 데이터의 연결을 통한 Linked Data 구성

기존 Vocabulary 의 재사용을 통한 모델링 - dc, dcterm, foaf, sioc, schem.org 등

1

2

3

4

외부 데이터셋과의 연결성 강화 (dbpedia) - 구축된 데이터의 silo 경계

영어권에서도 활용 가능한 영문 레이블 동시 제공

Page 18: CKAT (Connected Knowledge and Tools) #1 - Seoul City

대한민국 행정구역을 의미적으로 표현하기 위한 정의

행정구역은 국가마다 다름 - 특별시 , 광역시 , 도 , 시 , 군 , 구 , 읍 , 면 , 동 , 리로 구분 - 1 개의 특별시 , 6 개의 광역시 , 8 개의 도 , 1 개의 특별자치시 , 1 개의 특별자치도로 구성

18

모델링

행정구역 온톨로지 모델링 https://github.com/Open-Knowledge-Korea/ckat-knowledge-model

Page 19: CKAT (Connected Knowledge and Tools) #1 - Seoul City

행정구역 – 1. Raw Data 수집모델링

19

Page 20: CKAT (Connected Knowledge and Tools) #1 - Seoul City

20

모델링

행정구역 – 2. 클래스 및 속성 설계

Page 21: CKAT (Connected Knowledge and Tools) #1 - Seoul City

21

모델링

행정구역 – 3. 행정구역 인스턴스 구축

Page 22: CKAT (Connected Knowledge and Tools) #1 - Seoul City

hasGu 구

hasDong

A 안 >

B 안 >

include

include

22

모델링

행정구역 – 4. 행정구역 모델링 이슈

Page 23: CKAT (Connected Knowledge and Tools) #1 - Seoul City

URI 모델링 가이드라인참고문헌

23

1. Cool URIs for the Semantic Web, http://www.w3.org/TR/cooluris/2. Creating URIs, http://data.gov.uk/resources/uris3. Designing URI Sets for Location, http://location.defra.gov.uk/ wp-content/uploads/2010/04/Designing_URI_Sets_for_Location-Ver0.5.pdf4. 223 Best Practices URI Construction, www.w3.org/2011/gld/wiki/223_Best_Practices_URI_Construction5. Cool URIs don’t change, http://www.w3.org/Provider/Style/URI6. URI Design Principles: Creating Unique URIs for Government Linked Data, http://logd.tw.rpi.edu/instance-hub-uri-design

Page 24: CKAT (Connected Knowledge and Tools) #1 - Seoul City

24

For more information

contact Open Knowledge Korea

via - http://okfn.kr- https://www.facebook.com/ groups/OKFNKorea/- [email protected]

Or see more activities at:http://lod.datahub.kr