31
서서서 Linked Data 서서서 서서 서서 서서 서서서서서 서서서 서서서서 서서 Open Knowledge Foundation Korea, 201

서울시 링크드 데이터 서비스 사례 소개-모델링

Embed Size (px)

DESCRIPTION

서울시 링크드 데이터 서비스 사례 소개

Citation preview

Page 1: 서울시 링크드 데이터 서비스 사례 소개-모델링

서울시 Linked Data 서비스 사례 소개오픈 데이터에서 링크드 데이터로 진화

Open Knowledge Foundation Korea, 2013

Page 2: 서울시 링크드 데이터 서비스 사례 소개-모델링

구축 범위Modeling

- 서울시 열린데이터광장 데이터 중 시범과제에 적합한 데이터셋 선정 ( 문화시설 ) - 추가로 문화재청 데이터와 행정구역 모델링

문화재(

문화재청 )

문화재(

문화재청 )

문화시설(

열린데이터광장 )

문화시설(

열린데이터광장 )

행정구역행정구역

Page 3: 서울시 링크드 데이터 서비스 사례 소개-모델링

모델링 주안점 ( 방향 )Modeling

3

표현력 보다는 기존 데이터의 연결을 통한 Linked Data 구성

기존 Vocabulary의 재사용을 통한 모델링 - dc, dcterm, foaf, sioc, schem.org 등

11

22

33

44

외부 데이터셋과의 연결성 강화 (dbpedia) - 구축된 데이터의 silo 경계

영어권에서도 활용 가능한 영문 레이블 동시 제공

Page 4: 서울시 링크드 데이터 서비스 사례 소개-모델링

구축절차Modeling

데이터셋 선정

4

11

* 서울시 열린데이터 광장에서 모델링 대상 데이터셋 선정 ( 문화시설 )* 문화재청 , 행정구역 모델링 추가

데이터셋 항목 검토 및 매핑22

* 데이터셋의 개별 항목과 온톨로지 ( 클래스 , 속성 ) 의 매핑 관계 검토* 외부 어휘의 재사용 여부 및 범위 결정* 어휘와 데이터셋 항목 매핑

URI 체계 결정 및 온톨로지 설계 완료33

* 클래스 , 속성 , 인스턴스 URI 체계 결정* 온톨로지 모델링

Page 5: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 1. Raw DataModeling

5

Page 6: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 1. Raw DataModeling

6

필드명 필드설명 사용여부id 일련번호 Xfacility_code 문화시설코드 ?management_code 관리번호 Xsubject_code 주제분류코드 Xtheme_code 테마분류코드 Xfacility_name 문화시설명 Oregion1 시도 Oregion2 군구 Oregion3 읍면동 Osan_yn 산지여부 Obon_yn 산지여부 Obu_yn 산지여부 Omain_img 대표이미지 Oaddress 주소 Ophone 전화번호 Ofax 팩스번호 Ohomepage 홈페이지 Oopen_hour 관람시간 Oenter_fee 관람료 Oclose_day 휴관일 Oopen_day 개관일자 Oseat_cnt 객석수 Ox_coord x좌표 Oy_coord y좌표 Oetc_desc 기타사항 Ofacility_desc 시설소개 Oenter_free 무료구분 Xx_wgs84 위도 Oy_wgs84 경도 Ofacility_name_eng 영문명 Oaddress_eng 영문주소(Full) Ozipcode 우편번호 Oserial 시리얼 Xaddress_kor 주소(시/구/동) Oaddress_eng2 영문주소2 O

Page 7: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 2. GroupingModeling

7

Page 8: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 3. 기존 Vocabulary 분석Modeling

Page 9: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 3. 기존 Vocabulary 분석Modeling

Page 10: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 4. 클래스 , 속성 모델링 진행Modeling

문화시설 초기 클래스 구조

Page 11: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 5. schema.org 재사용 상의 이슈Modeling

schema.org 클래스 구조

Page 12: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 5. schema.org 재사용 상의 이슈Modeling

Another Type System 사용

Place

CivicStructure

Musieum

국립중앙박물관

type

장소

이름구청문화예술회관구민회관영화관박물관갤러리기념관전시관궁국악원문화원수련관

type

전시시설

박물관 기념관 갤러리

type 열거형 타입 시스템

계층형 타입 시스템

Schema.org 클래스

Page 13: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 6. 모델링을 위한 공유 TemplateModeling

( 최종본 아님 )

Page 14: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화시설 – 7. 문화시설 온톨로지 명세서Modeling

http://lod.datahub.kr/

Page 15: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재– 문화재청 데이터 활용Modeling

15

Page 16: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재– 1. 문화재청 Raw DataModeling

16

Page 17: 서울시 링크드 데이터 서비스 사례 소개-모델링

17

data.seoul.go.kr

필드명 필드설명 사용여부 비고id 아이디 변경됨(x->o)category 종목명 O 종목(열거형), 지정번호로 구분category_eng 종목명_영문 O name{@en}name 이름 X 한자 포함된 전체 이름eng_name 이름(영어) O name{@en}kor_name 이름(한글) O name{@ko}ch_name 이름(한자) O name{@zh}class 분류 Xclass1 분류 Oclass2 분류 Oclass3 분류 Oclass4 분류 Oconcept 문화재청(SKOS) 분류명 O 문화재분류 매핑을 위해 추가한 필드quantity 수량 Odesignate 지정일 O 문화재 지정일address 소재지 O address에서 주소 부분만 추출address_cls1 시도 Oaddress_cls2 시군구 Oaddress_cls3 읍면동 Oaddress_cls1_eng 시도(영문) Oaddress_cls2_eng 시군구(영문) Oaddress_cls3_eng 읍면동(영문) Oaddress_cls4_eng X 데이터 없음age 시대 O 열거형owner 소유자 Oowner_eng 소유자(영문) O name{@en}manager 관리자 Omanager_eng 관리자(영문) O name{@en}detail 관리기관 연락처 ?Contents 설명 O

image_url 이미지URL O 링크가 ';' 구분으로 복수개로 되어 있음. 확장자: JPGqrcode_url QR이미지 O

movie_url 동영상URL O 링크가 ';' 구분으로 복수개로 되어 있음, 확장자: WMVstreet-code X 데이터 없음building-num X 데이터 없음

문화재청 데이터 필드 및 사용여부 결정

Page 18: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재 – 2. 외부 어휘 분석Modeling

Europeana의 EDM(European Dana Model) - http://www.europeana.eu/schemas/edm/

Page 19: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재 – 3. 문화재 클래스 구조Modeling

국보 | 보물 | 사적 | 명승 | 천연기념물 | 중요무형문화재 | 중요민속문화재 | …

Page 20: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재 – 4. 문화재 분류체계 모델링Modeling

class1 class2 class3 class4유적건조물 정치국방 성 성곽시설유적건조물 종교신앙 불교 탑기록유산 서각류 금석각류 비유적건조물 종교신앙 불교 탑유적건조물 종교신앙 불교 석등유적건조물 종교신앙 불교 탑기록유산 서각류 금석각류 비기록유산 서각류 금석각류 비유적건조물 종교신앙 불교 탑유적건조물 종교신앙 불교 탑유적건조물 종교신앙 불교 탑유적건조물 종교신앙 불교 석등유적건조물 종교신앙 불교 불전유적건조물 종교신앙 불교 불전유적건조물 종교신앙 불교 불전유적건조물 종교신앙 불교 탑유적건조물 종교신앙 불교 석등유적건조물 종교신앙 불교 불전유적건조물 종교신앙 불교 불전유적건조물 종교신앙 불교 탑유적건조물 종교신앙 불교 탑유적건조물 교통통신 교통 교량유적건조물 교통통신 교통 교량유적건조물 종교신앙 불교 불전기록유산 서각류 금석각류 비유물 불교조각 금속조 불상유물 불교조각 금속조 불상유물 불교조각 금속조 불상유물 불교공예 의식법구 의식법구유적건조물 종교신앙 불교 탑유물 과학기술 천문지리기구 천문기록유산 서각류 목판각류 판목류기록유산 서각류 금석각류 비

문화재청 웹사이트 분류체계

Page 21: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재 – 4. 문화재 분류체계 모델링 이슈Modeling

Another type or subject?

SKOS 적용 여부

11

22

33

44

문화재청 분류모델과 RDF 모델의 불일치

분류체계로서의 대표성

Page 22: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재 – 4. 문화재 분류체계 모델링 이슈Modeling

Page 23: 서울시 링크드 데이터 서비스 사례 소개-모델링

문화재 – 5. Temporal 모델링Modeling

age 필드값 URI (PeriodOfTime )매핑 인스턴스 이름

선사시대 http://ko.wikipedia.org/wiki/ _선사 시대 PrehistoryicAge

석기시대 http://ko.wikipedia.org/wiki/ _석기 시대 StoneAge

청동시대 http://ko.wikipedia.org/wiki/ _청동기 시대 BronzeAge

철기시대 http://ko.wikipedia.org/wiki/ _철기 시대 IronAge

삼국시대 http://ko.wikipedia.org/wiki/ _삼국 시대 ThreeKingdoms

고구려 http://ko.wikipedia.org/wiki/고구려 Goguryeo

백제 http://ko.wikipedia.org/wiki/백제 Baekje

신라 http://ko.wikipedia.org/wiki/신라 Silla

가야 http://ko.wikipedia.org/wiki/가야 Gaya

발해 http://ko.wikipedia.org/wiki/발해 Balhae

통일신라 http://ko.wikipedia.org/wiki/통일신라 UnifiedSilla

고려시대 http://ko.wikipedia.org/wiki/고려 Goryeo

조선시대 http://ko.wikipedia.org/wiki/조선 Joseon

대한제국시대 http://ko.wikipedia.org/wiki/대한제국 GreatHanEmpire

일제강점기 http://ko.wikipedia.org/wiki/ _일제 강점기 JapaneseImperialism

Page 24: 서울시 링크드 데이터 서비스 사례 소개-모델링

대한민국 행정구역을 의미적으로 표현하기 위한 정의

행정구역은 국가마다 다름 - 특별시 , 광역시 , 도 , 시 , 군 , 구 , 읍 , 면 , 동 , 리로 구분 - 1 개의 특별시 , 6개의 광역시 , 8개의 도 , 1개의 특별자치시 , 1개의 특별자치도로 구성

행정구역 – 행정구역 온톨로지 모델링Modeling

Page 25: 서울시 링크드 데이터 서비스 사례 소개-모델링

행정구역 – 1. Raw DataModeling

25

Page 26: 서울시 링크드 데이터 서비스 사례 소개-모델링

행정구역 – 2. 행정구역 온톨로지 모델링Modeling

Page 27: 서울시 링크드 데이터 서비스 사례 소개-모델링

행정구역 – 3.행정구역 인스턴스 구축Modeling

Page 28: 서울시 링크드 데이터 서비스 사례 소개-모델링

hasGu 구

hasDong

A 안 >

B 안 >

include

include

행정구역 – 4.행정구역 모델링 이슈Modeling

Page 29: 서울시 링크드 데이터 서비스 사례 소개-모델링

*

Vocabulary

Vocabulary - /def/{vocabulary}Classes - /def/{vocabulary}/{class}Document - /def/{vocabulary}/{property}

Class

http://lod.datahub.kr/def/cf

http://lod.datahub.kr/def/cf/Museum

Facilityhttp://lod.datahub.kr/def/cf/

collects

* Class의 첫글자는 영문 대문자 , Property는 소문자를 사용함

303 See other

URIs for Ontology VocabularyModeling

Page 30: 서울시 링크드 데이터 서비스 사례 소개-모델링

URIs for Real-World ThingsModeling

*

Culture Facilities

Things - /id/{type}/{id} - /id/{type}/{id}/{child-type}/{child-id}Document - /doc/{type}/{id} - /doc/{type}/{id}/{child-type}

List

http://lod.datahub.kr/id/cf

http://lod.datahub.kr/doc/cf

303 See other

Facility

http://lod.datahub.kr/id/cf/123456

* id 형식 및 값에 대한 의사결정 필요

Page 31: 서울시 링크드 데이터 서비스 사례 소개-모델링

이후 진행 계획Modeling

행정구역 , 우편번호 등 인프라 온톨로지 구축

서울시 문화시설 전국 주요 기관 , 시설로 확대

11

22

33

44

온톨로지 스키마 고도화

파편화 되어있는 Raw Data를 Linked Data로…