31
Linked Data 모델링 오픈 데이터에서 링크드 데이터로 진화 Open Knowledge Foundation Korea, 2013

Linked Data 이야기

Embed Size (px)

DESCRIPTION

서울시 링크드데이터 사례 - 편집본

Citation preview

Page 1: Linked Data 이야기

Linked����������� ������������������  Data����������� ������������������  모델링����������� ������������������  

오픈����������� ������������������  데이터에서����������� ������������������  링크드����������� ������������������  데이터로����������� ������������������  진화����������� ������������������  

Open����������� ������������������  Knowledge����������� ������������������  Foundation����������� ������������������  Korea,����������� ������������������  2013����������� ������������������  

Page 2: Linked Data 이야기

구축����������� ������������������  범위����������� ������������������  Modeling����������� ������������������  

2

����������� ������������������  -����������� ������������������  서울시����������� ������������������  열린데이터광장����������� ������������������  데이터����������� ������������������  중����������� ������������������  시범과제에����������� ������������������  적합한����������� ������������������  데이터셋����������� ������������������  선정(문화시설)����������� ������������������  ����������� ������������������  -����������� ������������������  추가로����������� ������������������  문화재청����������� ������������������  데이터와����������� ������������������  행정구역����������� ������������������  모델링����������� ������������������  

문화재  (문화재청)

문화시설  (열린데이터광장)

행정구역

Page 3: Linked Data 이야기

모델링����������� ������������������  주안점(방향)����������� ������������������  Modeling

3

표현력����������� ������������������  보다는����������� ������������������  기존����������� ������������������  데이터의����������� ������������������  연결을����������� ������������������  통한����������� ������������������  Linked����������� ������������������  Data����������� ������������������  구성����������� ������������������  

기존����������� ������������������  Vocabulary의����������� ������������������  재사용을����������� ������������������  통한����������� ������������������  모델링����������� ������������������  ����������� ������������������  ����������� ������������������  -����������� ������������������  dc,����������� ������������������  dcterm,����������� ������������������  foaf,����������� ������������������  sioc,����������� ������������������  schem.org����������� ������������������  등����������� ������������������  

1

2

3

4

외부����������� ������������������  데이터셋과의����������� ������������������  연결성����������� ������������������  강화����������� ������������������  (dbpedia)����������� ������������������  ����������� ������������������  ����������� ������������������  -����������� ������������������  구축된����������� ������������������  데이터의����������� ������������������  silo����������� ������������������  경계����������� ������������������  ����������� ������������������  

영어권에서도����������� ������������������  활용����������� ������������������  가능한����������� ������������������  영문����������� ������������������  레이블����������� ������������������  동시����������� ������������������  제공����������� ������������������  

Page 4: Linked Data 이야기

구축절차����������� ������������������  Modeling����������� ������������������  

데이터셋����������� ������������������  선정����������� ������������������  

4

1 *����������� ������������������  서울시����������� ������������������  열린데이터����������� ������������������  광장에서����������� ������������������  모델링����������� ������������������  대상����������� ������������������  데이터셋����������� ������������������  선정����������� ������������������  (문화시설)����������� ������������������  *����������� ������������������  문화재청,����������� ������������������  행정구역����������� ������������������  모델링����������� ������������������  추가����������� ������������������  

데이터셋����������� ������������������  항목����������� ������������������  검토����������� ������������������  및����������� ������������������  매핑����������� ������������������  2 *����������� ������������������  데이터셋의����������� ������������������  개별����������� ������������������  항목과����������� ������������������  온톨로지����������� ������������������  (클래스,����������� ������������������  속성)의����������� ������������������  매핑����������� ������������������  관계����������� ������������������  검토����������� ������������������  *����������� ������������������  외부����������� ������������������  어휘의����������� ������������������  재사용����������� ������������������  여부����������� ������������������  및����������� ������������������  범위����������� ������������������  결정����������� ������������������  *����������� ������������������  어휘와����������� ������������������  데이터셋����������� ������������������  항목����������� ������������������  매핑����������� ������������������  

URI����������� ������������������  체계����������� ������������������  결정����������� ������������������  및����������� ������������������  온톨로지����������� ������������������  설계����������� ������������������  완료����������� ������������������  3 *����������� ������������������  클래스,����������� ������������������  속성,����������� ������������������  인스턴스����������� ������������������  URI����������� ������������������  체계����������� ������������������  결정����������� ������������������  *����������� ������������������  온톨로지����������� ������������������  모델링����������� ������������������  

Page 5: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  1.����������� ������������������  Raw����������� ������������������  Data����������� ������������������  Modeling����������� ������������������  

5

Page 6: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  1.����������� ������������������  Raw����������� ������������������  Data����������� ������������������  Modeling����������� ������������������  

6

필드명 필드설명 사용여부

id 일련번호 Xfacility_code 문화시설코드 ?management_code 관리번호 Xsubject_code 주제분류코드 Xtheme_code 테마분류코드 Xfacility_name 문화시설명 Oregion1 시도 Oregion2 군구 Oregion3 읍면동 Osan_yn 산지여부 Obon_yn 산지여부 Obu_yn 산지여부 Omain_img 대표이미지 Oaddress 주소 Ophone 전화번호 Ofax 팩스번호 Ohomepage 홈페이지 Oopen_hour 관람시간 Oenter_fee 관람료 Oclose_day 휴관일 Oopen_day 개관일자 Oseat_cnt 객석수 Ox_coord x좌표 Oy_coord y좌표 Oetc_desc 기타사항 Ofacility_desc 시설소개 Oenter_free 무료구분 Xx_wgs84 위도 Oy_wgs84 경도 Ofacility_name_eng 영문명 Oaddress_eng 영문주소(Full) Ozipcode 우편번호 Oserial 시리얼 Xaddress_kor 주소(시/구/동) Oaddress_eng2 영문주소2 O

Page 7: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  2.����������� ������������������  Grouping����������� ������������������  Modeling����������� ������������������  

7

Page 8: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  3.����������� ������������������  기존����������� ������������������  Vocabulary����������� ������������������  분석����������� ������������������  Modeling����������� ������������������  

Page 9: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  3.����������� ������������������  기존����������� ������������������  Vocabulary����������� ������������������  분석����������� ������������������  Modeling����������� ������������������  

Page 10: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  4.����������� ������������������  클래스,����������� ������������������  속성����������� ������������������  모델링����������� ������������������  진행����������� ������������������  Modeling����������� ������������������  

문화시설����������� ������������������  초기����������� ������������������  클래스����������� ������������������  구조����������� ������������������  

Page 11: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  5.����������� ������������������  schema.org����������� ������������������  재사용����������� ������������������  상의����������� ������������������  이슈����������� ������������������  Modeling����������� ������������������  

schema.org����������� ������������������  클래스����������� ������������������  구조����������� ������������������  

Page 12: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  5.����������� ������������������  schema.org����������� ������������������  재사용����������� ������������������  상의����������� ������������������  이슈����������� ������������������  Modeling����������� ������������������  

Another����������� ������������������  Type����������� ������������������  System����������� ������������������  사용����������� ������������������  

Place����������� ������������������  

CivicStructure����������� ������������������  

Musieum����������� ������������������  

국립중앙박물관����������� ������������������  

type����������� ������������������  

장소����������� ������������������  

이름

구청

문화예술회관

구민회관

영화관

박물관

갤러리

기념관

전시관

국악원

문화원

수련관

type����������� ������������������  

전시시설����������� ������������������  

박물관����������� ������������������   기념관����������� ������������������   갤러리����������� ������������������  

type����������� ������������������   열거형����������� ������������������  타입����������� ������������������  시스템����������� ������������������  

계층형����������� ������������������  타입����������� ������������������  시스템����������� ������������������  

Schema.org����������� ������������������  클래스����������� ������������������  

Page 13: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  6.����������� ������������������  모델링을����������� ������������������  위한����������� ������������������  공유����������� ������������������  Template����������� ������������������  Modeling����������� ������������������  

(최종본����������� ������������������  아님)����������� ������������������  

Page 14: Linked Data 이야기

문화시설����������� ������������������  ­–����������� ������������������  7.����������� ������������������  문화시설����������� ������������������  온톨로지����������� ������������������  명세서����������� ������������������  Modeling����������� ������������������  

http://lod.datahub.kr/����������� ������������������  

Page 15: Linked Data 이야기

문화재­–����������� ������������������  문화재청����������� ������������������  데이터����������� ������������������  활용����������� ������������������  Modeling����������� ������������������  

15

Page 16: Linked Data 이야기

문화재­–����������� ������������������  1.����������� ������������������  문화재청����������� ������������������  Raw����������� ������������������  Data����������� ������������������  Modeling����������� ������������������  

16

Page 17: Linked Data 이야기

17

data.seoul.go.kr����������� ������������������  

필드명 필드설명 사용여부 비고

id 아이디 변경됨(x->o)category 종목명 O 종목(열거형), 지정번호로 구분category_eng 종목명_영문 O name{@en}name 이름 X 한자 포함된 전체 이름eng_name 이름(영어) O name{@en}kor_name 이름(한글) O name{@ko}ch_name 이름(한자) O name{@zh}class 분류 Xclass1 분류 Oclass2 분류 Oclass3 분류 Oclass4 분류 Oconcept 문화재청(SKOS) 분류명 O 문화재분류 매핑을 위해 추가한 필드quantity 수량 Odesignate 지정일 O 문화재 지정일address 소재지 O address에서 주소 부분만 추출address_cls1 시도 Oaddress_cls2 시군구 Oaddress_cls3 읍면동 Oaddress_cls1_eng 시도(영문) Oaddress_cls2_eng 시군구(영문) Oaddress_cls3_eng 읍면동(영문) Oaddress_cls4_eng X 데이터 없음age 시대 O 열거형owner 소유자 Oowner_eng 소유자(영문) O name{@en}manager 관리자 Omanager_eng 관리자(영문) O name{@en}detail 관리기관 연락처 ?Contents 설명 O

image_url 이미지URL O 링크가 ';' 구분으로 복수개로 되어 있음. 확장자: JPGqrcode_url QR이미지 O

movie_url 동영상URL O 링크가 ';' 구분으로 복수개로 되어 있음, 확장자: WMVstreet-code X 데이터 없음building-num X 데이터 없음

문화재청����������� ������������������  데이터����������� ������������������  필드����������� ������������������  및����������� ������������������  사용여부����������� ������������������  결정����������� ������������������  

Page 18: Linked Data 이야기

문화재����������� ������������������  ­–����������� ������������������  2.����������� ������������������  외부����������� ������������������  어휘����������� ������������������  분석����������� ������������������  Modeling����������� ������������������  

Europeana의����������� ������������������  EDM(European����������� ������������������  Dana����������� ������������������  Model)����������� ������������������  -����������� ������������������  h%p://www.europeana.eu/schemas/edm/����������� ������������������  

Page 19: Linked Data 이야기

문화재����������� ������������������  ­–����������� ������������������  3.����������� ������������������  문화재����������� ������������������  클래스����������� ������������������  구조����������� ������������������  Modeling����������� ������������������  

국보����������� ������������������  |����������� ������������������  보물����������� ������������������  |����������� ������������������  사적����������� ������������������  |����������� ������������������  명승����������� ������������������  |����������� ������������������  천연기념물����������� ������������������  |����������� ������������������  중요무형문화재����������� ������������������  |����������� ������������������  중요민속문화재����������� ������������������  |����������� ������������������  …⋯����������� ������������������  

Page 20: Linked Data 이야기

문화재����������� ������������������  ­–����������� ������������������  4.����������� ������������������  문화재����������� ������������������  분류체계����������� ������������������  모델링����������� ������������������  Modeling����������� ������������������  

cla ss1 cla ss2 cla ss3 cla ss4

유적건조물 정치국방 성 성곽시설

유적건조물 종교신앙 불교 탑

기록유산 서각류 금석각류 비

유적건조물 종교신앙 불교 탑

유적건조물 종교신앙 불교 석등

유적건조물 종교신앙 불교 탑

기록유산 서각류 금석각류 비

기록유산 서각류 금석각류 비

유적건조물 종교신앙 불교 탑

유적건조물 종교신앙 불교 탑

유적건조물 종교신앙 불교 탑

유적건조물 종교신앙 불교 석등

유적건조물 종교신앙 불교 불전

유적건조물 종교신앙 불교 불전

유적건조물 종교신앙 불교 불전

유적건조물 종교신앙 불교 탑

유적건조물 종교신앙 불교 석등

유적건조물 종교신앙 불교 불전

유적건조물 종교신앙 불교 불전

유적건조물 종교신앙 불교 탑

유적건조물 종교신앙 불교 탑

유적건조물 교통통신 교통 교량

유적건조물 교통통신 교통 교량

유적건조물 종교신앙 불교 불전

기록유산 서각류 금석각류 비

유물 불교조각 금속조 불상

유물 불교조각 금속조 불상

유물 불교조각 금속조 불상

유물 불교공예 의식법구 의식법구

유적건조물 종교신앙 불교 탑

유물 과학기술 천문지리기구 천문

기록유산 서각류 목판각류 판목류

기록유산 서각류 금석각류 비

문화재청����������� ������������������  웹사이트����������� ������������������  분류체계����������� ������������������  

Page 21: Linked Data 이야기

문화재����������� ������������������  ­–����������� ������������������  4.����������� ������������������  문화재����������� ������������������  분류체계����������� ������������������  모델링����������� ������������������  이슈����������� ������������������  Modeling����������� ������������������  

Another����������� ������������������  type����������� ������������������  or����������� ������������������  subject?����������� ������������������  

SKOS����������� ������������������  적용����������� ������������������  여부����������� ������������������  

1

2

3

4

문화재청����������� ������������������  분류모델과����������� ������������������  RDF����������� ������������������  모델의����������� ������������������  불일치����������� ������������������  ����������� ������������������  

분류체계로서의����������� ������������������  대표성����������� ������������������  

Page 22: Linked Data 이야기

문화재����������� ������������������  ­–����������� ������������������  4.����������� ������������������  문화재����������� ������������������  분류체계����������� ������������������  모델링����������� ������������������  이슈����������� ������������������  Modeling����������� ������������������  

Page 23: Linked Data 이야기

문화재����������� ������������������  ­–����������� ������������������  5.����������� ������������������  Temporal����������� ������������������  모델링����������� ������������������  Modeling����������� ������������������  

age 필드값 매핑URI (PeriodOfTime 인스턴스) 이름

선사시대 http://ko.wikipedia.org/wiki/선사_시대 PrehistoryicAge

석기시대 http://ko.wikipedia.org/wiki/석기_시대 StoneAge

청동시대 http://ko.wikipedia.org/wiki/청동기_시대 BronzeAge

철기시대 http://ko.wikipedia.org/wiki/철기_시대 IronAge

삼국시대 http://ko.wikipedia.org/wiki/삼국_시대 ThreeKingdoms

고구려 http://ko.wikipedia.org/wiki/고구려 Goguryeo

백제 http://ko.wikipedia.org/wiki/백제 Baekje

신라 http://ko.wikipedia.org/wiki/신라 Silla

가야 http://ko.wikipedia.org/wiki/가야 Gaya

발해 http://ko.wikipedia.org/wiki/발해 Balhae

통일신라 http://ko.wikipedia.org/wiki/통일신라 UnifiedSilla

고려시대 http://ko.wikipedia.org/wiki/고려 Goryeo

조선시대 http://ko.wikipedia.org/wiki/조선 Joseon

대한제국시대 http://ko.wikipedia.org/wiki/대한제국 GreatHanEmpire

일제강점기 http://ko.wikipedia.org/wiki/일제_강점기 JapaneseImperialism

Page 24: Linked Data 이야기

대한민국����������� ������������������  행정구역을����������� ������������������  의미적으로����������� ������������������  표현하기����������� ������������������  위한����������� ������������������  정의����������� ������������������  

행정구역은����������� ������������������  국가마다����������� ������������������  다름����������� ������������������  ����������� ������������������  ����������� ������������������  -����������� ������������������  특별시,����������� ������������������  광역시,����������� ������������������  도,����������� ������������������  시,����������� ������������������  군,����������� ������������������  구,����������� ������������������  읍,����������� ������������������  면,����������� ������������������  동,����������� ������������������  리로����������� ������������������  구분����������� ������������������  ����������� ������������������  ����������� ������������������  -����������� ������������������  1개의����������� ������������������  특별시,����������� ������������������  6개의����������� ������������������  광역시,����������� ������������������  8개의����������� ������������������  도,����������� ������������������  1개의����������� ������������������  특별자치시,����������� ������������������  1개의����������� ������������������  특별자치도로����������� ������������������  구성����������� ������������������  ����������� ������������������  

행정구역����������� ������������������  ­–����������� ������������������  행정구역����������� ������������������  온톨로지����������� ������������������  모델링����������� ������������������  Modeling����������� ������������������  

Page 25: Linked Data 이야기

행정구역����������� ������������������  ­–����������� ������������������  1.����������� ������������������  Raw����������� ������������������  Data����������� ������������������  Modeling����������� ������������������  

25

Page 26: Linked Data 이야기

행정구역����������� ������������������  ­–����������� ������������������  2.����������� ������������������  행정구역����������� ������������������  온톨로지����������� ������������������  모델링����������� ������������������  Modeling����������� ������������������  

Page 27: Linked Data 이야기

행정구역����������� ������������������  ­–����������� ������������������  3.행정구역����������� ������������������  인스턴스����������� ������������������  구축����������� ������������������  Modeling����������� ������������������  

Page 28: Linked Data 이야기

시����������� ������������������  

시����������� ������������������  

hasGu����������� ������������������   구����������� ������������������  

동����������� ������������������  

hasDong����������� ������������������  

A안>����������� ������������������  

B안>����������� ������������������  

구����������� ������������������  

구����������� ������������������  

include����������� ������������������  

include����������� ������������������  

행정구역����������� ������������������  ­–����������� ������������������  4.행정구역����������� ������������������  모델링����������� ������������������  이슈����������� ������������������  Modeling����������� ������������������  

Page 29: Linked Data 이야기

*����������� ������������������  

Vocabulary����������� ������������������  

Vocabulary����������� ������������������  ����������� ������������������  -����������� ������������������  /def/{vocabulary}����������� ������������������  Classes����������� ������������������  ����������� ������������������  -����������� ������������������  /def/{vocabulary}/{class}����������� ������������������  Document����������� ������������������  ����������� ������������������  -����������� ������������������  /def/{vocabulary}/{property}����������� ������������������  

Class����������� ������������������  

http://lod.datahub.kr/def/cf����������� ������������������  

http://lod.datahub.kr/def/cf/Museum����������� ������������������  

Facility����������� ������������������  

http://lod.datahub.kr/def/cf/collects����������� ������������������  

*����������� ������������������  Class의 첫글자는 영문 대문자,����������� ������������������  Property는 소문자를 사용함����������� ������������������  

303����������� ������������������  See����������� ������������������  other����������� ������������������  

����������� ������������������  ����������� ������������������  

URIs for Ontology Vocabulary Modeling����������� ������������������  

Page 30: Linked Data 이야기

URIs for Real-World Things Modeling����������� ������������������  

*

Culture Facilities

Things - /id/{type}/{id} - /id/{type}/{id}/{child-type}/{child-id} Document - /doc/{type}/{id} - /doc/{type}/{id}/{child-type}

List

http://lod.datahub.kr/id/cf

http://lod.datahub.kr/doc/cf

303 See other

Facility

http://lod.datahub.kr/id/cf/123456

* id 형식 및 값에 대한 의사결정 필요

   

Page 31: Linked Data 이야기

이후����������� ������������������  진행����������� ������������������  계획����������� ������������������  Modeling����������� ������������������  

행정구역,����������� ������������������  우편번호����������� ������������������  등����������� ������������������  인프라����������� ������������������  온톨로지����������� ������������������  구축����������� ������������������  

서울시����������� ������������������  문화시설����������� ������������������  à����������� ������������������  전국����������� ������������������  주요����������� ������������������  기관,����������� ������������������  시설로����������� ������������������  확대����������� ������������������  

1

2

3

4

온톨로지����������� ������������������  스키마����������� ������������������  고도화����������� ������������������  

파편화����������� ������������������  되어있는����������� ������������������  Raw����������� ������������������  Data를����������� ������������������  Linked����������� ������������������  Data로…⋯����������� ������������������