Upload
malik-odonnell
View
70
Download
0
Embed Size (px)
DESCRIPTION
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках. Новицкий А.В. Институт программных систем НАН Украины. Цели. Выделить проблемы интеграции данных при онтологическом подходе Сделать обзор существующих проектов по интеграции данных в электронной библиотеке - PowerPoint PPT Presentation
Citation preview
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотекахНовицкий А.В.Институт программных систем НАН Украины
RCDL 2009
2
Цели
•Выделить проблемы интеграции данных при онтологическом подходе
•Сделать обзор существующих проектов по интеграции данных в электронной библиотеке
•Семантической аннотации как необходимый компонент интеграции данных
RCDL 2009
3
Что такое интеграция данных (ИД) ? • Под процессом интеграции данных мы
понимаем построение единого унифицированного метода доступа к гетерогенным распределенным преимущественно структурированным данным
RCDL 2009
4
Проблемы интеграции данных
Гетерогенность:СинтаксическаяСтруктурнаяСемантическая
RCDL 2009
5
семантическая гетерогенность•семантические конфликты
•описательные конфликты
•структурные конфликты
RCDL 2009
6
Виды сопоставлений онтологий:
•Расширение
•Гармонизация
•Выравнивание
RCDL 2009
7
Семантическая интерпарабельность в Европейских проектах
•Проект SWHi
•Проект eCulture
•Проект IPISAR (Испания)
•Проект EPOCH и AMA
RCDL 2009
8
Проект SWHi
Онтология SWHi для ЭБ, построенная на базовой онтологии PROTON в результате сопоставления с отологиями:
•таксономии предметной классификации NewsBank/Readex
•Дублинского Ядра•словаря FOAF Vocabulary
RCDL 2009
9
Проект eCulture•eCulture это семантическая поисковая
система для одновременного поиска в нескольких коллекциях учреждений культурного наследия
RCDL 2009
10
IPISAR
RCDL 2009
11
Проект EPOCH и AMA библиотек культурного наследия•EPOCH представляет собой
библиотечную сеть из более ста европейских культурных институтов
•Для интеграции и обмена используется модель данных CIDOC CRM
AMA Mapping Tool - для отображения источников данных (неструктурированная информация) в онтологию CIDOC CRM
RCDL 2009
12
Семантическая аннотация Для автоматической обработки контента ЭБ метаданных недостаточно. Необходимы более детальные формальное объяснения (аннотации), доступные через Интернет.Эти механизмы заложены в Sematic Web.
RCDL 2009
13
Проблемы Semantic Web•Множество рекомендаций и
направлений•Отсутствие онтологий и RDF данных•Отсутствие приложений для роботы с
семантическими данными
RCDL 2009
14
RDFa
•это способ выражения RDF-данных в XHTML, в рамках которого данные, предназначенные для человека, используются повторно для автоматической обработки.
RCDL 2009
15
Пример
RCDL 2009
16
Пример работы GRDDL (Gleaning Resource Descriptions from Dialects of Languages)
RCDL 2009
17
Использование в ЭБ (автоматическая публикация)
XHTML с профилем и алгоритмом
Автоматическая публикация в интернете
GRDDL
GR
DD
L
Сбор публикаций в интернете
Хранилище RDF
Запрос SPARQLSPARQL
XML binding XSLT
Liked Data
RCDL 2009
18
Дальнейшее развитие
•Связывание аннотированных документов с моделью данных Linked Data
•Расширение построенной модели с хранилищем Linked Open Data
RCDL 2009
19
Linked Open Data
RCDL 2009
20
Спасибо за внимание !
RCDL 2009
21
Принципы Linked Data
•Use URIs as names for things •Use HTTP URIs so that people can look
up those names. •When someone looks up a URI, provide
useful information, using the standards (RDF, SPARQL)
•Include links to other URIs. so that they can discover more things.