21
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках Новицкий А.В. Институт программных систем НАН Украины

Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

Embed Size (px)

DESCRIPTION

Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках. Новицкий А.В. Институт программных систем НАН Украины. Цели. Выделить проблемы интеграции данных при онтологическом подходе Сделать обзор существующих проектов по интеграции данных в электронной библиотеке - PowerPoint PPT Presentation

Citation preview

Page 1: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотекахНовицкий А.В.Институт программных систем НАН Украины

Page 2: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

2

Цели

•Выделить проблемы интеграции данных при онтологическом подходе

•Сделать обзор существующих проектов по интеграции данных в электронной библиотеке

•Семантической аннотации как необходимый компонент интеграции данных

Page 3: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

3

Что такое интеграция данных (ИД) ? • Под процессом интеграции данных мы

понимаем построение единого унифицированного метода доступа к гетерогенным распределенным преимущественно структурированным данным

Page 4: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

4

Проблемы интеграции данных

Гетерогенность:СинтаксическаяСтруктурнаяСемантическая

Page 5: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

5

семантическая гетерогенность•семантические конфликты

•описательные конфликты

•структурные конфликты

Page 6: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

6

Виды сопоставлений онтологий:

•Расширение

•Гармонизация

•Выравнивание

Page 7: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

7

Семантическая интерпарабельность в Европейских проектах

•Проект SWHi

•Проект eCulture

•Проект IPISAR (Испания)

•Проект EPOCH и AMA

Page 8: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

8

Проект SWHi

Онтология SWHi для ЭБ, построенная на базовой онтологии PROTON в результате сопоставления с отологиями:

•таксономии предметной классификации NewsBank/Readex

•Дублинского Ядра•словаря FOAF Vocabulary

Page 9: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

9

Проект eCulture•eCulture это семантическая поисковая

система для одновременного поиска в нескольких коллекциях учреждений культурного наследия

Page 10: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

10

IPISAR

Page 11: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

11

Проект EPOCH и AMA библиотек культурного наследия•EPOCH представляет собой

библиотечную сеть из более ста европейских культурных институтов

•Для интеграции и обмена используется модель данных CIDOC CRM

AMA Mapping Tool - для отображения источников данных (неструктурированная информация) в онтологию CIDOC CRM

Page 12: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

12

Семантическая аннотация Для автоматической обработки контента ЭБ метаданных недостаточно. Необходимы более детальные формальное объяснения (аннотации), доступные через Интернет.Эти механизмы заложены в Sematic Web.

Page 13: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

13

Проблемы Semantic Web•Множество рекомендаций и

направлений•Отсутствие онтологий и RDF данных•Отсутствие приложений для роботы с

семантическими данными

Page 14: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

14

RDFa

•это способ выражения RDF-данных в XHTML, в рамках которого данные, предназначенные для человека, используются повторно для автоматической обработки.

Page 15: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

15

Пример

Page 16: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

16

Пример работы GRDDL (Gleaning Resource Descriptions from Dialects of Languages)

Page 17: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

17

Использование в ЭБ (автоматическая публикация)

XHTML с профилем и алгоритмом

Автоматическая публикация в интернете

GRDDL

GR

DD

L

Сбор публикаций в интернете

Хранилище RDF

Запрос SPARQLSPARQL

XML binding XSLT

Liked Data

Page 18: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

18

Дальнейшее развитие

•Связывание аннотированных документов с моделью данных Linked Data

•Расширение построенной модели с хранилищем Linked Open Data

Page 19: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

19

Linked Open Data

Page 20: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

20

Спасибо за внимание !

Page 21: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках

RCDL 2009

21

Принципы Linked Data

•Use URIs as names for things •Use HTTP URIs so that people can look

up those names. •When someone looks up a URI, provide

useful information, using the standards (RDF, SPARQL)

•Include links to other URIs. so that they can discover more things.