9
RCDL`1999 – RCDL`2008 : DL, VDL, Semantic Web/GRID, GRID… Шириков В.П. shirikov @ jinr . ru Объединенный Институт Ядерных Исследований ( ОИЯИ) Аннотация Данная статья должна восприниматься как личный короткий авторский обзор достижений в области разработки и реализации электронных библиотек , представлявшихся участниками ежегодных конференций RCDL ( в основном российскими) в последние 10 лет. Все оценки и соображения в тексте обзора приведены в соответствие с личным авторским пониманием известных технологий, необходимых для реализации электронных библиотек и в других областях e-Science и её приложений.

Аннотация

Embed Size (px)

DESCRIPTION

RCDL`1999 – RCDL`2008 : DL, VDL, Semantic Web/GRID, GRID… Шириков В.П. shirikov @ jinr . ru Объединенный Институт Ядерных Исследований ( ОИЯИ). Аннотация - PowerPoint PPT Presentation

Citation preview

Page 1: Аннотация

RCDL`1999 – RCDL`2008 : DL, VDL, Semantic Web/GRID, GRID…

Шириков В.П[email protected]

Объединенный Институт Ядерных Исследований ( ОИЯИ)

АннотацияДанная статья должна восприниматься как личный короткий авторский обзор достижений в области разработки и реализации электронных библиотек , представлявшихся участниками ежегодных конференций RCDL ( в основном российскими) в последние 10 лет. Все оценки и соображения в тексте обзора приведены в соответствие с личным авторским пониманием известных технологий, необходимых для реализации электронных библиотек и в других областях e-Science и её приложений.

Page 2: Аннотация

RCDL`1999 год:Трактовка понятия DL

• "зеркальное" Интернет-отображение ресурсов традиционных библиотек и средств их использования.

• хранилища (коллекции) знаний и данных общего и специального назначения , реализованные в сетевой среде с применением современных технологий и стандартов формирования, модификации и средств использования информации. (В докладе М.Р.Когаловского).

Создание и использование информационной модели, способной отобразить

структуру и семантику таких гетерогенных коллекций :

доклад Л.А.Калиниченко "Integration of Heterogeneous Semi-structured Data Models in the

Canonical One«. Своеобразным логическим продолжением данной работы из

последних стала доложенная с соавторами на конференции GRID`2008 : "Application Driven Mediation Middleware Grid Infrastructure for Problem solving over

multiple Heterogeneous Distributed Information Resources".

Page 3: Аннотация

Использование версий технологии Semantic Web (с его средствами применения онтологий),

минимально необходимых для для реализации распределенных информационных систем, в том числе виртуальных DL и коллекций разного типа:

Работы по Web-ориентированным системам DL, доложенные, в частности, на конференциях RCDL и «Научный сервис в сети

Интернет»(например,работы В.А.Серебрякова и его соавторов по созданию

инфраструктуры единого научного информационного пространства РАН)

Page 4: Аннотация

Перечень признанных технологий в соответствие с презентацией T.Risse для RCDL`2007 по проекту BRICKS:

( http://www.brickscommunity.org )

Grid, Pear-to-Pear, SOA, Semantic Web с его средствами применения онтологий.

(См. http://rcdl2007.pereslavl.ru/en/doc/Risse_rcdl_tutorial.pdf )Подчеркивается тенденция перехода от понятия DL как интегрированной системы

с централизованным управлением к динамически конфигурируемой федерации DL-сервисов и информационных коллекций, когда возникает понятие

виртуальной DL как коллекции данных от разных контент-провайдеров без централизованного управления и с распределенными гетерогенными сервисами

(Естественно, что предоставляемые каждым провайдером сервисы должны поддерживать поисковые средства для различных типов информации (разных типов мультимедийных данных, поиска по контексту, многоязыкового доступа),

индексирование, аннотирование документов, предоставление регистров метаданных и ресурсов; в составе DMS виртуальной DL могут ресурсоёмкие

сервисы (например, для извлечения характеристических деталей из image/audio/video-документов, генерации метаданных, автоматического

редактирования сложных документов) .

Page 5: Аннотация

BRICKS (Продолжение)

Прикладной задачей проекта стала интеграция ресурсов в общую и разделяемую DL, куда входят в качестве локальных материалы электронных музеев, архивы

исторических документов и другие виды электронной памяти (цифрового наследия культурного многообразия: Building Resources for Integrated Cultural

Knowledge Services ); узлы (сайты) созданной по проекту сети BNnet оснащаются свободно доступными программными интерфейсами-"кирпичами" (bricks), через которые без централизованного управления они взимодействуют друг с другом и

используют доступные ресурсы для работы с контентом и метаданными по

принципу "равный с равным" (P2P); каждый узел может знать напрямую только одно подмножество других узлов, но если хочет использовать внешние по

отношению к этому подмножеству ресурсы, то может послать запрос к одному из известных ему и тот сфорвердирует запрос. T.Risse не акцентирует своё внимание на возможном применении своих средств в рамках Grid-структур, по существу это выглядит как Web-ориентированная реализация, сама по себе не нуждающаяся в

явном виде в каких-то сервисах из набора Grid-middleware, поэтому упоминание им

Grid-технологий в указанном списке можно понимать по-разному. Что касается технологий P2P, SOA и Semantic Web, то они нашли достаточно широкое

применение во многих работах по реализации DL/VDL и информационных систем, докладывавшихся на конференциях RCDL.

Page 6: Аннотация

Отношения с GRID-middleware и Semantic Grid.

1998 – 2002 :1) Концепция Grid ( I.Foster, C.Kesselman..) использования

вычислительных ресурсов (ВР) в системе распределенной потоковой обработки задач на базе сервисов "middleware" из пакетов GT. Ограниченность возможностей сервиса DMS (Data Management System) в базовом middleware для сферы интересов DL/VDL,

потребность в сервисах "on top of Grif-middleware".

2) Концепция Semantic Grid ( Keith G.Jeffry, David De Rouge et al "The Semantic Grid : a Future e-Science Infrastructure" (http://www.semanticgrid.

org/documents/semgrid-journal/semgrid-journal.pdf) как трёхуровневой системы SOA-сервисов для программной среды

компьютеризированной науки ( Data/Computation Services, Information Services, Knowledge Services) с детальным формализованным

примером цикла полной автоматизации обработки экспериментальных данных в сетевой среде с применением

конкретного перечня сервисов всех уровней и семиуровневой системы онтологий. "All grids that have or will be build have some

elements of all three layers in them".

Page 7: Аннотация

2003 -... Что дали технологии и его middleware уровня

GT3-GT4 информационным системам, DL,VDL ?

Стандартизация SOA-сервисов, средства формирования VO/IVO и работы с ПД (Пространством Данных): cервисы OGSA-DAI/DQP,

разработанные в интересах проектов AstroGrid /GridPP и использованные при реализации IBM Sphere Information Integrator; возможности программной реализации системы типа DSSP (Data

Space Support Platform)... (См.,например, совместные статьи в Трудах RCDL авторов из

ИПИ РАН и САО РАН в рамках деятельности IVOA и RVO, а также статью А.В.Жучкова, А.В.Кравченко и Н.В.Твердохлебова (ИХФ

РАН) в Трудах RCDL`2007 : "Сервис-ориентированный Грид--подход к информационным задачам в Пространстве Данных виртуальных

организаций") .

Page 8: Аннотация

…→2008г.: GT4→…→ EGEE/RDIG-middleware (gLite). Сервисы "on top of gLite" для создания ресурсоёмких DL, VDL в проектах с кураторами от

EGEE и ESA.DILIGENT ( A DIgital LIbrary Infrastructure on Grid ENabled Technology) и его

система сервисов "gCube on top of gLite" :

http://www.diligentproject.orghttp://www.gcube-system.org/architecture/overview/html

http://www.gcube-system.org/architecture/services/services/htm

B самом общем определении gCube позволяет исследователям динамически, по требованию (on-demand) создавать информационно-вычислительные

среды (Virtual Research Environments, VREs), агрегируя и формируя контент-ресурсы, прикладные сервисы и компьютерные ресурсы как за счет

собственных у прикладных проектов, так и за счет имеющихся в EGEE. В составе gCube достаточно средств для мониторирования использования

разделяемых ресурсов с гарантией их оптимального распределения и эксплуатации, а также лёгкого создания Web-порталов для VREs, через которые

пользователи могут иметь доступ к контенту и сервисам; предоставляется также набор типовых для DL функций (поиск, аннотирование, формирование,

визуализация документов и др.).

Page 9: Аннотация

Итоги в ИНТЕРНЕТ

1) Вэб-сайт конференций RCDL (http://rcdl.ru)

2) Симпозиум «Онтологическое моделирование: состояние и направления исследований и применения»

(май 2008, Звенигород)http://synthesis.ipi.ac.ru/synthesis/ontologyprogram

http://synthesis.ipi.ac.ru/synthesis/publicationshttp://www.cemi.rssi.ru/mei/articles/koga08-1.pdf

3) Сайт Российского семинара по оценке методов информационного поиска (http://romip.ru)