27
ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ Рубашкин В. Ш. Пивоварова Л. М. Чуприн Б. Ю. кафедра информационных систем в искусстве и гуманитарных науках Факультет филологии и искусств СПбГУ

OntoEd

Embed Size (px)

Citation preview

Page 1: OntoEd

ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ

ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ

Рубашкин В. Ш.Пивоварова Л. М.

Чуприн Б. Ю.кафедра информационных систем

в искусстве и гуманитарных науках

Факультет филологии и искусств СПбГУ

Page 2: OntoEd

2. Gomez-Perez A., Fernando-Lopez M., Corcho O. Ontology Engineering. – Springer – Ferlag, 2004.

3. Staab Steffen, Studer Rudi (eds). Handbook on Ontologies. – Berlin—Heidelberg: Springer—Verlag, 2004

4. Nirenburg S., Raskin V. Ontological Semantics. – Cambridge, MA: MIT Press, 2004

5. Denny M. Ontology Tools Survey, Revisited – 2004 http://www.xml.com/pub/a/2004/07/14/onto.html

=========================

7. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. – СПб.: Питер, 2000. С. 271 – 316

8. Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных информационных системах. - М.: Наука, 1989

Page 3: OntoEd

1. Рубашкин В. Ш. Универсальный понятийный словарь: функциональность и средства ведения // КИИ-2002. Восьмая национальная конференция по искусственному интеллекту с международным участием. Труды конференции. М., 2002. С. 231 – 237.

2. Рубашкин В. Ш., Лахути Д.Г. Семантический (концептуальный) словарь для информационных технологий. // Научно-техническая информация. - Сер. 2. Часть1. 1998.- N 1. - С. 19 –24; Часть2. 1999.- N 5. - С. 1 -12. Часть3. 2000. - N 7. - С. 1 – 9

3. Рубашкин В. Ш., Лахути Д.Г. Онтология: от натурфилософии к научному мировоззрению и инженерии знаний // Вопросы философии № 1, 2005. С. 64 – 81.

4. Guarino Nicola. Formal Ontology and Information Systems // Formal Ontology in Information Systems. Proceedings of FOIS’98, Trento, Italy, 6-8 June 1998. Amsterdam, IOS Press, pp. 3-15.

Page 4: OntoEd

1. Русский семантический словарь. Толковый словарь, систематизированный по классам слов и значений / РАН. Ин-т рус. яз.; Под общей ред. Н.Ю.Шведовой. – М.: Азбуковник. Том I.-1998; Том II. - 2000; Том III. – 2003.

3. Толковый словарь русских глаголов: Идеографическое описание. Английские эквиваленты. Синонимы. Антонимы. – М.: АСТ-ПРЕСС, 1999.

Page 5: OntoEd

Wiki:Ontology editors are applications designed to assist

in the creation or manipulation of ontologies.

Page 6: OntoEd

Онтология

Том Грубер (1991):

T. R. Gruber. The Role of Common Ontology in Achieving Sharable, Reusable Knowledge Bases // Principles of Knowledge Representation and Reasoning: Proceedings of the Second International Conference, 1991.

An ontology is an explicit specification of a conceptualisation.

Michael Denny. Ontology Tools Survey, 2004 :

Ontologies are a way of specifying the structure of domain knowledge in a formal logic designed for machine processing.

Page 7: OntoEd

Существенны три пункта:

4) Концептуальная структура

5) Формальная модель

6) Информационно-вычислительный ресурс

Page 8: OntoEd

Онтология

1) Концептуальная структура

а) единицы – понятия, а не слова!б) система, включающая множество понятий и набор утверждений об этих понятиях. (классификация понятий,отношения между понятиями; в частности иерархии понятий по отношениям общее – частное и часть - целое)

Проблема выбора и уровня детализации единиц; граница между понятиями и лексическими вариантами.

- линейный размер, цвета и оттенки

Page 9: OntoEd

Онтология

• Формальная модель (Модель знаний)Формализованное (посредством некоторого ЯПЗ) описание

концептуальной системы, специфицирующее:

а) используемую классификацию концептов

б) набор допустимых парадигматических отношений между концептами

в) аксиомы и правила вывода

Принципиальная важность выбора той или иной модели знаний• OKBC – фреймовая модель: концепты (классы), экземпляры,

слоты, фасеты • OWL – классы, экземпляры, свойства (datatype property, object

property)• InfoL – концепты, их словарные характеристики, связи между

концептами; дерево признаков.

Page 10: OntoEd

1) Информационно-вычислительный ресурс

(а не просто словарь!)

Технически – исполняемый модуль (напр., dll библиотека, COM-объект), обладающий некоторой функциональностью и стандартным

образом подключаемый к любым информационным технологиям.

Формально – это набор функций вида :

F (D), F (D1, D2)

===========================Поэтому ближайшим и непосредственным предшественником

можно считать информационно-поисковые тезаурусы (ИПТ), а переход к онтологиям интерпретировать как процесс

интеллектуализации ИПТ.

Page 11: OntoEd

Наша мотивировка функциональности онтологии –

семантический анализ текста

• вопрос – ответные соответствия (цвет - красный);• представление числовых данных;• кореференция;• предикат – актанты;

Функциональность:

• полный набор объемных отношений (тигр – охотник - повар);• предметно –ассоциативные отношения (тигр – лапа);• функциональные отношения (кг - масса)

Page 12: OntoEd

Представление данных и операционная среда онтологии:

СУБД как "естественная операционная среда".

Варианты: продукционная система.

Page 13: OntoEd

Онторедактор – не просто средство ввода и редактирования, но интегрированная среда разработки и использования

(integrated development environment - IDE)

Функциональность онтологии (использование)vsфункциональность онторедактора (создание и поддержка)

Онтология предоставляет программный интерфейс приложениям;

онторедактор реализует человеко-машинный интерфейс, обеспечивающий администрирование онтологий.

NB: Для реализации части функций онторедактора должна использоваться функциональность самой онтологии.

Page 14: OntoEd

Функциональность онторедактора

Функциональный стандарт еще только формируется.

Традиционные функции: • навигация, броузинг и поиск; • ввод и редактирование.

Нетрадиционные:• тестирование онтологии;• экспорт – импорт;• интеграция разнородных концептуальных систем (ontology

merging);• (полу)автоматическое пополнение онтологий;• определение взаимного соответствие концептов и единиц ЕЯ

("Лексикон"); • работа с описаниями экземпляров, являющихся "примерами"

(instance) концептов.

(+ Функциональность онтологии)

Page 15: OntoEd

Специфика навигации, броузинга, поиска

Просмотр и навигация предполагают некоторую "естественную" упорядоченность материала. "Естественный порядок в концептуальной системе = ???!

– по алфавиту?– по ключу?– в порядке "физического" следования?

- Поиск как средство навигации

- "Лексическая" навигация

- Классификационные фильтры и фильтры администрирования

Page 16: OntoEd

"Естественной" для концептуальной системы можно считать, скорее, таксономическую (общее - частное) упорядоченность концептов; она образует ядро всякой концептуальной модели.

Просмотр "сверху вниз" (от общего к частному).

А также, возможно, просмотр групп концептов связанных иерархическими связями другого типа (например, целое - часть).

Page 17: OntoEd

Отсюда - потребность графического представления всех или некоторых связей между концептами и поддержки процедур графического редактирования.

Вопрос об объеме графического представления связей:– только общее – частное?– + целое – часть?– + другие виды связей?

(артефакт – функция: судно – плыть; единица измерения – признак: ватт – мощность

и т.д.)

Складывающееся решение: в графике представляется только таксономия.

Page 18: OntoEd

Специфика ввода и редактирования

b) "ручной" ввод (собственно ввод);c) автоматический или автоматизированный ввод на основе

анализа корпуса текстов;d) автоматизированный ввод с использованием традиционной

лексикографической информации (энциклопедических и толковых словарей).

Главные проблемы: • достоверность;• эргономичность.

Page 19: OntoEd

Конечная цель при проектировании процедур собственно ввода –максимально исключить формально определимые ошибки.

Самое плохое решение – неконтролируемый ввод.

Не лучшее решение - обнаруживать ошибки post factum.

Технологически "хорошее" решение - процедура ввода должна быть организована так, чтобы ввод некорректных элементов описания оказался вообще невозможным.

Page 20: OntoEd

Требование достоверности ввода – конкретизация:

2) Неизбыточность и полнота описания – должны быть определены те и только те словарные признаки, которые релевантны для концептов данного типа.

2) Непротиворечивость описания – элементы словарных характеристик не должны противоречить

друг другу. Пример:

Для концепта, определяемого конъюнкцией (пересечением объектных классов; в других терминах – класс, определяемый через множественное наследование), определяющие концепты должны быть совместимы (в терминах OWL –не должны находиться в отношении Disjoint):

'слон' 'животное' And 'металлический' ???

NB: Вызов машины вывода!

Page 21: OntoEd

3) Правильность означивания – значения определяемых словарных признаков должны

принадлежать области их допустимых значений. Пример1:Формально неправильно:

БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'нагрев' ???

правильно: БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'линейный размер'

(допустим только концепт класса 'наименование числового признака', подкласс 'сочетающийся с числом').

Пример2 :

'лед' 'агрегатное состояние' And 'химический состав' ???

- категориальная ошибка: формальное толкование типа "конъюнкция" для объектного термина может содержать только объектные термины, либо означенные признаки.

Page 22: OntoEd

4) Содержательная правильность – вводимые словарные характеристики должны быть адекватны смыслу добавляемого или редактируемого концепта.

Примеры:ОБОБЩАЮЩИЙ_ПРИЗНАК ( 'цвет' ) =

'химические свойства вещества' ???

БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'температура' ???

'лед' 'отверстие' And 'цилиндрической формы' ???

- определение является формально правильным.

Такого рода ошибки не являются формально контролируемыми; они могут оставаться не выявленными, пока онтология не начнет

использоваться в приложениях, для которых именно эта связь окажется существенной.

Page 23: OntoEd

Решение задач формального контроля обусловлено возможностью построить формальное описание системы словарных признаков.a) определение области значений каждого признака;b) установление отношений зависимости по условиям

применимости между признаками.

Page 24: OntoEd

Тестирование

Тестирование как проверка формальной корректности (вместо контроля ввода)

vsтестирование как содержательный экспертный контроль.

Предмет тестирования во 2-м случае = ?

Формальный ответ:проверка отдельного концепта = просмотр словарной статьи;собственно тестирование как экспертный контроль связей:

• объемные отношения;• ассоциативные отношения;• функциональные отношения.

Page 25: OntoEd

Тестирование

Терминология [Gomez-Perez]:• evaluation - общее название для процедур проверки;• verification - whether the ontology is building correctly• validation – whether the ontology definitions really model

the real world• assessment – judging the ontology from the user's &

application's point of view

Page 26: OntoEd

Автоматизация пополнения

• Интеграция онтологий (ontology merging)

• Собственно пополнение (ontology learning)- по корпусу текстов- из традиционных словарей (+WordNet ?)

Page 27: OntoEd

Интеграция номологических и фактографических знаний(представление экземпляров)

Онтология – знание о применимости признаков к классу объектов.Фактография (напр., БД) – знание о значениях признаков для

конкретного объекта.

Относительность разделения на классы и экземпляры (ср. марки и автомобили).