24
1 Методика формирования Методика формирования нечетких онтологий нечетких онтологий Калуцкая Анастасия Петровна [email protected] Московский Государственный Технический Университет им. Н.Э.Баумана Управление знаниями и технологии семантического веба KMSW’2010, Санкт-Петербург, 4-5 декабря

методика формирования нечетких онтологий

Embed Size (px)

Citation preview

Page 1: методика формирования нечетких онтологий

1

Методика формированияМетодика формированиянечетких онтологийнечетких онтологий

Калуцкая Анастасия Петровна

[email protected]

Московский Государственный Технический Университет им. Н.Э.Баумана

Управление знаниями и технологии семантического веба KMSW’2010,

Санкт-Петербург, 4-5 декабря

Page 2: методика формирования нечетких онтологий

2

Понятие онтологииПонятие онтологии Онтология – это явное и формализованное определение структуры некоторой проблемной области (темы). Онтология – это подробная спецификация структуры определенной предметной области, первоначально сделанная на естественном языке. Она предлагает словарь для представления и обмена знаниями по интересующей проблеме и набор связей и свойств, которые определены между имеющимися в ее составе неделимыми сущностями. Онтологию часто понимают как «спецификацию разделяемой разными людьми концептуализации» или, иначе, отождествляют с набором сосуществующих концептуальных моделей предметной области. По сути, онтологии отражают соглашения о единых способах построения и использования концептуализации. При взаимодействии агентов онтологии используются как средство, предоставляющее общий словарь; здесь агенты, по сути, заключают соглашение, используя общую интерпретацию терминов словаря для обмена сообщениями на уровне знаний.Значительный вклад в теорию и проектирование онтологий внесли Т.Грубер, Н.Гуарино, Р.Мизогучи, Р.Студер, Т.А.Гаврилова, А.С.Клещев, А.В.Смирнов, С.В.Смирнов и др.

Page 3: методика формирования нечетких онтологий

3

Онтологии в системе моделей Онтологии в системе моделей представления знанийпредставления знаний

Page 4: методика формирования нечетких онтологий

4

Когнитивный агент: диалоговое управлениеКогнитивный агент: диалоговое управление

Гибкое, интеллектуальное управление и диалоговый интерфейс – это отличительные черты когнитивных агентов. При этом главная проблема состоит не столько в техническом обеспечении диалога, сколько в создании общего языка и единого «поля знаний», необходимых для взаимопонимания и совместной работы естественных и искусственных агентов. Для реализации диалогового управления необходимо построение общих онтологий, обеспечивающих эффективную коммуникацию человека и робота при выполнении последним сложных задач в неточно и неполностью определенной среде.

Page 5: методика формирования нечетких онтологий

5

Когнитивные агентыКогнитивные агентыПод агентом понимается «любая сущность, которая

находится в некоторой среде, воспринимает ее посредством сенсоров, получая данные, которые отражают события, происходящие в среде, интерпретирует эти данные и действует на среду посредством эффекторов».

Четыре агентообразующих фактора – среда, восприятие, интерпретация, действие.

Обычно определение искусственного агента сводится к выделению некоторого минимального набора его базовых характеристик, в число которых входят:

1) активность; 2) реактивность; 3) автономность; 4) коммуникативность; 5) интенциональность. Когнитивная функция обеспечивает процессы познания агентом внешнего

мира, других агентов, а также его самопознание. Основными когнитивными процессами являются: 1) процессы восприятия среды, 2) формирования ее обобщенного внутреннего представления, 3) обучения, 4) понимания принципов взаимодействия и поведения.

Page 6: методика формирования нечетких онтологий

6

Ментальная карта «Онтологии когнитивного Ментальная карта «Онтологии когнитивного агента»агента»

Page 7: методика формирования нечетких онтологий

7

Парадигматические отношенияПарадигматические отношенияОбщими отношениями для различных онтологий

являются: 1) генеративные отношения «есть некоторый» (is_a); 2) таксономические отношения («класс-подкласс»,

«класс-экземпляр); 3) родо-видовые отношения; 4) партономические (или мереологические)

отношения («часть–целое»); 5) отношения наследования или генеалогические

связи («предок-потомок»). Эти отношения могут быть как четкими, так и

нечеткими, например, нечеткие генеративные отношения «есть некоторый со степенью μ» (is_a_with_ μ).

Page 8: методика формирования нечетких онтологий

8

Примеры отношений в онтологияхПримеры отношений в онтологияхТаксономические отношения:Мобильные роботы есть подкласс класса

роботы, а транспортные роботы – подкласс класса мобильных роботов.

Партономические отношения:База знаний и сенсорная подсистема – части

когнитивной системы интеллектуального робота. Генеалогические отношения:Интегральные и интеллектуальные роботы

(т.е. роботы 3-го поколения) – «потомки» очувствленных роботов (роботов 2-го поколения), снабженных системой тактильных датчиков, которые позволяют им воспринимать текущую информацию из среды.

Page 9: методика формирования нечетких онтологий

9

Формализация нечетких онтологийФормализация нечетких онтологийВ настоящей работе предложена обобщенная нечеткая модель

онтологии, основанная на расширении алгебраической системы – базовой математической конструкции А.И.Мальцева.

В качестве основы для формализации онтологий предложено использовать нечеткую алгебраическую систему.

Нечеткая алгебраическая система есть тройка FAS = X, (R), Ω,

где X – множество нечетких объектов; (R)= {(r, φ)rR: Xn[0,1]} – множество нечетких отношений

между объектами; φ – сила отношения; Ω={ΩX, ΩR}– множество операций над объектами из X и

отношениями из R, например, унарных операций ΩX1: X X,

бинарных операций ΩX2:XX X, ΩR

2: (R)2 (R). При Ω = приходим к понятию нечеткой реляционной

системы.

Page 10: методика формирования нечетких онтологий

10

Формализация нечетких онтологийФормализация нечетких онтологийНечеткое представление «легкой» онтологии как пары ONT = X, (R), где X – множество категорий или понятий

предметной области, (R)–множество нечетких отношений между понятиями предметной области.

Когда определено также множество аксиом (проведена аксиоматизация предметной области), онтология является «весомой», т.е. представляется тройкой ONT’ = X, (R), AX.

Другой вариант определения весомых онтологий – введение множества Ф ={f} – конечного множества функций интерпретации, заданных на понятиях и/или отношениях онтологии ONT’’, f: Dn[0,1], D – область интерпретации.

Здесь значения f представляют собой числа из интервала [0,1], в частности, их можно понимать как значения вероятности, возможности или необходимости. Дальнейшее обобщение связано с лингвистическими оценками истинности.

Также онтологию можно представлять четверкой ONT* = X, (R), At, C , где At – множество нечетких свойств (значений) понятий, а C – множество нечетких ограничений.

Page 11: методика формирования нечетких онтологий

11

Представление онтологии в виде Представление онтологии в виде графаграфа

Целесообразность введения операций над объектами и отношениями онтологии обусловлена практическими соображениями: так в случае представления онтологии нечетким графом совершенно естественными являются теоретико-множественные операции пересечения, объединения, разности, а также операции добавления или удаления вершин или дуг графа, и пр.

Наглядно нечеткую онтологию можно представить с помощью нечеткого ориентированного графа

G =V, A, , w, где V – множество вершин, A – множество дуг орграфа, wij –

весовой коэффициент дуги, w: V V [0,1], w W.

Page 12: методика формирования нечетких онтологий

12

Онтология роботов в виде графаОнтология роботов в виде графа

Page 13: методика формирования нечетких онтологий

13

Теоретико-графовые характеристики Теоретико-графовые характеристики онтологиионтологии

Размерность онтологии есть общее число вершин p и дуг q графа онтологии. Она может задаваться как в аддитивной форме d =p+q, так и в мультипликативной форме d*=p·q.

Сложность онтологии характеризуется разнообразием путей в графе, ведущих от входа к выходу онтологии:

Влияние понятия в онтологии есть число его непосредственных связей с другими понятиями, т.е. задается степенью вершины графа онтологии – числом дуг qv, инцидентных вершине v, которая соответствует данному понятию.

Количественные характеристики связности графа можно использовать для оценки «богатства» онтологии. Так, граф называется k-связным, если каждая его вершина связана с числом k других вершин.

Основными характеристиками онтологии являются глубина и ширина. Так возможны три варианта определения глубины онтологии: абсолютная глубина – сумма длин всех путей графа; максимальная глубина – максимальная длина пути в графе; средняя глубина – абсолютная глубина, деленная на число путей в графе.

Аналогично абсолютная ширина онтологии есть сумма числа вершин для каждого уровня иерархии, взятая по всем уровням. Максимальная ширина – это максимальное количество вершин на одном уровне, а средняя ширина –абсолютная ширина, деленная на количество уровней.

1 2

1 121

)1(1 m

i

m

jijs

mm

Page 14: методика формирования нечетких онтологий

14

Пятиуровневая онтологическая Пятиуровневая онтологическая модельмодель

• На первом (верхнем) уровне расположена комплексная проблемная область D (например, когнитивные транспортные роботы), которая предполагает слияние источников информации (экспертов, коллекций текстов) из разных областей (робототехника, когнитивные науки, промышленные транспортные системы).

• Подобласти ПрО SD (второй уровень). Например, робототехника, когнитивные науки, промышленные транспортные системы.

• Каждая подобласть характеризуется своими источниками информации (третий уровень).

• С их помощью строится иерархия понятий ПрО, где на четвертом уровне расположены базовые категории онтологии Ci, i = [1; n].

• На пятом (нижнем) уровне – ключевые слова, относящиеся к именам категорий kj, j = [1; m].

Page 15: методика формирования нечетких онтологий

15

Пример нечеткой онтологииПример нечеткой онтологииНа рисунке дан иллюстративный пример нечеткой реляционной онтологии с тремя категориями (С1 – «робот», С2 – «познание», С3 – «движение») и четырьмя ключевыми словами (k1 – «мобильный робот», k2 – «космический робот», k3 – «интеллектуальный робот», k4 – «когнитивный робот»). Ядро нечеткой реляционной онтологии задается нечетким отношением R, определенном на декартовом произведении kC ключевых слов и категорий.

mk

k

k

R

...2

1

mnmm

n

n

n

rrr

rrr

rrr

CCC

...

............

...

...

...

21

22221

11211

21

Page 16: методика формирования нечетких онтологий

16 1616

Алгоритм Алгоритм построения построения

нечетких нечетких онтологийонтологий

Page 17: методика формирования нечетких онтологий

17

Формирование нечеткой онтологии с Формирование нечеткой онтологии с помощью экспертовпомощью экспертов

Первый сценарий связан с созданием автономной междисциплинарной рабочей группы экспертов hl, l = [1; p], которые вначале формируют термины и терминологические словосочетания проблемной области, а затем составляют простую иерархию «категории – ключевые слова».

При разработке онтологической системы эксперты производят выбор и соотнесение имен категорий с ключевыми словами.

Поскольку каждый эксперт есть специалист в определенной подобласти ПрО, а уровень его компетентности в других подобластях ниже, предварительно определяется вес эксперта по разделам (подобластям) ПрО, выражаемый числом из интервала [0, 1].

Далее эксперты определяют степень связи между категорией Ci и ключевым словом kj, которое также задается числом из интервала [0, 1]. Сближение значений весов может характеризовать «степень разделения» онтологии разными специалистами.

Page 18: методика формирования нечетких онтологий

18

Формирование нечеткой онтологии с Формирование нечеткой онтологии с помощью экспертовпомощью экспертов

Нечеткую онтологию можно также получить на основе четких онтологий, построенных разными экспертами. А именно, нечеткие значения связей в онтологии можно легко получить, исходя из четких экспертных оценок в ситуации групповой экспертизы. Пусть, например, имеется 10 экспертов, которые оценивают наличие связи категории Ci с ключевым словом kj. Предположим, семь экспертов указали, что связь есть, а трое – что связи нет. Тогда имеем степень связи rij = 0,7. В общем случае значение степени связи определяется формулой

rij = m/n,где m – число экспертов, указавших, что связь между Ci и kj есть, а n – общее число экспертов. Если необходимо сравнить между собой различные онтологии, то можно использовать показатели сходства графов.

Page 19: методика формирования нечетких онтологий

19

Формирование нечеткой онтологии Формирование нечеткой онтологии с помощью коллекции текстовс помощью коллекции текстов

Второй сценарий связан с формированием (возможно, с помощью экспертов) представительной коллекции текстовых документов (учебники, монографии, научные статьи, техническая документация, материалы с сайтов и пр.). Сборка терминологических словосочетаний из документов производится автоматически с использованием синтаксических признаков. Для выделения словосочетаний рассмотрим их лексико-грамматические типы. Различают следующие лексико-грамматические типы словосочетаний: глагольные, именные, наречные.

Глагольные словосочетания имеют следующие модели:• глагол + существительное или местоимение (с предлогом

или без предлога): двигаться к цели, захватить его (объект);• глагол + инфинитив или деепричастие: требует остановиться,

двигаться ускоряясь;• глагол + наречие: повернуть направо, запросить повторно.

Page 20: методика формирования нечетких онтологий

20

Формирование нечеткой онтологии с Формирование нечеткой онтологии с помощью коллекции текстовпомощью коллекции текстов

Именные словосочетания делятся на субстантивные, адъективные, с главным словом числительным и с главным словом местоимением. Остановимся на ряде субстантивных словосочетаний:

• одиночные существительные, аббревиатуры: агент, ИКА;• согласуемое слово + существительное: автономный агент;• существительное + существительное: взаимодействие со

средой;• существительное + инфинитив: команда остановиться.Также будем использовать модели адъективных словосочетаний:• прилагательное + существительное: интеллектуальный агент;• прилагательное + прилагательное + существительное:

физический когнитивный агент;• прилагательное + инфинитив: способный рассуждать, готовый

действовать.

Page 21: методика формирования нечетких онтологий

21

ЗаключениеЗаключение

Для организации совместной работы агентов в многоагентной системе необходимо построение системы онтологий, обеспечивающих коллективное понимание решаемых проблем. В такой системе важную роль играет понятие метаонтологии (онтологии над онтологиями), определяющее выбор языка формализации онтологии.

Большие перспективы онтологического моделирования связаны с формированием и развитием концепции гранулярных метаонтологий.

Page 22: методика формирования нечетких онтологий

22

Модифицированная схема взаимосвязи Модифицированная схема взаимосвязи онтологийонтологий

По сравнению с А.В.Смирнов и др. Онтологии в системах искусственного интеллекта: способы построения и организации (часть 1)// Новости искусственного интеллекта. – 2002. – №1. – С.3-13.

Page 23: методика формирования нечетких онтологий

23

Понятие гранулыПонятие гранулы

Грануляция информации основана на неклассическом представлении множества. Классическое понятие множества опирается на два основных принципа: принцип принадлежности и принцип различимости его элементов. В то же время, гранула есть совокупность неразличимых объектов, определяемая только их типом и количеством. Онтология гранул – это онтология представления сложных единиц информации и выявления знаний из данных. Под гранулой понимается группа объектов, объединяемых неразличимостью, сходством, близостью (т.е. отношениями, обладающими, по крайней мере, свойствами симметричности и рефлексивности). По сути, термин «гранула» означает динамическую целостную структуру, организованную для достижения некоторой цели.

Page 24: методика формирования нечетких онтологий

24

Спасибо за внимание!Спасибо за внимание!