Upload
yury-katkov
View
1.941
Download
2
Embed Size (px)
Citation preview
1
Методика формированияМетодика формированиянечетких онтологийнечетких онтологий
Калуцкая Анастасия Петровна
Московский Государственный Технический Университет им. Н.Э.Баумана
Управление знаниями и технологии семантического веба KMSW’2010,
Санкт-Петербург, 4-5 декабря
2
Понятие онтологииПонятие онтологии Онтология – это явное и формализованное определение структуры некоторой проблемной области (темы). Онтология – это подробная спецификация структуры определенной предметной области, первоначально сделанная на естественном языке. Она предлагает словарь для представления и обмена знаниями по интересующей проблеме и набор связей и свойств, которые определены между имеющимися в ее составе неделимыми сущностями. Онтологию часто понимают как «спецификацию разделяемой разными людьми концептуализации» или, иначе, отождествляют с набором сосуществующих концептуальных моделей предметной области. По сути, онтологии отражают соглашения о единых способах построения и использования концептуализации. При взаимодействии агентов онтологии используются как средство, предоставляющее общий словарь; здесь агенты, по сути, заключают соглашение, используя общую интерпретацию терминов словаря для обмена сообщениями на уровне знаний.Значительный вклад в теорию и проектирование онтологий внесли Т.Грубер, Н.Гуарино, Р.Мизогучи, Р.Студер, Т.А.Гаврилова, А.С.Клещев, А.В.Смирнов, С.В.Смирнов и др.
3
Онтологии в системе моделей Онтологии в системе моделей представления знанийпредставления знаний
4
Когнитивный агент: диалоговое управлениеКогнитивный агент: диалоговое управление
Гибкое, интеллектуальное управление и диалоговый интерфейс – это отличительные черты когнитивных агентов. При этом главная проблема состоит не столько в техническом обеспечении диалога, сколько в создании общего языка и единого «поля знаний», необходимых для взаимопонимания и совместной работы естественных и искусственных агентов. Для реализации диалогового управления необходимо построение общих онтологий, обеспечивающих эффективную коммуникацию человека и робота при выполнении последним сложных задач в неточно и неполностью определенной среде.
5
Когнитивные агентыКогнитивные агентыПод агентом понимается «любая сущность, которая
находится в некоторой среде, воспринимает ее посредством сенсоров, получая данные, которые отражают события, происходящие в среде, интерпретирует эти данные и действует на среду посредством эффекторов».
Четыре агентообразующих фактора – среда, восприятие, интерпретация, действие.
Обычно определение искусственного агента сводится к выделению некоторого минимального набора его базовых характеристик, в число которых входят:
1) активность; 2) реактивность; 3) автономность; 4) коммуникативность; 5) интенциональность. Когнитивная функция обеспечивает процессы познания агентом внешнего
мира, других агентов, а также его самопознание. Основными когнитивными процессами являются: 1) процессы восприятия среды, 2) формирования ее обобщенного внутреннего представления, 3) обучения, 4) понимания принципов взаимодействия и поведения.
6
Ментальная карта «Онтологии когнитивного Ментальная карта «Онтологии когнитивного агента»агента»
7
Парадигматические отношенияПарадигматические отношенияОбщими отношениями для различных онтологий
являются: 1) генеративные отношения «есть некоторый» (is_a); 2) таксономические отношения («класс-подкласс»,
«класс-экземпляр); 3) родо-видовые отношения; 4) партономические (или мереологические)
отношения («часть–целое»); 5) отношения наследования или генеалогические
связи («предок-потомок»). Эти отношения могут быть как четкими, так и
нечеткими, например, нечеткие генеративные отношения «есть некоторый со степенью μ» (is_a_with_ μ).
8
Примеры отношений в онтологияхПримеры отношений в онтологияхТаксономические отношения:Мобильные роботы есть подкласс класса
роботы, а транспортные роботы – подкласс класса мобильных роботов.
Партономические отношения:База знаний и сенсорная подсистема – части
когнитивной системы интеллектуального робота. Генеалогические отношения:Интегральные и интеллектуальные роботы
(т.е. роботы 3-го поколения) – «потомки» очувствленных роботов (роботов 2-го поколения), снабженных системой тактильных датчиков, которые позволяют им воспринимать текущую информацию из среды.
9
Формализация нечетких онтологийФормализация нечетких онтологийВ настоящей работе предложена обобщенная нечеткая модель
онтологии, основанная на расширении алгебраической системы – базовой математической конструкции А.И.Мальцева.
В качестве основы для формализации онтологий предложено использовать нечеткую алгебраическую систему.
Нечеткая алгебраическая система есть тройка FAS = X, (R), Ω,
где X – множество нечетких объектов; (R)= {(r, φ)rR: Xn[0,1]} – множество нечетких отношений
между объектами; φ – сила отношения; Ω={ΩX, ΩR}– множество операций над объектами из X и
отношениями из R, например, унарных операций ΩX1: X X,
бинарных операций ΩX2:XX X, ΩR
2: (R)2 (R). При Ω = приходим к понятию нечеткой реляционной
системы.
10
Формализация нечетких онтологийФормализация нечетких онтологийНечеткое представление «легкой» онтологии как пары ONT = X, (R), где X – множество категорий или понятий
предметной области, (R)–множество нечетких отношений между понятиями предметной области.
Когда определено также множество аксиом (проведена аксиоматизация предметной области), онтология является «весомой», т.е. представляется тройкой ONT’ = X, (R), AX.
Другой вариант определения весомых онтологий – введение множества Ф ={f} – конечного множества функций интерпретации, заданных на понятиях и/или отношениях онтологии ONT’’, f: Dn[0,1], D – область интерпретации.
Здесь значения f представляют собой числа из интервала [0,1], в частности, их можно понимать как значения вероятности, возможности или необходимости. Дальнейшее обобщение связано с лингвистическими оценками истинности.
Также онтологию можно представлять четверкой ONT* = X, (R), At, C , где At – множество нечетких свойств (значений) понятий, а C – множество нечетких ограничений.
11
Представление онтологии в виде Представление онтологии в виде графаграфа
Целесообразность введения операций над объектами и отношениями онтологии обусловлена практическими соображениями: так в случае представления онтологии нечетким графом совершенно естественными являются теоретико-множественные операции пересечения, объединения, разности, а также операции добавления или удаления вершин или дуг графа, и пр.
Наглядно нечеткую онтологию можно представить с помощью нечеткого ориентированного графа
G =V, A, , w, где V – множество вершин, A – множество дуг орграфа, wij –
весовой коэффициент дуги, w: V V [0,1], w W.
12
Онтология роботов в виде графаОнтология роботов в виде графа
13
Теоретико-графовые характеристики Теоретико-графовые характеристики онтологиионтологии
Размерность онтологии есть общее число вершин p и дуг q графа онтологии. Она может задаваться как в аддитивной форме d =p+q, так и в мультипликативной форме d*=p·q.
Сложность онтологии характеризуется разнообразием путей в графе, ведущих от входа к выходу онтологии:
Влияние понятия в онтологии есть число его непосредственных связей с другими понятиями, т.е. задается степенью вершины графа онтологии – числом дуг qv, инцидентных вершине v, которая соответствует данному понятию.
Количественные характеристики связности графа можно использовать для оценки «богатства» онтологии. Так, граф называется k-связным, если каждая его вершина связана с числом k других вершин.
Основными характеристиками онтологии являются глубина и ширина. Так возможны три варианта определения глубины онтологии: абсолютная глубина – сумма длин всех путей графа; максимальная глубина – максимальная длина пути в графе; средняя глубина – абсолютная глубина, деленная на число путей в графе.
Аналогично абсолютная ширина онтологии есть сумма числа вершин для каждого уровня иерархии, взятая по всем уровням. Максимальная ширина – это максимальное количество вершин на одном уровне, а средняя ширина –абсолютная ширина, деленная на количество уровней.
1 2
1 121
)1(1 m
i
m
jijs
mm
14
Пятиуровневая онтологическая Пятиуровневая онтологическая модельмодель
• На первом (верхнем) уровне расположена комплексная проблемная область D (например, когнитивные транспортные роботы), которая предполагает слияние источников информации (экспертов, коллекций текстов) из разных областей (робототехника, когнитивные науки, промышленные транспортные системы).
• Подобласти ПрО SD (второй уровень). Например, робототехника, когнитивные науки, промышленные транспортные системы.
• Каждая подобласть характеризуется своими источниками информации (третий уровень).
• С их помощью строится иерархия понятий ПрО, где на четвертом уровне расположены базовые категории онтологии Ci, i = [1; n].
• На пятом (нижнем) уровне – ключевые слова, относящиеся к именам категорий kj, j = [1; m].
15
Пример нечеткой онтологииПример нечеткой онтологииНа рисунке дан иллюстративный пример нечеткой реляционной онтологии с тремя категориями (С1 – «робот», С2 – «познание», С3 – «движение») и четырьмя ключевыми словами (k1 – «мобильный робот», k2 – «космический робот», k3 – «интеллектуальный робот», k4 – «когнитивный робот»). Ядро нечеткой реляционной онтологии задается нечетким отношением R, определенном на декартовом произведении kC ключевых слов и категорий.
mk
k
k
R
...2
1
mnmm
n
n
n
rrr
rrr
rrr
CCC
...
............
...
...
...
21
22221
11211
21
16 1616
Алгоритм Алгоритм построения построения
нечетких нечетких онтологийонтологий
17
Формирование нечеткой онтологии с Формирование нечеткой онтологии с помощью экспертовпомощью экспертов
Первый сценарий связан с созданием автономной междисциплинарной рабочей группы экспертов hl, l = [1; p], которые вначале формируют термины и терминологические словосочетания проблемной области, а затем составляют простую иерархию «категории – ключевые слова».
При разработке онтологической системы эксперты производят выбор и соотнесение имен категорий с ключевыми словами.
Поскольку каждый эксперт есть специалист в определенной подобласти ПрО, а уровень его компетентности в других подобластях ниже, предварительно определяется вес эксперта по разделам (подобластям) ПрО, выражаемый числом из интервала [0, 1].
Далее эксперты определяют степень связи между категорией Ci и ключевым словом kj, которое также задается числом из интервала [0, 1]. Сближение значений весов может характеризовать «степень разделения» онтологии разными специалистами.
18
Формирование нечеткой онтологии с Формирование нечеткой онтологии с помощью экспертовпомощью экспертов
Нечеткую онтологию можно также получить на основе четких онтологий, построенных разными экспертами. А именно, нечеткие значения связей в онтологии можно легко получить, исходя из четких экспертных оценок в ситуации групповой экспертизы. Пусть, например, имеется 10 экспертов, которые оценивают наличие связи категории Ci с ключевым словом kj. Предположим, семь экспертов указали, что связь есть, а трое – что связи нет. Тогда имеем степень связи rij = 0,7. В общем случае значение степени связи определяется формулой
rij = m/n,где m – число экспертов, указавших, что связь между Ci и kj есть, а n – общее число экспертов. Если необходимо сравнить между собой различные онтологии, то можно использовать показатели сходства графов.
19
Формирование нечеткой онтологии Формирование нечеткой онтологии с помощью коллекции текстовс помощью коллекции текстов
Второй сценарий связан с формированием (возможно, с помощью экспертов) представительной коллекции текстовых документов (учебники, монографии, научные статьи, техническая документация, материалы с сайтов и пр.). Сборка терминологических словосочетаний из документов производится автоматически с использованием синтаксических признаков. Для выделения словосочетаний рассмотрим их лексико-грамматические типы. Различают следующие лексико-грамматические типы словосочетаний: глагольные, именные, наречные.
Глагольные словосочетания имеют следующие модели:• глагол + существительное или местоимение (с предлогом
или без предлога): двигаться к цели, захватить его (объект);• глагол + инфинитив или деепричастие: требует остановиться,
двигаться ускоряясь;• глагол + наречие: повернуть направо, запросить повторно.
20
Формирование нечеткой онтологии с Формирование нечеткой онтологии с помощью коллекции текстовпомощью коллекции текстов
Именные словосочетания делятся на субстантивные, адъективные, с главным словом числительным и с главным словом местоимением. Остановимся на ряде субстантивных словосочетаний:
• одиночные существительные, аббревиатуры: агент, ИКА;• согласуемое слово + существительное: автономный агент;• существительное + существительное: взаимодействие со
средой;• существительное + инфинитив: команда остановиться.Также будем использовать модели адъективных словосочетаний:• прилагательное + существительное: интеллектуальный агент;• прилагательное + прилагательное + существительное:
физический когнитивный агент;• прилагательное + инфинитив: способный рассуждать, готовый
действовать.
21
ЗаключениеЗаключение
Для организации совместной работы агентов в многоагентной системе необходимо построение системы онтологий, обеспечивающих коллективное понимание решаемых проблем. В такой системе важную роль играет понятие метаонтологии (онтологии над онтологиями), определяющее выбор языка формализации онтологии.
Большие перспективы онтологического моделирования связаны с формированием и развитием концепции гранулярных метаонтологий.
22
Модифицированная схема взаимосвязи Модифицированная схема взаимосвязи онтологийонтологий
По сравнению с А.В.Смирнов и др. Онтологии в системах искусственного интеллекта: способы построения и организации (часть 1)// Новости искусственного интеллекта. – 2002. – №1. – С.3-13.
23
Понятие гранулыПонятие гранулы
Грануляция информации основана на неклассическом представлении множества. Классическое понятие множества опирается на два основных принципа: принцип принадлежности и принцип различимости его элементов. В то же время, гранула есть совокупность неразличимых объектов, определяемая только их типом и количеством. Онтология гранул – это онтология представления сложных единиц информации и выявления знаний из данных. Под гранулой понимается группа объектов, объединяемых неразличимостью, сходством, близостью (т.е. отношениями, обладающими, по крайней мере, свойствами симметричности и рефлексивности). По сути, термин «гранула» означает динамическую целостную структуру, организованную для достижения некоторой цели.
24
Спасибо за внимание!Спасибо за внимание!