23
ОНТОЛОГИИ ВЕРХНЕГО УРОВНЯ. ОБЗОР Пивоварова Лидия Михайловна СПбГУ 2010

онтологии верхнего уровня

Embed Size (px)

Citation preview

Page 1: онтологии верхнего уровня

ОНТОЛОГИИ ВЕРХНЕГО УРОВНЯ. ОБЗОР

Пивоварова Лидия Михайловна

СПбГУ2010

Page 2: онтологии верхнего уровня

Top-level онтологии: список

1. BFO2. ConceptNet3. DOLCE4. OCHRE5. PROTON6. SUMO7. UpperCYC8. YAGO9. YAMATO

Page 3: онтологии верхнего уровня

Принципы описания

1. Название2. Разработчики3. Объем4. Meta/top-level/domain5. Категоризация6. Тематическая направленность7. Язык8. Приложения9. URL

Page 4: онтологии верхнего уровня

BFO

• IFOMIS (Institute for Formal Ontology and Medical Information Science, Saarland University)

• 36 концептов• Meta• Классы, экземпляры, отношения.• Онтология реальности (а не представлений о ней).• Имплементирована на различных формальных

языках, в том числе OWL и KIF• Более сорока доменных онтологий, разработанных

на основе BFO; почти все они описывают ту или иную область биологии или медицины.

• http://www.ifomis.org/bfo

Page 5: онтологии верхнего уровня

Continuant(Континуант)

Spatial Region(Пространственный регион)

Independent Continuant(Независимый континуант)

Dependent Continuant(Зависимый континуант)

Volume(Объем)

Line(Линия)

Surface(Поверхность)

Point(Точка)

Site(Пространство)

Object Aggregate

(Объединение объектов)

Object(Объект)

Fiat Part of Object

(«Назначенная» часть объекта)

Boundary of Object

(Граница объекта)

Reliable Entity(Относительная

сущность)

Disposition(Поведение)

Role(Роль)

Quality(Качество)

Function(Функция)

SNAP

Page 6: онтологии верхнего уровня

Occurent (Оккурент)

Processual Entity(Процессная сущность)

Temporal Region(Временной регион)

Processual Context(Процессуальный

контекст)

Process Aggregate

(Объединение процессов)

Process(Процесс)

Boundary of Process

(Граница процесса)

SPAN

Scattered Spatiotemporal

Region(Разрозненный

пространственно-временной регион)

Connected Spatiotemporal

Region(Связный

пространственно-временной регион)

Spatiotemporal Interval

(Пространственно-временной интервал)

Spatiotemporal Instant

(Пространственно-временной экземпляр)

Scattered Temporal Region

(Разрозненный временной регион)

Connected Temporal Region

(Связный временной регион)

Temporal Interval(Временной интервал)

Temporal Instant(Временной экземпляр)

Fiat Part of Process

(«Назначенная» часть процесс)

Spatiotemporal Region(Пространственно-временной

регион)

Page 7: онтологии верхнего уровня

ConceptNet • MIT Media Lab• 1029711 утверждений для английского языка 356277 для

китайского, 233423 для португальского, около 15000 для японского и корейского, а также утверждения на датском, венгерском, французском, испанском и итальянском языках

• Иеррархия отсутствует; онтология представляет собой сеть

• Сетевая структура: узлы и отношения.• Повседневные знания (common sence).• Непосредственно на языке программирования (Python) • Использовалась для распознавания речи и изображений,

человеко-машинные интерфейсы, рекомендательные системы, поисковые системы

• http://csc.media.mit.edu/conceptnet

Page 8: онтологии верхнего уровня

DOLCE• Laboratory for Applied Ontology (LOA)• Приблизительно 100 концептов, 100 свойств и 20 аксиом• Скорее Meta - в том же смысле, в котором BFO; однако

большее число концептов предполагает и большую детализацию, т.е. приближение к top-level в нашем смысле

• Концепты и аксиомы• Онтология языковых и когнитивных представлений.• First-Order Logic; перевод на OWL, части, для который не

хватает выразительности OWL приведены в качестве комментариев на KIF

• Первый модуль в библиотеке WonderWeb• http://www.loa-cnr.it/DOLCE.html

Page 9: онтологии верхнего уровня

EntityСущность

AbstractАбстрактное

QualityКачествоPerdurant

Динамическое

EndurantСтатическое

Physical Endurant

Физическое статическое

Arbitrary SumПроизвольная

сумма

Non-physical Endurant

Нефизическ. статическое

Amount of Matter

Часть материи

Physical ObjectФизический

объект

FeatureПризнак

Agentive Physical Object

Агентивный физический

объект

Non-Agentive Physical Object Неагентивный

физический объект

Non-physical Object

Нефизический объект

Mental ObjectМентальный

объект

Social ObjectСоциальный

объект

Agentive Social Object

Агентивный социальный

объект

Non-Agentive Social Object

Неагентивный социальный

объект

Social AgentСоциальный

Агент

SocietyОбщество

StativeПостоянное

EventСобытие

AccomplishmentИсполнение

AchievementДостижение

ProcessПроцесс

StateСостояние

Page 10: онтологии верхнего уровня

EntityСущность

AbstractАбстрактное

QualityКачество

PerdurantДинамическое

EndurantСтатическое

Abstract QualityАбстрактное

Качество

Physical QualityФизическое

Качество

Temporal QualityВременное Качество

Temporal LocationВременное

месторасположение

Spatial LocationПространственное

месторасположение

SetМножество

RegionРегион

FactФакт

Abstract RegionАбстрактный

Регион

Physical RegionФизический

Регион

Temporal RegionВременной Регион

Time IntervalВременной интервал

Space RegionПространственный

регион

Page 11: онтологии верхнего уровня

OCHRE

• University of Chicago• Около 20 концептов• Meta• Концепты, свойства, ссылки.• Информация о культурном наследии.• XML, XMLSchema• Более десятка археологических и

филологических баз знаний.• http://ochre.lib.uchicago.edu/index.htm

Page 12: онтологии верхнего уровня

ItemЕдиница

Базовые концепты

Spatial unitПространственная

единица

Taxonomic unitТаксономическая

единица

Temporal unitВременная

единица

Agency unitАгентивная

единица

Resource unitВнешний ресурс

Bibliographic unitБиблиографическая

единица

Discourse unitДискурсивная

единица

Epigraphic unitЭпиграфическая

единица

Script unitРукописная

единица

Lexical unitЛексическая

единица

Концепты, необходимые для

группировки других концептов

List Список

HierarchyИеррархия

Relationship Отношения

Query Запрос

TextТекст

TaxonomyТаксономия

Page 13: онтологии верхнего уровня

PROTON

• Ontotext Lab, Sirma Group• 300 классов и 100 свойств• top-level• Классы и свойства.• Онтология реальности.• OWL Lite• SEKT Project (Semantic Web)• http://proton.semanticweb.org/

Page 14: онтологии верхнего уровня

EntityСущность

AbstractАбстрактноеObject

Объект

HappeningПроисходящее

EventСобытие

SituationПоложение

Time IntervalВременной интервал

RoleРоль

Job PositionДолжность

StatementУтверждение

AgentАгент

ServiceСервис

ProductПродукт

LocationМестоположение

GroupГруппа

PersonПерсона

OrganizationОрганизация

Information Resource

Информационный ресурс

DocumentДокумент

Contact InformationКонтактная

информация

General TermОбщий термин

NumberЧисло

TopicТема

LanguageЯзык

Page 15: онтологии верхнего уровня

SUMO

• IEEE (Institute of Electrical and Electronics Engineers)

• 1000 концептов и 5000 аксиом• top-level• Концепты и аксиомы.• Попытка объединения существующих

онтологий верхнего уровня.• KIF, переведена на OWL• Доменные онтологии и лексические базы.• http://www.ontologyportal.org/index.html

Page 16: онтологии верхнего уровня

physical(физическое)

process(процесс)

object(объект)

self connected object

(связный объект)

region(регион)

collection(коллекция)

agent(агент)

substance(материя)

corpuscular object (корпускулярный

объект)

content bearing object

(несущий содержание

объект)

food(еда)

hole(дыра)

astronomical body (астрономическое

тело)

geographic area(географический

регион)

group(группа)

organization(организация)

sentient agent(чувствующий

агент)

geopolitical area (геополитический

регион)

group (группа)

organism(организм)

dual object process(двухобъектный

процесс)

intentional process(интенциональный

процесс)

motion(движение)

internal change(внутреннее изменение)

shape change(изменение

формы)

Page 17: онтологии верхнего уровня

abstract(абстрактное)

graph element(элемент графа)

graph(граф)

proposition(пропозиция)

relation(отношение)

set or class(множество или класс)

attribute(атрибут)

quantity(количество)

number(число)

real number(вещественное

число)

imaginary number(мнимое число)

complex number(комплексное

число)

physical quantity(физическое количество)

constant quantity(постоянное количество)

unit of measure(единица

измерения)

function quantity(функциональное

количество)

internal attribute(внутренний атрибут)

relational attribute(относительный

атрибут)

saturation attribute(атрибут

пропитанности)

physical state(физическое состояние)

breakability attribute (атрибут

членимости)

perceptual attribute

(перцептивный атрибут)

biological attribute

(биологический атрибут)

shape attribute(атрибут формы)

positional attribute(атрибут

положения)

truth value(истинностное

значение)

social role (социальная роль)

biological attribute(биологический

атрибут)

time zone(часовой пояс)

single valued relation(отношение с одним

значением)

total valued relation(отношение с

интервальным значением)

partial valued relation(отношение с

частичным значением)

binary relation(бинарное

отношение)

ternary relation(тернарное отношение)

spatial relation(пространственн

ое отношение)temporal relation

(временное отношение)

quaternary relation

(отношение четырех

объектов)

list(список)

predicate(предикат)

Page 18: онтологии верхнего уровня

UpperCYC

• Cycorp, Inc.• 3000 терминов• Meta и top-level• Коллекции, индивидуумы, предикаты,

отношения, функции.• Универсальная.• CycL• Интегрирована в онтологии CYC и OpenCYC• http://glotta.ntua.gr/StateoftheArt/Ontologies/

cover.html

Page 19: онтологии верхнего уровня

YAGO• 2 миллиона сущностей и 20 миллионов фактов• Meta-модель с наполнением конкретной фактографической

информацией; в качестве промежуточного уровня выступает WordNet

• Сущности, классы, экземпляры, отношения, факты (каждая сущность является экземпляром какого-либо класса; факты также являются сущностями и могут вступать в отношения).

• База фактов (главным образом - концептуализация Википедии).

• Текстовый формат• Извлечение информации, логический вывод, вопросно-

ответные системы.• http://www.mpi-inf.mpg.de/yago-naga/yago/downloads.html

Page 20: онтологии верхнего уровня

YAMATO

• Mizoguchi Lab, Osaka University• Около 1000 концептов• Meta и top-level• Концепты, роли, носители ролей, отношения.• Универсальная онтология с упором на

концептуализацию свойств и репрезентаций.• XML (формат HOZO)• Несколько отраслевых онтологий: в том числе

медицинская, генетическая, онтология поведения и др.

• http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_library/upperOnto.htm

Page 21: онтологии верхнего уровня

EntityСущность

Dependent EntityЗависимая сущностьEntity

Сущность

SubstrateОснова

TimeВремя

SpaceПространство

SubstanceМатерия

FunctionalФункционал

Morphologial wholeМорфологическое

целое

AgentАгент

Occurent (Оккурент)

Continuant(Континуант)

Quality valueЗначение качества

QualityКачество

Non-unitaryНецелостное

ObjectОбъект

Living organism

Живой организм

Chemical compoundХимическое соединение

ArtifactАртефакт

PhysicalФизическое

AbstractАбстрактное

Semi-abstractПолу-абстрактное

MindСознание Content

СодержаниеRepresentationРепрезентация

Representation form

Форма репрезентации

Quality-Quantity

Качество-Количество

RoleРоль

FeatureСвойство

Generic qualityОригинальное

качество

PropertyСвойство

CategoricalКатегориальное

QuantityКоличество

Page 22: онтологии верхнего уровня

Выводы и впечатления• На сегодняшний день сложилось некое общее место самого

верхнего уровня – разделение на объекты, процессы и отношения.

• OWL является общепринятым языком импорта-экспорта, но он является не достаточным – в большинстве проектов не используется, или используется как вспомогательный.

• Большинство проектов не ориентированы на обработку естественного языка как основную задачу. Скорее, онтологии используются для организации и переорганизации знаний предметной области и поиска по ним.

• При этом анализ текста рассматривается как важнейший инструмент пополнения онтологии.

• Методологии создаются ad hoc, их очевидно недостаточно.

• Иногда создание онтологии становится самоцелью – гигантские проекты заканчиваются созданием неиспользуемого продукта.

Page 23: онтологии верхнего уровня

Спасибо за внимание!