Осипов Г.С. · Постановка задачи strips-планирования (111). 3.3.2. Ал-горитм strips (113). 3.3.3. Неполнота алгоритма

Осипов Г.С.

Методыискусственного

интеллекта

МОСКВАФИЗМАТЛИТ ®

УДК 519,816ББК 32,813

О74

Издание осуществлено при поддержкеРоссийского фонда фундаментальныхисследований по проекту 10-07-07014

Оси пов Г. С. Методы искусственного интеллекта.—М.:ФИЗМАТЛИТ,2011. — 296 с. — ISBN 978-5-9221-1323-6.

Монография содержит изложение основных методов искусственного ин-теллекта: методов представления знаний, методов моделирования рассужде-ний, методов моделирования поведения, методов обучения и приобретениязнаний интеллектуальными системами. Весь материал излагается с единыхпозиций. В качестве основных средств используются системы правил в ихобщем виде и семантические сети; особенное внимание уделено неоднород-ным семантическим сетям, а также методам планирования и моделированияцеленаправленного поведения. Системы правил использованы и для описанияэтих методов. Описаны методы автоматизации приобретения знаний, для чегоприменен аппарат неоднородных семантических сетей.

Для специалистов, аспирантов и студентов старших курсов университетов,изучающих информатику и информационные технологии.

ISBN 978-5-9221-1323-6

c© ФИЗМАТЛИТ, 2011

c© Г. С. Осипов, 2011

ОГЛАВЛЕНИЕ

Предисловие автора . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 7

Введение . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 9

Г л а в а 1. Методы представления знаний . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 23

Введение . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 23

1.1. Формальные языки и формальные системы . .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 231.1.1. Язык исчисления предикатов первого порядка (23).1.1.2. Элементы исчисления предикатов первого порядка (25).1.1.3. Формальные системы (27). 1.1.4. Алгебраические систе-мы (28). 1.1.5. Интерпретация (28). 1.1.6. Выполнимость иистинность (29).

1.2. Системы, основанные на правилах, или продукционные системы . . 311.2.1. Правила для представления знаний (32). 1.2.2. Рабочая па-мять (32). 1.2.3. Стратегии управления (33). 1.2.4. Разрешениеконфликтного множества правил (35). 1.2.5. Пример (39).

1.3. Cемантические сети для представления знаний . .. .. .. .. .. .. .. .. .. .. .. .. . 431.3.1. Простые и расширенные семантические сети (43).1.3.2. Универсум Эрбрана и семантические сети (45). 1.3.3. Неод-нородные семантические сети (48).

1.4. Совместность . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 541.4.1. Вектор совместности событий (55). 1.4.2. Матрицы совмест-ности элементов (55).

1.5. Представление знаний в системах фреймов . .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 571.5.1. Фреймы (57). 1.5.2. Системы фреймов (58). 1.5.3. Основнаявычислительная задача в системе фреймов (59).

1.6. Элементы дескриптивной логики . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 591.6.1. Основные понятия (61). 1.6.2. База знаний в дескрип-тивной логике (61). 1.6.3. Рассуждения в дескриптивной ло-гике (62). 1.6.4. Семейство языков дескриптивных логик (65).1.6.5. Отображение дескриптивной логики в логику первого поряд-ка (66). 1.6.6. Дескриптивная логика с конкретным доменом (67).1.6.7. Правила вывода (69).

4 Оглавление

Г л а в а 2. Методы автоматизации рассуждений. .. .. .. .. .. .. .. .. .. .. .. .. .. . 72

Введение . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 72

2.1. Автоматизация дедуктивных рассуждений. Поиск доказательствтеорем методом резолюций . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 752.1.1. Скулемовская стандартная форма (76). 2.1.2. Метод резолю-ций для исчисления высказываний (80). 2.1.3. Метод резолюцийдля исчисления предикатов первого порядка (82).

Примеры . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 84

2.2. Индуктивные рассуждения . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 862.2.1. Понятие квазиаксиоматической теории (86). 2.2.2. Немо-нотонные рассуждения (87). 2.2.3. ДСМ — метод индуктивноговывода (89).

2.3. Аргументационные рассуждения. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 93

2.4. Рассуждения на основе прецедентов . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 972.4.1. Метрики на множестве прецедентов (97). 2.4.2. Согласова-ние прецедентов (102). 2.4.3. Предпочтения и глобальная реле-вантность (103). 2.4.4. Адаптация прецедентов (104).

Г л а в а 3. Методы интеллектуального планирования . .. .. .. .. .. .. .. .. .. . 107

Введение . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 107

3.1. Хронология методов интеллектуального планирования . .. .. .. .. .. .. .. . 109

3.2. Планирование как поиск доказательства теорем . .. .. .. .. .. .. .. .. .. .. .. . 110

3.3. Планирование в пространстве состояний . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 1113.3.1. Постановка задачи STRIPS-планирования (111). 3.3.2. Ал-горитм STRIPS (113). 3.3.3. Неполнота алгоритма STRIPS (113).3.3.4. Вычислительная сложность задачи STRIPS-планиро-вания (116). 3.3.5. Языковые средства описания доменовпланирования (118).

3.4. Поиск в пространстве планов. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 1183.4.1. Основная идея (118). 3.4.2. Алгоритм SNLP (121).3.4.3. Принцип малой связности (122).

3.5. Планирование как задача удовлетворения ограничений . .. .. .. .. .. .. . 1223.5.1. Постановка задачи удовлетворения ограничений (122).3.5.2. Синтез планов на основе техники прямого распространенияограничений (123). 3.5.3. Алгоритм GraphPlan (127).

3.6. Планирование на основе прецедентов . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 1303.6.1. Общая схема метода планирования на основе преце-дентов (130). 3.6.2. Методы адаптации прецедентов (131).3.6.3. Некоторые системы планирования, основанного на прецеден-тах (133).

Г л а в а 4. Интеллектуальные динамические системы. .. .. .. .. .. .. .. .. .. . 150

Введение . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 150

4.1. Уточнение постановки задачи. Правила . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 152

4.2. Стратегии применения правил. Состояния и траектория системы . . 153

4.3. Управляемые динамические системы, основанные на правилах . .. . 155

Оглавление 5

4.3.1. Возмущения (156). 4.3.2. Управление как способ компенса-ции возмущений (156).

4.4. Особенности баз знаний динамических систем, основанных на пра-вилах. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 1574.4.1. Синтез обратной связи по траектории (158). 4.4.2. Стратегиясинтеза обратной связи по состояниям (161).

4.5. Элементы теории управляемости интеллектуальных динамическихсистем . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 163

4.6. Примеры интеллектуальных динамических систем. .. .. .. .. .. .. .. .. .. .. . 1654.6.1. Описание агентов (165). 4.6.2. Функции и форму-лы (169). 4.6.3. Замыкание состояний. Аксиомы (172).4.6.4. Крестообразный перекресток равнозначных однополосныхдорог (174). 4.6.5. Движение по попутной проезжей части (177).4.6.6. Стратегия применения правил (179). 4.6.7. Модели корабля,станции и управления. Общее описание (181). 4.6.8. Пара-метры модели орбитальной станции (183). 4.6.9. Параметрыпроцесса стыковки (184). 4.6.10. Правила замыкания (184).4.6.11. Правила переходов (185). 4.6.12. Управление. Подцелии зоны управления (186). 4.6.13. Правила выбора цели (186).4.6.14. Правила управления (187). 4.6.15. Результаты модельногоэксперимента (189).

Г л а в а 5. Приобретение знаний и машинное обучение . .. .. .. .. .. .. .. . 192

Введение . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 192

5.1. Источники знаний для интеллектуальных систем . .. .. .. .. .. .. .. .. .. .. . 193

5.2. Прямые методы приобретения знаний . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 1945.2.1. Имена (194). 5.2.2. Признаки (195). 5.2.3. Виды семан-тических связей (196). 5.2.4. Типы семантических связей (200).5.2.5. Метод интервью (204).

5.3. Приобретение знаний из примеров . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 2145.3.1. Задачи машинного обучения (214). 5.3.2. Поиск (218).5.3.3. Индуктивный алгоритм построения деревьев реше-ний (TDIDT) (223). 5.3.4. Последовательное покрытие:AQ-обучение (228). 5.3.5. Оценка обучающих алгоритмов (232).5.3.6. Машинное обучение в языке исчисления предикатов первогопорядка (234).

5.4. Искусственные нейронные сети и их обучение . .. .. .. .. .. .. .. .. .. .. .. .. . 2445.4.1. Область применения искусственных нейронных сетей (244).5.4.2. Достоинства и недостатки искусственных нейронных се-тей (246). 5.4.3. Персептрон (247). 5.4.4. Процедура обратно-го распространения (247). 5.4.5. Сети встречного распростране-ния (249). 5.4.6. Сети с обратными связями (251).

Г л а в а 6. Приобретение знаний и анализ текстов . .. .. .. .. .. .. .. .. .. .. .. . 255

Введение . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 255

6.1. Коммуникативная грамматика русского языка. .. .. .. .. .. .. .. .. .. .. .. .. .. . 2666.1.1. Минимальные синтаксические единицы — синтаксемы (266).6.1.2. Категориальная семантика лексических единиц (267).

6 Оглавление

6.2. Реляционно-ситуационный анализ текста . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 2726.2.1. Морфологический и синтаксический анализ (272).6.2.2. Установление значений синтаксем (274).

6.3. Установление значений синтаксем в безглагольных предложениях 2796.3.1. Выбор объектов, признаков и свойств (279). 6.3.2. Обнару-жение правил установления значений синтаксем (283).

6.4. Установление отношений на множестве синтаксем . .. .. .. .. .. .. .. .. .. .. . 284

С пи с о к ли т е р а т у ры. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 288

Предисловие автора

Настоящая книга, как следует из ее названия, посвящена методамискусственного интеллекта. Мне приходилось не раз заявлять, чтоискусственный интеллект является экспериментальной наукой. Темне менее, книга посвящена изложению основ теоретических методовискусственного интеллекта.

Побудительные мотивы написать книгу такого свойства возниклиу меня давно. Разумеется, в искусственном интеллекте возникли и раз-вивались подходы, вобравшие в качестве своих органических частейметоды математической логики, теории алгоритмов, комбинаторики,распознавания образов, когнитивной психологии и лингвистическойсемантики. Понятно, что по этой причине существует соблазн назватькнигой о методах искусственного интеллекта (как случается иногда)книгу, содержащую изложение всех имеющих то или иное отношениек делу методов других дисциплин. Но тогда возникает вопрос: в чемзаключается содержание, собственно, методов искусственного интел-лекта?

Цель написания книги состояла в ответе на этот последний во-прос. Сегодня искусственный интеллект является достаточно разветв-ленной наукой и продолжает развиваться. За пятьдесят лет своегосуществования как науки он накопил значительный арсенал средстви собственных подходов и, поэтому, книга содержит изложение именнооснов методов искусственного интеллекта, к коим относятся методыпредставления знаний, методы моделирования рассуждений, методымоделирования поведения, методы приобретения знаний и, конечно же,не только они. На протяжении всей книги материал излагался, повозможности, с единых позиций при сохранении приемлемого уровнястрогости. При этом всюду, где это оказалось возможным, привлека-лись математические средства, именно в качестве средств изложения.На отбор материала оказали существенное влияние как мое пониманиетого, что сегодня следует, безусловно, включить в арсенал методовискусственного интеллекта, так и мои интересы. Поэтому, как пере-чень, так и содержание указанных разделов не претендует на полнотуи «равномерность» представления материала, хотя все необходимоедля понимания современной проблематики искусственного интеллектав книге имеется.

При изложении способов представления знаний в качестве ос-новных средств использовались системы правил в их общем виде

8 Предисловие автора

и семантические сети; особенное внимание уделено неоднородным се-мантическим сетям. Представление знаний в виде систем правил ис-пользовалось и при описании методов планирования и моделированияповедения.

Проблематике моделирования рассуждений было уделено не оченьмного внимания, так как на русском языке ей посвящена обширнаялитература. Напротив, большое внимание в книге уделено методампланирования целенаправленного поведения, так как в монографиче-ской литературе на русском языке эти вопросы освещены, повидимому,впервые. Существенное внимание уделено интеллектуальным динами-ческим системам и основанным на них методам моделирования целе-направленного поведения. В последних двух главах описаны методыавтоматизации приобретения знаний, при этом, по крайней мере в пя-той главе, активно применяется аппарат неоднородных семантическихсетей.

Здесь надо сказать, что в основе части книги лежат изданныев 2009 г. мои «Лекции по искусственному интеллекту», правда суще-ственно переработаные и расширенные. Разумеется, книга содержити материал, никаким образом в «Лекциях» не представленный.

Замечу, что книга совершенно не касается архитектур интеллек-туальных систем, их инструментальных средств и прикладных интел-лектуальных систем. Даже в тех случаях, когда нельзя было обойтисьбез кратких сведений о тех или иных системах, речь шла, главнымобразом, об используемых в них идеях и методах. Архитектуры ин-теллектуальных систем и их инструментальных средств — обширнаяи важная область деятельности и она заслуживает отдельной книги,которую следовало бы тогда назвать, например «Интеллектуальныесистемы» или «Системы искусственного интеллекта».

В заключение хотелось бы выразить признательность Вадиму Ни-колаевичу Вагину, который не только прочел рукопись и указал ряднедостатков, но и дал ценные советы по включению дополнительногоматериала, что, надеюсь, способствовало улучшению книги.

Книга предназначена как специалистам, так и аспирантам и студен-там старших курсов университетов.

Автор

Введение

Научная дисциплина под названием «искусственный интеллект»входит в комплекс компьютерных наук, а создаваемые на основе еерезультатов технологии относятся к информационным технологиям.

Основной целью исследований в искусственном интеллекте являет-ся получение методов, моделей и программных средств, позволяющихискусственным устройствам реализовать целенаправленное поведениеи разумные рассуждения.

На этом пути возникает ряд задач, важнейшая особенность которыхсостоит в том, что, в большинстве случаев, до получения результатарешения задачи не известен алгоритм ее решения. Например, точнонеизвестно, как происходит узнавание изображения, понимание текста,поиск доказательства теоремы, построение плана действий. Алгоритмырешения таких задач являются, обычно, одним из результатов их ре-шения. В частности, алгоритм доказательства теоремы можно извлечьиз ее доказательства.

Человек решает задачи такого рода, используя, в числе проче-го, свои знания и компетентность. В то же время, у искусственныхустройств (например, компьютеров), привлекаемых для решения такихзадач, обычно отсутствует достаточный уровень начальной компетент-ности. Это означает, что одной из основных задач искусственногоинтеллекта является разработка механизмов переноса компетентности,т. е. обучения искусственных устройств (или, как принято говорить,приобретения знаний). При этом считается, что результаты решениязадач и сам ход решения должны быть транспарентны — «прозрачны»для человека и допускать объяснение.

Таким образом, важной характеристикой представления результа-тов и хода решения задач искусственного интеллекта является их,в значительной степени, вербальный характер.

Создавая те или иные начальные компьютерные представления имодели, исследователь или разработчик сравнивает их поведение меж-ду собой и с примерами решения тех же задач специалистом в со-ответствующей области, модифицирует их на основе этого сравнения,пытаясь добиться лучшего соответствия результатов. Таким образом,искусственый интеллект представляет собой экспериментальную науку.

Для того чтобы модификация программ улучшала результаты ихработы, надо иметь разумные исходные представления и модели. Такие

10 Введение

представления и модели доставляют психологические исследования,в частности, исследования в области когнитивных наук.

Первые исследования, относящиеся к искусственному интеллекту,были предприняты почти сразу же после появления первых вычисли-тельных машин.

В 1954 г. американский исследователь А.Ньюэлл (A.Newel) решилнаписать программу для игры в шахматы. Этой идеей он поделил-ся с аналитиками корпорации «РЭНД» (RAND Corporation (J. Show)и Г. Саймоном (H. Simon), которые предложили Ньюэллу свою по-мощь. В качестве теоретической основы такой программы было ре-шено использовать метод, предложенный в 1950 г. Клодом Шенноном(К. Shannon), основателем теории информации. Точная формализацияэтого метода была выполнена Аланом Тьюрингом (Alan Turing). Он жепромоделировал его вручную.

К работе была привлечена группа голландских психологов подруководством А. ДеГроота (A. deGroot), изучавших стили игры выда-ющихся шахматистов. Через два года совместной работы этот кол-лектив создал язык программирования ИПЛ1 — по-видимому первыйсимвольный язык обработки списков. Вскоре была написана и перваяпрограмма, которую можно отнести к достижениям в области искус-ственного интеллекта. Эта была программа «Логик-Теоретик» (1956 г.),предназначенная для автоматического поиска доказательств теоремв исчислении высказываний.

Собственно же программа для игры в шахматы, NSS, была завер-шена в 1957 г. В основе ее работы лежали так называемые эвристики

(правила выбора в отсутствии теоретических оснований) и описанияцелей. Управляющий алгоритм пытался уменьшить различия междуоценками текущей ситуации и оценками цели или одной из подцелей.

В 1960 г. та же группа на основе принципов, использованных в NSS,написала программу, которую ее создатели назвали GPS (GeneralProblem Solver) — универсальный решатель задач. GPS могла справ-ляться с рядом головоломок, вычислять неопределенные интегралы,решать некоторые другие задачи. Эти результаты привлекли вниманиеспециалистов в области вычислений. Появились программы автома-тического поиска доказательств теорем из планиметрии и решенияалгебраических задач.

Джона Маккарти (J.McCarty) из Стэнфорда заинтересовали мате-матические основы этих результатов и вообще символьных вычисле-ний. В результате в 1963 г. он разработал язык ЛИСП (LISP, от ListProcessing), основу которого составило использование единого списко-вого представления для программ и данных, применение выраженийдля определения функций, скобочный синтаксис.

Введение 11

В это же время в СССР, в основном, в Московском государственномуниверситете и Академии наук СССР был выполнен ряд пионерскихисследований, возглавленных Вениамином Пушкиным и Дмитрием По-спеловым [1], целью которых было выяснение того, как же, в действи-тельности, человек решает переборные задачи.

В качестве полигона для этих исследований были выбраны различ-ные математические игры, в частности, игра «15» и игра «5», а в каче-стве инструментального метода исследования — регистрация движенияглаз или гностическая динамика. Основными методами регистрациидвижения глаз были электроокулограмма и использование присоски,помещаемой на роговицу.

Цель каждой такой игры заключается в переходе от некоторойисходной ситуации к конечной. Переходы осуществляются путем по-следовательного перемещения фишек по горизонталям и вертикалямна свободное поле.

Возьмем, например, игру «5», исходная и конечная ситуации в ко-торой выглядят, соответственно, следующим образом:

2 3 5

1 4

и

1 2 3

4 5 .

Оптимальным образом задача решается за шесть ходов, которыесоответствуют перемещениям фишек 1, 4, 5, 3, 2, 1. Решение былобы намного сложнее, если бы на первом ходу двигалась бы, например,фишка 2, или на втором ходу — фишка 3. Понятно, что задача можетбыть представлена в виде дерева (или лабиринта), корнем которогоявляется исходная ситуация, а перемещение каждой фишки приводитв новую вершину. Все ситуации являются при таком подходе вер-шинами графа или точками на дереве игры и именно они являютсятеми элементами, из которых строится «модель мира». Два элементасвязывает ход — преобразование одной ситуации в другую.

Такая модель игры приводит, вообще говоря, к полному переборуили «лабиринту» вариантов и составляет основу так называемой лаби-ринтной гипотезы решения переборных задач.

C другой стороны, анализ экспериментальных данных позволилвычленить два вида изменений параметров гностической динамикив процессе обучения решению задачи. А именно, изменения ряда пара-

12 Введение

метров уже при решении второй или третьей из множества однотипныхзадач у одной из групп испытуемых характеризуется появлением точкиизлома.

К числу этих параметров относятся время решения задачи, количе-ство осмотров условий, количество осмотров цели, общее количествоосмотров, плотность осмотра и отношение числа осмотров условийк числу осмотров цели. У другой же группы испытуемых таких изме-нений не происходит.

Так, например, отношение числа осмотров условий задачи к числуосмотров цели у первой группы испытуемых претерпевает излом послерешения второй задачи и продолжает уменьшаться при решении числапоследующих задач. У второй группы испытуемых уменьшения этогоотношения не происходит. То же относится и к времени решения задач.

Анализ и других экспериментальных данных подтвердил существо-вание некоторых общих тенденций в динамике обучения решениюзадач.

Есть все основания полагать, что основным фактором, влияющимна временные характеристики этого процесса у первой группы ис-пытуемых, является момент понимания эквивалентности задач илитранспозиции (переноса) отношений, сформированных в ходе решенияпервых задач.

Изучение всей совокупности данных позволяет связать формирова-ние подобной системы отношений со временем решения второй и по-следующих задач — именно тогда формируется то общее, что связы-вает первую и вторую задачи. Осознание общности и, следовательно,«открытие» эквивалентности происходит при столкновении с третьейзадачей.

Сопоставление экспериментальных данных свидетельствует такжео том, что соотнесение различных ситуаций связано между собойпосредством такого когнитивного компонента, как анализ цели. Иначеговоря, анализ исходной ситуации управляется анализом цели и про-цессом соотнесения исходной и конечной ситуаций. Таким образом,моделирование исходной ситуации является управляемым компонен-том, а установленные в конечной ситуации отношения являются ре-гулятором этого моделирующего процесса. Сама же модель исходнойситуации рассматривается с точки зрения ситуации конечной.

Эту модель можно также изобразить в виде графа, но вершинамиэтого графа будут не ситуации, как при использовании «лабиринта»вариантов, а элементы ситуаций. Ребрами, соединяющими вершины,будут не переходы из одной ситуации в другую, а те отношения,которые были выявлены на множестве этих элементов с помощьюгностической динамики. Эти соображения составили основу модельной

Введение 13

гипотезы решения переборных задач и привели к появлению в 1964 г.языка (и метода) ситуационного управления [2].

К исследованиям в области искусственного интеллекта стали про-являть интерес и логики. В том же 1964 г. была опубликована работаленинградского логика Сергея Маслова «Обратный метод установлениявыводимости в классическом исчислении предикатов», в которой впер-вые предлагался метод автоматического поиска доказательства теоремв исчислении предикатов.

На год позже (в 1965 г.) в США появляется работа Дж.А. Робинсо-на (J. A. Pobinson), посвященная иному методу автоматического поискадоказательства теорем в исчислении предикатов первого порядка. Этотметод был назван методом резолюций и послужил отправной точкойдля создания нового языка программирования со встроенной процеду-рой логического вывода — языка Пролог (Prolog) в 1971 г.

В 1966 г. в СССР Валентином Турчиным был разработан языкрекурсивных функций Рефал, предназначенный для описания языкови разных видов их обработки. Хотя он и был задуман как алгорит-мический метаязык, но для пользователя это был, подобно ЛИСПуи Прологу, язык обработки символьной информации.

В конце 60-х годов появились первые игровые программы, систе-мы для элементарного анализа текста и решения некоторых мате-матических задач (планиметрии, взятия неопределенных интегралов).В возникавших при этом сложных переборных проблемах количествоперебираемых вариантов резко снижалось применением всевозможныхэвристик и «здравого смысла». Такой подход стали называть эври-стическим программированием. Дальнейшее бурное развитие эври-стического программирования шло по пути усложнения алгоритмов иулучшения эвристик. Однако вскоре стало ясно, что существует неко-торый предел, за которым никакие улучшения эвристик и усложненияалгоритма не повысят качества работы системы и, главное, не расширятее возможностей. Программа, которая играет в шахматы, никогда небудет играть в шашки или карточные игры.

Постепенно исследователи стали понимать, что всем ранее создан-ным программам недостает самого важного — знаний в соответству-ющей области. Специалисты, решая задачи, достигают высоких ре-зультатов, благодаря своим знаниям и опыту; если программы будутобращаться к знаниям и применять их, то они тоже достигнут высокогокачества работы.

Это понимание, возникшее в начале 70-х годов, по существу, озна-чало качественный скачок в работах по искусственному интеллекту.

Основополагающие соображения на этот счет высказал в 1977 г. на5-й Объединенной конференции по искусственному интеллекту амери-канский ученый Э. Фейгенбаум (E. Feigenbaum).

14 Введение

Уже к середине 70-х годов появляются первые прикладные интел-лектуальные системы, использующие различные способы представле-ния знаний для решения задач — экспертные системы. Одной изпервых была экспертная система DENDRAL, разработанная в Станфорд-ском университете и предназначенная для порождения формул химиче-ских соединений на основе спектрального анализа. В настоящее времяDENDRAL [3] поставляется покупателям вместе со спектрометром. Си-стема MYCIN предназначена для диагностики и лечения инфекционныхзаболеваний крови. Система PROSPECTOR прогнозирует залежи полез-ных ископаемых. Имеются сведения о том, что с ее помощью былиоткрыты залежи молибдена, ценность которых превосходила 100 мил-лионов долларов. Система оценки качества воды, реализованная наоснове российской технологии SIMER+MIR [4] обнаружила причиныпревышения предельно допустимых концентрациий загрязняющих ве-ществ в Москве-реке в районе Серебрянного Бора. Система CASNETпредназначена для диагностики и выбора стратегии лечения глаукомыи т. д.

В настоящее время разработка и реализация экспертных системпревратилась в инженерную дисциплину. Научные же исследованиясосредоточены в ряде сформировавшихся и формирующихся направле-ний; некоторые из них перечислены ниже.

1. Представление знаний. Представление знаний (knowledge re-presentation) — одно из наиболее сформировавшихся направлений ис-кусственного интеллекта. Традиционно к нему относилась разработ-ка формальных языков и программных средств для отображения иописания так называемых когнитивных структур 1). Сегодня к пред-ставлению знаний причисляют также исследования по дескриптивнойлогике, логикам пространства и времени, онтологиям.

Пространственные логики позволяют описывать конфигурацию про-странственных областей, объектов в пространстве; изучаются такжесемейства пространственных отношений. В последнее время эта об-ласть, из-за тесной связи с прикладными задачами, становится доми-нирующей в исследованиях по представлению знаний. Например, длязадач роботики важно уметь по изображению некоторой сцены восста-новить ее вербальное (формальное) описание, для того чтобы далее этоописание использовать, например, для планирования действий робота.

Объектами дескриптивной логики являются так называемые кон-цепты (базовые структуры для описания объектов в интеллекткаль-ных системах) и, связанные в единое целое, множества концептов (аг-

1) Структур человеческого сознания, отражающих представление личностио действительности

Введение 15

регированные объекты). Дескриптивная логика вырабатывает методыработы с такими сложными концептами, методы рассуждений об ихсвойствах и выводимости на них. Дескриптивная логика может бытьиспользована, кроме того, для построения объяснительной компонентыбазы знаний.

Онтологические исследования посвящены способам концептуализа-ции знаний и методологическим соображениям о разработке инстру-ментальных средств для анализа знаний.

2. Автоматизация рассуждений. В основе автоматизации рас-суждений лежат различные способы представления знаний.

Автоматизация рассуждений, помимо автоматизации дедуктивныхрассуждений, включает: автоматизацию индуктивных рассуждений,автоматизацию рассуждений на основе прецедентов (case-basedreasoning, CBR), на основе аргументации, на основе ограничений,автоматизацию рассуждений с неопределенностью, рассужденияо действиях и изменениях, автоматизацию немонотонных рассужденийи др. Остановимся кратко на некоторых из них.

Рассуждения на основе прецедентов. Здесь главные проблемы —«фокусировка поиска» на использовании прошлого опыта, оценка сход-ства прецедентов, поиск алгоритмов адаптации прецедентов и техноло-гии визуализации.

Пусть задано множество прецедентов как множество пар 〈СЛУЧАЙ,РЕШЕНИЕ〉, множество зависимостей между различными атрибутамиСЛУЧАЕВ и РЕШЕНИЙ, а также целевая проблема ЦЕЛЬ. Для возника-ющей новой ситуации («нового случая») требуется найти пару 〈НОВЫЙСЛУЧАЙ, ИСКОМОЕ РЕШЕНИЕ〉, которая решает целевую проблему.

Алгоритмы для таких задач основаны обычно на сравнении пре-цедентов с новым случаем (в какой-либо метрике), с использованиемзависимостей между атрибутами случаев и атрибутами решения. Такиезависимости могут задаваться человеком при построении базы случаев,или обнаруживаться в базе случаев автоматически. При поиске ре-шения для целевой проблемы выполняется адаптация уже имеющихсяв базе прецедентов решения. Для этой адаптации и используютсяозначенные зависимости.

Важной проблемой рассуждений на основе прецедентов (CBR) яв-ляется проблема выбора подходящего прецедента. Естественно искатьподходящий прецедент в той области пространства поиска, где нахо-дятся решения сходных проблем. Но как определить, какие именнорешения надо считать сходными?

Одна из гипотез, называемая гипотезой компактности, состоитв том, что сходство проблем налагает ограничения на сходство соот-

16 Введение

ветствующих решений в форме слабой связи между ними. Это обстоя-тельство и используется для ограничения области поиска решений.

Методы CBR уже применяются в множестве прикладных задач —в медицине, управлении проектами, для анализа и реорганизациисреды, для разработки товаров массового спроса с учетом предпочте-ний разных групп потребителей, и т. д. Следует ожидать приложе-ний методов CBR для задач интеллектуального поиска информации,электронной коммерции (предложение товаров, создание виртуальныхторговых агентств), планирования поведения в динамических средах,компоновки, конструирования, синтеза программ.

Автоматизация рассуждений на основе ограничений. Наиболееинтересны здесь задачи моделирования рассуждений, основанных напроцедурных динамических ограничениях. Они мотивированы слож-ными актуальными задачами — например, планированием в реальнойобстановке. Решение ищется в области значений, удовлетворяющихзаданные ограничения.

Под задачей удовлетворения ограничений понимается четверка мно-жеств: множество переменных, множество соответствующих областейпеременных, множество ограничений на переменные и множество от-ношений над областями. Решением проблемы удовлетворения огра-ничений называется набор значений переменных, удовлетворяющихограничениям на переменные, такой, что при этом области, которымпринадлежат эти значения, удовлетворяют отношениям над областями.

Задача удовлетворения динамических ограничений есть последова-тельность задач удовлетворения ограничений, в которой каждая после-дующая задача есть ограничение предыдущей. Эти задачи по смыслублизки задачам динамического программирования. Они связаны такжес интервальной алгеброй.

Немонотонные рассуждения. К немонотонным рассуждениям от-носятся исследования по логике умолчаний (default logic), по логике«пересматриваемых» (defeasible) рассуждений, логике программ, тео-ретико-аргументационой характеризации логик с отменами, характе-ризации логик с отношениями предпочтения, построению эквивалент-ных множеств формул для логик с очерчиванием (circumscription)и некоторые другие. Такого рода модели возникают при реализациииндуктивных рассуждений, например, по примерам; связаны они так-же с задачами машинного обучения и некоторыми иными задачами.В частности, в задачах моделирования рассуждений на основе ин-дукции источником первоначальных гипотез служат примеры. Еслинекоторая гипотеза H возникла на основе N положительных примеров(например, экспериментального характера), то никто не может датьгарантии, что в базе данных или в поле зрения алгоритма не окажется

Введение 17

N + 1-й пример, опровергающий гипотезу (или меняющий степень ееистинности). Это означает, что ревизии должны быть подвержены и всеследствия гипотезы H .

Рассуждения о действиях и изменениях. Большая часть работв этой области посвящена применениям ситуационного исчисления —формализма, предложенного Джоном Маккарти в 1968 г. для описаниядействий, рассуждений о них и эффектов действий. Для преобразова-ния плана поведения робота в исполняемую программу, достигающуюс некоторой вероятностью фиксированной цели, вводится специальноелогическое исчисление, основанное на ситуационной логике. Для этойлогики предложены варианты реализации на языке pGOLOG — версииязыка GOLOG, содержащей средства для введения вероятностей.

Активно исследуются логики действий, применение модальных ло-гик для рассуждений о знаниях и действиях.

Рассуждения с неопределенностью. В основе таких рассужденийнаходится использование байесовского формализма в системах правили сетевых моделях. Байесовские сети — это статистический методобнаружения закономерностей в данных. Для этого используется пер-вичная информация, содержащаяся либо в сетевых структурах, либов базах данных. Под сетевыми структурами понимается в этом случаемножество вершин и отношений на них, задаваемое с помощью ребер.Содержательно, ребра интерпретируются как причинные связи. Всякоемножество вершин Z, представляющее все пути между некоторымидвуми иными вершинами X и Y , соответствует условной зависимостимежду этими двуми последними вершинами.

Далее задается некоторое распределение вероятностей на множе-стве переменных, соответствующих вершинам этого графа и полу-ченная, но минимизированная (в некотором смысле) сеть называетсябайсовской сетью.

На такой сети можно использовать так называемый байесовскийвывод, т. е. для вычисления вероятностей следствий событий можноиспользовать (с некоторой натяжкой) формулы теории вероятностей.Иногда рассматриваются так называемые гибридные байесовские сети,с вершинами которых связаны как дискретные, так и непрерывныепеременные. Байесовские сети часто применяются для моделированиятехнических систем.

3. Приобретение знаний, машинное обучение и автоматическоепорождение гипотез. Работы в области приобретения знаний интел-лектуальными системами были и остаются важнейшим направлени-ем теории и практики искусственного интеллекта. Целью этих работявляется создание методологий, технологий и программных средств

18 Введение

переноса знаний и компетентности в базу знаний системы. При этомв качестве источников знаний выступают эксперты (т. е. высококвали-фицированные специалисты предметных областей), тексты и данные,например, хранимые в базах данных.

В соответствии с этим, развиваются различные методы приобрете-ния знаний.

Машинному обучению в мире уделяется большое внимание. Суще-ствует множество методов машинного обучения, среди самых распро-страненных — методы конструктивной индукции, методы построениядеревьев решений, методы ближайших соседей и др. Исходной инфор-мацией, например, для построения дерева решений является множествопримеров. С каждой вершиной дерева ассоциируется наиболее (натекущем шаге) частотный класс примеров. На следующем шаге этотпринцип рекурсивно применяется к текущей вершине, т. е. множествопримеров, связанных с текущей вершиной, также разбивается на под-классы. Алгоритм завершает свою работу либо при удовлетворениинекоторого критерия, либо при исчерпании подклассов (если они за-даны).

Активно исследуются методы обучения причинам действий. Ино-гда говорят о так называемой теории действий, имея в виду ситуа-ционное исчисление в духе Джона МакКарти. В этой теории причиныдействий и сами действия описываются в виде клаузальных хорновскихструктур (импликация, левая часть которой есть конъюнкция атомар-ных формул, а правая состоит из одной атомарной формулы).

Далее, методы индуктивного логического программирования моди-фицируются таким образом, чтобы быть применимыми к поиску такихструктур. Когда такие структуры найдены, их можно использоватьв языках логического программирования для рассуждений о действияхи их причинах.

Многие работы этого направления посвящены «нейронной пара-дигме». Нейросетевой подход используется в огромном количествезадач — для кластеризации информации из Интернета, автоматическойгенерации локальных каталогов, представления образов (в рекурсив-ных нейронных сетях). Среди активно изучаемых в последнее вре-мя тем — неоднородные нейронные модели с отношениями сходства.(Heterogeneous Neural Networks with similarity relation).

Это отношение сходства определяется на множестве входов и мно-жестве состояний сети, а мерой сходства является скалярное произве-дение векторов либо эвклидово расстояние (где один вектор — векторвходов, а другой является распределением весов нейронов, описываю-щих текущую ситуацию).

Работы по автоматическому порождению гипотез преследуют,главным образом, формализацию правдоподобных рассуждений, поиск

Введение 19

зависимостей причинно-следственного типа между некоторыми сущ-ностями или, в широком смысле, создание познавательных процедурполучения нового знания на основе анализа эмпирических данных.В качестве примеров можно привести: порождение гипотез о свойстваххимических соединений (прогноз биологических активностей), о воз-можных причинах дефектов (диагностика) и т. п.

4. Интеллектуальный анализ данных и обработка образнойинформации. Это сравнительно новое направление, основу которогосоставляют две процедуры: обнаружение закономерностей в исход-ной информации и использование обнаруженных закономерностей дляпредсказания (прогнозирования). Сюда относят задачи выбора инфор-мативных данных из большой их совокупности, выбора информативныххарактеристик некоторого объекта из более широкого множества егохарактеристик, задачи построения модели, позволяющие вычислятьзначения выбранных информативных характеристик по значениям дру-гих характеристик, и т. п.

Значительную часть этого направления составляют исследованияпо различным аспектам распознавания изображений, в частности,с помощью нейросетей (включая псевдооптические нейросети). Изу-чаются методы распознавания последовательностей видеообразов наоснове декларативного подхода и извлечения семантически значимойинформации. К этому же направлению принадлежат исследования пографической технологии программирования в Интернете.

5. Многоагентные системы, динамические интеллектуальныесистемы и планирование. Это направление, изучающее интеллекту-альные программные агенты и их коллективы.

Основные задачи в этой области таковы: реализация переговоровинтеллектуальных агентов и разработка языков для этой цели, коорди-нация поведения агентов, разработка архитектуры языка программиро-вания агентов.

Следует подчеркнуть, что со времени появления агентских техноло-гий интерес к ним переместился из сферы академических исследованийв сферу коммерческих и промышленных приложений, а идеи и методыагентских технологий весьма быстро мигрировали из искусственногоинтеллекта в практику разработки программного обеспечения и другиевычислительные дисциплины.

С агентскими технологиями тесно связаны задачи планированияповедения, или ИИ-планирования, — способность интеллектуальнойсистемы синтезировать последовательность действий для достиженияжелаемого целевого состояния. Работы по созданию эффективных ме-тодов такого синтеза востребованы и активно ведутся уже около 30 лет.

20 Введение

Планирование является основой автоматического управления автоном-ным целенаправленным поведением программно-технических систем.

Среди методов ИИ-планирования сегодня выделяют классическоепланирование, т. е. планирование в условиях статической среды, ди-намическое планирование, т. е. планирование в условиях изменениясреды и, главное, с учетом такого изменения, иерархическое планиро-вание, т. е. когда действия абстрактного плана высокого уровня кон-кретизируются более детальными планами нижнего уровня, частично-упорядоченное (или монотонное) планирование, когда план строитсяна основе частично упорядоченного множества подпланов. При этомобщий план (элементами которого являются подпланы), обязан бытьмонотонным, а каждый из подпланов может быть немонотонным. До-бавлю, что монотонность — это такое свойство плана, когда каждоеего действие уменьшает различия между текущим состоянием и цельюповедения. Например, если план движения робота к цели таков, чтокаждый его шаг приближает к цели, то план монотонен, но еслион наткнулся при этом на препятствие и требуется его обойти, томонотонность плана нарушится. Однако если план обхода препятствиявыделить в отдельный подплан и рассматривать таковой как элементисходного плана, то монотонность последнего восстановится.

Активно ведутся работы и в области распознавания планов, пост-роения планировщиков и расширения их возможностей, эвристическо-го планирования с ресурсными ограничениями, управления планирова-нием посредством временной логики, планирования с использованиемграфов.

Рассматриваются подходы к планированию, при которых построе-ние текущих планов выполняется непрерывно для каждого состояниясистемы в реальном времени. Для этого предусмотрен непрерывныймониторинг объекта управления.

Задачи планирования относятся в наше время к весьма важным иперспективным направлениям в искуственном интеллекте.

Интеллектуальные динамические системы — результат интегра-ции интеллектуальных систем с динамическими системами. В общемслучае это двухуровневые динамические модели, где один из уровнейотвечает за стратегию поведения системы (или, как иногда говорят,носит делиберативный характер), а другой уровень отвечает за реше-ние частных задач, например, реализацию того или иного режима наоснове применения математической модели.

Для описания временных зависимостей при построении интеллек-туальных динамических систем исследуются соответствующие логики.

Работы в области систем поддержки принятия решений посвяще-ны моделированию сложных технологических и технических систем,

Введение 21

поиску решений в условиях чрезвычайных ситуаций, задачам проекти-рования систем управления техническими объектами, использованиювероятностных подходов и сценариев при принятии решений, рядудругих проблем.

6. Обработка естественного языка, пользовательский интер-фейс и модели пользователя. Это направление связано с разработкойсистем поддержки речевого общения, c решением проблем пониманияестественного языка в интеллектуальных системах, с повышением точ-ности поиска, с задачами сегментации текстов по тематическим топи-кам, с задачами управления диалогом, с задачами анализа естественно-го языка, с использованием различных эвристик. Сюда же включаютсяпроблемы дискурса (иногда под дискурсом понимают совокупностьречевых актов вместе с их результатами).

По прежнему актуальны задачи обучения контекстному анализутекста, задачи приобретения знаний интеллектуальными системамии извлечения информации из текстов.

Важнейшей задачей в процессе извлечения информации, как, впро-чем, и в процессе приобретения знаний, является минимизация ролиэксперта — участника процесса.

Важность этого направления нельзя недооценивать. Причина то-му — возрастание потоков текстовой информации, существующий со-циальный заказ на поиск релевантной информации в Интернете, наанализ текстовой информации, на извлечение данных из текстов.

Предметом исследований в этом направлении является также ди-намическое моделирование пользователя, в частности, в системахэлектронной коммерции, адаптивный интерфейс, мониторинг и анализпользовательского поведения в Интернете.

7. Когнитивное моделирование. Когнитивное моделирование ис-следует сущность когнитивных функций в широком смысле этого словапосредством их эмпирического изучения и последующего моделиро-вания.

В отличие от подходов, направленных на развитие методов реше-ния трудных задач с априорно отсутствующими алгоритмами реше-ния (таких, как представление знаний, моделирование рассужденийи поведения и ряда других), когнитивное моделирование являетсяпроцессно-ориентированным.

Это означает, что в основе когнитивного моделирования лежатнаблюдения над интеллектуальными и аффективными процессами, по-строение и экспериментальное исследование моделей этих процессовс последующими оценками релевантности как примененных моделей,так и методов моделирования.

22 Введение

Работы в области когнитивного моделирования включают иссле-дование церебральных механизмов распространения и обработки ин-формации в процессе реализации когнитивных функций, механизмовкатегоризации, именования (действий, объектов), механизмов целеоб-разования и поведения, возникновения и развития когнитивных кон-фликтов.

8. Нечеткие модели и мягкие вычисления. Это направление пред-ставлено нечеткими схемами вывода, «вывода по аналогии», взглядомна теорию нечетких мер с вероятностных позиций, нечеткими пред-ставлениями, аналитическими моделями для описания геометрическихобъектов, алгоритмами эволюционного моделирования с динамически-ми параметрами, такими, как время жизни и размер популяции, ме-тодами решения оптимизационных задач с использованием технологийгенетического поиска, гомеостатических и синергетических принципови элементов самоорганизации.

9. Разработка инструментальных средств. Это обширная сферадеятельности, ставящая перед собой задачи:

а) создания программных средств приобретения знаний для автома-тизированного переноса знаний и компетентности в базы знаний.При этом в качестве источников могут выступать не только«прямые» их носители — эксперты различных областей, но итекстовые материалы — от учебников до протоколов, а также, ра-зумеется, базы данных (имплицитные источники знаний). Верба-лизация, т. е. перевод таких источников в эксплицитную форму,составляет содержание методов обнаружения знаний в данных,в том числе различных методов обучения по примерам (включаяпредобработку больших массивов данных для дальнейшего ана-лиза);

б) реализации программных средств поддержки баз знаний;в) реализации программных средств автоматизации рассуждений;г) реализации программных средств поддержки проектирования ин-

теллектуальных систем. Набор таких средств обычно содержитредактор текстов, редактор понятий, редактор концептуальныхмоделей, библиотеку моделей, систему приобретения знаний отэкспертов, средства обучения по примерам и ряд других модулей.

Гл а в а 1

МЕТОДЫ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

Введение

В этой главе рассматриваются основные методы представления зна-ний в интеллектуальных системах: системы правил, семантические се-ти и системы фреймов. Достаточно подробно описаны системы правил,неоднородные семантические сети и отношения в них. В последнемпараграфе главы описаны основы дескриптивной логики, возникшейотносительно недавно и играющей роль логической основы некоторыхметодов представления знаний. При изложении основных способовпредставления знаний активно применяется язык исчисления предика-тов первого порядка, атомарные формулы которого использованы дляописания составных частей конструкций, используемых для представ-ления знаний.

Поэтому прежде чем переходить собственно к методам представ-ления знаний, уделим некоторое внимание исчислению предикатовпервого порядка и одной из его интерпретаций.

1.1. Формальные языки и формальные системы

Существуют работы, где язык исчисления предикатов рассматри-вается как язык представления знаний, однако это не главное егоназначение и мы будем использовать его, главным образом, в качествесредства описания элементов конструкций других языков, более ори-ентированных на представление знаний.

Опишем вначале основные конструкции языка исчисления предика-тов первого порядка и их интерпретацию в духе работ [5, 6].

1.1.1. Язык исчисления предикатов первого порядка. Основ-ные конструкции языка L — языка исчисления предикатов первогопорядка — называются формулами. Введем вначале алфавит языка L.Алфавит включает:

1. Счетное множество букв x, y, ..., z, которое будем называть мно-жеством символов для обозначения переменных языка.

24 Гл. 1. Методы представления знаний

2. Счетное множество букв a, b, ..., c, которое будем называть мно-жеством символов для обозначения констант языка.

3. Счетное множество прописных букв P ,Q, ... для обозначенияпредикатных символов языка.

4. Счетное множество строчных букв f , g, ... для обозначения функ-циональных символов.

5. Символы для логических связок → (влечет), ¬ (не).6. Символ для квантора ∀ (для любого).7. ( , ) — скобки.

Предикатные буквы P ,Q, ... и функциональные буквы f , g, ... могутбыть n-местными или, как еще говорят, n-арными. Иначе говоря,с каждым предикатным или функциональным символом будем связы-вать некоторое натуральное число, равное числу его аргументов.

Определим теперь понятие формулы или правильно построенноговыражения языка исчисления предикатов первого порядка.

Формулы языка определяются индуктивным образом. Начнемс определения терма языка:

1. Символ для обозначения переменной есть терм.2. Символ для обозначения константы есть терм.3. Если t1, t2, ... , tm, ..., tn — термы, а f и g — функциональные

символы арности m и n соответственно, то f(t1, t2, ..., tm) иg(t1, t2, ... , tn) также термы.

4. Если t1, t2, ..., tm, ... , tn — термы, а P и Q — предикатныесимволы арности m и n соотвественно, то P (t1, t2, ..., tm) иQ(t1, t2, ... , tn) — атомарные формулы.

5. Атомарная формула есть формула.6. Если A, B — формулы, то A→ B, ¬A, ¬B — формулы.7. Если A — формула, то ∀xA — формула.8. Всякое слово в алфавите языка является формулой тогда и только

тогда, когда это можно показать с помощью конечного числаприменений пп. 1–7.

Таким образом, мы завершили одно из возможных определенийязыка исчисления предикатов первого порядка. Существуют и другиеопределения, однако язык, определенный нами, является полным, т. е.в нем выразимо все то, что выразимо в языках (исчисления предикатовпервого порядка), определенных любым иным способом.

Можно, например, определить логические связки ∧, ∨ (читается и

и или), выразив их через связки → и ¬:1. A ∧B = ¬(A→ ¬B),2. A ∨B = ¬A→ B.

1.1. Формальные языки и формальные системы 25

Квантор существования ∃ (существует) также выражается черезквантор всеобщности и отрицание:

∃ xA(x) = ¬∀x¬A(x).

Разумеется, ∧, ∨ и ∃ с тем же успехом можно было бы вклю-чить в язык в качестве трех дополнительных символов. Есть, однако,некоторые преимущества в том, чтобы сохранить список символов какможно более коротким. Например, индуктивные определения и дока-зательства по индукции оказываются в этом случае короче.

В дальнейшем нам придется использовать понятия свободногои связанного вхождения переменной в формулу. Вхождение перемен-ной x в формулу A называется связанным, если эта переменная сле-дует за кванторами существования или общности, предшествующимиформуле A и находится в области их действия. В противном случаевхождение переменной называется свободным. Если в формуле A от-сутствуют свободно входящие в нее переменные (т. е. либо все перемен-ные связаны, либо отсутствуют), то формула называется замкнутойформулой или предложением. Атомарную замкнутую формулу будемназывать фактом. В том случае, если язык состоит только лишь изпредложений, то он называется пропозициональным языком, а бук-вы A, B, . . ., входящие в формулы этого языка — пропозициональнымипеременными.

1.1.2. Элементы исчисления предикатов первого порядка. Рас-смотрим вкратце основные понятия исчисления предикатов первогопорядка.

Введем вначале аксиомы исчисления предикатов:

1. A→ (B → A).

2. (A→ (B → C))→ ((A→ B)→ (A→ C)).

3. (¬A→ ¬B)→ (B → A).Однако исчисление предикатов первого порядка не исчерпывается

приведенными выше тремя аксиомами и правилами вывода. Смыслкванторов устанавливается еще двумя аксиомами и одним правиломвывода.

4. Аксиома генерализации: (∀x)((A → B) → (A → (∀x)B)), где xне является свободной переменной в A;

5. Аксиома спецификации: ∀tA(t) → A(x), где t — терм, а x несодержится в t в качестве свободной переменной.

Правила вывода:

1. Правило отделения: если выводимо A и выводимо A → B, товыводимо B.


2. Правило подстановки: в любую аксиому на место любой про-позициональной переменной можно подставить любое предложе-ние, предварительно переименовав пропозициональные перемен-ные подставляемого предложения так, чтобы они не совпадалис пропозициональными переменными аксиомы.

Если в аксиомах 1–3 все переменные являются пропозициональны-ми, то такое исчисление называется пропозициональным исчислениемили исчислением высказываний.

Рассмотрим пример вывода в исчислении высказываний. Возьмем,например, три закона логики, сформулированные Аристотелем и на-зываемые постулатами Аристотеля. В языке исчисления высказыванийони записываются следующим образом.

Пусть P — пропозициональная переменная исчисления высказыва-ний:

Постулат 1. P → P .Постулат 2. P ∨ ¬P .Постулат 3. ¬(P ∧ ¬P ).Первый из постулатов Аристотеля — это так называемый закон

тождества; второй — закон исключенного третьего и третий — законпротиворечия.

Докажем один из постулатов, например P → P .Используем аксиому 1 и правило подстановки (вместо B подставим

P → P : получим A→ ((P → P )→ A)).Из аксиомы 2: (A → ((P → P ) → C)) → ((A → (P → P )) → (A →

→ C)).Вместо A, C подставим P :

(P → ((P → P )→ P ))︸︷︷︸X

→ ((P → (P → P ))→ (P → P ))︸︷︷︸Y

.

Применим правило отделения: та часть последней формулы, котораяобозначена через X , является аксиомой, т. е. выводима, тогда, в силуправила отделения, выводима формула, обозначенная через Y .

Теперь применим правило отделения к Y :

(P → (P → P ))︸︷︷︸X′

→ (P → P )︸︷︷︸Y ′

и, рассуждая таким же образом, получим, что Y ′ выводима. Такимобразом, закон тождества Аристотеля является теоремой исчисле-ния высказываний. Действуя таким же образом, можно доказать, чтовторой и третий постулаты Аристотеля также являются теоремамиисчисления высказываний.

1.1. Формальные языки и формальные системы 27

3. Правило обобщения: если выводимо A, то выводимо ∀xA, гдеx — свободная переменная в A.

Аксиомы 1–5 исчисления предикатов первого порядка (или матема-тической логики первого порядка) называются логическими аксиома-ми, они описывают логические законы, справедливые всегда, незави-симо от предметной области. Если же к аксиомам 1–5 добавить ещеи аксиомы, опсывающие некоторую предметную область, например,арифметику или теорию групп, то получим формальную теорию —формальную арифметику или формальную теорию групп, соответствен-но. При этом, разумеется, в алфавит языка следует ввести спецаль-ные функциональные символы, такие как сложение в арифметике илиумножение в теории групп.

Словосочетание «первый порядок» относится исключительно к томуобстоятельству, что кванторы ∀ и ∃ действуют на некотором мно-жестве U . Логика второго порядка разрешает одному из кванторовдействовать на подмножествах множества U и на функциях из сте-пеней U в U . Логика третьего порядка может использовать кванто-ры по множествам функций и т. д. Уже из этих разъяснений видно,что в логиках более высоких порядков (как говорят, более сильныхлогиках) используются и некоторые нелогические понятия, такие какмножество.

Некоторым обобщением понятия исчисления является понятие фор-мальной системы.

1.1.3. Формальные системы. Будем полагать, что если заданынекоторый алфавит, множество формул, множества аксиом и правилвывода, то тем самым задана некоторая формальная система. Иначеговоря, формальная система F представляет собой совокупность сле-дующих объектов:

F = 〈T ,P ,A,П〉,

T — счетное множество символов и операций над ними; P — мно-жество правил грамматики, применение которых к символам из Tпозволяет строить правильно построенные формулы; A — множествоаксиом; П — множество правил вывода.

Если среди аксиом имеются нелогические аксиомы (аксиомы, опи-сывающие некоторую предметную область), то формальная системаназывается формальной теорией.

Выводом (или доказательством) в формальной системе называ-ется конечная последовательность правильно построенных формулA1,A2, ...,An, таких что каждая из формул последовательности либоявляется аксиомой, либо получена из предыдущих формул последо-вательности с использованием аксиом и правил вывода. Формула An


в этом случае называется выводимой формулой (или теоремой) фор-мальной системы F .

1.1.4. Алгебраические системы. Введем теперь некоторые алгеб-раические понятия, которые окажутся полезными в дальнейшем.

Определение 1.1.4. n-арным отношением R на M называетсяподмножество Mn; записывается так: R ⊆Mn.

Пусть задано непустое множество — универсум M .Упорядоченную тройку S = 〈M ,G,R〉, где универсум M называется

основным множеством, G — множество n-местных функций из Mn

в M , а R — семейство n-арных отношений на M , будем называтьалгебраической системой [7].

Если в определении алгебраической системы S положить R = ∅, тотакая алгебраическая система называется алгеброй, а если G = ∅, тотогда алгебраическая система называется моделью.

Иногда удобнее использовать понятие многосортной или много-основной алгебраической системы, полагая существование несколькихосновных множеств M1, M2,. . ., Mn вместо одного множества M .Тогда функции из G и отношения из R становятся многосортными,т. е. с каждым местом в списке аргументов функции или отношениясвязывается некоторый сорт i, задаваемый, например, индексом одногоиз множеств из Mi (i = 1, 2, ...,n), а сами функции и отношения опре-деляются на декартовых произведениях множеств из числа основныхмножеств.

1.1.5. Интерпретация. Пусть заданы формальная система Fс языком L и универсум M . Зададим отображение I, которое всякомуконстантному символу a языка L системы F ставит в соответствиенекоторый элемент m ∈M , всякому n-местному предикатному символуP — n-местное отношение R ⊆ Mn, а всякому m-местному функци-ональному символу f — m-местную функцию G: Mn → M . Тогда Iназывается интерпретирующим отображением, а алгебраическая си-стема S = 〈M ,G,R〉 — моделью или интерпретацией формальнойсистемы F . Элементы множества M , функции и отношения, соот-ветствующие константным, функциональным и предикатным символамязыка L в смысле отображения I, называют иногда интерпретациямиконстантных, функциональных и предикатных символов языка L соот-ветственно.

При определенных обстоятельствах можно говорить и о моделяхязыка. Моделью языка L называется пара 〈M , I〉, где M и I — ужеиспользовавшиеся только что универсум и интерпретирующее отобра-жение.

Заметим, что при данном универсуме M для символов языка Lсуществует много различных интерпретаций.

Documents

Осипов Г.С. · Постановка задачи strips-планирования (111). 3.3.2. Ал-горитм strips (113). 3.3.3. Неполнота алгоритма