Transcript
Page 1: ЛОГИЧЕСКИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ ПРИРОДНЫХ ЯВЛЕНИЙ ПРИ КОМПЛЕКСНОМ АНАЛИЗЕ ЭКОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ

Вершинин Н.Н., Костиневич В.В.

ЛОГИЧЕСКИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ ПРИРОДНЫХ ЯВЛЕНИЙ ПРИ КОМПЛЕКСНОМ АНАЛИЗЕ ЭКОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ

Рассмотрены методы структурно-логического моделирования процессов, происходящих в экосистемах.

Предложены направления развития приложений методов искусственного интеллекта для исследования

природных явлений с целью системного анализа экологической безопасности.

Основой для логического подхода при моделировании различных явлений и процессов служит булева

алгебра и ее логические операторы. Свое развитие булева алгебра получила в виде исчисления преди-

катов, в котором она расширена за счет введения предметных символов, отношений между ними, кван-

торов существования и всеобщности. Практически каждая система искусственного интеллекта, постро-

енная на логическом принципе, представляет собой систему доказательства теорем. При этом исходные

данные хранятся в базе данных в виде аксиом, а правила логического вывода представляют собой от-

ношения между ними.

Для большинства логических методов характерна большая трудоемкость, поскольку во время поиска

доказательства возможен полный перебор вариантов. Поэтому данный подход требует эффективной реа-

лизации вычислительного процесса, и хорошая работа обычно гарантируется при сравнительно неболь-

шом размере базы данных. Примером практической реализации логических методов являются деревья

решений [1], которые реализуют в концентрированном виде процесс «обучения» или синтеза решающего

правила.

Добиться большей применяемости логическому подходу позволяет такое сравнительно новое направ-

ление, как нечеткая логика. После основополагающих работ Л. Заде [2] термин fuzzy (англ. нечет-

кий, размытый) стал одним из ключевых слов в структурно-логическом анализе. В отличие от традици-

онной математики, требующей на каждом шаге моделирования точных и однозначных формулировок зако-

номерностей, нечеткая логика предлагает совершенно иной уровень мышления, благодаря которому

творческий процесс моделирования происходит на более высоком уровне абстракции, при котором по-

стулируется лишь минимальный набор закономерностей. Например, правдивость логического высказыва-

ния может принимать в нечетких системах, кроме обычных «да/нет» (1/0), еще и промежуточные значе-

ния: «не знаю» (0,5), «скорее да, чем нет» (0,75), «скорее нет, чем да» (0,25) и т.д. Данный под-

ход больше похож на мышление человека, который редко отвечает на вопросы односложно («да» или

«нет»).

Одним из направлений экологической науки, которое опирается на аппарат нечеткой логики, явля-

ется исследование методов самоорганизации и эволюционных процессов.

Под термином «самоорганизация» понимается процесс самопроизвольного (спонтанного) увеличения

порядка, или организации в системе, состоящей из многих элементов, происходящий под действием

внешней среды. Принципы самоорганизации были предметом исследования многих выдающихся ученых: Дж.

фон Неймана, Н. Винера, У.Р. Эшби и др. Большой вклад в развитие этого направления внесли работы

украинских кибернетиков под руководством А.Г. Ивахненко [3], разработавших целый класс адаптивных

самоорганизующихся моделей (англ. self-organisation models), который можно было бы назвать «ин-

теллектуальным обобщением» эмпирико-статистических методов.

Можно отметить следующие принципы самоорганизации, которые отражены в математических моделях,

описывающих эти принципы:

принцип неокончательных решений (предложен Д. Габором и заключается в необходимости сохранения

достаточной «свободы выбора» нескольких лучших решений на каждом шаге самоорганизации),

принцип внешнего дополнения (базируется на теореме К. Геделя и заключается в том, что только

внешние критерии, основанные на новой информации, позволяют синтезировать истинную модель объек-

та, скрытую в зашумленных экспериментальных данных);

принцип массовой селекции (предложен А.Г. Ивахненко и указывает наиболее целесообразный путь

постепенного усложнения самоорганизующейся модели, с тем, чтобы критерий ее качества проходил

через свой минимум).

Для возникновения самоорганизации необходимо иметь исходную структуру, механизм случайных ее

мутаций и критерии отбора, благодаря которому мутация оценивается с точки зрения полезности для

улучшения качества системы. Т.е. при построении этих систем искусственного интеллекта исследова-

тель задает только исходную организацию и список переменных, а также критерии качества, формали-

зующие цель оптимизации, и правила, по которым модель может изменяться (самоорганизовываться или

эволюционировать). При этом сама модель может принадлежать самым различным типам: линейная или

нелинейная регрессия, набор логических правил или любая другая модель.

Можно выделить следующие подклассы самоорганизующихся моделей [4]:

модели, реализующие полиномиальные алгоритмы, обобщением которых явился метод группового учета

аргументов (МГУА);

модели, основанные на вероятностных методах самоорганизации и грамматике конечных стохастиче-

ских автоматов;

исследование структуры сложной системы и решение задач восстановления уравнений (физических

законов), описывающих разомкнутый объект по небольшому количеству экспериментальных точек.

Принцип массовой селекции, используемый в алгоритмах МГУА, как и многие другие идеи кибернети-

ки, заимствует действующие природные механизмы и схематически повторяет агротехнические методы

селекции растений или животных, например:

высевается некоторое количество семян и, в результате опыления, образуются сложные наслед-

ственные комбинации;

селекционеры выбирают некоторую часть растений, у которых интересующее их свойство выражено

больше всего (эвристический критерий);

семена этих растений собирают и снова высевают для образования новых, еще более сложных комби-

наций;

через несколько поколений селекция останавливается, и ее результат является оптимальным;

если чрезмерно продолжать селекцию, то наступит ―инцухт‖ — вырождение растений (т.е. существу-

ет оптимальное число поколений и оптимальное количество семян, отбираемых в каждом из них).

Алгоритм МГУА воспроизводит схему массовой селекции [5] и включает генераторы усложняющихся из

ряда в ряд комбинаций и критерии порогового самоотбора лучших из них. Так называемое «полное»

описание объекта в виде 1 2( , , )mY f x x x , где f — некоторая функция, заменяется несколькими рядами

«частных» описаний:

1 ряд селекции: 1 1 2 2 1 3 1( , ); ( , ); ; ( , )s m my x x y x x y x x ;

2 ряд селекции: 1 1 2 2 1 3 1( , ); ( , ); ; ( , )p s sz y y z y y z y y , где 2ns C ,

2sp C и т.д.

Page 2: ЛОГИЧЕСКИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ ПРИРОДНЫХ ЯВЛЕНИЙ ПРИ КОМПЛЕКСНОМ АНАЛИЗЕ ЭКОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ

Входные аргументы и промежуточные переменные сопрягаются попарно, и сложность комбинаций на

каждом ряду обработки информации возрастает (как при массовой селекции), пока не будет получена

единственная модель оптимальной сложности. Поскольку каждое частное описание является функцией

только двух аргументов, его коэффициенты легко определить по данным обучающей последовательности

при малом числе узлов интерполяции. Из ряда в ряд селекции пропускается только некоторое количе-

ство самых регулярных переменных, степень регулярности которых оценивается по специальным крите-

риям. Ряды селекции наращиваются до тех пор, пока регулярность повышается. Как только достигнут

минимум ошибки, селекцию следует остановить. Практически рекомендуется остановить селекцию даже

несколько раньше достижения полного минимума, как только ошибка начинает падать слишком медленно.

Это приводит к более простым и более достоверным уравнениям.

По своим принципам инвариантного отображения среды многорядные алгоритмы МГУА чрезвычайно

близки идеям нейросетевого моделирования, в частности, многослойному персептрону Ф. Розенблатта

[6].

Самоорганизующиеся модели служат, в основном, для прогнозирования поведения и структуры экоси-

стем, так как по самой логике их построения участие исследователя в этом процессе сведено к мини-

муму. Можно привести ряд конкретных примеров использования алгоритмов МГУА: для долгосрочных про-

гнозов экологической системы озера Байкал, моделирования геоботанических описаний; системы «хищ-

ник–жертва», прироста деревьев, прогнозирования токсикологических показателей загрязнителей,

оценки динамики численности сообществ зоопланктона [7, 8] и т.д.

В математической кибернетике различают два вида итеративных процессов развития систем [6]:

адаптация, при которой экстремум (цель движения системы) остается постоянной;

эволюция, при которой движение сопровождается изменением и положения экстремума.

Если самоорганизация связана только с адаптационными механизмами подстройки реакций системы

(например, изменением значений весовых коэффициентов), то понятие эволюции связано с возможностью

эффектора (термин, введенный С. Лемом [1968]) изменять свою собственную структуру, т.е. количе-

ство элементов, направленность и интенсивность связей, настраивая их оптимальным образом относи-

тельно поставленных задач в каждый конкретный момент времени. В процессе эволюции в условиях

сложной и меняющейся среды эффектор способен приобрести принципиально новые качества, выйти на

следующую ступень развития. Например, в процессе биологической эволюции возникли чрезвычайно

сложные и вместе с тем удивительно продуктивно функционирующие живые организмы.

Эволюционное моделирование [8] представляет собой существенно универсальный способ построения

прогнозов макросостояний системы в условиях, когда полностью отсутствует апостериорная информа-

ция, а априорные данные задают лишь предысторию этих состояний. Общая схема алгоритма эволюции

выглядит следующим образом:

задается исходная организация системы (в эволюционном моделировании в этом качестве может фи-

гурировать, например, конечный детерминированный автомат Мили;

проводят случайные «мутации», т.е. изменяют случайным образом текущий конечный автомат;

отбирают для дальнейшего «развития» ту организацию (тот автомат), которая является «лучшей» в

смысле некоторого критерия, например, максимальной точности предсказания последовательности зна-

чений макросостояний экосистемы.

Критерий качества модели в этом случае мало чем отличается, например, от минимума среднеквад-

ратической ошибки на обучающей последовательности метода наименьших квадратов (со всеми вытекаю-

щими отсюда недостатками). Однако, в отличие от адаптации, в эволюционном программировании струк-

тура решающего устройства мало меняется при переходе от одной мутации к другой, т.е. не происхо-

дит перераспределения вероятностей, которые бы закрепляли мутации, приведшие к успеху на предыду-

щем шаге. Поиск оптимальной структуры происходит в большей степени случайным и нецеленаправлен-

ным, что затягивает процесс поиска, но обеспечивает наилучшее приспособление к конкретным изменя-

ющимся условиям.

Одним из первых возможность применения эволюционного моделирования для целей экологического

прогнозирования использовал В.Ф. Крапивин [7]. В дальнейшем, эти подходы применялись для прогно-

зирования величины прироста деревьев [8] и состояний байкальского планктона [8]. Идея эволюции

нашла свое выражение в разработке моделей временных рядов экологических переменных с использова-

нием трехэтапного эволюционного предсказывающего алгоритма [7] и автоматов Мили для многосимволь-

ных целочисленных временных рядов [7]. В этих работах использовался конечный автомат Мили со

структурой, описывающей некоторый набор состояний автомата и совокупность связей между ними. Ав-

томат в ходе эволюционного процесса «мутировал» в соответствии с некоторым набором заданных пра-

вил преобразования входных символов в выходные.

В последнее десятилетие наблюдается повышенный интерес к наиболее «биологизированным» моделям

эволюции с использованием генетического алгоритма, который можно считать «интеллектуальной» фор-

мой метода проб и ошибок. Генетический алгоритм [7], позаимствованный у природных аналогов, явля-

ется наиболее элегантным представителем эволюционных методов и представляет собой мощное поиско-

вое средство, эффективное в различных проблемных областях и основанное на трех компонентах:

генетической памяти, сконцентрированной в «хромосомах»;

воспроизведения, осуществляемого при помощи операторов кроссинговера и мутации;

селекции продуктивных решений методами оптимизации многоэкстремальных функций.

Еще один широко используемый подход к построению систем искусственного интеллекта – имитацион-

ный. Данный подход является классическим для кибернетики с одним из ее базовых понятий – «черным

ящиком» – устройством, информация о внутренней структуре и содержании которого отсутствует полно-

стью, но известны спецификации входных и выходных сигналов. Объект, поведение которого имитирует-

ся, как раз и представляет собой такой «черный ящик». Нам не важно, что у него и у модели внутри

и как он функционирует, главное, чтобы наша модель в аналогичных ситуациях вела себя точно так

же. Таким образом, здесь, после обучения и самоорганизации, моделируется еще одно свойство чело-

века – способность копировать то, что делают другие, не вдаваясь в подробности, зачем это нужно.

Основным недостатком имитационного подхода также является низкая информационная способность боль-

шинства моделей, построенных с его помощью.

В экоинформатике также применяются структурный подход и нейросетевое моделирование. Под струк-

турным подходом подразумеваются попытки построения систем искусственного интеллекта путем модели-

рования структуры человеческого мозга. В последние десять лет впечатляет феномен резкого повыше-

ния интереса к структурным методам самоорганизации – нейросетевому моделированию, которое успешно

применяется в самых различных областях – бизнесе, медицине, технике, геологии, физике, т.е. вез-

де, где нужно решать задачи прогнозирования, классификации или управления. Однако, известные све-

дения об использовании нейронных сетей в российской экологии весьма скудны и ограничиваются моде-

Page 3: ЛОГИЧЕСКИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ ПРИРОДНЫХ ЯВЛЕНИЙ ПРИ КОМПЛЕКСНОМ АНАЛИЗЕ ЭКОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ

лированием лесорастительных свойств ландшафтных зон [8] и моделированием некоторых аспектов гид-

роэкологических систем [8].

В основе всего нейросетевого подхода лежит идея построения вычислительного устройства из боль-

шого числа параллельно работающих простых элементов – формальных нейронов. Эти нейроны функциони-

руют независимо друг от друга и связаны между собой однонаправленными каналами передачи информа-

ции. Ядром нейросетевых представлений является идея о том, что каждый отдельный нейрон можно мо-

делировать довольно простыми функциями, а вся сложность мозга, гибкость его функционирования и

другие важнейшие качества определяются связями между нейронами. Нейронные сети (НС) – очень мощ-

ный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости, нелинейные

по свой природе. Как правило, нейронная сеть используется тогда, когда неизвестны предположения о

виде связей между входами и выходами (хотя, конечно, от пользователя требуется какой-то набор

эвристических знаний о том, как следует отбирать и подготавливать данные, выбирать нужную архи-

тектуру сети и интерпретировать результаты).

На вход нейронной сети подаются представительные данные и запускается алгоритм обучения, кото-

рый автоматически анализирует структуру данных и генерирует зависимость между входом и выходом.

Для обучения нейронных сетей применяются алгоритмы двух типов: управляемое («обучение с учите-

лем») и неуправляемое («без учителя»).

Простейшая сеть имеет структуру многослойного персептрона с прямой передачей сигнала, которая

характеризуется наиболее устойчивым поведением. Входной слой служит для ввода значений исходных

переменных, затем последовательно отрабатывают нейроны промежуточных и выходного слоев. Каждый из

скрытых и выходных нейронов, как правило, соединен со всеми элементами предыдущего слоя (для

большинства вариантов сети полная система связей является предпочтительной). В узлах сети актив-

ный нейрон вычисляет свое значение активации, беря взвешенную сумму выходов элементов предыдущего

слоя и вычитая из нее пороговое значение. Затем значение активации преобразуется с помощью функ-

ции активации (или передаточной функции), и в результате получается выход нейрона. После того,

как вся сеть отработает, выходные значения элементов последнего слоя принимаются за выход всей

сети в целом.

Наряду с моделью многослойного персептрона, позднее возникли и другие модели нейронных сетей,

различающихся по строению отдельных нейронов, по топологии связей между ними и по алгоритмам обу-

чения. Среди наиболее известных сейчас вариантов можно назвать нейронные сети с обратным распро-

странением ошибки, основанные на радиальных базисных функциях, обобщенно-регрессионные сети Хоп-

филда и Хэмминга, самоорганизующиеся карты Кохонена, стохастические нейронные сети и т.д. Суще-

ствуют работы по рекуррентным сетям (т.е. содержащим обратные связи, ведущие назад от более даль-

них к более ближним нейронам), которые могут иметь очень сложную динамику поведения. Начинают

эффективно использоваться самоорганизующиеся (растущие или эволюционирующие) нейронные сети, ко-

торые во многих случаях оказываются более предпочтительными, чем традиционные полносвязные

нейронные сети.

Для моделей, построенных по мотивам человеческого мозга, характерны как легкое распараллелива-

ние алгоритмов и связанная с этим высокая производительность, так и не слишком большая вырази-

тельность представленных результатов, не способствующая извлечению новых знаний о моделируемой

среде.

Важным условием применения нейронных сетей, как и любых статистических методов, является объ-

ективно существующая связь между известными входными значениями и неизвестным откликом. Эта связь

может носить случайный характер, искажена шумом, но она должна существовать. Известный афоризм

«garbage in, garbage out» («мусор на входе – мусор на выходе») нигде не справедлив в такой степе-

ни, как при использовании методов нейросетевого моделирования. Это объясняется, во-первых, тем,

что итерационные алгоритмы направленного перебора комбинаций параметров нейросети оказываются

весьма эффективными и очень быстрыми лишь при хорошем качестве исходных данных. Однако, если это

условие не соблюдается, число итераций быстро растет и вычислительная сложность оказывается сопо-

ставимой с экспоненциальной сложностью алгоритмов полного перебора возможных состояний. Во-

вторых, сеть склонна обучаться прежде всего тому, чему проще всего обучиться, а, в условиях силь-

ной неопределенности и зашумленности признаков, это – прежде всего артефакты и явления «ложной

корреляции».

Отбор информативных переменных в традиционной регрессии и таксономии осуществляют путем «взве-

шивания» признаков с использованием различных статистических критериев и пошаговых процедур, ос-

нованных, в той или иной форме, на анализе коэффициентов частных корреляций или ковариаций. Для

этих целей используют различные секвенциальные (последовательные) процедуры, не всегда приводящие

к результату, достаточно близкому к оптимальному. Эффективный автоматизированный подход к выбору

значимых входных переменных может быть реализован с использованием генетического алгоритма. В

связи с этим, в общей схеме статистического моделирования методами искусственного интеллекта ре-

комендуется последовательное выполнение двух разных процедур:

с помощью эволюционных методов в бинарном пространстве признаков ищется такая минимальная ком-

бинация переменных, которая обеспечивает незначительную потерю информации в исходных данных,

полученная на предыдущем этапе минимизированная матрица данных подается на вход нейронной сети

для обучения.

На основании проведенного сравнения представляется, что искусственные нейронные модели будут

более эффективны при выполнении следующих условий:

моделируемый объект очень сложен;

моделируемый объект существенно нелинеен;

для моделирования «участков» объекта, имеющих несложное математическое описание, предпочти-

тельно использование частных моделей (например, построенных с помощью алгоритмов типа МГУА).

Литература 1. Аверкин А.Н., Батыршин И.З., Блишун А.Ф. и др. Нечеткие множества в моделях управления и

искусственного интеллекта // Под ред. Д.А. Поспелова. – М.: Наука, 1998. – 312 с.

2. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных реше-

ний. – М.: Мир, 1976. – 165 с.

3. Базыкин А.Д. Математическая биофизика взаимодействующих популяций. – М.: Наука, 1995. – 180

с.

4. Брусиловский П.М. Коллективы предикторов в экологическом прогнозировании. – Саратов: Изд-во

Сарат. ун-та, 1997. – 104 с.

5. Букатова И.Л., Михасев Ю.И., Шаров А.М. Экоинформатика. Теория и практика эволюционного мо-

делирования. – М.: Наука, 2002. – 206 с.

Page 4: ЛОГИЧЕСКИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ ПРИРОДНЫХ ЯВЛЕНИЙ ПРИ КОМПЛЕКСНОМ АНАЛИЗЕ ЭКОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ

6. Нетрадиционные модели и системы с нечеткими знаниями /Под ред. А.Ф. Блишуна. – М.: Энерго-

атомиздат, 1996. – 144 с.

7. Левич А.П. Структура экологических сообществ. – М.: МГУ, 1980. – 181 с.

8. Ивахненко А.Г. Долгосрочное прогнозирование и управление сложными системами. – Киев: Техни-

ка, 1995. – 311 с.

9. Ивахненко А.Г. Самообучающиеся системы распознавания и автоматического управления. – Киев:

Техника, 1999. – 392 с.


Recommended