32
1 Построение автономных адаптивных управляющих систем на основе нечеткой логики Караваев М.В., Институт системного программирования РАН

Построение автономных адаптивных управляющих систем на основе нечеткой логики

Embed Size (px)

DESCRIPTION

Караваев М.В., Институт системного программирования РАН. Построение автономных адаптивных управляющих систем на основе нечеткой логики. Основные задачи. Самообучение, используя только собственный опыт взаимодействия с внешней средой Адаптация к изменяющимся свойствам внешней среды - PowerPoint PPT Presentation

Citation preview

Page 1: Построение автономных адаптивных управляющих систем на основе нечеткой логики

1

Построение автономных адаптивных управляющих систем на основе нечеткой логики

Караваев М.В.,Институт системногопрограммирования РАН

Page 2: Построение автономных адаптивных управляющих систем на основе нечеткой логики

2/38

Основные задачи

Самообучение, используя только собственный опыт взаимодействия с внешней средой

Адаптация к изменяющимся свойствам внешней среды

Управление объектом с целью нахождения максимума априорно заложенной целевой функции (аппарат эмоций)

Page 3: Построение автономных адаптивных управляющих систем на основе нечеткой логики

3/38

Методы и проблемы построения адаптивных систем управления

Page 4: Построение автономных адаптивных управляющих систем на основе нечеткой логики

4/38

Технологии построениясистем управления

ТАР (позднее ТАУ)

Автоматы (конечные, вероятностные)

Нечеткие контроллеры

Нейро-контроллеры

Подходы, основанные на концептуальных моделях нервных систем (П.К. Анохин, J.A.Meyer, А.А.Жданов)

Page 5: Построение автономных адаптивных управляющих систем на основе нечеткой логики

5/38

Технологии построениясистем управления

+–––+Нечеткие контроллеры

?+++–Концептуальные модели нервных систем

+–––+Нейро-контроллеры

–++++Автоматы

+–––+ТАУ

Простота взаимодей-

ствия с реальным

миром

Простота организации

переобучения

Возможность работы без априорного

задания модели ОУ

Активное поведени

е

Проработан-

ность теории

Подход

Page 6: Построение автономных адаптивных управляющих систем на основе нечеткой логики

6/38

Пример работы традиционного нечеткого контроллера

t

холодная теплая горячая

t1

0,50

0,65

1,00

0,10

A

повернуть влево не вращать повернуть вправо

0,50

0,65

1,00

0,10

A1

0-30 304

1. Если вода горячая и давление слабое, то повернуть синий вентиль вправо;2. Если вода горячая и давление сильное, то повернуть красный вентиль влево;3. Если вода теплая, то не вращать вентили;4. Если вода холодная и давление слабое, то повернуть красный вентиль вправо;5. Если вода холодная и давление сильное, то повернуть синий вентиль влево;

1. Повернуть синий вентиль вправо:min(0,00; 0,35) = 0,00;2. Повернуть красный вентиль влево: min(0,00; 0,78) = 0,00;3. Не вращать вентили: 0,65 = 0,65;4. Повернуть красный вентиль вправо:min(0,10; 0,35) = 0,10;5. Повернуть синий вентиль влево:min(0,10; 0,00) = 0,00.

Центр масс

фаззификация

композиция и дефаззификация

набор правил управления

вычисление посылок правил

Page 7: Построение автономных адаптивных управляющих систем на основе нечеткой логики

7/38

Метод Автономного Адаптивного Управления

• Разбивает задачу управления на подзадачи: ФРО, БЗ, ПР и др.

• Две целевые функции: выживание и накопление знаний

• Активное поведение, источником которого является аппарат эмоций

• Адаптивность и автономность

• Имеет ограничения вследствие дискретности представления информации в системе

Page 8: Построение автономных адаптивных управляющих систем на основе нечеткой логики

8/38

Модификация схемысистемы ААУ

Система управления

СенсорыБлок ФРО

Аппаратэмоций

Базазнаний

Блокпринятиярешений

Исполнительные органы

Среда

Базовая схема

Модифицированная схема

Page 9: Построение автономных адаптивных управляющих систем на основе нечеткой логики

9/38

Основные задачи, решаемые разработанной системой ААУ на основе НЛ

Генерация нечетких функций принадлежности и правил управления (идентификация нечеткой модели)

Адаптация БЗ к изменяющимся свойствам среды и ОУ

Распознавание образов (фаззификация) и принятие решений на основании правил в БЗ (включая дефаззификацию)

Page 10: Построение автономных адаптивных управляющих систем на основе нечеткой логики

10/38

Существующие методы идентификации нечеткой модели

Нечеткие нейронные сети Генетические алгоритмы Методы, основанные на кластерном и

статистическом анализе.Методы кластеризации:• C-means;• Fuzzy C-means;• mountain method;• subtractive method (метод вычетов)

Page 11: Построение автономных адаптивных управляющих систем на основе нечеткой логики

11/38

Кодирование информации в нечетких системах ААУ

1. Входные и выходные функции принадлежности (ФРО и подсистема принятия решений). Трапецеидального вида, задаются x-координатами вершин трапеции

F

µ(F)

0

Fi

FmaxFmin

Xlb i

Xlt i Xrt i

Xrb i

Fj

Xlb j

Xlt j Xrt j

Xrb j

Page 12: Построение автономных адаптивных управляющих систем на основе нечеткой логики

12/38

Представление знаний в нечетких системах ААУ

2. Правила вида Rh: Oi & Aj Ok / Eh в БЗ, где

– задает входной образ (набор входных множеств) правила;

– набор управляющих воздействий;

– образ результата (набор входных множеств), который должен распознаваться при выполнении данного правила;

Eh – оценка результирующего образа.

1 1 2 2( ) & ( )... ( )j j j jM MA y y y

1 1 2 2( ) & ( )... ( )i i i iN NO x x x

1 1 2 2( ) & ( )... ( )k k k kN NO x x x

Page 13: Построение автономных адаптивных управляющих систем на основе нечеткой логики

13/38

Алгоритм генерациинечетких правил

1. Накопление статистики в виде набора векторов, координаты которых соответствуют значениям входных и выходных переменных системы

2. Выполнение процедуры кластеризации

3. Генерация входных и выходных функций принадлежности

4. Объединение близких функций принадлежности и удаление повторяющихся правил

5. Склеивание правил по ИЛИ (при отсутствии адаптации)

Page 14: Построение автономных адаптивных управляющих систем на основе нечеткой логики

14/38

Генерация функций принадлежности

F

µ(F)

0

Fi

FmaxFmin

Xlb i

Xlt i Xrt i

Xrb i

Fj

Xlb j

Xlt j Xrt j

Xrb j

1

2

1

21

2

2

Nrt

lt

NNrb

lb

cX

cX

ccX

ccX

где ci – координата i-ой точки кластера, а N – количество точек в кластере.

Page 15: Построение автономных адаптивных управляющих систем на основе нечеткой логики

15/38

Вычисление степенейадекватности правил

Q – степень адекватности [0,1]

– результирующая принадлежность входных, выходных образов и действия множествам, описываемым правилом [0,1]

q – скорость переобучения [0,1]

))(()()( 111 tj

txj

tyj

txj

tj

tj QOwqAwOwQQ

()jw

Page 16: Построение автономных адаптивных управляющих систем на основе нечеткой логики

16/38

Алгоритм принятия управляющих решений

1. Вычисление посылок всех нечетких правил

2. Корректировка посылок по значениям степеней адекватности нечетких правил

3. Корректировка посылок по оценкам результирующих образов

4. Вычисление суммы посылок и сравнение ее с порогом

5. Вычисление результирующего воздействия (дефаззификация): центр масс или средневзвешенное, или принятие случайного решения

Page 17: Построение автономных адаптивных управляющих систем на основе нечеткой логики

17/38

Корректировка посылок правил по оценкам результирующих образов

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Исходное значение посылки правила

Ре

зул

ьти

ру

ющ

ее

зн

ач

ен

ие

по

сы

лки

пр

ав

ил

а

Сигмоидальная функция

Квадратичная функция

Линейная функция спорогом

Emin [0,1] – константа,

задающая нижний порог, отсекающий правила с низкими оценками.

max

tan 0.5 13 1.1

0.5

i

i i

Ea

E

2

max

ii i

E

E

i min max

i min maxmax

0, E

, Ei ii

если E E

Eесли E E

E

Page 18: Построение автономных адаптивных управляющих систем на основе нечеткой логики

18/38

Эксперименты с прикладной системой ААУ на основе нечеткой логики при управлении различными объектами

Page 19: Построение автономных адаптивных управляющих систем на основе нечеткой логики

19/38

Общая схема инструментальной программной системы 4GN

БлокФРО

АппаратЭмоций

БазаЗнаний

Блок принятиярешений

Сенсоры

Исполн.Органы

Среда

Редактормежблочныхсоединений

Скрипт-редактор скомпилятором С#

Редакторнейросетей

Библиотеканейроноподобных

элементов и связей

Редакторсистемы

Библиотека готовыхподсистем ААУ

Application System

Designer 4GN

Подсистемавизуализации

Библиотека визуализирующихмодулей Runtime 4GN

Подсистемауправления работой

Application system

Подсистема настройкисвойств блоков

Application System

Фай

лы

, баз

ы д

анны

х, д

руги

е пр

огра

мм

ы...

Page 20: Построение автономных адаптивных управляющих систем на основе нечеткой логики

20/38

Прикладная система управления перевернутым маятником

Система 4GN в процессе обучения системы управления маятником

Page 21: Построение автономных адаптивных управляющих систем на основе нечеткой логики

21/38

Результаты экспериментов с перевернутым маятником (фиксированное начальное положение)

8º12º12º12º12ºДопустимое отклонение маятника

2020505050Количество опытов

790518---Среднее количество тактов работы УС

2791541383291396Стандартное отклонение (SD)

173123-70272Минимальное количество попыток

610417-19107052Максимальное количество попыток

3952592835351846Среднее количество попыток

ААУААУIgelSANEGENITORСистема управления

Page 22: Построение автономных адаптивных управляющих систем на основе нечеткой логики

22/38

Результаты экспериментов с перевернутым маятником (произвольное начальное положение)

12º12º12º12ºДопустимое отклонение маятника

20505050Количество опытов

895---Среднее количество тактов работы УС

8411489842092Стандартное отклонение (SD)

349-46415Минимальное количество попыток

622-446112964Максимальное количество попыток

44896716912578Среднее количество попыток

ААУIgelSANEGENITORСистема управления

Page 23: Построение автономных адаптивных управляющих систем на основе нечеткой логики

23/38

Прикладная система стабилизации углового движения АКА

Система 4GN в процессе отладки системы стабилизации углового движения автоматического космического аппарата

Page 24: Построение автономных адаптивных управляющих систем на основе нечеткой логики

24/38

Результаты экспериментов с системой стабилизации углового движения космического аппарата

5,95,95,95,6Качество управления

+–– –Случайные возмущения

0,580,550,060,17Средняя степень наполнения БЗ

115176735972Стандартное отклонение (SD)

71959254845640Минимальное количество тактов

1106119982508940Максимальное количество тактов

92586269057590Среднее количество тактов до выхода на заданное качество управления

Fuzzy Pilot 2

Fuzzy Pilot 1

Pilot 2Pilot 1Система управления

Page 25: Построение автономных адаптивных управляющих систем на основе нечеткой логики

25/38

Переобучение (адаптация) нечеткой системы стабилизации углового движения космического аппарата

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

1 182 363 544 725 906 1087 1268 1449 1630 1811 1992 2173 2354 2535 2716 2897 3078 3259 3440 3621

Такты работы системы

Оц

енка

кач

еств

а уп

рав

лен

ия

Page 26: Построение автономных адаптивных управляющих систем на основе нечеткой логики

26/38

Прикладная система управления мобильным роботом

Pioneer P3-DX

Модель робота Pioneer P3-DX в среде моделирования Player/Stage

Page 27: Построение автономных адаптивных управляющих систем на основе нечеткой логики

27/38

Результаты экспериментов с мобильным роботом(рост оценки качества управления)

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

1 83 165 247 329 411 493 575 657 739 821 903 985 1067 1149 1231 1313 1395 1477 1559 1641

Такты работы системы

Оц

енка

кач

еств

а уп

рав

лен

ия

Page 28: Построение автономных адаптивных управляющих систем на основе нечеткой логики

28/38

Результаты экспериментов

Нечеткая система ААУ показала скорость обучения при балансировке перевернутым маятником на 9%-115% более высокую по сравнению с системами, построенными на основе обучения с подкреплением, при равных критериях качества.

Нечеткая система ААУ продемонстрировала существенное сокращение (примерно в 8 раз) времени обучения при стабилизации углового движения космического аппарата, по сравнению с существующими системами ААУ.

Продемонстрирована возможность применения разработанной системы для эффективного управления мобильным роботом Pioneer P3-DX.

Page 29: Построение автономных адаптивных управляющих систем на основе нечеткой логики

29/38

Основные результаты работы

1. Разработано обобщенное описание системы ААУ на основе теории нечетких множеств.

2. Разработаны методы синтеза управляющих систем ААУ на основе теории нечетких множеств, в том числе алгоритмы автоматической генерации входных и выходных функций принадлежности, нечетких правил управления, вычисления оценок, принятия решений и адаптации БЗ.

3. На основе разработанных методов создана модель прикладной системы управления в виде модуля для системы Designer4GN на языке C#, которая была испытана на задачах балансирования перевернутым маятником, стабилизации углового движения космического аппарата и управления мобильным роботом.

4. Проведены несколько серий компьютерных экспериментов с разработанной системой управления и моделями объектов управления, в ходе которых было показано преимущество нечеткой системы ААУ над аналогичными системами управления в скорости обучения.

Page 30: Построение автономных адаптивных управляющих систем на основе нечеткой логики

30/38

Список публикаций по теме диссертации

1. Жданов А. А., Караваев М. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 3. – М.: ИСП РАН, 2002, с. 119-135.

2. Караваев М.В., Жданов А.А. Применение нечеткой логики в системах автономного адаптивного управления. Сборник материалов всероссийской научно-технической конференции "Наука – производство – технологии – экология": Том 1. Киров: Изд-во ВятГУ, 2002, с. 13-14.

3. Alexander Zhdanov, Maxim Karavaev and Helen Maklakova, Claire Medigue, Michel Sorine. Simulation of control mechanisms in the cardio-vascular system. French-Russian A.M. Liapunov Institute for Applied Mathematics and Computer Science. Transactions. Vol. 4. Pp. 233-245. Moscow. 2003.

4. Караваев М.В. Правила формирования связей между нейроноподобными элементами в системах автономного адаптивного управления. С. 102-108. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2004: Часть 2. М.: МИФИ. С. 102-108.

5. Жданов А.А., Устюжанин А.Е., Караваев М.В. Нейросетевой самообучаемый метод адаптивного управления динамическими объектами. Материалы XXIX Академических чтений по космонавтике, 2005 год. М.: 2005. с. 93.

6. А.А. Жданов, А.Е. Устюжанин, М.В. Караваев, Д.Б. Липкевич. 4GN – инструмент для разработки нейроноподобных адаптивных систем управления на основе метода автономного адаптивного управления. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2005: Часть 1. М.: МИФИ. С. 203-209.

7. Жданов А.А., Караваев М.В. Разработка адаптивной системы управления мобильным роботом с применением. Всероссийская научно-техническая конференция "Наука – производство – технологии – экология". Сборник материалов: Том 1. Киров: Изд-во ВятГУ, 2005, с. 34-36.

8. Караваев М. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 7 (под ред. А.А.Жданова). – М.: ИСП РАН, 2004, с. 41-53.

9. М.В. Караваев. Применение нечеткой логики в системах автономного адаптивного управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.

10. М.В. Караваев, А.Е. Устюжанин, А.А. Жданов. 4GN – программный инструмент для проектирования интеллектуальных систем управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.

Page 31: Построение автономных адаптивных управляющих систем на основе нечеткой логики

31

Спасибоза внимание!

Page 32: Построение автономных адаптивных управляющих систем на основе нечеткой логики

32/38

Список источников

1. Заде Л. Понятие лингвистической переменной и его применение к принятию приближённых решений. – М.: Мир, 1976.

2. Жданов А.А. Метод автономного адаптивного управления // Известия Академии Наук. Теория и системы управления, 1999, № 5, с. 127-134.

3. Moriarty, D. E. and R. Miikulainen. Efficient reinforcement learning through symbiotic evolution. Machine Learning 22, 11–32, 1996.

4. Christian Igel. Neuroevolution for Reinforcement Learning Using Evolution Strategies. In R. Sarker, R. Reynolds, H. Abbass, K. C. Tan, B. McKay, D. Essam, and T. Gedeon, editors, Congress on Evolutionary Computation 2003 (CEC 2003), Volume 4, pp. 2588-2595, IEEE Press, 2003.