57
ر ی ب ک ر می ی ا عت ن ص گاه ش ن دا ی ک ش ز پ ی س د ن ه م کده ش ن دا ش& ی( پ رل ی+ ب ک ز مدل- پ ی ت ت- ن م0 ن& ی- پ زد- پ ده و کار ع ش ی ور ت0 ا= ن در ش ن ا=را م ت س شی دی ن- ب ی مل دعا ن چ های اد: ن س ا واه خ د ن چ و ت ر کی ای د ا=ق- اب ن- چ ده: ن ه ه دQ ارائS مدی ح م ه ل عاد رماه ا= د1389

DMPC Mohammadi

  • Upload
    hn317

  • View
    231

  • Download
    4

Embed Size (px)

DESCRIPTION

multi agent

Citation preview

Page 1: DMPC Mohammadi

دانشگاه صنعتی امیرکبیردانشکده مهندسی پزشکی

بین مبتنی بر مدل کنترل پیشتوزیع شده و کاربرد آن

های بندی سیستم آرایشدراستاد:چندعاملی

جناب آقای دکتر توحیدخواهارائه دهنده:

عادله محمدی

1389آذرماه

Page 2: DMPC Mohammadi

فهرست مطالب

Page 3: DMPC Mohammadi

عاملAgent

ها درك كرده و سنسور را از طري!ق محي:ط ك!ه وجودي!ک كند. ميعمل بر روي آن خودمختاربه صورت

3

Page 4: DMPC Mohammadi

عامل در قالب يك سيستم فيدبكي

4

Page 5: DMPC Mohammadi

خودمختاريAutonomy

وجود عام!ل هر ي!ا انس!ان مس!تقيم دخال!ت بدون گيري و عم!ل خود داراي استقالل ديگ!ر، در تص!ميم

است.

5

Page 6: DMPC Mohammadi

عامل ها خودمختارند :احساس محیط خود و سایر عامل ها رد و بدل اطالعات با سایر عامل هامحاسبه و اجرای اعمال کنترلی الزم

برای رسیدن به سهم خود در تابع هدف

6

Page 7: DMPC Mohammadi

7

سیستم های چندعاملیMulti-agent Systems

مفهوم وقت!ي درک با عام:ل تعدادي در کنار ه!م قرار گرفت!ه تا در خودمختاري

فردي، اهداف جمعي كنار عمدتاً هدف كنند، دنبال را راس!!تا همان در واالتري پيدا تجلي چندعامل!ي هاي س!يستم عنوان

کند ميتحقق هدفی در سطح سیستم

7

Page 8: DMPC Mohammadi

88

مفاهيم مربوط به سيستم هاي چندعاملي

Page 9: DMPC Mohammadi

همکاریCooperation

توافق عامل ها برای داشتن هدفی مشترک با سایر عامل ها، 1(

که این هدف معموال به صورت آفالین مشخص می شود.

به اشتراک گذاشتن اطالعات به صورت 2(آنالین برای تحقق هدف مشترک

9

Page 10: DMPC Mohammadi

Distribution

ویژگی ذاتی سیستم های چندعاملی :توزیع شدگی

یعن!ی ه!ر عام!ل توس!ط انتقال اطالعات محلی با سایر عامل ها باید ”مختارانه“ عمل کند.

10

Page 11: DMPC Mohammadi

کنترل توزیع شده طبیعت ابعاد وسیع سیستم ها

کاربردهای ابعاد وسیع •سیستم های قدرت• سیستم های توزیع آب• سیستم ترافیک• سیستم های تولید• سیستم های اقتصادی•

11

Page 12: DMPC Mohammadi

DMPC vs. CMPC

ورودی کنترلی کل 12

دینامیک کل سیستم

حلیک

مسئلهبهینه سازی

ورودی های کنترلی محلی

دینامیک تک تک عامل ها

حلچند

مسئلهبهینه سازی

Page 13: DMPC Mohammadi

کنترل بهینه غیرمتمرکزOptimal Decentralized Control

• Optimal control problem subject to decentralized information structure constraints

که • محل!ی های حال!ت ب!ه فق!ط محل!ی فیدب!ک ه!ر اطالعات آنها کامل است دسترسی دارد

13

Page 14: DMPC Mohammadi

Optimal Decentralized Controllers

حالت های هر زیرسیستم و همسایه های آن •در اطالعات انتقال یا گیری اندازه ب!!ا

دسترس استه!ا همخوانی • بی!ن عام!ل اهداف هماهن!گ ب!ا

داردمحاسبات موازی و توزیع شده•

14

Page 15: DMPC Mohammadi

MPC توزیع شده هر عامل : متغیرها، تابع هزینه و قیود محلی مسائل بهینه سازی محلی کو!چکتر از مساله بهینه

سازی متمرکزدرجه ای از هماهنگی بین عامل ها نیاز است تامین اطالعات مورد نیاز

15

Page 16: DMPC Mohammadi

آرایش بندی در سیستم های چندعاملی

ايجاد تعامل!ي مناس!ب بي!ن تعدادي از عامل ها •در يک فضاي مشخص

های • سیستم در مه!!م مس!!ائل از یک!!ی بين هماهنگ!ي و همكاري مس!ئله چندعامل!ی

عامل از به تعدادي اس!ت قرار ك!ه هاس!ت الگوي خاصي دست يابند.

ه!ر گاه اي!ن تعام!ل در ي!ك فض!ا نمود پيدا كند، •آرايش ) آنگاه عنوان تعبير Formationبندي )

مناسبي براي آن است. 16

Page 17: DMPC Mohammadi

بندي در طبيعت آرايشبندي در ط!بيعت ني!ز قاب!ل مشاهده است آرايش

می و ک!ه آسمان در پرندگان حرك!ت ب!ه توان .ه کردها در محيط اشار پخش شدن گونه

17

Page 18: DMPC Mohammadi

بندي در طبيعت آرايش

18

Page 19: DMPC Mohammadi

انواع هدف در آرایش بندی

19

Page 20: DMPC Mohammadi

بندي ثابت آرايشرس!يدن ب!ه آراي!ش مناس!ب ب!ه عنوان ص!ورت مسئله مطرح

شود. ميه!ا در محي!ط پراكنده هس!تند و باي!د ضم!ن تعامل در ابتدا عامل

ه!ا ب!ه س!مت آرايش!ي كه بر ب!ا محي!ط، در حضور س!ایر عاملشود، همگرا شوند. هاي مسئله تعيين مي اساس خواسته

20

Page 21: DMPC Mohammadi

بندي متحرك آرايش

21

حفظ يا تغيير هدف اصلي مناسب آرايش حين تغييرات محيط و در حضور ساير

استها عامل

Page 22: DMPC Mohammadi

بندي متحرك انواع آرايشدر محي!ط مدنظ!ر قرار گرفته و ره:بر . ي!ك عام!ل ب!ه عنوان1

اتخاذ س!اير ع!امل آ!ن!، تص!ميم! مناسب را ب!ا تعام!ل ه!ا در كنند. مي!

مجازي . 2 شرايط ره:بر و هدف اس!اس بر ك!ه بوده ع!امل س!اير آن محي!ط، ب!ا را خود مجازی ب!ه ص!ورت ه!ا

كنند. تنظيم! مي!

هاي همسايه خود را ب!ا عامل محل:ي: ه!ا ب!ه ص!ورت . عامل3و س!عي مي! به هماهن!گ کرده آراي!ش، كنن!د ض!م!ن حف!ظ تغييرات محيط پاسخ دهند.

22

Page 23: DMPC Mohammadi

بندي فضايي/ منطقی آرايشبندي فضايي آرايش

تعريف مي تعامالت مختص!اتي هدف اص!لي شود ص!رفاً عامل س!اير ب!ا تعامالت همين ك!ه ب!ه محدود ني!ز ه!ا

فرض است.

االضالع ه!ا در س!ه گوش!ه ي!ك مثل!ث متساوي آرای!ش عامل

ها هدف: حفظ فاصله مساوی بين همه عامل

23

مثال

Page 24: DMPC Mohammadi

بندي منطقي آرايشآرايش مي تعمی!م كه توان دانس!ت بندي فضاي!ي

دیگری پارامترهای فضایی مختص!ات بر عالوه گيري دخیل هستند. نیز در تعیین تصميم

شبكه پدافند موشكي پارامترهاي!ي مث!ل فاص!له ام!ن از يكديگر، ميزان

مراكز هم از فاص!له و اختفاء ميزان پوشان!ي، حساس نيز مورد توجه است.

24

مثال

Page 25: DMPC Mohammadi

موانع هوشمند/ غيرهوشمند تأثي!ر محيط حرك!ت عامل تح!ت در محي!ط ه!ا

مي محدوديت محدود اي!ن از يك!ي ها شود. وجود موانع است.

موانع استاتيكدر پارامترهاي هدف تأثيرگذار نيستند.

آنها ب!ا تعام!ل و بوده هوشمن!د غي!ر موان!ع اي!ن آسان است.

25

Page 26: DMPC Mohammadi

در مقاب!ل ممك!ن اس!ت موانع!ي وجود داشتهباشن!د ك!ه ابعاد هدف را تغيير داده و بعضاً در

عامل بي!ن رقاب!ت بروز ممكن ص!ورت ه!ا، اس!ت كالً ص!ورت مس!ئله را تغيير دهند.)لزوم

تطبيق و يادگيري(

26

Page 27: DMPC Mohammadi

کاربردهاشبكه! سنسورهاي بي سيم در محيط هاي تداخلي•انجام عمليات جستجو )امداد و نجات، مين يابي(•كنترل حركت ماهواره در مدار زمين•روابط بين المللی•امنيت شبكه هاي اينترنتي•مديريت بحران و منابع•سپر دفاع موشكي•محيط نبرد•

27

Page 28: DMPC Mohammadi

ارز هاي معادل يا هم واژهكنند تر بررسي مي های خاصي را دقيق هر يك جنبه•

28

Page 29: DMPC Mohammadi

ائتالف Coalition

دنبال عامل• را يكساني اهداف الزاماً ه!!ا انجام نمي ادامه در اس!ت ممك!ن ول!ي كنن!د،

به زمان!ي خاص!ي در مقاط!ع وظاي!ف محول!ه يكديگر نياز داشته باشند.

كل!ي • ائتالف در حال!ت هدفدار و موقت ” شكل میان!ی هدف ي!ك اس!اس بر ك!ه بوده

رس!د كه هدف از گرفت!ه و زمان!ي ب!ه پايان ميبي!ن رفت!ه باش!د ي!ا ادام!ه آ!ن ب!ا اهداف اوليه در ائتالف در حضور ادامه اينك!ه ي!ا باش!د تضاد

سودي براي عامل نداشته باشد“ . 29

Page 30: DMPC Mohammadi

Flocking behavior حرکت گله ایيكي از انواع رفتارهاي اجتماعي •عامل• از بزرگ!ي ي!ك ‌‌‌گروه ب!ا يكس:ان ه!ا در هدف هم ب!ا

فاصله مشخص ها در يك . در اين رفتار همه عاملاند تعامليكس:ان ب!ا و س:رعت موانع ب!ا برخورد از و كرده حرك!ت

كنند. يكديگر خودداري ميكاربردها:•سنسورهاي • از بزرگ!ي گروه از اس!تفاده ب!ا محي!ط پاي!ش

متحرك تحويل موازي بار به مقصد• انجام عمليات امداد و نجات•

30

Page 31: DMPC Mohammadi

Coverage كنترل پوشش Control

:هدف• انجام در مناسب همپوشان!ي! ايجاد يك وظيفه ه!مگاني است

بندي ثابت مشابه آرايش•تفاوت : ه!دف پوشش محيط است و تأكيدي •

بر روي آرايش وجود ندارد

31

Page 32: DMPC Mohammadi

Consensusاجماع

رس!يدن هم!ه عامل ه!ا ب!ه ي!ك حال!ت واحد و يكسان و ايجاد هماهنگي بين آنها

32

Page 33: DMPC Mohammadi

RHCحل مساله آرایش بندی با Why RHC?- Generality: generic state & control cons.

- Reconfigurability: redefine functions & cons. To reflect changes

Why not RHC?- Computational demand- Theoretical Conservation: proofs of stability

33

Page 34: DMPC Mohammadi

RHCتوزیع شده راه حل غیر متمرکز مزایای زیر را دارد:

خودمختاری زیرسیستم ها حفظ می شود.•• scalableخودمختاری عام!ل ه!ا حف!ظ م!ی شود و نتیجه

قابل گسترش به تعداد زیادی عامل است. توزی!ع شده: در تئوری فق!ط یک RHCمشک!ل

راه ح!ل متمرک!ز، پایداری مجانب!ی را تضمین می کند.

34

Page 35: DMPC Mohammadi

RHCحل مساله آرایش بندی با یک • و شود م!ی! تعری!ف مناس!بی! هدف تاب!ع

نهایی ه!دف تحق!ق برای بهین!ه کنترل مس!اله در ها ربات هماهنگ!ی! و بندی آرای!ش یعن!ی قال!ب کنترل پی!ش بی!ن مبتن!ی بر مدل ح!ل می

شود.هدف ای!ن اس!ت ک!ه ب!ا اس!تفاده از روش! افق •

سوی ب!ه را ه!ا عام!ل از گروه!ی! بی!ن پی!ش هدف مشترکی هدایت کرده و پایدار کنیم.

•35

Page 36: DMPC Mohammadi

قیود در سیستم های چندعاملی ممکن قیود دارند. دینامی!ک ی!ک ه!ر ه!ا عام!ل

اس!ت برای ه!ر ی!ک از عام!ل ه!ا به طور فردی کنترلی محدود ورودی مثال باش!د داشت!ه وجود

برای هر عامل. دس!ته دیگری از قیود وجود دارن!د ک!ه! مربوط به

ذات سیستم هستند. مثال قید نانهولونومیک بس!ته ب!ه هدف!ی ک!ه تعری!ف شده ب!ه وجود می

ب!ا ه!م کوپ!ل م!ی کنند مثال آین!د و عام!ل ه!ا را قیود جلوگیری از تصادم.

36

Page 37: DMPC Mohammadi

معرفی سیستم و شرایط مسالهبرای هر عامل

37

حالت ها و کنترل

{1,..., }ai N

2( ) ( ( ), ( )) ni i iz t q t q t

( ) niu t

( ) ( ), 1,...,i i aq t u t i N

دینامیک هر یک به صورت زیر است

دینامیک خطی و همسان برای عامل ها

Page 38: DMPC Mohammadi

معرفی سیستم و شرایط مسالههر عامل تحت قیود ورودی و حالت زیر قرار دارد

38

( ) , ( ) , 0i iu t z t t U Z

ای!ن اس!ت ک!ه تمام!ی عام!ل ها هدف کنترل:ی به طور مجانبی و با همکاری یکدیگر به

ک!ه ی!ک نقط!ه تعادل معادل!ه دینامی!ک س!یستم است برسند

1( ,..., ) a

a

Nc c cNz z z Z

Page 39: DMPC Mohammadi

RHCمتمرکز همکاری عامل ها با مینیمم کردن تابع هزینه زیر •

تحقق می یابد

39

0

2 2 2 2

( , )( , ) i j ij di jL z u q q d q q q u

E

, , وزن های ثابت و مثبت 2

dq q هزینهTracking1 2 3( ) / 3c c c

dq q q q

1 2 3( ) / 3q q q q

Page 40: DMPC Mohammadi

RHCمتمرکز

در ای!ن مرحل!ه الزم اس!ت فرضیات!ی در نظ!ر گرفته شوند.

مثال اینکه تما!م حالت ها قابل اندازه گیری هستند.دینا!میک پیشروی برابر در انجام محاس!بات زما!ن

حلقه بسته قابل صرفنظر کردن است.

40

می توان تابع هزینه جمعی را به صورت 2معادل زیر نیز بنویسیم 2( , ) c

QL z u z z u

Page 41: DMPC Mohammadi

centralized open-loop optimalcontrol problem

41

*

( )

2

2

( ( ), ) min ( ( ), ( )) ( ( )),

( ) ( ), ( ) , ( ) , [ , ],( ; ( )) ( ),

( ) , 0

( ) : { : ( ) , 0}

a a

a

t T

ut

N N

c T

P

nN

J z t T L z u d G z t T

subject to

q s u s u s z s s t t Tz t T z t

whereG z z z P P and

z G z

U Z

Page 42: DMPC Mohammadi

RHCمتمرکز مسئله کنترل بهینه مورد نظر را در زمان

42

0t مقدار دهی اولیه می کنیم

دوره زمانی به روز شدن افق غلطکی*

0( ) ( ),centq u t سیستم حلقه بسته

قانون کنترل افق پیش بین متمرکز به صورت زیر است

* *( ) ( ; ( )), [ , ],0cent centu u z t t t T

Page 43: DMPC Mohammadi

RHCتوزیع شده ه!ر دو عامل!ی ک!ه ب!ا ه!م همکاری م!ی کنن!د همسایه

نامیده می شوند.

Gگراف تعامل بین عامل هاست

iبرای هر عامل

43

Page 44: DMPC Mohammadi

Decoupled integrated Cost

44

Page 45: DMPC Mohammadi

RHCتوزیع شده ه!ر عام!ل ب!ا دردس!ت داشت!ن حال!ت کنونی خود و •

همس!ایه های!ش مس!اله کنترل بهین!ه حلقه باز خود را حل می کند.

، کنترل مفروض iقب!ل از ه!ر آپدی!ت، ه!ر عامل •برای ه!ر کدام از همس!ایه های خو!د را دریافت

می کند.

45

Page 46: DMPC Mohammadi

RHC توزیع شده

46

Page 47: DMPC Mohammadi

RHC توزیع شده

47

Page 48: DMPC Mohammadi

Local compatibility constraint

این قید تضمین می کند که هیچ عاملی در مساله •بهینه سازی از آنچه که همسایه هایش از آن انتظار

دارند، خیلی فراتر نمی رود.

• Degree of consistency between what a vehicle plans to do and what neighbors believe that vehicle will plan to do

متناظر با توان دوم پریود آپدیت است.•48

Page 49: DMPC Mohammadi

Controller

49

Page 50: DMPC Mohammadi

پایداریهدف رساندن حالت ها به مبدا •

• Optimal Cost Function as Lyapunov function

• Terminal Constraints Terminal inequality constraint Terminal cost function

50

Page 51: DMPC Mohammadi

Dual-Mode RHC• Robustness to model uncertainty in the

presence of generic state constraints by making the constraints more conservative.

51

Page 52: DMPC Mohammadi

Centralized

52

Page 53: DMPC Mohammadi

Distributed

53

Page 54: DMPC Mohammadi

مقایسه روش هامحاسبات • ب!ه نس!بت شده توزی!ع محاس!بات برتری

موازی:بهینه • مس!اله ح!ل هنگام در شده توزی!ع روش در

سازی هیچ انتقال اطالعاتی بین عامل ها نیاز نیستبهینه • تکرار مس!اله در حی!ن بهین!ه س!ازی موازی در

سازی، مسائل با هم در ارتباطند.هزینه ارتباطی پایینتر•

54

Page 55: DMPC Mohammadi

مراجع1. Distributed Receding Horizon Control of Multi-agent Systems, William B. Dunbar,

California Institute of Technology Pasadena, California, 20042. Receding Horizon Control of Multi-Vehicle Formations: A Distributed Implementation,

William B. Dunbar, Richard M. Murray, Control and Dynamical Systems 107-81, California Institute of Technology, Pasadena, CA 91125, 2004 IEEE CONFERENCE ON DECISION AND CONTROL

3. Distributed Model Predictive Control By Eduardo Camponogara, Dong Jia, Bruce H. Krogh, and Sarosh Talukdar, Department of Electrical and Computer Engineering, Carnegie Mellon University, Pittsburgh, PA 15213, U.S.A, IEEE Control Systems Magazine

با 4. رقابت:ي محيط هاي در تقويت:ي يادگيري از اس:تفاده ب:ا عامل ه:ا آرايش بندي بازي جن::گ، در رس::اله ، دانشكده مهندس::ي برق، دانشگاه ص!!نعتي اميرك!!بيركاربرد

دكت:ر ، دكت:ر احمدافشار،عل:ي اکرم:ي زاده، دکتراي مهندس:ي برق گراي:ش كنترل.1389، محمدباقر منهاج

55

Page 56: DMPC Mohammadi

56

با تشکر از توجه شما

Page 57: DMPC Mohammadi

57