فصل دوم - هوش مصنوعی

Preview:

Citation preview

1

مدر�س:محمد صبری

دانشجوی دکتری مهندسی کامپیوتر گرایش هوش مصنوعی عضو هیات علمی دانشگاه آزاد اسالمی واحد شهر قدس تهران

هوش مصنوعی، رهیافتی نوینفصل دوم: »عامل هوشمند«

2

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

3

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

4

عامل

نما،& چراغ راهرو، ترموستات تواند شامل ربات انسان عامل می•و .. باشد.

بر • متناوب طور به ک&ه اس&ت موجودی عام&ل عام&ل: تعری&ف گیرد، های&ی ک&ه از حس&گرها)س&نسورها( می اس&اس رشت&ه دریاف&ت

ایی از اعمال را در محیط انجام می دهد. دنباله

5

اجزای عامل

هایی از (: وظیفه دریافت مشخصهSensorسنسور )1.(Perceptمحیط)

(Action(: وظیفه انجام اعمال بر روی محیط )Actuatorعملگر )2.پردازش

6

وظیفه عامل

ایی از های ورودی را ب&ه دنبال&ه عام&ل وظیف&ه دارد رشت&ه دریاف&ت•اعمال نگاشت نماید.

توان گفت عامل مانند یک تابع است. بنابراین می•

توان&د اعمال خود در محی&ط را درک کن&د، ام&ا تاثی&ر آنها عام&ل م&ی•بر روی محیط همیشه قابل پیش بینی نیست.

APf *:

رشته دریافت

عمل)ها(

)(PerceptAgentAction

7

مثال: دنیای جارو برقی

عامل: یک جارو برقی هوشمند• Bو A محیط: دو اطاق • دوربین2سنسور: •

[A,Clean]دریافت ها: تمیز یا کثیف بودن اطاق، محل استقرار جاروبرقی •

اعمال: حرکت به چپ، حرکت به راست، مکش و استراحت •

8

مثال: دنیای جاروبرقی

)222(

تمیز یا کثیف

وجود یا عدم وجود جاروبرقی

تعداد اطاق

تعداد حاالت

9

عامل و محیطباشد. ها می بنابراین هر محیط دارای مجموعه ای از حالت•باشد. ها می محیط در هر لحظه در یکی از این حالت•شود. عمل عامل در محیط باعث تغییر حالت محیط می•حالت فعلی: •Suckعمل: •حالت بعدی : •

10

مثال: دنیای جاروبرقی

Percept sequence Action

[A, Clean] Right

[A, Dirty] Suck

[B, Clean] Left

[B, Dirty] Suck

[A, Clean],[A, Clean] Right

[A, Clean],[A, Dirty] Suck

… …

دید بیرونی طراح

11

مثال: دنیای جاروبرقی

function REFLEX-VACUUM-AGENT ([location, status]) return an action

if status == Dirty then return Suck

else if location == A then return Right

else if location == B then return Left

برنامه باید بر روی یک سخت افزار .فیزیکی اجرا شود

12

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

13

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

14

مفهوم عقالنیت

یک عامل عاقل، عاملی است که کار درست را انجام دهد.•یعنی تمام سطرهای جدول به درستی پر شده باشد.•

کار درست چگونه تعیین می شود؟ ابزار اندازه گیری چیست؟•Performance Measureمعیار کارایی

15

مثال: جاروبرقی هوشمند

معیار کارایی برای جاروبرقی چیست؟•میزان آشغ&ال جمع آوری شده در یک بازه زمانی؟قدرت مکش؟ صدای موتور؟زیبایی ظاهری؟ امکانات جانبی؟

بر باید بلک&ه تعیی&ن شود. رفتار عام&ل نحوه اس&اس بر نبای&د کارای&ی معیار اساس آنچه از محیط مورد انتظار است تعیین شود.

ها میزان تمیزی اطاق

16

مفهوم عقالنیت

برای دستیابی به عقالنیت چهار فاکتور زیر باید به درستی تعریف شود:•معیار کارایی1.دانش اولیه محیطی2.اعمال3.ها رشته دریافت4.

ه&ا و دان&ش اولیه عامل&ی است که بر اس&اس رشته دریافتتعری&ف عامل هوشمند: •کن&د، ک&ه بواس&طه اجرای آ&ن عم&ل، معیار کارایی مورد محیط&ی، عمل&ی را انتخاب

انتظار حداکثر گردد.

17

مفهوم عقالنیت

( متفاوت است.omniscienceکل ) عقالنیت با دانای•.دانای کل نتیجه هر عمل خود را از قبل می داند

( متفاوت است.perfectionعقالنیت با کمال گرایی )•.کمال گرا هر عمل را به بهترین شکل ممکن انجام می دهد

18

مفهوم عقالنیت

پیش نیازهای عقالنیت شامل موارد زیر است.•جمع آوری اطالعات/اکتشاف: مثال فرد نابینا 1.یادگیری از تجربه: مثال گریه کردن نوزاد2.داشتن استقالل: مثال ربات فضانورد3.

19

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

20

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

21

انواع محیط

برای طراحی یک عامل هوشمند باید مشخصات دقیق مساله تع&یین شود.••ً شود. بیان می PEAS با مشخصات مساله اصطالحا

– Performance

– Environment

– Actuators

– Sensors

22

PEAS خودرو با راننده اتوماتیک

معیار کارایی: •... سالم رسیدن، مقصد درست، هزینه پایین، رعایت قوانین، راحتی و

محیط&:•... خیابان / آزادراه، ترافیک، عابر پیاده، آب و هوا، وضعیت نوری و

عملگر:•... گاز، ترمز، بوق، بلندگو، صفحه نمایش و

سنسور:•... دوربین، فاصله یاب، سرعت سنج، صفحه کلید، موقعیت یاب و

تمرین:

PEAS

را برای وتبالیست

ربات ف

کنید.تشریح

23

انواع محیط

مشاهده)1. قاب&ل جنب&هFully Observableکامال تمام روی (: بر که محی&ط های انتخاب عمل تاثیرگذار است، توسط سنسورها قابل دریافت باشد.

24

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

کامال قابل مشاهده؟قطعی؟

اپزیودیک؟ایستا؟

گسسته؟تک عامله؟

25

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟قطعی؟

اپزیودیک؟ایستا؟

گسسته؟تک عامله؟

26

انواع محیط

مشاهده)1. قاب&ل جنب&هFully Observableکامال تمام روی (: بر که محی&ط های انتخاب عمل تاثیرگذار است، توسط سنسورها قابل دریافت باشد.

قابل Deterministicقطع&ی)2. فعل&ی وضعی&ت روی از مس&اله بعدی حال&ت :)شناسایی باشد.

27

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟قطعی؟

اپزیودیک؟ایستا؟

گسسته؟تک عامله؟

28

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟اپزیودیک؟

ایستا؟گسسته؟

تک عامله؟

29

انواع محیط

های محی&ط ک&ه بر روی انتخاب عمل (: تمام جنب&هFully Observableکامال قاب&ل مشاهده)1.تاثیرگذار است، توسط سنسورها قابل دریافت باشد.

شناسایی Deterministicقطع&ی)2. قاب&ل فعل&ی وضعی&ت روی از مس&اله بعدی حال&ت :)باشد.

(: مس&اله را بتوان ب&ه بخ&ش های کوچکت&ر اتمی&ک)غی&ر قاب&ل تجزیه( Episodicاپیزودی&ک)3.تقس&یم نمود. س&نسور ه&ر بخ&ش را جداگان&ه دریاف&ت نموده و عم&ل مورد نظر را بر

روی آن انجام دهد. عمل مورد نظر به اعمال قبلی و بعدی ارتباط ندارد.

30

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟اپزیودیک؟

ایستا؟گسسته؟

تک عامله؟

31

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟خیر خیر خیر خیر خیر اپزیودیک؟

ایستا؟گسسته؟

تک عامله؟

32

انواع محیط

گیری عام&ل، امکان تغ&یی&ر نداشته (: محیط&ی ک&ه در حی&ن تص&میمStaticایس&تا )4.باشد.

33

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟خیر خیر خیر خیر خیر اپزیودیک؟

ایستا؟گسسته؟

تک عامله؟

34

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟خیر خیر خیر خیر خیر اپزیودیک؟بلی خیر بلی بلی بلی ایستا؟

گسسته؟تک عامله؟

35

انواع محیط

(: محیط&ی ک&ه در حین تص&میم گیری عام&ل، امکان تغ&یی&ر نداشته Staticایس&تا )4.باشد.

(: محیط&ی ک&ه تعداد اعمال قاب&ل انجام بر روی آن شمارا Discreteگس&سته )5.باشد )غیر بی نهایت(.

36

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟خیر خیر خیر خیر خیر اپزیودیک؟بلی خیر بلی بلی بلی ایستا؟

گسسته؟تک عامله؟

37

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟خیر خیر خیر خیر خیر اپزیودیک؟بلی خیر بلی بلی بلی ایستا؟بلی خیر بلی بلی بلی گسسته؟

تک عامله؟

38

انواع محیط

(: محیط&ی ک&ه در حی&ن تص&میم گیری عام&ل، امکان تغیی&ر نداشته Staticایس&تا )4.باشد.

(: محیط&ی ک&ه تعداد اعمال قاب&ل انجام بر روی آن شمارا Discreteگس&سته )5.باشد) غیر بی نهایت(.

های دیگ&ر باش&د ک&ه درصدد (: محیط&ی ک&ه شام&ل عام&لMulti Agentچن&د عامل&ه)6.حداکثر نمودن معیار کارای&ی خودشان هستند و بر روی کارایی عامل ممکن

است تاثیر گذار باشند.

39

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟خیر خیر خیر خیر خیر اپزیودیک؟بلی خیر بلی بلی بلی ایستا؟بلی خیر بلی بلی بلی گسسته؟

تک عامله؟

40

انواع محیط

پازل راننده اتوماتیک بازی حکم تخته نرد شطرنج

بلی خیر خیر بلی کامال قابل بلیمشاهده؟

بلی خیر خیر خیر خیر قطعی؟خیر خیر خیر خیر خیر اپزیودیک؟بلی خیر بلی بلی بلی ایستا؟بلی خیر بلی بلی بلی گسسته؟بلی خیر خیر خیر خیر تک عامله؟

41

انواع محیط

تری&ن محی&ط، محیط&ی اس&ت ک&ه کامالً قاب&ل مشاهده، قطع&ی، اپیزودیک، س&اده•ایستا، گسسته و تک عامله باشد.

محی&ط• محی&ط اغل&ب واقع&ی مس&ایل غیر های مشاهده، قاب&ل بخش&ی های قطعی، ترتیبی، پویا، پیوسته و چند عامله هستند.

42

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

43

فهرست مطالب

معرفی عامل و محیط•مفهوم عقالنیت•انواع محیط•انواع عامل•

44

انواع عاملکند؟ یک عامل چگونه کار می•عامل = برنامه + سخت افزار•ها همگی دارای یک ساختار مشترک هستند. عامل•

ورودی: دریافت فعلی1.

خروجی: عمل مناسب2.

برنامه: پردازش ورودی برای تع&یین خروجی3. است.پردازشها در نحوه تفاوت عامل•

45

عامل مبتنی بر جدولFunction TABLE-DRIVEN_AGENT(percept) returns an action

static: percepts, a sequence initially emptytable, a table of actions, indexed by percept sequence

append percept to the end of perceptsaction LOOKUP(percepts, table)return action

این رویکرد با شکست مواجه خواهد شد.•

46

انواع عاملچهار نوع عامل عبارتند از:•

(Simple Reflexعامل واکنشی ساده )1.

(Model Based Reflexعامل واکنشی مبتنی بر مدل )2.

(Goal Basedعامل مبتنی بر هدف )3.

(Utility Basedعامل مبتنی بر سودمندی )4.

توانند به قاعده یادگیری مجهز شوند. ها می ی عامل همه•

47

عامل واکنشی سادهدریاف&ت فعل&ی صورت • بر اس&اس انتخاب عم&ل فق&ط

پذیرد. میسازی از طریق مجموعه قوانین پیاده•

شرطی امکان پذیر است. انجام شود«مکش آنگاه است کثیف اطاق اگر»

48

دنیای جاروبرقی

function REFLEX-VACUUM-AGENT ([location, status]) return an actionif status == Dirty then return Suckelse if location == A then return Rightelse if location == B then return Left

49

عامل واکنشی سادهfunction SIMPLE-REFLEX-AGENT(percept) returns an action

static: rules, a set of condition-action rules

state INTERPRET-INPUT(percept)rule RULE-MATCH(state, rule)action RULE-ACTION[rule]return action

50

عامل و محیطباشد. ها می بنابراین هر محیط دارای مجموعه ای از حالت•باشد. ها می محیط در هر لحظه در یکی از این حالت•شود. عمل عامل در محیط باعث تغییر حالت محیط می•

51

عامل واکنشی سادهfunction SIMPLE-REFLEX-AGENT(percept) returns an action

static: rules, a set of condition-action rules

state INTERPRET-INPUT(percept)rule RULE-MATCH(state, rule)action RULE-ACTION[rule]return action

.ساختار ساده و پیچیدگی کمی داردتواند مورد استفاده های کامالً قابل مشاهده می فقط در محیط

قرار گیرد.

52

عامل مبتنی بر مدلمشاهده • قابل بخش&ی های محی&ط در اس&تفاده قابلی&ت دارای

است. و دانشی که از محیط کسبساخت مدلبا •

کند. کند، حالت را بروزرسانی می میمدل دنیاکند؟ دنیا چطور تغییر می1.عمل من چه تاثیری بر روی محیط دارد؟2.

53

عامل مبتنی بر مدلfunction REFLEX-AGENT-WITH-STATE(percept) returns an action

static: rules, a set of condition-action rulesstate, a description of the current world stateaction, the most recent action.

rule RULE-MATCH(state, rule)action RULE-ACTION[rule]return action

54

عامل و محیط 1آخرین حالت:=•Suckآخرین عمل: • 5حالت فعلی:=•

55

عامل مبتنی بر مدلfunction REFLEX-AGENT-WITH-STATE(percept) returns an action

static: rules, a set of condition-action rulesstate, a description of the current world stateaction, the most recent action.

rule RULE-MATCH(state, rule)action RULE-ACTION[rule]return action

56

عامل مبتنی بر هدفکدام حاالت • بداند ت&ا دارد تعیی&ن هدف ب&ه نیاز عام&ل

مطلوب است.تفاوت اصلی با دو عامل قبلی•

این است که آینده نیز در نظر گرفته شده است.

57

عامل مبتنی بر هدفبرنام&ه• و مس&ایل جس&تجو برای کل&ی کاربرد ب&ه طور پر ریزی

است.البته تعیین هدف در صورتیکه •

تعداد طوالنی از اعمال برای رسیدن به هدف نیاز باشد، با مشکل همراه خواهد بود.

58

عامل مبتنی بر سودمندیب&ه جای تعیی&ن هدف)ص&فر ی&ا ی&ک(، میزان خوب&ی یا بدی •

عمل تعیین شود.(:Utility Functionتابع سودمندی)•

دهد. به هر حالت یک عدد نسبت می این عدد متناسب با میزان خوبی یا

شود. بدی حالت تخصیص، داده می

59

عامل مبتنی بر سودمندیمزایا:•

می توان بین اهداف متداخل 1. مصالحه برقرار نمود.

بر اساس میزان مطلوبیت به هر2. هدف وزن تخصیص داده شود.

60

قاعده یادگیریها، عمل مولفه کارایی: بر اساس دریافت•

مناسب را انتخاب می کند.گیری مولفه یادگیرنده: ب&اعث بهبود تصمیم•

گردد. در مولفه کارایی میقاضی: به عملکرد عامل بر اساس ی&ک•

دهد. استاندارد کارایی، فیدبک میهای ناشناخته مشکل گشا: برای حالت•

ی&ا جدید، راه حل ارایه می دهد.

Recommended