25
םםםםםם םםםםםםםםםם םםםםםםםםExpectimax םם- םםםם םםם( םםםם םםםםם םםםםםםםם236501 ) םםםם םםםםם, םםםםםם םםםם םםםםם םםםם2013-14

משחקים הסתברותיים אלגוריתם Expectimax משחק השש- בש

  • Upload
    zalman

  • View
    190

  • Download
    3

Embed Size (px)

DESCRIPTION

משחקים הסתברותיים אלגוריתם Expectimax משחק השש- בש. מבוא לבינה מלאכותית (236501) מדעי המחשב, טכניון עומר גייגר חורף 2013-14. Lesson Plan. בשיעור זה נדון במשחקים הסתברותיים. לצורך כך... נרענן מושגים בסיסיים בהסתברות בדידה וקומבינטוריקה : - PowerPoint PPT Presentation

Citation preview

Page 1: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

הסתברותיים משחקיםExpectimaxאלגוריתם

- בש השש משחקמלאכותית ) לבינה (236501מבוא

, טכניון המחשב מדעיגייגר עומר

2013-14חורף

Page 2: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Lesson Plan. הסתברותיים במשחקים נדון זה בשיעור

... כך לצורך-: וקומבינטוריקה בדידה בהסתברות בסיסיים מושגים נרענן

•. , , , : גאומטרית בינומית ברנולי יוניפורמית נפוצות התפלגויות•. , תקן, סטיית שונות תוחלת•. \ , \ לסדר חשיבות בלי עם חזרות ללא עם קומבינטורית בחירה

- : הסתברותיים למשחקים בקורס המרכזי האלגוריתם את .Expectimaxנתרגל

-: - בש השש למשחק הרלוונטיות בשאלות נתמקד• , . לקרוא מתבקש במשחק בקיא שלא מי בקצרה המשחק חוקי את נסקור

. הבחינה לקראת ובפרט המשחק של הבנה ולוודא בעיון השקפים את•. למשחק מתאימה בסיסית יוריסטיקה נגדירשחקן • ביצועי של באספקטים .Expectimaxנדון זו יוריסטיקה עם

אלגוריתם - את (.Monte-carloנזכיר ואחרים ) חלקית אינפורמציה עם למשחקים

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

Page 3: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

6 5 4 3 2 1

1

2

3

4

5

6

6 5 4 3 2 1

1

2

3

4

5

6

6 5 4 3 2 1

1

2

3

4

5

6

Probability Q1עם זהות הוגנות קוביות זוג של התוצאות התפלגות ?6מה פאות-

: דאבל לא

דאבל:

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

Page 4: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Probability Q2 " עם " הוגנות קוביות זוג התפלגות לגבי ונשאל ...Kנכליל פאות

: דאבל לא

דאבל:

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

K K-1 ... 3 2 1

1

2

3

...

K-1

K

Page 5: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Combinatorics Q3? - " פאות " עם זהות קוביות זוג לתוצאת יש שונות אפשרויות כמה

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

.1דרך חשבונית: סדרה וסכם שורות ספור.2דרך ואחרים: דאבלים ספור.2בחר: 3דרך סדר חשיבות ובלי חזרות עם מתוך

נקבל .21עבור אפשרויות

K K-1 ... 3 2 1

1

2

3

...

K-1

K

Page 6: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Backgammon

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

בש- שששחקנים • שני משחקמתחלף • תוראפס • סכוםמלאה • אינפורמציהדטרמיניסטי • אי

המשחק חוקי. מראש וידוע קבוע התחילי המצב

. " מהלוח: " השחקן של הכלים כל הוצאת המטרה.' ' ב: לשחקן השעון כיוון נגד או א לשחקן השעון כיוון עם השחקן חיילי הנעת האמצעי

. , חייליו את להוציא מתחיל הוא שלו האחרון לרביע הועברו השחקן חיילי שכל לאחר

Page 7: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

המשחק חוקיעם ) • זהות קוביות זוג מגלגל השחקן תור (.6בכל פאות המוגדר : • בכיוון צעדים מחייליו אחד להזיז בוחר השחקן שונים יצאו אם

.) ההפוך" ) בסדר או צעדים מחייליו אחד כל כ ואח• : " לבצע " בוחר השחקן דאבל יצא .הזזות 4אם לבחירתו חיילים עם צעדיםנקרא ) • זה יריב חיילי משני יותר נמצאים בו מיקום על הזזה לסיים אסור

.)" בית"• ." מוצא " החייל זה במקרה לקיחה נקרא בודד יריב חייל על הזזה סיום

בשקף ) יוסבר הבא בתור השחקן של הראשון לרביע לחזור ונדרש מהלוחהבא(.

•. בתור פעמים מספר חייל אותו להזיז Iניתן

I

Backgammon

Page 8: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

המשחק חוקישהשחקן • לפני השחקן של הראשון לרביע לחזור חייבים שנלקחו חיילים

. נוסף מהלך כל מבצע• " " " צורך ו הקובייה שעל המספר י עפ מתבצעת הראשון לרביע החזרה מיקום

צעד.

I

I

I

6 5 4 3 2 1

6 5 4 3 2 1

Backgammon

Page 9: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

המשחק חוקי•. , לאיבוד הולך הוא בצעד להשתמש אפשרות שאין מקרה בכל•. זאת - לעשות השחקן חייב המהלכים בשני להשתמש וניתן במידהמהלכים • נותרו שלא כיוון השני על ולוותר מהלך לבצע שאסור אומרת זאת

. מכך להימנע ניתן אם חוקיים5 1 1

64

1 5 1

1 5 1

תקוע!6

! לבצע חייב

: נוכחי מצב

Backgammon

4

4 6

Page 10: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

סיום - המשחק חוקי• , את להוציא מתחיל הוא שלו האחרון לרביע חייליו כל את הביא ששחקן לאחר

חייליו.•. ללוח מעבר שנמצאת הבאה לנקודה הזזה כעל הוצאה על לחשוב ניתן•. הבא המיקומים למספור בהתאם הן האפשריות ההוצאות לפיכךערך • עם קובייה באמצעות במיקום חייל להוציא גם ורק ניתן אך זאת אך

- מ גדול במיקום חייל אף שאין .במקרה

IIV

IV

6 5 4 3 2 1

6 5 4 3 2 1

Backgammon

1 11

54 : נוכחי מצב

1 11

1 11

5

45

4 NO!

OK1st 2nd

Page 11: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Backgammon game tree

MIN

MAX

PROB

על ההסתברויות מההקשתות?

מקדם מהוהסיעוף?(PROBבצומת)

: דאבל לאדאבל:

21

Page 12: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Expectimax algorithm

DIFF

(

with RB-Minimax

)

Page 13: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Backgammon Q4- בש השש משחק עבור פשוטה יוריסטיקה הציעו

. מהלוח מסוף השחקנים שני חיילי כלל של המרחק את לבטא נרצה." " יציאה ל עד בלוח נקודה מכל היחידה צעדי את נמספר כך לצורך

חיילי עבור המקביל הסכום את ונחסיר מהיציאה היריב חיילי כל מרחקי את נסכםהסוכן.

זו ליוריסטיקה נקרא

IIV

6 5 4 3 2 16+ : 6 5 4 3 2 1

12+ : 1 2 3 4 5 6 1 2 3 4 5 6 : + 18

III

III

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

חישוב דוגמת25חוץ =

Page 14: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Exam Q5א, 2007-8חורף מועד

, ערכי של משוקלל סכום כלומר הסתברותיים בצמתים תוחלת מחשב האלגוריתםRB-Expectimax. השונות ההסתברויות לפי

שלאחר מבטיח ההבטחה הוא Dמשפט היוריסטי הערך בו למצב נגיע צעדים. המוחזר הערך לפחות

, ביותר הנמוך הערך את ההסתברותיים בצמתים לבחור צריך זאת להבטיח מנת על. , . נוספים מינימום כצמתי ההסתברותיים לצמתים להתייחס כלומר התוחלת במקום

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

Page 15: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

א, 2007-8חורף מועד

) עבור ) הגרוע המקרה את מניח שהוא כיוון פחדני שמרני באופן ישחק זה שחקןתוצאות יניבו גבוהה בהסתברות אשר ממהלכים ימנע וכך ההסתברותיים הגורמים

. ישחק השחקן הנראה ככל סביר והפחות הגרוע מהמקרה החשש בגלל רק טובות. המקורי מהאלגוריתם טובה פחות בצורה

Exam Q5

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

Page 16: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

, - שחקן שיבחר המהלך מה בש בשש הבא הלוח מצב ומה Expectimaxבהינתן רגיל ? באמצעות בחירתך את הצדק הקודמת מהשאלה השמרני השחקן שיבחר המהלך

ה " Expectimaxערכי עומק לפי ל הנ המהלכים שני .MINואז PROBאז, MAX: 3עבור

פשטני ניתוחה לערך נותן אפשרי מהלך .Expectimaxכל ההתקדמות עבור

" " חוזרת לאכילה אפשרות פותח אך האכילה עבור ערך לכך מוסיף רצוי ה המהלך . היא" בחזרה החייל את יוכל היריב הבא שבמהלך ההסתברות הבא בתור היריב י ע

. , מלקחת נמנע הזהיר שהשחקן הסיכון בדיוק זהו אך נמוכה יחסית

Backgammon expansion question

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

1 5 3 1 51 5 3 1 521

2הרצוי המהלך

1

המהלך שייבחר

2

Page 17: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Backgammon expansion question

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

1 6 2 1 51 5 3 6

21השמרני : המהלך לאחר המצב

1 5 3 1 51 5 3 5

הרצוי : המהלך לאחר המצב

1בחוץ:

הנותר לעומק ושל של המינימקס ערכי בין ההפרש את 2נחשב : האכילה בעקבות היוריסטי הרווח

: " הבא בתור היריב י ע חוזרת לאכילה הסיכוי : שכזו חוזרת אכילה בעקבות היוריסטי ההפסד

שלילי הפרש מתקבל ולכן מההסתברות מתעלם השמרני השחקן

הקודם : המצב

Page 18: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Probability Q6התפלגות עם הסכוםמה זהות הוגנות קוביות זוג 6של

פאות?

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

6 5 4 3 2 1

7 6 5 4 3 2 1

8 7 6 5 4 3 2

9 8 7 6 5 4 3

10 9 8 7 6 5 4

11 10 9 8 7 6 5

12 11 10 9 8 7 6

23456789

101112

0% 2% 4% 6% 8% 10% 12% 14% 16% 18%

1/36 2/36

2/361/36

6 /365 /365 /36

Page 19: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Probability Q7" Sennetבמשחק הטלת י ע נקבע לתזוזה הצעדים וספירת 6מספר הוגנים מטבעות

? . " " שכזו הטלות שישיית תוצאת של ההתפלגות מה שהתקבלו פלי ה מספר

: ברנולי התפלגות בודדת הטלה

: בינומית התפלגות הטלות שישיית

( מדעי המחשב- 236501מבוא לבינה מלאכותית )

2013-14טכניון. עומר גייגר חורף

Page 20: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Probability Q8בינומית התפלגות

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

0

1

2

3

4

5

6

0% 5% 10% 15% 20% 25% 30% 35%

1/64

1/646/64

6/6415/64

15/6420/64

Page 21: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Probability Q8? , זו התפלגות של התקן וסטיית השונות התוחלת מה

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

Page 22: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Probability Q8 ... בינומית המפולג שמשתנה ידוע לאימות מקיים ורק

שלנו )( במקרה

: אדיטיבית הינה שתוחלת גם זכרו

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

Page 23: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Probability Q9עם זהות הוגנות קוביות זוג מגלגלים תור בכל מונופול .6במשחק פאות

. ) ( " נוסף " בתור זוכה הוא זה במקרה ורק דאבל מטיל שהשחקן במקרה? שחקן של הרצופים התורות כמות של התוחלת מה

הינה . דאבל לקבל ההסתברות שהרי גאומטרית בהתפלגות מדובר

" הקבוע, י ע חסום לשחקן הרצופים התורות מספר המונופול במשחק .3בפועל

: , הגדרה לפי התוחלת את נחשב קטומה גאומטרית התפלגות נקבל

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

Page 24: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

Monte-Carlo algorithm

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר חורף

•. : לשחקנים חלקית רק ידוע המשחק מצב חלקית אינפורמציה יש בהם למשחקים מתאים•. הידועה האינפורמציה עם קונסיסטנטיים שהינם מלאים מצבים נדגום•. - ממוצע ונחשב האפשריים למהלכים אלו מצבים עבור ביטא אלפא נשערך•. ביותר הטוב ממוצע ערך עם למצב שמוביל המהלך את נבצע

Page 25: משחקים הסתברותיים אלגוריתם  Expectimax משחק השש- בש

: של באדיבותו חומרים על מבוסס התרגול' מרקוביץ' שאול פרופ

( מדעי המחשב- 236501מבוא לבינה מלאכותית )2013-14טכניון. עומר גייגר, חורף

Thank you! questions?