Topics in Algorithmic Game Theory נושאים אלגוריתמיים בתורת המשחקים

Preview:

DESCRIPTION

Topics in Algorithmic Game Theory נושאים אלגוריתמיים בתורת המשחקים. תזכורת: משחקי פוטנציאל. “R” ‏. “E” ‏. 0 ‏. 1 ‏. “R” ‏. 4 , 4 ‏. -1 , 5 ‏. 1 ‏. 2 ‏. “E” ‏. 5 , -1 ‏. 0 , 0 ‏. הגדרה : נאמר שמשחק הוא משחק פוטנציאל אם קיימת פונקציה Φ : A 1 x A 2 x A 3 ··· x A n  R - PowerPoint PPT Presentation

Citation preview

Topics in Algorithmic Game Theory

נושאים אלגוריתמיים בתורת המשחקים

תזכורת: משחקי פוטנציאל

“E” 0 , 0

“R” “E”

4 , 4

5- , 1

-1 , 5“R”

2

0

1

1

:הגדרה

שמשחק משחק נאמר קיימת פוטנציאלהוא אםפונקציה

Φ: A1 x A2 x A3 ··· x An R

:כך שלכל מתקיים

Φ(ai, a-i) – Φ(a’i, a-i) = ui(ai, a-i) – ui(a’i, a-i)

cvb

𝑎𝑖 ,𝑎𝑖′

פונקצית פוטנציאל

“E” 0 , 0

“R” “E”

4 , 4

5- , 1

-1 , 5“R”

2

0

1

1

משקל :טענה שיווי יש סופי פוטנציאל למשחקטהור.

לא כל משחק הוא משחק פוטנציאל●למשל, במשחק זוג או פרט אין שיווי משקל נאש ●

באסטרטגיות טהורות, ובפרט זה אינו משחק פוטנציאל

● 10

● 8 K 2+K

● 2-K ? ?

PRICE OFיציבות מחיר הSTABILITY

(POS) PRICE OF אנרכיהמחיר ה

ANARCHY (POA)

מוטיבציה

מחיר היציבות ומחיר האנרכיה הם מדדים של חוסר פסימיתו אופטימיתשימושיים להערכה

יעילות של מערכת במקרה הגרוע )למשל, במקרים של ריבוי שיוויי משקל(

“E” 0 ,0

“R” “E”

4 ,4

5- ,1

-1 ,5“R”

“E” 0 ,0

“R” “E”

4 ,4

5- ,1

-1 ,5“R”

“E” 0 ,0

“R” “E”

90 ,90

99- ,1

-1 ,99“R”

מוטיבציה

הרווחה החברתית נתעניין במחלקות של משחקים בהם המתקבלת היא "סבירה" בהשוואה לזו המתקבלת במצבים

בהם השחקנים אינם פועלים באופן אסטרטגי.

NE

PNE

PNE

NE

מוטיבציה

הרווחה החברתית נתעניין במחלקות של משחקים בהם המתקבלת היא "סבירה" בהשוואה לזו המתקבלת במצבים

בהם השחקנים אינם פועלים באופן אסטרטגי.

עלות החברתית וכנ"ל עבור ה

משחק בניית רשת

G(V, E)נתון גרף מכוון ●

c(e)עולה G בגרף eבניית קשת ●

שחקניםk > 2יש ●

ti וקודקוד מטרה si יש קודקוד התחלה iלכל שחקן ●

Gבגרף ti אל siמקודקוד piכל שחקן צריך לבחור מסלול ●

כל שחקן ישלם עבור המסלול שהוא בחר באופן הבא: ●

ci (pi, p-i) = ∑ c(e)/ l(e, p)

l(e, p) הוא מספר השחקנים שהקשתe שייכת למסלול שלהם באוסףp( = pi, p-iהמסלולים )

epi

עלות חברתית

היא העלות p1, p2, …, pk של אוסף מסלולים החברתיתהעלות ●הכוללת של כל השחקנים:

∑i ci (pi, p-i) = p1, p2, …, pk) cost(

דוגמא k, 1+ε, 0עלויות הקשתות הן ●

שחקניםk > 2יש ●

יש iלכל שחקן ●

ti וקודקוד מטרה siקודקוד התחלה

k, 1+ε, 0עלויות הקשתות הן ●

שחקניםk > 2יש ●

יש iלכל שחקן ●

ti וקודקוד מטרה siקודקוד התחלה

אם כל השחקנים ישתמשו בקשת השמאלית לבניית המסלול, ●

ci = = 1 ישלם iאז כל שחקן

kהעלות החברתית היא

דוגמא

k, 1+ε, 0עלויות הקשתות הן ●

שחקניםk > 2יש ●

יש iלכל שחקן ●

ti וקודקוד מטרה siקודקוד התחלה

ישתמש בקשת הימנית לבניית המסלול שלו, אז הוא 1אם שחקן ● וכל השאר ישלמו כל אחדישלם

העלות החברתית הכוללת היא

דוגמא

עם שיווידוגמא משקל יחיד

t אל siמעוניין במסלול מ-i שחקן ●

ε+1היא עלות חברתית אופטימלית●

כדאי לסטותkכי לשחקן לא שיווי משקל אבל, זהו ●

כדאי לסטות וכו' k-1ובאופן אינדוקטיבי: גם לשחקן ●

היא:עלות חברתית של שיווי המשקל●

Θ(log k) = =

: משחק בניית רשת הוא משחק פוטנציאל )ולכן תמיד קיים שיווי משפטמשקל טהור(.

:הוכחה

בהמשך

PRICE OF אנרכיהמחיר הANARCHY

(POA)

הגדרה

יוגדר להיות היחס Price of Anarchy (PoA)מחיר האנרכיה : הגדרההבא:

המכסימליתהעלות של שיווי משקל טהור עם העלות החברתית

העלות החברתית המינימלית

הערות:

ככל שהיחס קטן יותר כך מחיר האנרכיה נמוך יותר. ●

עבור רווחה חברתית נתעניין ברווחה האופטימלית חלקי הרווחה של ●שיווי המשקל עם העלות המינימלית.

הוא k, כאשר k >: מחיר האנרכיה של משחק בניית רשת משפט.PoA k= מספר השחקנים, וקיים משחק בניית רשת שעבורו

חסם הדוק(k)כלומר הוא

: הוכחה

( )Q1, Q2, …, Qk( ) שיווי משקל נאש טהור, ויהי P*1, P*2, …, P*kיהי

הפתרון שעלותו החברתית מינימלית. נסמן

OPT= Q1, Q2, …, Qk) cost(

.Pi לכל > cost (Pi) costi (P*i, P*-i)בשיווי משקל מתקיים:

ולכן: , Pi היה בונה לבד את המסלול iאחרת, שחקן

OPT < min cost (Pi) costi (P*i, P*-i) <

tiל- si מכסה עלות של מסלול כלשהו מ-OPTכי

הוא מספר k, כאשר k >: מחיר האנרכיה של משחק בניית רשת משפט.PoA k= השחקנים, וקיים משחק בניית רשת שעבורו

: הוכחה

( ) שיווי משקל נאש טהור.q1, q2, …, qkיהי

( )הפתרון שעלותו החברתית מינימלית. p*1, p*2, …, p*kיהי

).OPT= p*1, p*2, …, p*k) cost נסמן:

.pi לכל > cost (pi) costi (qi, q-i) < costi (pi, q-i)בשיווי משקל מתקיים:

. pi היה בונה לבד את המסלול iאחרת, שחקן

> cost (pi) min costi (qi, q-i)בפרט:

OPT < min cost (pi)בנוסף:

. tiל- si מכסה עלות של מסלול כלשהו מ-OPTכי

∑. k · OPT < costi (qi, q-i) נקבל:

k= האנרכיה מחיר

נסתכל על המשחק שבדוגמא

: kשיווי משקל עם עלות חברתית ●

כל השחקנים בונים את הקשת השמאלית

פתרון עם עלות מינימלית: ●

כל השחקנים בונים את הקשת הימניתהערה: זהו גם שיווי משקל●

PoA = = kכאשר אפסילון שואף לאפס: ● ע"פ מה שהוכח קודם kהערה: לא ייתכן שיווי משקל עם עלות חברתית < ●

PRICE OFיציבות מחיר הSTABILITY

(POS)

הגדרות

יוגדר להיות היחס Price of Anarchy (PoA)מחיר האנרכיה : הגדרההבא:

מכסימליתהעלות של שיווי משקל טהור עם העלות החברתית ה

העלות המינימלית

יוגדר להיות היחס Price of Stability (PoS)מחיר היציבות : הגדרההבא:

המינימליתהעלות של שיווי משקל טהור עם העלות החברתית

העלות המינימלית

היציבות דוגמא, מחיר

נסתכל על המשחק שבדוגמא.

שיווי משקל:●

כל השחקנים בונים את הקשת השמאלית

פתרון עם עלות מינימלית: ●

כל השחקנים בונים את הקשת הימניתהערה: זהו גם שיווי משקל●

PoS = = 1כאשר אפסילון שואף לאפס: ●

: משחק בניית רשת הוא משחק פוטנציאל )ולכן תמיד קיים שיווי משפטמשקל טהור(.

:הוכחה

נגדיר תחילה את פונקצית הפוטנציאל המתאימה למשחק.●

הוא מספר k , כאשר >: מחיר היציבות של משחק בניית רשת משפט .PoS= השחקנים, וקיים משחק בניית רשת שעבורו

: הוכחה

הוא מספר k , כאשר >: מחיר היציבות של משחק בניית רשת משפט .PoS= השחקנים, וקיים משחק בניית רשת שעבורו

: הוכחה

הוא מספר k , כאשר >: מחיר היציבות של משחק בניית רשת משפט .PoS= השחקנים, וקיים משחק בניית רשת שעבורו

: הוכחה

הוא מספר k , כאשר >: מחיר היציבות של משחק בניית רשת משפט .PoS= השחקנים, וקיים משחק בניית רשת שעבורו

: הוכחה

הוא מספר k , כאשר >: מחיר היציבות של משחק בניית רשת משפט .PoS= השחקנים, וקיים משחק בניית רשת שעבורו

: הוכחה

דוגמא שעבורה: PoS

t אל siמעוניין במסלול מ-i שחקן ●

ε+1היא עלות חברתית אופטימלית●

כדאי לסטותkכי לשחקן לא שיווי משקל אבל, זהו ●

כדאי לסטות וכו' k-1ובאופן אינדוקטיבי: גם לשחקן ●

היא:עלות חברתית של שיווי המשקל●

Θ(log k) = =

לסיכום, עבור משחק בניית רשת:

k = אנרכיהמחיר ה

יציבות = מחיר ה

כמה הערות נוספות אנרכיהעל מחיר ה

מחיר היציבות ומחיר האנרכיה הם מדדים של פסימית ואופטימית שימושיים להערכה

ביצועי מערכת במקרה הגרוע )למשל, במקרים של ריבוי שיוויי משקל(

: המצב הרצוי ביותר הוא כשמחיר הערה "להתערב, אז אין צורך "1האנרכיה קרוב ל-

במערכת

ניתן להגדיר את מחיר האנרכיה גם עבור שיווי משקל כללי )לא ● בהכרח טהור(

ניתן באופן דומה להגדיר מחיר אנרכיה לרווחה חברתית●)רווחה חברתית מכסימלית חלקי הרווחה החברתית של שיווי המשקל עם הרווחה ●

המינימלית(.

Knapsack Problemבעית התרמיל –

אלגוריתמים לבעית התרמיל

לא ידוע אלגוריתם יעיל לפתרון בעית התרמיל.בעיה:●

-קירוב בזמן פולינומי לבעיה.2בשבוע שעבר ראינו ●

O(nC)היום נראה אלגוריתם בסיבוכיות ●

)"פסאודו-פולינומי"(

אלגוריתמים תכנון דינמי

// A[i, k] will be the maximum value that can be attained with total size less than or equal to k using items 1, 2, …, i

For c = 0, 1, 2, …, C

do A[0, c] := 0

For i = 1, 2, …, n

For k = 0, 1, …, C

if k > si

A[i, k] := max(A[i-1, k], A[i-1, k- si] + vi)

else A[i, k] := A[i-1, k]

אלגוריתמים תכנון דינמי

A[i, k] will be the maximum value that can be attained with total size less than or equal to k using items 1, 2, …, i

For k = 0, 1, 2, …, C

do A[0, k] := 0

For i = 1, 2, …, n

For k = 0, 1, …, C

if k > si

A[i, k] := max (A[i-1, k], A[i-1, k- si] + vi)

else A[i, k] := A[i-1, k]

אלגוריתמים תכנון דינמי

A[i, k] will be the maximum value that can be attained with total size less than or equal to k using items 1, 2, …, i

For k = 0, 1, 2, …, C

do A[0, k] := 0

For i = 1, 2, …, n

For k = 0, 1, …, C

if k > si

A[i, k] := max (A[i-1, k], A[i-1, k- si] + vi)

else A[i, k] := A[i-1, k]

O(nC)סיבוכיות אלגוריתם תכנון דינמי ●

נכונות?●

Bibliography

Chandra Chekuri, CS 573: Algorithmic Game Theory, 2008Lecture Notes ,

Noam Nisan, Tim Roughgarden, Eva Tardos, and Vijay Vazirani, Algorithmic Game Theory, Cambridge University Press, 2007.

David Easley and Jon Kleinberg, Networks, Crowds, and Markets, Cambridge University Press, 2010

Wikipedia