Transcript
Page 1: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑΤΙΤΛΟΣ:

<< ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ>>

ΣΠΟΥΔΑΣΤΡΙΑ: ΧΡΙΣΤΟΦΟΡΑΤΟΥ ΣΟΦΙΑΑ.Μ: 4759

ΕΠΟΠΤΕΥΩΝ ΚΑΘΗΓΗΤΗΣ:ΣΑΡΙΑΝΝΙΔΗΣΝΙΚΟΛΑΟΣ

ΚΟΖΑΝΗ 2009

Page 2: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

2

ΚΟΖΑΝΗ 2009

ΕΥΧΑΡΙΣΤΙΕΣ

Θα ήθελα να ευχαριστήσω πολύ τον καθηγητή μου , για την προσοχή που έδειξε στη

εργασία της πτυχιακής. Χάρη στην πολύτιμη βοήθεια του , μέσα από συνεχόμενες

μελέτες έγινε η διάρθρωση αυτής της πτυχιακής , που αφορά τα παίγνια.

Page 3: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

3

ΠΕΡΙΕΧΟΜΕΝΑ

ΕΥΧΑΡΙΣΤΙΕΣ……………………………...………………………………....2

ΠΕΡΙΕΧΟΜΕΝΑ…………………………………………..………………….3

ΠΡΟΛΟΓΟΣ……………………………………………………..……….…...6

ΕΙΣΑΓΩΓΗ ΙΣΤΟΡΙΚΗ ΑΝΑΔΡΟΜΗ

ΚΕΦΑΛΑΙΟ 1Ο……………………………………………………………………………………….………10

ΤΙ ΕΙΝΑΙ ΤΑ ΠΑΙΓΝΙΑ

Παραδείγματα

ΚΕΦΑΛΑΙΟ 2Ο΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄΄.΄΄΄΄΄΄΄΄13

ΠΟΥ ΕΜΦΑΝΙΖΟΝΤΑΙ

Πώς το level-k-model επεκτείνει τη Θεωρία Παιγνίων

ΚΕΦΑΛΑΙΟ 3Ο…………..…………………………………………………………………………\……….16

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ

Θεωρία παιγνίων Κοινωνίες και συνεργασία

Σημείο ισορροπίας (σημείο Nash)

Page 4: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

4

Το μοίρασμα της πίτσας

Σημείο ισορροπίας στο μοίρασμα της πίτσας

Το δίλημμα του φυλακισμένου

ΚΕΦΑΛΑΙΟ 4Ο…………………………………………………………………………………………..…..24

«Ανθρώπινες» εξισώσεις

Συνεργασία αντί ανταγωνισμού

Ο δείκτης του Σάπλεϊ

Το δίλημμα του καφέ

Τριψήφιο κόλπο

Ασφαλιστικές δικλείδες

Υπολογισμός της «ωφέλειας»

ΚΕΦΑΛΑΙΟ 5Ο……………………………………………………………………………………………….33

Το θεώρημα minimax και η θεωρία των παιγνίων

ΚΕΦΑΛΑΙΟ 6Ο……………………………………………………………………………………………….39

Υπολογιστές

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΚΑΙ ΔΙΔΑΚΤΙΚΗ

Αλγοριθμική και Εξελικτική Θεωρία Παιγνίων

Η Φιλοδοξία της Θεωρίας Παιγνίων

ΘΕΩΡΙΑ ΣΤΑΤΙΚΩΝ ΠΑΙΓΝΙΩΝ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ

ΘΕΩΡΙΑ ΔΥΝΑΜΙΚΩΝ ΠΑΙΓΝΙΩΝ ΑΚΟΛΟΥΘΟΥΝ ΠΑΡΑΔΕΙΓΜΑΤΑ

ΕΠΙΛΟΓΟΣ…………………………………………………..………………68

Page 5: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

5

ΣΥΜΠΕΡΑΣΜΑΤΑ

ΠΕΡΙΛΗΨΗ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ………………………………………………....……..69

ΠΕΡΙΛΗΨΗ ΣΤΑ ΑΓΓΛΙΚΑ……………………………………….... …….70

Βιβλιογραφία…………………………………………………….…………71

Ειδικότερη Βιβλιογραφία

Ιστογραφία…………………………………………………………….……73

Page 6: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

6

ΠΡΟΛΟΓΟΣ

Η μελέτη αυτή αφορά τη θεωρία των παιγνίων. Μια θεωρία όπου

βρίσκει εφαρμογή σε πολλούς τομείς στη ζωή μας. Τα παίγνια αφορούν

των τρόπο που παίρνονται στρατηγικές αποφάσεις.

Τα παίγνια είναι μια μέθοδος ανάλυσης προβλημάτων που έχουν σχέση

με τον τρόπο λήψης αποφάσεων σε καταστάσεις σύγκρουσης και

συνεργασίας.

Παίκτης μπορεί να είναι ένα προσωπάκια οργάνωση , ένα κράτος

ή ένας συνασπισμός.

Ως αντικείμενο έρευνας μπορούν να θεωρηθούν διάφορα

προβλήματα πολίτικης , ψυχολογικής , κοινωνικής , οικονομικής

μορφής.

Για τη λύση των προβλημάτων αυτών θεωρείται προηγουμένως

απαραίτητη η ανάλυση καταστάσεων , οπού δυο ή περισσότεροι

δρώντες (παίκτες) βρίσκονται αντιμέτωποι και ακολούθου συνεργατικές

ή μη συνεργατικές στρατηγικές. Κάθε παίκτης προσπαθεί να

χρησιμοποιήσει όλα τα μέσα που διαθέτει, για να εμποδίσει τον

αντίπαλο του να αποκτήσει πλεονεκτήματα που θα περιορίσουν τα

κέρδη του. Επομένως οι ενέργειες του εξαρτώνται άμεσα από τη θέση

(στρατηγική) που θα επιλέξει ο αντίπαλος.

Είναι δεδομένο ότι κάθε κατάσταση αντιπαλότητας είναι αρκετά

περιπλοκή. Η ανάλυση της είναι δύσκολη και πολλές φορές αδύνατη ,

γιατί ο ερευνητής δε διαθέτει όλες τις απαραίτητες πληροφορίες για να

διελευκάνθη το πρόβλημα. Ένας επιστημονικός τρόπος σκέψης , μια

μεθοδική δηλαδή και συστηματική εργασία, είναι στις περιπτώσεις αυτές

απαραίτητη. Η στρατηγική των παιγνίων με τον τρόπο έρευνας της

προσπαθεί να δώσει απάντηση ακόμη και στα προβλήματα, οπού οι

εμπειρικές πληροφορίες είναι περιορισμένες.

Ο Όρος στρατηγική των παιγνίων ή θεωρία των παιγνίων (game

theory) μπορεί να θεωρηθεί συνώνυμος με τον όρο θεωρία των

Page 7: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

7

αποφάσεων. Η διάφορα μεταξύ τους έγκειται στο ότι στη θεωρία των

αποφάσεων λαμβάνονται υπόψη , καταστάσεις , στις όποιες ένας

φορέας συμφερόντων παίζει αποφασιστικό ρολό , ενώ στη θεωρία των

παιγνίων ερμηνεύονται και καταστάσεις , στις όποιες δυο ή και

περισσότεροι δρώντες συμμετέχουν από κοινού στο σύστημα

αλληλενεργειών και αλληλεπιδράσεων που οι ίδιοι δημιουργούν.

Οι επιστήμονες von Neumann kais Morgenstern προσπάθησαν

πρώτοι να εφαρμόσουν τη μέθοδο της θεωρίας των παιγνίων στην

οικονομία, ξεφεύγοντας έτσι από την απλή εφαρμογή της στα ανωτέρα

μαθηματικά . Αργότερα η εφαρμογή της θεωρίας αυτής επεκτάθηκε στις

κοινωνικές και πολιτικές επιστήμες και θεωρείται σήμερα σαν μια βασική

μέθοδος ανάλυσης προβλημάτων σύγκρουσης και συνεργασίας μεταξύ

δυο ή περισσότερων δρώντων.

Page 8: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

8

ΕΙΣΑΓΩΓΗ ΙΣΤΟΡΙΚΗ ΑΝΑΔΡΟΜΗ

Η θεωρία παιγνίων (game theory) ξεκίνησε σαν κλάδος των

οικονομικών με το σπουδαίο βιβλίο των John von Neumann και Oskar

Morgenstern Theory of games and economic behaviour Θεωρία

Παιγνίων και Οικονομική Συμπεριφορά πάνω σε παιχνίδια μηδενικού

αθροίσματος (zero-sum games). Το κύριο αντικείμενό της είναι η

ανάλυση των αποφάσεων σε καταστάσεις (παιχνίδια) στρατηγικής

αλληλεπίδρασης (strategic interdependence).

Στους περαιτέρω θεμελιωτές ανήκουν

ο John Forbes Nash (η ζωή του έγινε θέμα της ταινίας "ένας

υπέροχος άνθρωπος"), ο οποίος γενίκευσε το πρόβλημα σε

παιχνίδια μη μηδενικού αθροίσματος και πρόσφερε σαν λύση την

ισορροπία Νας (Nash Equilibrium)

ο Reinhard Selten άνοιξε το δρόμο για ικανοποιητική λύση του

προβλήματος σε δυναμικά παιχνίδια με την έννοια της

ισορροπίας στα υποπαιχνίδια (Subgame Perfect Nash

Equilibrium) και της ισορροπίας τρεμάμενου χεριού (trembling

hand perfect equilibrium)

ο John Harsanyi ασχολήθηκε με παιχνίδια υπό μερική

πληροφόρηση (Incomplete Information).

Για τις εργασίες τους τιμήθηκαν οι τρεις τελευταίοι το 1994 με το

βραβείο της Σουηδικής Ακαδημίας Επιστημών στην μνήμη του Alfred

Bernhard Nobel. Είναι σίγουρο βέβαια ότι αν ο Τζον φον Νόιμαν ζούσε

θα μοιραζόταν και αυτός το βραβείο.

Τα τελευταία 30 χρόνια, η θεωρία παιγνίων έχει βρει ευρύτατη

εφαρμογή στα οικονομικά, όπου ολόκληροι κλάδοι στηρίζονται στις

Page 9: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

9

μεθόδους της, όπως π.χ. η βιομηχανική οργάνωση (industrial

organisation), ο σχεδιασμός μηχανισμών (mechanism design) με

σπουδαιότερο υποκλάδο τον σχεδιασμό δημοπρασιών (auctions)

κ.α.

Επίσης, η θεωρία παιγνίων χρησιμοποιείται και στην Πολιτική

Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης (Collective

action), όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών. Στη

συγκεκριμένη εκδοχή, μιλάμε για παίγνια συνεργασίας (Cooperative

Game Theory). Αυτό βρίσκεται σε άμεση συσχέτιση με τον ρόλο του

κράτους και των θεσμών σε θέματα συνεργασίας. Χαρακτηριστικό

παράδειγμα είναι η παροχή δημόσιων αγαθών και η φορολογία.

Επιπρόσθετα χρησιμοποιείται όμως ευρέως και σε άλλες επιστήμες,

όπως εξελικτική βιολογία, ψυχολογία, κοινωνιολογία κλπ.

Το 2005 οι θεωρητικοί παιγνίων Thomas Schelling και Robert Aumann

κέρδισαν το βραβείο νόμπελ για τις οικονομικές επιστήμες.

Page 10: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

10

ΚΕΦΑΛΑΙΟ 1Ο

ΤΙ ΕΙΝΑΙ ΤΑ ΠΑΙΓΝΙΑ

Παίγνιο: Συμμετέχουν τουλάχιστον δύο παίκτες με τουλάχιστον

δύο

στρατηγικές ο καθένας και αντίθετα συμφέροντα. Το αποτέλεσμα για

κάθε

παίκτη καθορίζεται από τις συνδυασμένες επιλογές όλων των παικτών

και

δίνεται από τον πίνακα αποτελεσμάτων του παιγνίου (reward ή pay−off

matrix).

Στα παίγνια μηδενικού αθροίσματος, αυτό που κερδίζει ο ένας

παίκτης είναι ακριβώς αυτό που χάνει ο αντίπαλός του (win/lose

games).

Παραδείγματα:

MONOPOLY (το παιχνίδι)

poker

bridge

Πόλεμος

Ποδοσφαιρικό ματς

Ληστεία (εννοείται η επιτυχημένη!)

Γίνεται πλέον ευρύτερα αποδεκτό ότι τέτοιου είδους παίγνια μιμούνται

τη ζωή. Η επιτυχία του ενός σημαίνει την αποτυχία του άλλου—για να

απολαύσεις εσύ το δικό σου φαγοπότι κάποιος άλλος πεινάει και

λιμοκτονεί. Αυτό άραγε δεν σημαίνει η επιβίωση του ικανότερου; Αν το

Page 11: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

11

παιχνίδι είναι η επιβίωση και οι διαθέσιμοι πόροι είναι περιορισμένοι,

τότε μόνο εις βάρος του άλλου μπορεί κανείς να ωφεληθεί. Σε συνθήκες

ανταγωνισμού, προκειμένου να μείνεις μέσα στο παιχνίδι, πρέπει να

στερήσεις από τους άλλους αυτό που όλοι διεκδικείτε.

Πολλές διαπραγματεύσεις αφορούν αποκλειστικά και μόνο στη

διανομή (ενός αντικειμένου, ενός χρηματικού ποσού, ενός οικονομικού

αγαθού, υλικού ή άυλου). Οι δύο πλευρές πρέπει να αποφασίσουν

καταρχήν εάν θα μοιράσουν το αγαθό αυτό και κατά δεύτερον πώς θα

το μοιράσουν (θα πάρουν όλοι το ίδιο ποσοστό? Με ποια κριτήρια θα

γίνει η μοιρασιά?)

Όλα αυτά τα ζητήματα είναι κρίσιμα για την έκβαση της

συγκεκριμένης διαπραγμάτευσης. Εάν οι διαπραγματευτές

επικεντρωθούν μόνο στα ζητήματα αυτά, είναι πολύ πιθανόν η

διαπραγμάτευση να καταλήξει σε αδιέξοδο και τα δύο μέρη να μην

μπορέσουν να ανακαλύψουν εναλλακτικές λύσεις που να είναι αμοιβαία

επωφελείς.

Ένας βασικός λόγος είναι

Ένα απλό παράδειγμα:

Ο Γιάννης έχει 10 μήλα και 0 πορτοκάλια. Ο Γιώργος έχει 10

πορτοκάλια και 0 μήλα. Οι δύο φίλοι έχουν διαφορετικές προτιμήσεις.

Πιο συγκεκριμένα, ο Γιάννης σιχαίνεται τα μήλα και λατρεύει τα

πορτοκάλια. Αντίθετα ο Γιώργος τρώει ευχάριστα και μήλα και

πορτοκάλια. Στη διάρκεια των διαπραγματεύσεων, ο Γιώργος μπορεί να

Ασύμμετρη πληροφόρηση

Page 12: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

12

παραπλανήσει τον Γιάννη σχετικά με τις προτιμήσεις του και να πει ότι

λατρεύει τα μήλα. Εάν ο Γιάννης αποκαλύψει τις προτιμήσεις του και ο

Γιώργος πει ψέματα για τις δικές του προτιμήσεις, τότε ο Γιώργος θα

αποκτήσει το «μεγαλύτερο κομμάτι της πίτας» (περισσότερα μήλα).

Στα παίγνια θετικού αθροίσματος (positive sum games) η κάθε

πλευρά έχει όφελος από τη σχέση της με την άλλη -- και οι δύο

πλευρές κερδίζουν (win/win games).

Παραδείγματα:

μια ανταλλαγή πληροφοριών

μια ερωτική σχέση

μια εμπορική ανταλλαγή με όρους αμοιβαιότητας

Όπως θα δούμε και παρακάτω, με την εφαρμογή του μοντέλου

του “διλήμματος του φυλακισμένου” σε πειράματα που πραγματοποίησε

ο Ρώσος ψυχολόγος Anatol Rapoport, όταν οι άνθρωποι ως φορείς

δράσης έχουν δύο επιλογές (συνεργασίας ή σύγκρουσης) οδηγούνται

μακροπρόθεσμα σε συνεργατικές στρατηγικές (με χαρακτηριστικό

παράδειγμα την στρατηγική “tit for tat”), που αποδεικνύονται πιο

συμφέρουσες από τις συγκρουσιακές ή καθαρά ανταγωνιστικές

στρατηγικές. Έτσι, μακροπρόθεσμα υιοθετούν ένα συνεργασιακό ήθος.

Page 13: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

13

ΚΕΦΑΛΑΙΟ 2Ο

ΠΟΥ ΕΜΦΑΝΙΖΟΝΤΑΙ

Πού συναντάμε τη Θεωρία Παιγνίων στην καθημερινή μας ζωή; Τι

νομίζετε ότι έλειπε από τον χαρακτηρισμό της στρατηγικής

συμπεριφοράς, όπως ορίστηκε αρχικά;

H Θεωρία Παιγνίων εξετάζει τον τρόπο με τον οποίον οι

άνθρωποι παίρνουν αλληλοεξαρτώμενες αποφάσεις, οι συνέπειες των

οποίων εξαρτώνται από τις αποφάσεις που παίρνουν οι άλλοι.

Επομένως, οι καλές αποφάσεις βασίζονται, συχνά, στις προβλέψεις για

τις αποφάσεις των άλλων και πρέπει να λαμβάνουν υπόψη ότι και οι

άλλοι μπορεί να σκέπτονται με τον ίδιον τρόπο.

Εφαρμογές συναντάμε σχεδόν παντού στη καθημερινή μας ζωή:

από την απόφαση για το πώς να αποφύγεις ένα ταξί την ώρα που

διασχίζεις τον δρόμο, μέχρι τις πολύ σημαντικές αποφάσεις διοίκησης

επιχειρήσεων και κυβερνήσεων. Για παράδειγμα, όταν η Microsoft ήλθε

αντιμέτωπη με τον ανταγωνισμό τής Netscape, πριν από μερικά χρόνια,

προσπάθησε να «προλάβει» την είσοδό της αντιγράφοντας τα

χαρακτηριστικά πλοήγησης της Netscape με το δικό της πρόγραμμα

πλοήγησης στο Διαδίκτυο. Επειδή και οι δύο διαδικασίες εξελίσσονταν

ταυτόχρονα, οι προγραμματιστές και των δύο εταιρειών έπρεπε να

κάνουν... υποθέσεις, με βάση τις γνώσεις τους για τα χαρακτηριστικά

που θα είχε το άλλο πρόγραμμα. Ο τρόπος με τον οποίον αποφάσισαν

τι έπρεπε να κάνουν, απαιτεί παιγνιοθεωρητική ανάλυση.

H παραδοσιακή Θεωρία Παιγνίων χρησιμοποιεί την έννοια της

ισορροπίας (Nash) - παίρνοντας το όνομά της από τον John Nash, ο

Page 14: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

14

οποίος κέρδισε το βραβείο Νόμπελ στα Οικονομικά το 1994 και

αναγορεύθηκε σε επίτιμο διδάκτορα του Πανεπιστημίου Αθηνών το

2000 - κατά την οποίαν κάθε άνθρωπος παίρνει την απόφαση που είναι

η καλύτερη γι' αυτόν, δεδομένων των επιδιώξεών του και των

αποφάσεων των άλλων. Εμμέσως, η «ισορροπία» υποθέτει ότι κάθε

άνθρωπος διαθέτει ένα τέλειο υπόδειγμα πρόβλεψης της συμπεριφοράς

τού άλλου, οι προβλέψεις του οποίου - στατιστικά τουλάχιστον - είναι

σωστές, όπως στην έννοια της «ισορροπίας» των ορθολογικών

προσδοκιών στη Μακρο-οικονομική. H ισορροπία είναι ένα δυνατό και

χρήσιμο... εργαλείο, στις περιπτώσεις που οι άνθρωποι έχουν

προηγούμενη εμπειρία από ανάλογα παίγνια.

Πώς το level-k-model επεκτείνει τη Θεωρία Παιγνίων

Στην πρόσφατη διάλεξή του στο Τμήμα Οικονομικών Επιστημών

του Πανεπιστημίου Πελοποννήσου, ο καθηγητής Crawford μίλησε

για το level-k-model.

Το level-k-model γενικεύει την έννοια της «ισορροπίας», ώστε να

μπορεί να περιγράφει καλύτερα τις αρχικές αντιδράσεις των ανθρώπων

σε μια ευρύτερη γκάμα καταστάσεων. Το χρησιμοποιούμε, τόσο για να

αναλύσουμε τα δεδομένα από τα πειράματά μας όσο και για τα

«αινίγματα» των οικονομικών και κοινωνικών επιστημών, τα οποία δεν

επιδέχονται ανάλυση με βάση την ισορροπία.

Σημειώστε την παραπομπή που αφορά στον δηλητηριασμό του

Ουκρανού υποψηφίου για την προεδρία (και προέδρου σήμερα) Viktor

Yushchenko: «Κάθε κυβέρνηση που θέλει να σκοτώσει έναν αντίπαλο...

δεν θα το έκανε σε μια συνάντηση με κυβερνητικούς αξιωματούχους».

Page 15: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

15

Το επιχείρημα αυτό αποτυπώνει την κοινή στρατηγική διαίσθηση,

που είναι συνεπής με την «ισορροπία»: αν οι αστυνομικοί επιθεωρητές

σκέφτονταν με αυτόν τον τρόπο, η συνάντηση με τους κυβερνητικούς

αξιωματούχους θα ήταν ακριβώς η κατάλληλη στιγμή για την κυβέρνηση

να προσπαθήσει να σκοτώσει τον αντίπαλο. H ανάλυσή μας δείχνει

πως το level-k-model εξηγεί ότι τόσο το σκεπτικό της στρατηγικής του

χωρίου όσο και ο κατάλληλος τρόπος δηλητηριασμού του Yushchenko -

ή, ακόμα πιο σημαντικό, ο τρόπος σύλληψης των υπευθύνων -

καθορίζεται από αντιλήψεις περί στρατηγικής συμπεριφοράς, όπως

εκφράζονται στην παραπομπή.

Άλλο παράδειγμα είναι η ανάλυση για την απόφαση των

Συμμάχων του B' Παγκοσμίου Πολέμου να εισβάλουν στην Ευρώπη την

D-Day, από τη Νορμανδία ή το Καλαί, και τις συνακόλουθες

προσπάθειές τους να ξεγελάσουν τους Γερμανούς για τον τόπο της

εισβολής, στην εργασία μου στο American Economic Review (2003).

Page 16: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

16

ΚΕΦΑΛΑΙΟ 3Ο

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ

Η Θεωρία Παιγνίων, αφού καταξιώθηκε ως η σύγχρονη θεμελίωση της

οικονομικής, φιλοδοξεί πλέον να ενοποιήσει όλες τις κοινωνικές

επιστήμες. Από τα μικρά προβλήματα της κοινωνίας (π.χ. το σχεδιασμό

δημοπρασιών) μέχρι τα μεγάλα φιλοσοφικά μας αινίγματα (π.χ. περί

Ηθικής και του ρόλου του Κράτους), η Θεωρία Παιγνίων έχει άποψη.

Εντάσσει τον εαυτό της στα φαινόμενα που καλείται η ίδια να εξηγήσει.

Αντίθετα με τις άλλες προσεγγίσεις στην κοινωνική επιστήμη, η Θεωρία

Παιγνίων υποθέτει ότι κανείς δεν κάνει πράγματα που δεν θα έκανε αν

τη γνώριζε! Οι κοινοί άνθρωποι εμφανίζονται σ’ αυτήν ως θεωρητικοί

και οι θεωρητικοί ως κοινοί άνθρωποι. Πρωτότυπο. Όμορφο.

Ανθρωπιστικό.

Το πρόβλημα με τη Θεωρία Παιγνίων είναι ότι η μαθηματική της

γλώσσα αποκλείει πολλούς από συζητήσεις από τις οποίες δεν θα

έπρεπε να λείπει κανείς. Εκείνοι που ενδιαφέρονται περισσότερο για

την κοινωνική σημασία της Θεωρίας Παιγνίων, συνήθως απωθούνται

από τα μαθηματικά της. Κι εκείνοι που κατέχουν τις απαιτούμενες

τεχνικές, συχνά δεν ενδιαφέρονται για την πολιτική και φιλοσοφική τους

σημασία.

Στους οικονομολόγους παρουσιάζει την αρτιότερη μέθοδο ανάλυσης

του αντικειμένου τους, αλλά και μια ευκαιρία επαναπροσέγγισης με τη

φιλοσοφία, την ψυχολογία, και την πολιτική επιστήμη. Στους

κοινωνικούς επιστήμονες προσφέρει εφόδια χρήσιμα στην κριτική

αξιολόγηση της Θεωρίας Παιγνίων.

Page 17: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

17

Θεωρία παιγνίων Κοινωνίες και συνεργασία

Ερωτήματα που απασχολούν τα παίγνια

Ποιες συμπεριφορές μπορούν να διατηρηθούν σε μια κοινωνία;

Πως εδραιώνονται αυτές οι συμπεριφορές;

Πως μπορούν να αλλάξουν προς κάτι καλύτερο;

- Τι έχει να πει για αυτά η θεωρία παιγνίων;

Στρατηγικά παίγνια

Παίζουν n≥2 παίκτες

Κάθε παίκτης επιλέγει από ένα σύνολο δυνατών επιλογών που

λέγονται στρατηγικές

Το αποτέλεσμα του παιγνίου καθορίζεται από τις επιλογές όλων

των παικτών

Δεν υπάρχει ο παράγοντας τύχη

Σημείο ισορροπίας (σημείο Nash)

Page 18: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

18

Σε ένα παίγνιο με δύο παίκτες, σημείο Nash είναι ένα ζευγάρι

στρατηγικών (μία για κάθε παίκτη) που η μία είναι η καλύτερη

απάντηση στην άλλη και αντίστροφα

Γενικεύεται για παίγνια με n>2 παίκτες

Σε κάθε παίγνιο υπάρχει τουλάχιστον ένα σημείο ισορροπίας

(θεώρημα Nash)

Το μοίρασμα της πίτσας

Μία πίτσα, 8 κομμάτια

Κάθε παίκτης δηλώνει πόσα κομμάτια θέλει

Αν το άθροισμα των κομματιών που ζητούν είναι μικρότερο ή ίσο

του 8, παίρνουν όσα ζήτησαν. Αλλιώς δεν παίρνουν τίποτα.

Σημείο ισορροπίας στο μοίρασμα της πίτσας

Page 19: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

19

Προφανής συμπεριφορά συνεργασίας να ζητήσουν από 4

κομμάτια

Αν ξέρω ότι ο άλλος θα ζητήσει 6 κομμάτια το καλύτερο που έχω

να κάνω είναι να ζητήσω 2

Αν ξέρω ότι ο άλλος θα ζητήσει 2, το καλύτερο είναι να ζητήσω 6

Το 2 και 6 είναι στρατηγικές που αποτελούν σημείο ισορροπίας

Εδώ υπάρχουν 7 σημεία ισορροπίας.

Το δίλημμα του φυλακισμένου

Δύο παίκτες, έχουν να επιλέξουν τη συνεργασία ή όχι

Αν συνεργαστούν κερδίζουν από 3 πόντους

Αν δε συνεργαστούν από 1

Αν μόνο ένας συνεργαστεί θεωρείται κορόιδο και δεν παίρνει

τίποτα ενώ ο άλλος κερδίζει 5

Η ιστορία

Page 20: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

20

Δύο άτομα έχουν συλληφθεί στον τόπο του εγκλήματος και

ανακρίνονται

Η ποινή είναι φυλάκιση 5 χρόνια

Έχουν την ευκαιρία να κατηγορήσουν ο ένας τον άλλο

Όποιος κατηγορήσει τον άλλο τη γλιτώνει (άρα -5 χρόνια)

Αν και οι δύο αλληλοκατηγορηθούν πάνε από 4 χρόνια φυλακή

(άρα -1 χρόνο)

Αν κανείς δεν ρίξει κατηγορίες πάνε από 2 χρόνια φυλακή (άρα -3

χρόνια)

Εδώ η συνεργασία σημαίνει «δεν κατηγορώ τον άλλο»

Βέλτιστη στρατηγική

Οι αριθμοί δηλώνουν πόσα χρόνια φυλακής γλιτώνω

Κάθε γραμμή αντιστοιχεί σε μια δική μου στρατηγική

Κάθε στήλη σε μία στρατηγική του αντιπάλου

1 Συνεργάζομαι

5 Δε συνεργάζομαι

0 Συνεργάζεται

3 Δε συνεργάζεται

Page 21: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

21

Η καλύτερη μου επιλογή είναι πάντα να μη συνεργαστώ

Επαναλαμβανόμενο δίλημμα του φυλακισμένου

Μεταξύ δύο παικτών παίζεται πολλές φορές (πρακτικά άπειρες)

το δίλημμα του φυλακισμένου

Μου δίνεται η δυνατότητα να τιμωρήσω αυτόν που δε

συνεργάζεται στον επόμενο γύρο

Άρα, μπορεί να δικαιολογηθεί η συνεργασία

Σημεία ισορροπίας στο επαναλ. δίλημμα του φυλακισμένου

Ένα σημείο ισορροπίας είναι να συνεργάζονται συνέχεια και οι 2

εφόσον και ο άλλος συνεργάζεται

Υπάρχουν και άλλα σημεία ισορροπίας που μπορεί να σημαίνουν

εκμετάλλευση

Page 22: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

22

Πχ: Ο ένας συνεργάζεται 50% των περιπτώσεων, εφόσον ο

άλλος συνεργάζεται πάντα. Ο δεύτερος συνεργάζεται εφόσον ο

πρώτος συνεργάζεται στις μισές επαναλήψεις

Ποιο από τα σημεία ισορροπίας θα επικρατήσει;

Μία απάντηση δίνεται από την εξελικτική θεωρία παιγνίων

Βασική ιδέα

Παίγνια που παίζονται για πολλούς γύρους-γενιές μεταξύ των

ατόμων μιας κοινωνίας

Ο πληθυσμός που ακολουθεί μια στρατηγική εξαρτάται από την

επιτυχία της στρατηγικής στην προηγούμενη γενιά

Αν σταθεροποιηθούν οι επιλογές των στρατηγικών έχουμε σημείο

ισορροπίας

Page 23: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

23

Το πείραμα του Axelrod

Πειράματα σε υπολογιστή

Εικονικοί παίκτες, κάθε ένας και μια στρατηγική

Ανάλογα με τα αποτελέσματα κάθε γύρου, οι παίκτες άφηναν τις

κακές στρατηγικές και έπαιζαν τις πιο επιτυχημένες

Προσομοίωση τέτοιων πειραμάτων με την εφαρμογή Winprisoner

Page 24: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

24

ΚΕΦΑΛΑΙΟ 4Ο

Μια σύγχρονη μαθηματική θεωρία μπορεί να αναλύσει κάθε είδος

αναμέτρησης, από την ντάμα και το σκάκι μέχρι τον «τζόγο» ή

έναν πυρηνικό πόλεμο, και να προβλέψει τον νικητή.

Η φύση αποτελεί το μεγαλύτερο εργαστήριο πειραμάτων.

Πράγματι, για να επεξεργαστούν μια θεωρία, οι επιστήμονες συνήθως

ξεκινούν παρατηρώντας τη φύση, στη συνέχεια αφαιρούν τα μη

ουσιώδη στοιχεία και τέλος δοκιμάζουν να κάνουν προβλέψεις για αυτό

που θα έπρεπε να συμβεί σε απόλυτα ελεγχόμενες πειραματικές

συνθήκες. Αυτό έκανε ο Ισαάκ Νεύτων για να επεξεργαστεί τη θεωρία

της παγκόσμιας έλξης: παρατήρησε ότι τα σώματα πέφτουν,

παράβλεψε την τριβή με τον αέρα και εφάρμοσε τις υποθέσεις του για

την αμοιβαία έλξη ακόμα και στους πλανήτες. Η παρατήρηση των

τροχιακών κινήσεών τους επιβεβαίωσε τους συλλογισμούς του.

«Ανθρώπινες» εξισώσεις

Ο Τζον Νας, τη δεκαετία του ’50, έκανε κάτι παρόμοιο

δημιουργώντας ένα νέο μαθηματικό πεδίο που ονομάστηκε «θεωρία

παιγνίων»: παρατήρησε πώς συμπεριφέρονται οι άνθρωποι σε

διάφορες καταστάσεις, έφτιαξε ένα απλοποιημένο σχήμα των σχέσεων

και των ενεργειών τους και επεξεργάστηκε κάποιες εξισώσεις που τις

περιέγραφαν. Το αποτέλεσμα δεν ήταν βέβαια ο μαθηματικός τύπος

των ανθρώπινων σχέσεων, όμως αποδείχτηκε αρκετά σημαντικό ώστε

να του χαρίσει το νόμπελ οικονομίας το 1994.

Το 2000 ο Κρις Φέργκιουσον κέρδισε το πρώτο βραβείο και 1,5

εκατομμύριο δολάρια, στο Poker World Series Champion στο Λας

Βέγκας. Στο τουρνουά συμμετείχαν περίπου 500 παίκτες, όμως ο

Page 25: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

25

Φέργκιουσον, που είχε το παρατσούκλι «Ιησούς» λόγω των γενειάδας

και των μακριών μαλλιών του, κατάφερε να τους νικήσει όλους, ακόμα

και παίκτες πολύ πιο έμπειρους από εκείνον, χάρη στη θεωρία

παιγνίων.

Η εποχή με τους παίκτες που είναι προικισμένοι μόνο με ταλέντο

έχει περάσει ανεπιστρεπτί. Για να νικήσει κάποιος στο πόκερ, εκτός από

τα απαραίτητα χαρίσματα της πειθαρχίας και της υπομονής, πρέπει να

έχει και μαθηματική ικανότητα, για να μπορεί να υπολογίζει τις

επιπτώσεις κάθε κίνησης. Πράγματι, ο Φέργκιουσον ανέλυσε ένα

μεγάλο αριθμό παρτίδων, για να επεξεργαστεί τη νικηφόρα στρατηγική

του.

«Αν παίζουν δύο, συμφέρει να μπλοφάρεις μόνο όταν έχεις τα

χειρότερα χαρτιά, όχι όταν έχεις μέτρια». Αυτός ο κανόνας αναφέρεται

στο βιβλίο Theory of Games and Economic Behaviour (1944) του

μαθηματικού Τζον φον Νόιμαν και του οικονομολόγου Όσκαρ

Μόργκενστερν, που συγκαταλέγονται τους θεμελιωτές της θεωρίας

παιγνίων.

Ας υποθέσουμε ότι έχουμε μείνει μόνο δύο παίκτες. Ο μοναδικός

τρόπος για να κερδίσω ενώ έχω τα χειρότερα χαρτιά είναι να

μπλοφάρω. Αν περιμένω την κίνηση του αντίπαλου, θα χάσω, είτε

αυτός ποντάρει είτε όχι.

Τον Φον Νόιμαν τον ενδιέφερε το πόκερ μόνο ως σημείο

αφετηρίας για μια θεωρία που θα εξηγούσε κάθε είδος ανθρώπινης

σχέσης, από την οικονομία ως τις σχέσεις των ζευγαριών. «Η ζωή είναι

γεμάτη μπλόφες», υποστήριζε, «γεμάτη μικρές τακτικές παραπλάνησης:

αυτό αποκρυπτογραφούν τα παιχνίδια της θεωρίας μου». Στόχος

ομολογουμένως πολύ φιλόδοξος, ακόμα και γι’ αυτόν τον εκκεντρικό

Page 26: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

26

επιστήμονα που, όπως λέγεται, κατάφερνε να απομνημονεύσει μια

σελίδα του τηλεφωνικού καταλόγου μέσα σε λίγα λεπτά. Όμως πολλά

συμπεράσματα του Φον Νόιμαν ισχύουν ακόμα σε μεγάλο βαθμό, παρ’

όλο που κάποια οδήγησαν σε παράδοξες προτάσεις. Για παράδειγμα,

μετά το Β΄ Παγκόσμιο πόλεμο υπήρχε μεγάλη ένταση ανάμεσα στην

ΕΣΣΔ και τις ΗΠΑ. Βασισμένος στη θεωρία παιγνίων, ο Φον Νόιμαν

προέβλεψε ότι, όταν η Σοβιετική Ένωση κατασκεύαζε την ατομική

βόμβα, θα ξεκινούσε ένας φρενήρης συναγωνισμός πυρηνικών

εξοπλισμών. Για να αποφευχθεί αυτό το αδιέξοδο, ο Φον Νόιμαν

πρότεινε μια δραστική λύση: να βομβαρδιστεί με πυρηνικά η ΕΣΣΔ για

προληπτικούς λόγους. Ευτυχώς δεν εισακούστηκε.

Συνεργασία αντί ανταγωνισμού

Από αυτό το επεισόδιο μπορεί να δημιουργηθεί η εντύπωση ότι

Φον Νόιμαν απέκλειε τη δυνατότητα συνεργασίας. Ωστόσο ο ίδιος έθεσε

τη συνεργασία στους ακρογωνιαίους λίθους της θεωρίας του. Γνώριζε,

πράγματι, ότι σε ορισμένες περιπτώσεις η συνεργασία είναι επωφελής.

Όπως σε μια σκηνή της ταινίας Ένας υπέροχος άνθρωπος που

περιγράφει τη ζωή του μαθηματικού Τζον Νας: σε ένα μπαρ βρίσκονται

τέσσερις φίλοι που διασκεδάζουν, ενώ ο Νας είναι απορροφημένος με

τη δουλειά του. Η πόρτα ανοίγει και μπαίνουν πέντε κοπέλες, μια

εντυπωσιακή ξανθιά και τέσσερις μελαχρινές. Οι τέσσερις φίλοι

γοητεύονται από την ξανθιά και προκαλούν ο ένας τον άλλο για το ποιος

θα καταφέρει να την κατακτήσει. Ο Νας όμως κάνει την εξής

παρατήρηση: «Αν προσπαθήσετε όλοι να κατακτήσετε την ξανθιά, θα

ακυρώσετε αμοιβαία τις προσπάθειές σας και στη συνέχεια, όταν θα

συμβιβαστείτε με τις μελαχρινές, εκείνες θα σας απορρίψουν, γιατί

καμιά γυναίκα δεν θέλει να αποτελεί τη δεύτερη επιλογή. Ο μοναδικός

τρόπος για να κερδίσετε είναι να δοκιμάσει καθένας με μια μελαχρινή

και κανένας με την ξανθιά». Αυτή η ιστορία, παρ’ όλο που πλάστηκε στο

μυαλό των σεναριογράφων της ταινίας και όχι του ίδιου του Νας, μας

Page 27: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

27

διδάσκει ότι το καλύτερο σύστημα δεν είναι πάντα αυτό στο οποίο

καθένας αγωνίζεται για το ατομικό συμφέρον του.

Ποιος έχει το πάνω χέρι;

Όμως τα λεγόμενα «συνεργατικά παιχνίδια» είναι εξαιρετικά

πολύπλοκα. Για παράδειγμα, είναι δύσκολο να καθορίσουμε ποιος από

τους πολλούς μετόχους μιας εταιρείας έχει τον έλεγχο, γιατί οι πιθανές

συμμαχίες καθιστούν απρόβλεπτη την κατάσταση.

Ας υποθέσουμε ότι το ελληνικό κράτος αποφασίζει να

ιδιωτικοποιήσει μια εταιρεία και πρέπει να καθορίσει το ποσοστό που

μπορεί να πουλήσει ώστε να συνεχίσει να έχει τον έλεγχό της. Σε

πρώτη ανάγνωση φαίνεται ότι, κρατώντας το 51% των μετοχών, το

κράτος παραμένει το αφεντικό. Αυτή η απόφαση είναι έξυπνη από

οικονομική άποψη; Η απάντηση είναι όχι. Το κράτος μπορεί να

συνεχίσει να βρίσκεται στο τιμόνι της εταιρείας κρατώντας το 35% ή και

ακόμα λιγότερο. Φυσικά χρειάζεται πολλή προσοχή, γιατί αν το κράτος

κρατήσει το 35% και πουλήσει το υπόλοιπο 65% σε ένα μεγιστάνα, η

εταιρεία δεν ανήκει πλέον στο ελληνικό κράτος αλλά στο μεγιστάνα. Αν

θέλει να διατηρήσει τον έλεγχο, πρέπει να φροντίσει ώστε οι υπόλοιπες

μετοχές να καταλήξουν στα χέρια χιλιάδων μικρομετόχων.

Ο δείκτης του Σάπλεϊ

Ένα μέτρο για την ικανότητα ελέγχου ενός μετόχου στην εταιρεία

είναι ο λεγόμενος «δείκτης ισχύος», που μπορεί να υπολογιστεί με

πολλούς τρόπους. Ο πιο γνωστός είναι ο δείκτης του Σάπλεϊ, από το

όνομα του εμπνευστή του, Λόιντ Στόγουελ Σάπλεϊ, συμφοιτητή του Νας

στο Πρίνστον. Αυτός ο δείκτης μπορεί να χρησιμοποιηθεί και για το

διαμερισμό των κερδών, τα οποία δεν είναι απαραιτήτως ανάλογα με

τον αριθμό των μετοχών που κατέχει κάθε μέτοχος. Ιδού ένα

Page 28: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

28

συγκεκριμένο παράδειγμα: αν το 100% των μετοχών έχει μοιραστεί σε

τέσσερις συνεταίρους που κατέχουν αντίστοιχα το 10%, το 20%, το 30%

και το 40%, ο δείκτης του Σάπλεϊ προβλέπει ότι τα κέρδη θα

διανεμηθούν ως εξής: 8,3%, 25%, 25%, και 41,6%.

Κάλλιο πέντε...

Σε κάποια παιχνίδια δεν προβλέπεται η συνεργασία, αλλά μπορεί

να εκδηλωθεί αυθόρμητα. Ένα γνωστό παράδειγμα είναι το «δίλημμα

του κατηγορούμενου»: δύο εγκληματίες ύποπτοι για τη συμμετοχή σε

μια ληστεία συλλαμβάνονται και ανακρίνονται χωριστά. Ο ανακριτής λέει

και στους δύο: «Γνωρίζουμε ότι είστε ένοχοι. Αν εσύ ομολογήσεις και ο

συνεργός σου δεν ομολογήσει, θα είσαι ελεύθερος και ο φίλος σου θα

εκτίσει ποινή δεκαετούς φυλάκισης. Αν όμως ομολογήσετε και οι δύο,

θα μοιραστείτε την ποινή: 5 χρόνια έκαστος. Σε περίπτωση που δεν

ομολογήσει κανείς σας, θα πάρετε το ελάχιστο, 1 χρόνο έκαστος. Σε

πληροφορώ ότι ο συνεργάτης μου κάνει την ίδια κουβέντα με το

συνεργό σου. Τι αποφάσισες να κάνεις;». Οι δύο παίκτες έχουν όλες τις

πληροφορίες (το παιχνίδι είναι «πλήρους πληροφόρησης»), αλλά

βρίσκονται χωριστά και δεν μπορούν να επικοινωνήσουν (το παιχνίδι

είναι «μη συνεργατικό»).

Για τα παιχνίδια αυτού του είδους ο Νας απέδειξε, εν έτει 1950,

την ύπαρξη μιας ισορροπίας, δηλαδή ενός συνδυασμού «βέλτιστων»

στρατηγικών. Στο δίλημμα του φυλακισμένου, η ισορροπία του Νας

προβλέπει ότι θα ομολογήσουν και οι δύο. Πράγματι, ο κίνδυνος

δεκαετούς φυλάκισης ξεπερνά το δυνητικό όφελος από τη φυλάκιση

ενός μόνου χρόνου.

Τα αποτελέσματα αυτού του είδους μπορεί να μοιάζουν

προφανή, όμως οι ίδιες τεχνικές υπολογισμού μπορούν να

Page 29: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

29

εφαρμοστούν σε καταστάσεις όλο και πιο πολύπλοκες, παρέχοντας

λιγότερο προφανή αποτελέσματα.

Το δίλημμα του καφέ

Η θεωρία του Νας είναι εμπνευσμένη από ένα μαθηματικό

μοντέλο του 1838 του Γάλλου οικονομολόγου Αντουάν Ογκιστέν

Κουρνό, στο οποίο δύο εταιρείες αγωνίζονται για την κυριαρχία στο ίδιο

κομμάτι της αγοράς.

Σε αυτή την περίπτωση μπορεί να προκύψει μια κατάσταση

παρόμοια με το δίλημμα του κατηγορούμενου, όπως το εξής

παράδειγμα: σε μια περιοχή υπάρχουν μόνο δύο καφετέριες και ο

νόμος λέει ότι στην αρχή κάθε μήνα οι δύο ιδιοκτήτες πρέπει να ορίζουν

την τιμή του καφέ για όλο τον προσεχή μήνα. Οι επιτρεπόμενες τιμές

είναι μόνο δύο: 1 ευρώ και 1,5 ευρώ. Αν οι δυνητικοί πελάτες είναι

πάντα οι ίδιοι, πόσο θα χρεώνουν τον καφέ οι δύο καφετέριες; Με την

υψηλή ή τη χαμηλή τιμή; Οι δύο ιδιοκτήτες μπορούν να συμφωνήσουν

και να κρατήσουν την τιμή στο 1,5 ευρώ. Οι πελάτες θα μοιραστούν

δίκαια και στις δύο καφετέριες. Όμως αν ένας από τους δύο χαμηλώσει

την τιμή, θα «κλέψει» πελάτες του άλλου και συνεπώς θα κερδίζει

περισσότερα. Όπως στο προηγούμενο δίλημμα, οι παίκτες τείνουν να

«προδίδουν» ο ένας τον άλλο. Η κύρια διαφορά ανάμεσα στα δύο

παιχνίδια είναι ότι το «δίλημμα του καφέ» επαναλαμβάνεται, άρα μπορεί

να προκύψει η συνεργασία.

Αν κάποιος από τους δύο προδώσει τον άλλο, πρέπει να

περιμένει ότι στο μέλλον ο αντίπαλός του θα κάνει το ίδιο. Είναι λοιπόν

πιθανό να κρατήσουν και οι δύο την τιμή στο 1,5 ευρώ σχηματίζοντας

ένα «καρτέλ» ακόμα και χωρίς συγκεκριμένη συμφωνία. Αυτό εξηγεί

γιατί είναι πολύ δύσκολο για τους ελέγχους αντιτράστ να αποδείξουν

την ύπαρξη των «καρτέλ»: μπορεί να υπάρχει σύμπραξη ανάμεσα σε

Page 30: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

30

εταιρείες που δραστηριοποιούνται στον ίδιο τομέα ακόμα και χωρίς

συγκεκριμένες μυστικές συμφωνίες.

Τριψήφιο κόλπο

Μια συγκεκριμένη περίπτωση στην οποία, κατά τη διάρκεια ενός

μη συνεργατικού παιχνιδιού, αναπτύχθηκε μια μορφή συνεργασίας είναι

οι πλειστηριασμοί συχνοτήτων τηλεφωνίας που προκηρύσσονταν στις

ΗΠΑ από το 1994. Αρχικά όλα έβαιναν καλώς, αλλά το 1997 κάτι

άλλαξε. Εκείνη τη χρονιά το αμερικανικό κράτος κέρδισε από τις

πωλήσεις των συχνοτήτων μόλις το 1% του ποσού που είχε προβλέψει:

σαν να λέμε ότι βγάζοντας ένα σπίτι σε πλειστηριασμό θα κέρδιζε

κάποιος 5.000 ευρώ αντί για 500.000. Αν οι εταιρείες που

πλειοδοτούσαν συναγωνίζονταν η μία την άλλη σε κάθε συχνότητα

χωριστά, θα ανέβαζαν πολύ τη ζήτηση και συνεπώς θα η τελική τιμή θα

ήταν πολύ ακριβή. Άρχισαν λοιπόν να ανταλλάσσουν σινιάλα με ένα

ευφυές σύστημα που οι διοργανωτές της δημοπρασίας δεν είχαν

προβλέψει: για τις εταιρείες που συμμετείχαν στη δημοπρασία δεν είχε

μεγάλη διαφορά να ξοδέψουν 1.537.000 δολάρια ή 1.537.385… όμως η

δεύτερη προσφορά περιείχε ένα μήνυμα προς τους άλλους, το οποίο

αναφερόταν στη συχνότητα που προτιμούσε αυτός που έκανε την

προσφορά. Χρησιμοποιώντας αυτόν τον κώδικα, οι συμμετέχοντας στη

δημοπρασία κατάφεραν να συμφωνήσουν χωρίς ποτέ να συναντηθούν.

Μετά από λίγα χρόνια όμως, μια άλλη δημοπρασία για

δικαιώματα κινητής τηλεφωνίας που έγινε στην Αγγλία οργανώθηκε από

ειδικούς στη θεωρία παιγνίων, οι οποίοι εμπόδισαν αυτές τις παράνομες

συνεννοήσεις: η προσφορά στρογγυλοποιούνταν εξαλείφοντας τα τρία

τελευταία ψηφία, άρα τα 1.537.385 δολάρια γίνονταν 1.537.000.

Ξέσπασε έτσι το αντίθετο αποτέλεσμα: καθώς ανέβαιναν οι προσφορές,

οι συμμετέχοντες πείθονταν αμοιβαία για την αξία των

δημοπρατούμενων αδειών και ανέβαζαν την προσφορά. Αυτό το

Page 31: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

31

σοβαρότατο «παιχνίδι» μας διδάσκει ότι, για να έχει όφελος ο

δημοπράτης σε έναν πλειστηριασμό, πρέπει να εμποδίσει τη

συνεργασία, διαφορετικά κινδυνεύει να βρεθεί σε ένα παιχνίδι τελείως

διαφορετικό από αυτό που είχε διοργανώσει.

Ασφαλιστικές δικλείδες

Μια παρόμοια οικονομική συναλλαγή είναι η πώληση ενός

μεταχειρισμένου αυτοκινήτου. Εδώ όμως οι δύο πρωταγωνιστές (ο

πωλητής και ο αγοραστής) έχουν διαφορετικό βαθμό πληροφόρησης.

Ενώ ο πωλητής γνωρίζει πλήρως τα προτερήματα και τα ελαττώματα

του εμπορεύματός του, ο αγοραστής δεν μπορεί παρά να έχει μια

ανακριβή ιδέα. Γι’ αυτό, αν πραγματοποιηθεί η πώληση, ο πωλητής

κερδίζει περισσότερα από την πραγματική αξία του αυτοκινήτου, ενώ ο

αγοραστής πάντα χάνει κάτι. Μια αγορά με αυτούς τους «κανόνες» δε

θα είχε λόγο ύπαρξης: για να λειτουργήσει, κάθε αγοραστής θα έπρεπε

να έχει όλες τις απαραίτητες πληροφορίες.

Η συναλλαγή του παραδείγματος ανήκει σε μια μεγάλη κατηγορία

καταστάσεων στις οποίες ένας από τους δύο πρωταγωνιστές διαθέτει

περισσότερες πληροφορίες από τον άλλο. Χάρη στην ανάλυση αυτών

των προβλημάτων, ο Τζ. A. Άκερλοφ, ο Μάικλ Σπενς και ο Τζόζεφ

Στίγκλιτς κέρδισαν το βραβείο νόμπελ οικονομίας το 2001. Τα

προβλήματα που ονομάζονται «πλήρους πληροφόρησης» είναι πολύ

κοινά και συνεπώς πολύ σημαντικά. Η πώληση ενός οποιουδήποτε

καταναλωτικού προϊόντος είναι ένα από αυτά. Πόσο θα αντέξει το κινητό

που αγοράσαμε; Είναι φτιαγμένο με ποιοτικά ή φτηνά υλικά; Τη στιγμή

της αγοράς δεν μπορούμε να είμαστε βέβαιοι. Γι’ αυτό υπάρχουν

διάφορες ασφαλιστικές δικλείδες, όπως η εγγύηση και το δικαίωμα

Page 32: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

32

επιστροφής, που καθησυχάζουν τον καταναλωτή για την πραγματική

αξία του προϊόντος.

Υπολογισμός της «ωφέλειας»

Στα παιχνίδια όπου μπορεί να καθοριστεί η «ωφέλεια» κάθε

παίκτη μπορούν να βρεθούν πολύ συγκεκριμένες λύσεις. Ένα καλό

παράδειγμα είναι η διαπραγμάτευση, την οποία μελέτησε ο Νας το

1950: δύο άτομα πρέπει να μοιραστούν ένα χρηματικό ποσό, ο ένας

είναι πλούσιος ενώ ο άλλος όχι. Ενώ ο φτωχός, λόγω ανάγκης, θα

ικανοποιηθεί ακόμα και με λίγα, ο πλούσιος, λόγω ισχύος, θα

ευχαριστηθεί μόνο με πολλά χρήματα. Αυτό το μοντέλο οδηγεί σε ένα

άνισο αποτέλεσμα. Στην περίπτωση που έλυσε ο Νας, αν το ποσό είναι

500 ευρώ, ο πλούσιος θα πάρει 310 ενώ ο φτωχός μόλις 190. Ο Νας

λαμβάνει υπόψη ένα θεμελιώδη παράγοντα: τα πράγματα, ακόμα και το

χρήμα, έχουν διαφορετική αξία για κάθε άτομο και αυτό επηρεάζει το

παιχνίδι.

Αυτό το συμπέρασμα μπορεί να μοιάζει κυνικό, όμως η ίδια

θεωρία μπορεί να εκφράσει συναισθήματα αγάπης, αλτρουισμού και

φιλανθρωπίας. Ένα παράδειγμα είναι το παρακάτω. Ένας πατέρας

παίζει μουτζούρη με το μικρό γιο του και οι κανόνες είναι απλοί: χάνει

όποιος μείνει στο τέλος με το μουτζούρη. Αν το παιδί με κάποιον τρόπο

δώσει στο γονέα του να καταλάβει ποιο χαρτί είναι ο μουτζούρης, παρ’

όλο που οι κανόνες προβλέπουν ότι χάνει αυτός που μένει με το

μουτζούρη, ο πατέρας και πάλι θα το πάρει. Γιατί σε αυτή την

περίπτωση η ωφέλειά του δεν είναι τόσο να νικήσει ο ίδιος όσο να δει το

παιδί ευχαριστημένο. Ο αλτρουισμός των παικτών είναι ένα στοιχείο του

παιχνιδιού και πρέπει να λαμβάνεται υπόψη προκειμένου η θεωρία να

περιγράψει, έστω και τμηματικά, τη ζωή.

Page 33: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

33

ΚΕΦΑΛΑΙΟ 5Ο

Το θεώρημα minimax και η θεωρία των παιγνίων

Το θεώρημα minimax αναφέρει ότι για μία μεγάλη κλάση

παιγνίων δύο ατόμων δεν υπάρχει λόγος να γίνεται το παίγνιο. Ο

καθένας από τους δύο παίκτες μπορεί να θεωρήσει, για κάθε δυνατή

στρατηγική του παιχνιδιού, την μεγίστη ζημιά που μπορεί να υποστεί

ακολουθώντας αυτή την στρατηγική και ακολούθως να εκλέξει ως

βέλτιστη στρατηγική εκείνη που του ελαχιστοποιεί την μέγιστη ζημία.

Εάν ένας παίκτης ακολουθήσει την διαδικασία αυτή, μπορεί να

είναι στατιστικά βέβαιος ότι δεν θα χάσει περισσότερα από αυτή την

τιμή που λέγεται τιμή minimax. Εφόσον (αναφέρει το θεώρημα minimax)

η τιμή minimax ισούται με το αρνητικό της παρόμοια οριζόμενης τιμής,

που ο αντίπαλος του μπορεί να εγγυηθεί για τον εαυτό του, το τελικό

αποτέλεσμα προσδιορίζεται πλήρως από τους κανόνες του παιγνίου.

Η θεωρία των παιγνίων τώρα είναι ένας κλάδος των

μαθηματικών, ο οποίος χρησιμοποιείται για την ανάλυση

ανταγωνιστικών καταστάσεων που η έκβαση τους εξαρτάται όχι μόνο

από τις επιλογές ενός ατόμου ή και από την τύχη αλλά και από τις

επιλογές των άλλων ατόμων, ή παικτών.

Εφόσον η έκβαση ενός παιχνιδιού εξαρτάται από τις ενέργειες και

τις αποφάσεις όλων των παικτών, καθένας από αυτούς προσπαθεί να

προβλέψει τις επιλογές των υπολοίπων, με σκοπό να καθορίσει την

δική του βέλτιστη επιλογή.

Το κυρίως αντικείμενο της θεωρίας παιγνίων είναι το πώς θα γίνουν

αυτοί οι αλληλεξαρτώμενοι στρατηγικοί υπολογισμοί.

Η θεωρία παιγνίων υποδιαιρείται σε πολλούς μεγάλους τομείς. Οι

σημαντικότεροι είναι:

Page 34: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

34

• Δύο πρόσωπα εναντίον π προσώπων. Η θεωρία των δύο προσώπων

ασχολείται με την βέλτιστη στρατηγική επιλογή δύο ατόμων, ενώ η

θεωρία των π προσώπων (π>2) ενδιαφέρεται για τις συμμαχίες (ή

συνασπισμούς) που θα μπορούσαν να κάνουν κάποιοι από αυτούς

έτσι, ώστε τα μέλη της συμμαχίας να αποκομίσουν τα μέγιστα δυνατά

κέρδη.

• Μηδενικό άθροισμα εναντίον μη μηδενικού αθροίσματος. Τα κέρδη

κάθε παίκτη προστίθενται στο μηδέν (ή σε κάποιον άλλο σταθερό

αριθμό) για κάθε έκβαση (γύρο) του παιχνιδιού. Αυτό συμβαίνει στα

παιχνίδια μηδενικού αθροίσματος. Στα παιχνίδια μη μηδενικού

αθροίσματος τα ποσά αθροίζονται σε κάθε έκβαση και, κατά συνέπεια,

η αφετηρία δεν είναι κοινή για όλους τους παίκτες. Στα παιχνίδια

μηδενικού αθροίσματος ό,τι ποσό κερδίζεται συνολικά τόσο ποσό

χάνεται. Κατά συνέπεια το αλγεβρικό άθροισμα των ποσών είναι μηδέν.

Αντίθετα, στα παιχνίδια μη μηδενικού αθροίσματος είναι δυνατόν σε

κάποιο γύρο να χάσουν ή να κερδίσουν όλοι οι παίκτες (από το

απόθεμα του παιχνιδιού).

• Συνεργασία εναντίον μη συνεργασίας. Ως παιχνίδια συνεργασίας

χαρακτηρίζονται εκείνα, στα οποία οι παίκτες συνάπτουν συμβάσεις και

θεσπίζουν κανονισμούς. Αντίθετα, στα παιχνίδια μη συνεργασίας,

μπορεί να επιτρέπεται ή όχι η επικοινωνία μεταξύ των παικτών. Πάντως

και στα παιχνίδια μη συνεργασίας αν αποφασιστεί κάποια συμφωνία,

αυτή δεν πρέπει να παραβιαστεί με το αιτιολογικό ότι πρόκειται για

παιχνίδι μη συνεργασίας. Κοινό γνώρισμα όλων των κλάδων της

θεωρίας παιγνίων είναι η υπόθεση ότι οι παίκτες, μεταξύ πολλών κακών

εκβάσεων, θα επιλέξουν την λιγότερο κακή.

Page 35: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

35

Αν και τα Πειραματικά Οικονομικά υφίστανται ως κλάδος της

Οικονομικής Επιστήμης εδώ και πολλά χρόνια, λίγοι είναι εκείνοι

που γνωρίζουν πραγματικά περί τίνος πρόκειται.

Στα Οικονομικά, η θεωρία και η εμπειρική δουλειά

αλληλοσυμπληρώνονται, με την έννοια ότι η εμπειρική δουλειά

«ελέγχει» τη θεωρία παρέχοντας εκτιμήσεις παραμέτρων που

σχετίζονται με τη συμπεριφορά, κάτι που η θεωρία δεν μπορεί να κάνει

από μόνη της. H εμπειρική δουλειά βασίζεται σε δεδομένα του

συγκεκριμένου αντικειμένου· ωστόσο, η στροφή - κατά τα τελευταία 30

χρόνια - προς υποδείγματα όπου οι άνθρωποι έχουν διαφορετική

πληροφόρηση και αλληλεπιδρούν με τρόπους που δεν μπορούν να

περιγραφούν από τη θεωρία των ανταγωνιστικών αγορών έχει αυξήσει

τη σημασία των εργαστηριακών πειραμάτων.

Ένα από τα πρώτα και πολύ γνωστά παραδείγματα είναι η

κλασική θεωρία της συμπεριφοράς σε μεμονωμένες αγορές - του

Vernon Smith - που δημοσιεύθηκε το 1962 στο περιοδικό «Journal of

Political Economy» και για την οποία ο Smith έλαβε το βραβείο Νόμπελ

στα Οικονομικά το 2002. Άλλο ένα από τα πρώτα παραδείγματα

εφαρμογής πειραματικών μεθόδων για την ανάλυση ατομικών

αποφάσεων είναι η εργασία του Ανδρέα Παπανδρέου (μαζί με άλλους

συναδέλφους) με τίτλο «Α Test of a Stochastic Theory of Choice», το

1957 (University of California Press).

Τα πειράματα χρησιμοποιούνται σήμερα με αυξανόμενη

συχνότητα, προκειμένου να αναπτύξουν και να βελτιώσουν τη

λειτουργία των δημόσιων και ιδιωτικών οργανισμών, ειδικά στις

περιπτώσεις που η θεωρία είναι ανεπαρκής για να αποτελέσει έναν

αξιόπιστο οδηγό. Για παράδειγμα, πραγματοποιήθηκαν πειράματα ώστε

να συνεισφέρουν στον σχεδιασμό των δημοπρασιών για τις συχνότητες

στις οποίες λειτουργούν τα μέσα προσωπικής ηλεκτρονικής

Page 36: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

36

επικοινωνίας (π.χ. κινητά τηλέφωνα) της Ομοσπονδιακής Επιτροπής

Εμπορίου των ΗΠΑ. H πρώτη εφαρμογή τού σχεδιασμού αυτού

απέφερε στις ΗΠΑ 18 δισ. δολάρια.

Πού συναντάμε τη Θεωρία Παιγνίων στην καθημερινή μας ζωή; Τι

νομίζετε ότι έλειπε από τον χαρακτηρισμό της στρατηγικής

συμπεριφοράς, όπως ορίστηκε αρχικά;

H Θεωρία Παιγνίων εξετάζει τον τρόπο με τον οποίον οι

άνθρωποι παίρνουν αλληλοεξαρτώμενες αποφάσεις, οι συνέπειες των

οποίων εξαρτώνται από τις αποφάσεις που παίρνουν οι άλλοι.

Επομένως, οι καλές αποφάσεις βασίζονται, συχνά, στις προβλέψεις για

τις αποφάσεις των άλλων και πρέπει να λαμβάνουν υπόψη ότι και οι

άλλοι μπορεί να σκέπτονται με τον ίδιον τρόπο.

Εφαρμογές συναντάμε σχεδόν παντού στη καθημερινή μας ζωή:

από την απόφαση για το πώς να αποφύγεις ένα ταξί την ώρα που

διασχίζεις τον δρόμο, μέχρι τις πολύ σημαντικές αποφάσεις διοίκησης

επιχειρήσεων και κυβερνήσεων. Για παράδειγμα, όταν η Microsoft ήλθε

αντιμέτωπη με τον ανταγωνισμό τής Netscape, πριν από μερικά χρόνια,

προσπάθησε να «προλάβει» την είσοδό της αντιγράφοντας τα

χαρακτηριστικά πλοήγησης της Netscape με το δικό της πρόγραμμα

πλοήγησης στο Διαδίκτυο. Επειδή και οι δύο διαδικασίες εξελίσσονταν

ταυτόχρονα, οι προγραμματιστές και των δύο εταιρειών έπρεπε να

κάνουν... υποθέσεις, με βάση τις γνώσεις τους για τα χαρακτηριστικά

που θα είχε το άλλο πρόγραμμα. Ο τρόπος με τον οποίον αποφάσισαν

τι έπρεπε να κάνουν, απαιτεί παιγνιοθεωρητική ανάλυση.

H παραδοσιακή Θεωρία Παιγνίων χρησιμοποιεί την έννοια της

ισορροπίας (Nash) - παίρνοντας το όνομά της από τον John Nash, ο

οποίος κέρδισε το βραβείο Νόμπελ στα Οικονομικά το 1994 και

αναγορεύθηκε σε επίτιμο διδάκτορα του Πανεπιστημίου Αθηνών το

Page 37: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

37

2000 - κατά την οποίαν κάθε άνθρωπος παίρνει την απόφαση που είναι

η καλύτερη γι' αυτόν, δεδομένων των επιδιώξεών του και των

αποφάσεων των άλλων. Εμμέσως, η «ισορροπία» υποθέτει ότι κάθε

άνθρωπος διαθέτει ένα τέλειο υπόδειγμα πρόβλεψης της συμπεριφοράς

τού άλλου, οι προβλέψεις του οποίου - στατιστικά τουλάχιστον - είναι

σωστές, όπως στην έννοια της «ισορροπίας» των ορθολογικών

προσδοκιών στη Μακρο-οικονομική. H ισορροπία είναι ένα δυνατό και

χρήσιμο... εργαλείο, στις περιπτώσεις που οι άνθρωποι έχουν

προηγούμενη εμπειρία από ανάλογα παίγνια.

Είστε διευθυντής του Εργαστηρίου Πειραματικών Οικονομικών στο

Πανεπιστήμιο του Σαν Ντιέγκο της Καλιφόρνιας. Τι ακριβώς κάνετε

στο Εργαστήριο;

Το μεγαλύτερο μέρος της πρόσφατης δουλειάς μου έχει να κάνει

με το πεδίο της Θεωρίας Παιγνίων που καλείται Συμπεριφορική Θεωρία

Παιγνίων, και η οποία συνδυάζει τη θεωρία με εμπειρικές - κυρίως

πειραματικές - αποδείξεις για τη στρατηγική συμπεριφορά, ώστε να

παραχθεί μία γενικότερη και πιο χρήσιμη θεωρία. Ένα μεγάλο κομμάτι

της δουλειάς αυτής χρησιμοποιεί εργαστηριακά πειράματα που

συγκεντρώνουν εμπειρικά στοιχεία, ώστε να προβλέπεται καλύτερα η

δομή των ανθρωπίνων αποφάσεων.

Στο εργαστήριό μας (δυναμικότητας 18 - 24 «αντικειμένων»), τα

«αντικείμενα» συγκεντρώνονται και παίρνουν αποφάσεις, στο πλαίσιο

ενός συγκεκριμένου περιβάλλοντος που έχει περιγραφεί με ακρίβεια.

Τι αποτελέσματα δίνουν τα πειράματά σας για τη συμπεριφορά και

τη στρατηγική σκέψη των «πραγματικών» ανθρώπων;

έχουν γίνει πειράματα που δείχνουν με απόλυτη ακρίβεια τον τρόπο με

τον οποίον οι άνθρωποι προβλέπουν τις αντιδράσεις των άλλων σε

πρωτόγνωρες καταστάσεις. Βρήκαμε ότι κάποιες από τις αντιδράσεις

Page 38: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

38

τους δεν μπορούν να περιγραφούν από την «ισορροπία». Ωστόσο, σε

πιο πολύπλοκα παίγνια, οι αποφάσεις των ατόμων αποκλίνουν

συστηματικά από την «ισορροπία». Αναπτύξαμε πρόσφατα ένα

υπόδειγμα (αρχικά προτεινόμενο από άλλους) που καλείται level-k-

model, το οποίο προβλέπει, πότε οι αποφάσεις των ανθρώπων

συμπίπτουν με την «ισορροπία» και το πώς θα αποκλίνουν, όταν

αποκλίνουν.

Θα λέγαμε τα Πειραματικά Οικονομικά και η πειραματική Θεωρία

Παιγνίων, είναι πιο σημαντικά από τις ίδιες τις θεωρίες;

Ναι, με την έννοια ότι αποτελούν εργαλεία (όπως η Οικονομετρία), τα

οποία μπορούν να αλλάξουν τα πάντα στα Οικονομικά, πέρα και πάνω

από τα πεδία στα οποία χρησιμοποιήθηκαν αρχικά.

Page 39: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

39

ΚΕΦΑΛΑΙΟ 6Ο

Υπολογιστές

Στη θεωρία υπολογιστών, ο von Neumann έκανε πρωτοποριακή

δουλειά στον λογικό σχεδιασμό, στο πρόβλημα του να παίρνουμε

αξιόπιστες απαντήσεις από μία μηχανή με μη αξιόπιστα συστατικά

στοιχεία, στη λειτουργία της μνήμης, και στο πρόβλημα κατασκευής

αυτομάτων που μπορούν να αναπαράγουν το είδος τους.

Μία από τις πιο αξιοπρόσεκτες ιδέες, για την μελέτη της οποίας

πρότεινε να εφαρμοστούν μέθοδοι της πληροφορικής, ήταν να

χρωματιστεί το στρώμα πάγου των πολικών περιοχών της Γης, έτσι

ώστε να ελαττωθεί το ποσό ενέργειας που αυτές ανακλούν- ως

αποτέλεσμα η Γη θα θερμαινόταν τόσο ώστε το κλίμα της Ισλανδίας θα

πλησίαζε το κλίμα της Χαβάης.

Η αξιωματική μέθοδος αναφέρεται μερικές φορές ως το μυστικό της

επιτυχίας του von Neumann. Την χειρίστηκε όχι με σχολαστικότητα

αλλά με διορατικότητα. Έφθανε στη ρίζα του θέματος επικεντρώνοντας

την προσπάθεια του στις βασικές ιδιότητες, τα αξιώματα, από τα οποία

απορρέουν όλες οι άλλες ιδιότητες.

Από το 1936 έως το 1938 ο Alan Turing ήταν μεταπτυχιακός

σπουδαστής στο τμήμα μαθηματικών στο Princeton και έκανε τη

διατριβή του κάτω από τον Alonzo Church. Ο Von Neumann

προσκάλεσε τον Turing να γίνει βοηθός του αλλά αυτός προτίμησε να

επιστρέψει στο Κέιμπριτζ.

Ένα έτος αργότερα ο Turing έγινε μέλος της ομάδας για τον πόλεμο στο

Bletchley Park, χάρις στην δημοσίευση μιας εργασίας του το 1934 που

περιλάμβανε τις έννοιες του λογικού σχεδιασμού και της καθολικής

μηχανής. Δεν ξέρουμε αν ο Neumann ήξερε για τις ιδέες του Turing, αν

Page 40: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

40

και τις εφάρμοσε στο σχέδιο της Υπολογιστικής Μηχανής του Ιδρύματος

Προχωρημένων Σπουδών (IAS ) του Princeton δέκα χρόνια αργότερα.

Το ενδιαφέρον του Von Neumann για τους υπολογιστές

εστιάστηκε στην εφαρμογή των υπολογιστών στα εφαρμοσμένα

μαθηματικά για συγκεκριμένα προβλήματα, κι όχι μόνο για την

ανάπτυξη των πινάκων.

Κατά τη διάρκεια του πολέμου, χάρις την πείρα του στην υδροδυναμική,

την επιστήμη των βλημάτων, τη μετεωρολογία, τη θεωρία παιχνιδιών,

και τη στατιστική, τέθηκε επικεφαλής διαφόρων προγραμμάτων.

Αυτή η εργασία του τον οδήγησε να σκεφτεί τη χρήση μηχανικών

συσκευών για τον υπολογισμό. Η ιστορία μπορεί να αναφέρει ότι ο

Neumann δούλεψε για πρώτη φορά στον υπολογιστή ENIAC, στην

πραγματικότητα όμως ήταν με τον υπολογιστή Harvard Mark I, του

Howard Aiken (ASCC).

Η αλληλογραφία του το 1944 δείχνει το ενδιαφέρον του για την

εργασία όχι μόνο του Aiken αλλά και των ηλεκτρομηχανικών (με τη

χρήση ρελέ) υπολογιστών του George Stibitz, και την εργασία του Jan

Schilt στο Επιστημονικό Εργαστήριο Υπολογιστών Watson στο

Πανεπιστήμιο της Κολούμπια.

Χάρις τις εργασίες του φτιάχτηκε ο υπολογιστής ENIAC, και η

υπολογιστική μηχανή του IAS. Επίσης, χτίστηκαν αρκετοί

"υπερυπολογιστές" από Εθνικά Εργαστήρια ως αντίγραφα της

μηχανής του.

Μέχρι τα τελευταία χρόνια του πόλεμος ο Neumann ήταν ο σύνδεσμος

μεταξύ των επιστημονικών ομάδων που εργάζονταν μυστικά στο

Εθνικού Εργαστηρίου Los Alamos (και του προγράμματος Μανχάτταν).

Page 41: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

41

Με τη βοήθεια του υπολογιστή του επιταχύνθηκε η κατασκευή της

βόμβας υδρογόνου, την 1η Νοεμβρίου 1952.

Στη δεκαετία του '50 ο von Neumann απασχολήθηκε ως σύμβουλος

στην ΙΒΜ για να συντάξει προηγμένα προγράμματα τεχνολογίας.

Πρώτη ενότητα – στατικά παίγνια πλήρους πληροφόρησης

Βασική θεωρία: Η κανονική μορφή και οι αυστηρά

κυριαρχούμενες στρατηγικές

Ισορροπία κατά Nash

Το μοντέλο Cournot

Το μοντέλο Bertrand

Μακροοικονομική πολιτική

Μεικτές στρατηγικές (mixed strategies)

Μεικτές στρατηγικές και ισορροπία κατά Nash

Δεύτερη ενότητα: δυναμικά παίγνια πλήρους πληροφόρησης

Παίγνια Ακολουθίας

Το μοντέλο Stackelberg

Το μοντέλο Leontief

Το μοντέλο διαπραγμάτευσης του Rubinstein

Επαναλαμβανόμενα Παίγνια

Δυναμικά παίγνια πλήρους και ατελούς πληροφόρησης

Επαναλαμβανόμενα Παίγνια άπειρου χρονικού ορίζοντα

Page 42: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

42

Δυναμικά παίγνια πλήρους και ατελούς πληροφόρησης

Τρίτη ενότητα: στατικά παίγνια ελλειπούς πληροφόρησης (static games

of incomplete information)

Στατικά παιγνια ελλειπούς πληροφόρησης

Το μοντέλο Counrot με ελλειπή πληροφόρηση

Τέταρτη ενότητα: δυναμικά παίγνια ελλειπούς πληροφόρησης (dynamic

games of incomplete information)

Δυναμικά παιγνια ελλειπούς πληροφόρησης

Signaling Games

Spence’s model of job-market signalling

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΚΑΙ ΔΙΔΑΚΤΙΚΗ

Όπως η θεωρία παιγνίων έχει εφαρμογές στις φυσικές, στις οικονομικές

αλλά και στις κοινωνικές επιστήμες, είναι αναμενόμενο να έχει

επιπτώσεις και στη διδακτική, η οποία αποτελεί ένα ιδανικό πλαίσιο

συνεργασίας. Η θεωρία παιγνίων μπορεί να χρησιμοποιηθεί ως

Page 43: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

43

εργαλείο για να επιτευχθεί μια δυναμική προσέγγιση ενός προβλήματος

ή θέματος. Μπορεί όμως και να την εκμεταλλευτούμε για να

αναλύσουμε τη δομή μιας διδακτικής οντότητας. Σε αυτή την περίπτωση

προσφέρει μέσω του αφαιρετικού της ύφους, δημιουργικές δυνατότητες

για την επινόηση ορθολογικών μεν λύσεων αλλά που δεν είναι

προφανείς με μια κλασική προσέγγιση.

Διότι με τη θεωρία παιγνίων σημασία δεν έχει πια η γραμμική σκέψη

αλλά ο συνδυασμός των στρατηγικών συμπεριφοράς. Σε αυτό το

πλαίσιο, η βέλτιστη λύση είναι σημαντική μόνο όταν αφορά το σύνολο.

Έτσι μια άμεση επίπτωση στον τομέα της διδακτικής είναι η

μεθοδολογία που πρέπει να χρησιμοποιήσει μια ομάδα που θέλει να

λύσει το ίδιο πρόβλημα. Με αυτόν τον τρόπο, η διδακτική μπορεί να

εκμεταλλευτεί τις διαφορές των ατόμων όσον αφορά στο γνωστικό

επίπεδο. Η θεωρία παιγνίων αποδεικνύει ότι αυτό το μείγμα

στρατηγικών είναι ανώτερο από κάθε άλλη επιλογή. Συνεπώς, δεν

υπάρχει λόγος να κάνει η διδακτική χρήση μιας σειριακής προσέγγισης.

Επιπλέον, η δυναμική της απόφασης μπορεί να περιγραφτεί από τη

θεωρία παιγνίων. Άρα δεν έχουμε μόνο το αποτέλεσμα αλλά και τη

διαδικασία που είναι πιο σημαντική όπως το απέδειξε το έργο του

Lakatos. Όμως ακόμα και το αποτέλεσμα μπορεί να ερμηνευτεί ως μια

ειδική περίπτωση ισορροπίας Nash εφόσον η λύση είναι η βέλτιστη

επιλογή και η συνεργασία δημιουργεί εκ φύσεως ένα συμμετρικό

πλαίσιο. Η ερμηνεία αυτής της ειδικής διδακτικής περίπτωσης επιτρέπει

τη γενίκευση και σε μη συνεργατικό πλαίσιο που μοντελοποιεί καλύτερα

τη συμπεριφορά μιας τάξης όταν αντιμετωπίζει ένα καινούργιο μάθημα.

Διότι μερικοί από τους μαθητές θα ακολουθήσουν τις οδηγίες του

δασκάλου, άλλοι δεν θα τις καταλάβουν, ενώ άλλοι ακόμα θα

αντισταθούν για γνωστικούς ή και κοινωνικούς λόγους. Εκεί για την

εφαρμοσμένη διδακτική είναι πολύ σημαντικό το τι μπορεί να προκύψει

από αυτό το πλαίσιο. Και πάλι, στη θεωρία παιγνίων, ακόμα και σε αυτό

Page 44: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

44

το μη συνεργατικό πλαίσιο ή τουλάχιστον όχι τέλεια συνεργατικό,

υπάρχει μια ισορροπία Nash. Πρέπει όμως να επισημάνουμε το

γεγονός ότι δεν είναι απαραίτητα μοναδική και επομένως πρέπει να

επιλέξουμε εκείνη που συμπίπτει με την επίτευξη της διδασκαλίας με τη

διδακτική έννοια. Βέβαια, στην περίπτωση που ο ορίζοντας του

παιγνίου δεν είναι προσιτός στους παίκτες, η θεωρία δεν μπορεί να είναι

πειστική όσον αφορά στην αποτελεσματικότητά της, όμως και εδώ

παραμένει μια στρατηγική ευρηματικότητας και αυτό αποτελεί το

μεγαλύτερο επίτευγμά της σε έναν τομέα που είναι εξ αρχής μια ανοιχτή

δομή

Αλγοριθμική και Εξελικτική Θεωρία Παιγνίων

Η θεωρία παιγνίων προσφέρει μοντέλα και αναλυτικά εργαλεία για την

κατανόηση φαινομένων που παρατηρούνται όταν κάποιες εγωιστικές

οντότητες (παίκτες) με προσωπικές στρατηγικές και συμφέροντα

αλληλεπιδρούν. Στόχος της διατριβής είναι η μελέτη προβλημάτων που

συνδέονται τόσο με τη θεωρία παιγνίων όσο και με τη θεωρία

υπολογισμού. Τα συγκεκριμένα θέματα με τα οποία ασχοληθήκαμε και

τα αποτελέσματα της έρευνάς μας συνοψίζονται παρακάτω.

Υπολογισμός Προσεγγιστικών Ισορροπιών Nash. Ένα από τα πλέον

θεμελιώδη αλγοριθμικά προβλήματα της θεωρίας παιγνίων είναι το

πρόβλημα υπολογισμού μιας ισορροπίας Nash ενός δοθέντος παιγνίου.

Μια ισορροπία Nash είναι ένας συνδυασμός στρατηγικών, μία για κάθε

παίκτη, τέτοια ώστε να μην υπάρχει παίκτης που να μπορεί να αυξήσει

το κέρδος του αν αποκλίνει μονομερώς, αν αλλάξει δηλαδή τη

στρατηγική του.

Πρόσφατα όμως αποδείχθηκε ότι το πρόβλημα υπολογισμού μιας

Page 45: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

45

ισορροπίας Nash είναι πλήρες για την κλάση πολυπλοκότητας PPAD,

γεγονός που έστρεψε την έρευνα προς την αναζήτηση є-

προσεγγιστικών ισορροπιών Nash, δηλαδή συνδυασμών στρατηγικών

με την ιδιότητα ότι κανένας παίκτης δεν μπορεί να αυξήσει το κέρδος

του περισσότερο από є αν αποκλίνει μονομερώς.

Στα πλαίσια της διατριβής αναπτύξαμε δύο από τους πρώτους

αλγορίθμους υπολογισμού μιας є-προσεγγιστικής ισορροπίας Nash για

την περίπτωση όπου το є είναι κάποια σταθερά. Οι προσεγγίσεις που

επιτυγχάνουν οι αλγόριθμοί μας είναι є=3/4 και є=(2+λ)/4 αντίστοιχα,

όπου λ είναι το ελάχιστο, μεταξύ όλων των ισορροπιών Nash, κέρδος

για έναν παίκτη. Επιπλέον, μελετήσαμε μια ευρεία κλάση τυχαίων

παιγνίων δύο παικτών, για την οποία υπολογίσαμε μια πολύ καλή є-

προσεγγιστική ισορροπία Nash, με το є να τείνει στο 0 καθώς το

πλήθος των διαθέσιμων στρατηγικών των παικτών τείνει στο άπειρο.

Εξισορρόπηση Φορτίου και Ατελής Πληροφόρηση. Οι αρχές της

θεωρίας παιγνίων είναι χρήσιμες στην ανάλυση της επίδρασης που έχει

στην καθολική απόδοση ενός συστήματος διαμοιραζόμενων πόρων η

εγωιστική και ανταγωνιστική συμπεριφορά των χρηστών του. Προς την

κατεύθυνση αυτή, εστιάσαμε στο πρόβλημα της εξισορρόπησης

φορτίου. Συγκεκριμένα, κάθε ένας από ένα σύνολο n χρηστών, με

διαφορετικό φορτίο ο καθένας, καλείται να επιλέξει έναν από δύο

διαθέσιμους εξυπηρετητές όπου θα αναθέσει το φορτίο του. Ο στόχος

κάθε χρήστη είναι να ελαχιστοποιήσει το κόστος του, το οποίο ορίζεται

ως το αναμενόμενο συνολικό φορτίο στον εξυπηρετητή που θα επιλέξει.

Στην περίπτωση που κάθε χρήστης γνωρίζει τόσο το μέγεθος του

φορτίου του όσο και τα μεγέθη των φορτίων των άλλων χρηστών, το

επαγόμενο παίγνιο είναι ουσιαστικά ένα παίγνιο συμφόρησης με βάρη,

ανήκει δηλαδή σε μια κατηγορία παιγνίων τα οποία έχουν μελετηθεί

εκτενώς στην πρόσφατη βιβλιογραφία.

Page 46: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

46

Στα πλαίσια της διατριβής μελετήσαμε την περίπτωση όπου οι χρήστες

έχουν ατελή πληροφόρηση σχετικά με τα ακριβή μεγέθη των φορτίων

τους. Εστιάσαμε στις λεγόμενες κατωφλιακές στρατηγικές, δηλαδή σε

στρατηγικές της μορφής “αν το φορτίο είναι μικρότερο από το κατώφλι,

επίλεξε τον εξυπηρετητή 1, διαφορετικά επίλεξε τον εξυπηρετητή 2”'.

Μελετήσαμε διάφορα μοντέλα πληροφόρησης (π.χ. όταν όλα τα φορτία

είναι άγνωστα ή όταν κάθε παίκτης γνωρίζει το μέγεθος του δικού του

φορτίου) και αναλύσαμε για το καθένα το σύνολο και τις ιδιότητες των

ισορροπιών Nash. Yπολογίσαμε επίσης φράγματα στο λόγο απόκλισης

(ένα μέγεθος ανάλογο του λόγου συνεργασίας στα παίγνια

συμφόρησης), ο οποίος εκφράζει την επίδραση που έχει στην απόδοση

του συστήματος η εγωιστική συμπεριφορά των χρηστών του, σε σχέση

με την απόδοση που θα επιτύγχανε ένας βέλτιστος κεντρικοποιημένος

αλγόριθμος.

Χρωματισμοί Γραφημάτων και Θεωρία Παιγνίων. Εκτός από τα

υπολογιστικά θέματα που σχετίζονται με τη θεωρία παιγνίων, έχει

ενδιαφέρον να μελετηθεί κατά πόσο μπορεί η θεωρία παιγνίων να

βοηθήσει στην ανάπτυξη και ανάλυση αλγορίθμων για υπολογιστικά

δύσκολα προβλήματα συνδυαστικής βελτιστοποίησης. Προς αυτήν την

κατεύθυνση, μελετήσαμε από παιγνιοθεωρητική σκοπιά το πρόβλημα

χρωματισμού των κορυφών ενός γραφήματος. Συγκεκριμένα, ορίσαμε

το παίγνιο χρωματισμού γραφήματος ως εξής: Το σύνολο των παικτών

είναι το σύνολο των n κορυφών του γραφήματος, το σύνολο των

στρατηγικών για κάθε κορυφή είναι ένα σύνολο n χρωμάτων και το

κέρδος μιας κορυφής v σε ένα συνδυασμό στρατηγικών είναι 0 αν

υπάρχει γειτονική κορυφή με το ίδιο χρώμα, διαφορετικά ισούται με το

πλήθος των κορυφών που έχουν επιλέξει το ίδιο χρώμα με τη v.

Αποδείξαμε ότι κάθε παίγνιο χρωματισμού γραφήματος έχει πάντα μια

Page 47: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

47

αγνή ισορροπία Nash, και ότι κάθε αγνή ισορροπία Nash αντιστοιχεί σε

ορθό χρωματισμό του γραφήματος. Δείξαμε επίσης ότι υπάρχει πάντα

μια αγνή ισορροπία Nash που χρησιμοποιεί βέλτιστο αριθμό χρωμάτων,

δηλαδή ίσο με το χρωματικό αριθμό του γραφήματος. Επιπλέον,

περιγράψαμε και αναλύσαμε έναν πολυωνυμικό αλγόριθμο που

υπολογίζει μια αγνή ισορροπία Nash για ένα οποιοδήποτε παίγνιο

χρωματισμού γραφήματος.

Η ανάλυση των ιδιοτήτων των ισορροπιών Nash του παιγνίου

χρωματισμού γραφήματος μας οδήγησε σε μια σειρά από άνω

φράγματα στο συνολικό πλήθος των χρωμάτων που χρησιμοποιούνται

σε μια οποιαδήποτε αγνή ισορροπία Nash. Όλα αυτά τα άνω φράγματα

αποτελούν ταυτόχρονα άνω φράγματα στο χρωματικό αριθμό του

γραφήματος, και ο αλγόριθμος εύρεσης μιας αγνής ισορροπίας Nash

που αναπτύξαμε εγγυάται ότι μπορούμε να υπολογίσουμε σε

πολυωνυμικό χρόνο έναν ορθό χρωματισμό του γραφήματος που

χρησιμοποιεί συνολικά ένα πλήθος χρωμάτων που ικανοποιεί

ταυτόχρονα τα περισσότερα κλασικά γνωστά φράγματα στο χρωματικό

αριθμό.

Η Φιλοδοξία της Θεωρίας Παιγνίων

Οι Μεγάλοι Κατακτητές εκλογίκευαν τις πράξεις τους βλέποντας

στον εαυτό τους τον γεφυροποιό μεταξύ ηπείρων, τον καταλύτη

μεταλαμπάδευσης πολιτισμών, τον ενοποιητή Ανατολής και Δύσης. Κάτι

αντίστοιχο συμβαίνει και με τις επιστήμες. Αδυνατούν να κρύψουν τις

ιμπεριαλιστικές τους τάσεις. Συχνά ξεπερνούν τα όριά τους

εισβάλλοντας με ενθουσιασμόσε ξένα «χωράφια». Κάποτε

Page 48: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

48

θριαμβεύουν, ανοίγοντας νέα επιστημονικά πεδία, χωρίς κατακτημένους

και κατακτητές.

ΘΕΩΡΙΑ ΣΤΑΤΙΚΩΝ ΠΑΙΓΝΙΩΝ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ

Στις σελίδες που ακολουθούν με τη μορφή εικόνας διατυπώνουμε τη

θεωρία μέσα από παραδείγματα.

Ορολογία

Στρατηγικές Επιλογές διαθέσιμες σε κάθε παίκτη

Αποδόσεις Αριθμητική αποτίμηση των στόχων του κάθε παίκτη.

Μπορούν να λάβουν υπόψη χρησιμότητα

δικαιοσύνη

αλτρουισμό

φήμη

Το γεγονός ότι οι αποδόσεις είναι αριθμητικές δενσημαίνει απαραίτητα ότι οι παίκτες είναι εγωιστές.

Page 49: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

49

Στατικά παίγνια πλήρουςπληροφόρησης -1-

Ένα στατικό παίγνιο (οι παίκτες παίζουνταυτόχρονα) αποτελείται από: Ένα σύνολο παικτών (τουλάχιστον δύο

παίκτες) {Παίκτης 1,…., Παίκτης n} Για κάθε παίκτη ένα σύνολο στρατηγικών S1,

S2,…,Sn

Αποδοχές που λαμβάνονται από κάθε παίκτηγια κάθε συνδυασμό στρατηγικώνui(s1, s2, ...sn), για όλα τα s1S1, s2S2, ... snSn

Στατικά παίγνια πλήρουςπληροφόρησης -2-

Ταυτόχρονης κίνησης Κάθε παίκτης επιλέγει την

στρατηγική του χωρίς να γνωρίζει τιςεπιλογές των άλλων παικτών

Πλήρους πληροφόρησης Όλοι οι παίκτες γνωρίζουν τις

διαθέσιμες στρατηγικές και τιςπιθανές αποδοχές του κάθε παίκτη

Page 50: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

50

Στατικά παίγνια πλήρουςπληροφόρησης -3-

Υποθέσεις για κάθε παίκτη Ορθολογισμός

Στόχος των παικτών είναι να μεγιστοποιήσουν τιςαποδοχές τους

Οι παίκτες είναι σε θέση να υπολογίζουν τέλεια τιςαποδοχές τους

Κάθε παίκτης γνωρίζει ότι οι άλλοι παίκτεςείναι επίσης ορθολογιστές

Στατικά παίγνια πλήρουςπληροφόρησης -4-

Συνεργάζονται οι παίκτες; ΌΧΙ. Μελετάμε μόνο παίγνια μη συνεργασίας.

Χρονοδιάγραμμα Κάθε παίκτης i επιλέγει τη στρατηγική του si

χωρίς να γνωρίζει τις επιλογές των άλλωνπαικτών.

Στη συνέχεια κάθε παίκτης i παίρνει τιςαποδοχές του ui(s1,…,sn).

Το παιχνίδι τελειώνει.

Page 51: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

51

Κανονική ή στρατηγική μορφήαναπαράστασης παιγνίου

Η κανονική ή στρατηγική μορφή ενόςπαιγνίου καθορίζει: Ένα πεπερασμένο σύνολο παικτών {1,2,…,n}

Τις στρατηγικές των παικτών S1 S2 ... Sn

Τις συναρτήσεις αποδοχών τους u1 u2 ... un

όπου ui : S1 × S2 × ...× Sn→R

Κανονική ή στρατηγική μορφήπαιγνίου 2 παικτών

Αναπαράσταση σε πίνακα 2 παίκτες: Παίκτης 1 και Παίκτης 2 Κάθε παίκτης έχει πεπερασμένο αριθμό

στρατηγικών

Παράδειγμα: S1={s11, s12, s13}S2={s21, s22}

Player 2

s22

u1(s13,s22), u2(s13,s22)u1(s13,s21), u2(s13,s21)s13

u1(s12,s22), u2(s12,s22)u1(s12,s21), u2(s12,s21)s12Player 1

u1(s11,s22), u2(s11,s22)u1(s11,s21), u2(s11,s21)s11

s21

Player 2

s22

u1(s13,s22), u2(s13,s22)u1(s13,s21), u2(s13,s21)s13

u1(s12,s22), u2(s12,s22)u1(s12,s21), u2(s12,s21)s12Player 1

u1(s11,s22), u2(s11,s22)u1(s11,s21), u2(s11,s21)s11

s21

Page 52: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

52

Θεωρία στατικών παιγνίων μέσα από παραδείγματα

Τα παίγνια αυτά ονομάζονται παίγνια σταθερού

αθροίσματος

Παράδειγμα

Πίνακες αποδοχών παίγνιου μηδενικούαθροίσματος

-15,150,0-8,8A3

0,02,-2-1,1A2

10,-101,-1-2,2A1

B3B2B1

-150-8A3

02-1A2

101-2A1

B3B2B1

Page 53: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

53

Παράδειγμα: Μερίδιο Αγοράς

Δύο ανταγωνιστικές εταιρείες επιλέγουντην στρατηγική μάρκετινγκ που θαακολουθήσουν.

Firm A επιλέγει ανάμεσα σε: Standard, medium risk, high risk

Firm B επιλέγει ανάμεσα σε: Defend against standard, defend against

medium, defend against high risk

Πίνακας Αποδοχών

10%40%90%High Risk

70%56%60%Medium Risk

80%50%20%Standard

Defend High

Defend Medium

Defend Standard

Firm B

Firm

A

Page 54: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

54

Στρατηγική Maximin-Minimax

Για να βρούμε την ισορροπία: Η Firm B προσπαθεί να ελαχιστοποιήσει την απόδοση

της Firm A Με αυτό σαν δεδομένο η Firm A επιλέγει την

στρατηγική όπου η ελάχιστη απόδοση είναιμεγαλύτερη.

Στρατηγική Maximin: Η Firm A μεγιστοποιεί το ποσότων ελάχιστων αποδόσεων Maximin: Maximize your minimum payoff

Στρατηγική Minimax: Η Firm B ελαχιστοποιεί τοποσό των μέγιστων αποδόσεων Minimax: Minimize your maximum loss

Λύση

10%10%40%90%High Risk

80%

70%

80%

Defend High

56%90%Max

56%56%60%Medium Risk

20%50%20%Standard

MinDefend Medium

Defend Standard

Θεωρία παιγνίων μη σταθερού αθροίσματος μέσα από τους παρακάτω

πινάκες

Page 55: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

55

Το δίλημμα του φυλακισμένου

Παίκτες: {Φυλακισμένος 1, Φυλακισμένος 2}

Στρατηγικές: {S1 ,S2 }= {Δεν Ομολογεί, Ομολογεί}

Συναρτήσεις αποδοχών:u1(ΔΟ, ΔΟ)=-1, u1(ΔΟ, Ο)=-9, u1(Ο, ΔΟ)=0, u1(Ο, Ο)=-6;u2(ΔΟ, ΔΟ)=-1, u2(ΔΟ, Ο)=0, u2(Ο, ΔΟ)=-9, u2(Ο, Ο)=-6

-6 , -60 , -9

-9 , 0-1 , -1Φ 1

Φ 2

Ο

ΔΟ

Ο

ΔΟΠαίκτες

Στρατηγικές

Αποδοχές

Λύνοντας το δίλημμα τουφυλακισμένου Η ομολογία είναι πάντα η καλύτερη

στρατηγική ότι και να κάνει οι άλλος παίκτης. Κυρίαρχη Στρατηγική: η στρατηγική που

είναι πάντα καλύτερη ότι και να κάνει οάλλος παίκτης.

Κυριαρχούμενη Στρατηγική: υπάρχεικάποια άλλη στρατηγική που είναι πάντακαλύτερη ότι και να κάνει ο άλλος παίκτης.

-6 , -60 , -9

-9 , 0-1 , -1

Φυλακισμένος 2

Φυλακισμένος 1 Δεν ομολογεί Ομολογεί

Δεν ομολογεί

Ομολογεί

Page 56: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

56

Αυστηρώς κυριαρχούμενηστρατηγική (strictly dominated strategy)

Στην κανονική μορφή του παιγνίου {S1 , S2 , ..., Sn , u1 , u2 , ..., un}, όπου si', si" Si στρατηγικές τουπαίκτη i.

Στρατηγική si' είναι αυστηρώς κυριαρχούμενη απότην στρατηγική si" αν

ui(s1, s2, ... si-1, si', si+1, ..., sn)< ui(s1, s2, ... si-1, si", si+1, ..., sn)

για όλα s1 S1, s2 S2, ..., si-1Si-1, si+1 Si+1, ..., snSn.

Ασθενώς κυριαρχούμενηστρατηγική (weakly dominated strategy)

Στην κανονική μορφή του παιγνίου {S1 , S2 , ..., Sn , u1 , u2 , ..., un}, όπου si', si" Si στρατηγικέςτου παίκτη i.

Στρατηγική si' είναι ασθενώς κυριαρχούμενηαπό την στρατηγική si" αν

ui(s1, s2, ... si-1, si', si+1, ..., sn)

≤ (αλλά όχι πάντα =) ui(s1, s2, ... si-1, si", si+1, ..., sn)

για όλα s1 S1, s2 S2, ..., si-1Si-1, si+1 Si+1, ..., snSn.

Page 57: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

57

Παράδειγμα

0 , 11 , 2

2 , 00 , 30 , 11 , 0

Player 1

Player 2

Middle

Up

Down

Left Right

Η στρατηγική Right είναι αυστηρώςκυριαρχούμενη από την Middle.

Η στρατηγική Down είναι αυστηρώςκυριαρχούμενη από την στρατηγική Up.

Η στρατηγική Left είναι αυστηρώςκυριαρχούμενη από την στρατηγική Middle

Τουρίστες & Ντόπιοι

Έστω ότι υπάρχουν μόνο δύο καφέ σε ένα νησί Μπορούν αν χρεώσουν τον καφέ €2 or €4 or €5 6000 επιλέγουν τυχαία ένα καφέ 4000 ντόπιοι επιλέγουν το καφέ με την

χαμηλότερη τιμή Παράδειγμα 1:

Και οι δύο χρεώνουν €2 κάθε ένας παίρνει 5,000 πελάτες και €10,000

Παράδειγμα 2: Καφέ 1 χρεώνει €4, Καφέ 2 χρεώνει €5 Καφέ 1 παίρνει 3000+4000=7,000 πελάτες και €28,000 Καφέ 2 παίρνει 3000 πελάτες και €15,000

Page 58: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

58

Λύση

Καφέ 2

25 , 25

28 , 15

14 , 15€5€4

15 , 2815 , 14€5

20 , 2012 , 14€4Καφέ 1

14 , 1210 , 10€2

€2

Αποδόσεις σε χιλιάδες

Καφέ 2

25 , 25

28 , 15€5€4

15 , 28€5

20 , 20€4Καφέ 1

ΘΕΩΡΙΑ ΔΥΝΑΜΙΚΩΝ ΠΑΙΓΝΙΩΝ ΑΚΟΛΟΥΘΟΥΝ ΠΑΡΑΔΕΙΓΜΑΤΑ

Page 59: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

59

Παράδειγμα

Μία εταιρεία έχει το μονοπώλιο σε μία αγορά καιαντιμετωπίζει την πιθανότητα να μπει στην αγορά έναςανταγωνιστής.

Ο ανταγωνιστής μπορεί να επιλέξει να μπει ή να μηνμπει στην αγορά.

Αν ο ανταγωνιστής μπει η εταιρεία μπορεί να επιλέξει ναακολουθήσει ήπια ή επιθετική πολιτική.

Οι αποδοχές είναι γνωστές και στους δύο παίκτες.Ανταγωνιστής

Μπαίνει

Μονοπωλητής

ΉπιαΕπιθετική

1, 2

2, 1 0, 0

Ο πρώτος αριθμός είναι τακέρδη του ανταγωνιστή. Οδεύτερος αριθμός είναι τακέρδη της εταιρείας.

ΔενΜπαίνει

Χαρακτηριστικά ΔυναμικώνΠαιγνίων Πλήρους Πληροφόρησης

Σύνολο παικτών Ποιος κινείται πότε και ποιες είναι οι εναλλακτικές

κινήσεις που έχει στην διάθεση του; Τι γνωρίζουν οι παίκτες όταν αποφασίζουν –

κινούνται; Οι αποδόσεις των παικτών καθορίζονται από τις

επιλογές τους. Όλα τα παραπάνω τα γνωρίζουν όλοι οι παίκτες. Τα δυναμικά παίγνια μπορούμε να τα

αναπαραστήσουμε είτε στην στρατηγική τους μορφήείτε στην εκτεταμένη μορφή.

Page 60: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

60

Εκτεταμένη μορφήΔέντρα Αποφάσεων Ένα δέντρο

αποτελείται απόκόμβους και ευθείες Κάθε ευθεία ενώνει δύο

κόμβους Κάθε ζευγάρι κόμβων

ενώνεται από έναμοναδικό μονοπάτι

Μονοπάτι είναι μία σειράδιακεκριμένων κόμβωνy1, y2,..., yn τέτοια ώστεyi και yi+1 ενώνονται απόμία μοναδική ευθεία, for i=1, 2, ..., n-1.

x0

x1 x2

x3x4 x5 x6

x7 x8

κόμβος

Ευθεία πουενώνει τουςκόμβους x1 και x5

Μονοπάτι από τοx0 στο x4

Εκτεταμένη μορφήΔέντρα Αποφάσεων Σε κάθε δέντρο υπάρχει ένας αρχικός κόμβος από τον

οποίο ξεκινάει το παιχνίδι. Κάθε κόμβος εκτός του αρχικού έχει έναν μοναδικό

κόμβο που προηγείται (predecessor). Κάθε κόμβος που δεν έχει επόμενο κόμβο

(successor) ονομάζεται τελικός (terminal). Κάθε κόμβος εκτός του τελικού αντιπροσωπεύει έναν

παίκτη. Για κάθε κόμβο εκτός του τελικού η ευθεία που τον

ενώνει με τον επόμενο κόμβο αντιπροσωπεύει μίαεναλλακτική που έχει στην διάθεση του ο παίκτης πουαντιπροσωπεύεται από την συγκεκριμένο κόμβο.

Page 61: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

61

Εκτεταμένη μορφήΔέντρα Αποφάσεων Ένα μονοπάτι από τον

αρχικό κόμβο στοντελικό αντιπροσωπεύειμία πλήρη σειράκινήσεων και καθορίζειτην απόδοση του κάθεπαίκτη.

Η στρατηγική ενόςπαίκτη είναι έναπλήρες σχέδιο δράσηςκαι καθορίζει τι θακάνει ο παίκτης σεκάθε περίπτωση.

Player 1

Player 2

H T

-1, 1 1, -1

H T

Player 2

H T

1, -1 -1, 1

Είσοδος σε αγορά

Διαφήμιση και Είσοδος Ένας μονοπωλητής αντιμετωπίζει την πιθανότητα

εισόδου στην αγορά από έναν ανταγωνιστή Ο μονοπωλητής μπορεί να προσπαθήσει να

αποθαρρύνει τον ανταγωνιστεί κάνοντας μίαπολυέξοδη διαφημιστική καμπάνια και μειώνονταςτις τιμές

Ταχύτητα και Ευελιξία Ο ανταγωνιστής είναι «γρήγορος» και

«ευέλικτος». Περιμένει να δει τι θα κάνει ο μονοπωλητής και

μετά να αποφασίσει αν θα μπει στην αγορά.

Page 62: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

62

Εκτεταμένη μορφή παιγνίουExtensive form

Μ

Α

Α

1,1

3,3

2,4

4,2

Ads

No ads

In

Out

In

Out

ΑπόδοσηΜονοπωλητή

ΑπόδοσηΑνταγωνιστή

ΣτρατηγικέςΜονοπωλητή

ΣτρατηγικήΑνταγωνιστή

Παράδειγμα

Δύο ισορροπίες Nash Μπαίνει, Ήπια

Δεν Μπαίνει, Επιθετική

Η δεύτερη δεναποτελεί ισορροπίαNash τέλεια ανάυποπαίγνιο γιατί δεναποτελεί ισορροπίαστο υποπαίγνιο.

Ανταγωνιστής

Μπαίνει

Μονοπωλητής

ΉπιαΕπιθετική

1, 2

2, 1 0, 0

ΔενΜπαίνει

Μονοπωλητής

ΉπιαΕπιθετική

2, 1 0, 0

Page 63: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

63

Παράδειγμα

Ισορροπία Nash τέλεια ανά υποπαίγνιο (DG, E) O παίκτης 1 επιλέγει D και αν ο παίκτης 2 επιλέξει Ε

τότε επιλέγει G

Ο παίκτης 2 επιλέγει Ε

Παίκτης 2

E F

Παίκτης 1

G H 3, 1

1, 2 0, 0

Παίκτης 1

C D

2, 0

Πολλαπλή ισορροπία Nash τέλεια ανά υποπαίγνιο (1)

Τέλεια ανά υποπαίγνιο ισορροπία Nash (D, FHK).

Player 1

CD

Player 2

F G

1, 00, 1

Player 2

J K

1, 32, 2

Player 2

H I

2, 11, 1

E

Page 64: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

64

Πολλαπλή ισορροπία Nash τέλεια ανά υποπαίγνιο (2)

Τέλεια ανά υποπαίγνιο ισορροπία Nash(E, FHK).

Player 1

CD

Player 2

F G

1, 00, 1

Player 2

J K

1, 32, 2

Player 2

H I

2, 11, 1

E

Πολλαπλή ισορροπία Nash τέλειαανά υποπαίγνιο (3)

Τέλεια ανά υποπαίγνιο ισορροπία (D, FIK).

Player 1

CD

Player 2

F G

1, 00, 1

Player 2

J K

1, 32, 2

Player 2

H I

2, 11, 1

E

Page 65: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

65

Παράδειγμα: Κλέφτες καιΑστυνόμοι Έστω ότι έγινε μία ληστεία σε τράπεζα και

πριν προλάβουν να φύγουν οι κλέφτεςφτάνει οι αστυνομία. Οι κλέφτες κρατάνετους πελάτες σαν ομήρους και απειλούννα τους σκοτώσουν αν δεν τους αφήσουνοι αστυνομικοί να φύγουν. Οι αστυνομικοίμπορούν να αφήσουν τους κλέφτες ναφύγουν ή να μπουν μέσα στην τράπεζα.

Πιθανά αποτελέσματα:

Να μπουν μέσα οι αστυνομικοί, οι κλέφτεςνα σκοτώσουν τους ομήρους, να τουςπιάσουν και να κατηγορηθούν για ληστείαμετά φόνου

Να μπουν μέσα οι αστυνομικοί, οι κλέφτεςνα παραδοθούν, να τους πιάσουν και νακατηγορηθούν για απόπειρα ληστείας

Να αφήσουν τους ληστές να φύγουν, οιόμηροι αφήνονται ελεύθεροι

Page 66: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

66

ΕκτεταμένηΜορφή

Παιγνίου

Κλέφτες

Αστυνόμοι

Μπαίνουν στην

τράπεζα

3Αφήνουν κλέφτες

να φύγουν (S,B)

1

Σκοτώνουν ομήρους (W,W)

2Παραδίδονται (B,S)

B: best S: second best W: worst

Παράδειγμα: Παιχνίδι με χαρτιά

Δύο φίλοι αποφασίζουν να παίξουν ένα τυχερόπαιχνίδι. Θα τραβήξουν μία κάρτα από μίατράπουλα με δύο μόνο χαρτιά μία ντάμα (Q) και ένα ρήγα (Κ).

Βάζει ο καθένας από €1 και τραβάει ο 1ος μίακάρτα την βλέπει και ποντάρει €2 ή €4.

Ο 2ος παίκτης μπορεί να κάνει πίσω και ναχάσει το €1 που έβαλε στην αρχή τουπαιχνιδιού ή να δει το χαρτί που τράβηξε ο 1ος. Αν είναι ρήγας τότε κερδίζει ο 1ος αν είναιντάμα κερδίζει ο 2ος.

Page 67: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

67

Εκτεταμένη Μορφή

Ν

Α

Α

Β

Β

Β

Β

5

1

3

1

-5

1

-3

1

K

Q

0,5

0,5

€4

€2

€2

€4

πίσω

βλέπει

βλέπει

βλέπει

βλέπει

πίσω

πίσω

πίσω

Στρατηγική ήΚανονική Μορφή

Για τον παίκτη Α Για τον παίκτη Β

Αν Κ Αν Q

πόνταρε

1 2 2

2 2 4

3 4 2

4 4 4

άτολμος

παράλογος

λογικός

ριψοκίνδυνος

Αν Α€4

Αν Α€2

1 πίσω βλέπει

2 βλέπει βλέπει

3 πίσω πίσω

4 βλέπει πίσω

λογικός

ριψοκίνδυνος

άτολμος

παράλογος

Page 68: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

68

ΕΠΙΛΟΓΟΣ

ΣΥΜΠΕΡΑΣΜΑΤΑ

Η Θεωρία Παιγνίων, αφού καταξιώθηκε ως η σύγχρονη

θεμελίωση της οικονομικής, φιλοδοξεί πλέον να ενοποιήσει όλες τις

κοινωνικές επιστήμες. Από τα μικρά προβλήματα της κοινωνίας (π.χ. το

σχεδιασμό δημοπρασιών) μέχρι τα μεγάλα φιλοσοφικά μας αινίγματα

(π.χ. περί Ηθικής και του ρόλου του Κράτους), η Θεωρία Παιγνίων έχει

άποψη. Εντάσσει τον εαυτό της στα φαινόμενα που καλείται η ίδια να

εξηγήσει. Αντίθετα με τις άλλες προσεγγίσεις στην κοινωνική επιστήμη,

η Θεωρία Παιγνίων υποθέτει ότι κανείς δεν κάνει πράγματα που δεν θα

έκανε αν τη γνώριζε! Οι κοινοί άνθρωποι εμφανίζονται σ’ αυτήν ως

θεωρητικοί και οι θεωρητικοί ως κοινοί άνθρωποι. Πρωτότυπο. Όμορφο.

Ανθρωπιστικό.

Το πρόβλημα με τη Θεωρία Παιγνίων είναι ότι η μαθηματική της

γλώσσα αποκλείει πολλούς από συζητήσεις από τις οποίες δεν θα

έπρεπε να λείπει κανείς. Εκείνοι που ενδιαφέρονται περισσότερο για

την κοινωνική σημασία της Θεωρίας Παιγνίων, συνήθως απωθούνται

από τα μαθηματικά της. Κι εκείνοι που κατέχουν τις απαιτούμενες

τεχνικές, συχνά δεν ενδιαφέρονται για την πολιτική και φιλοσοφική τους

σημασία.

Page 69: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

69

ΠΕΡΙΛΗΨΗ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Το 1944, ο Αυστρο- Ουγγαρέζος μαθηματικός John Von

Neumann και ο Αυστριακός οικονομολόγος Oskar Morgenstern

δημοσίευσαν το πρωτοποριακό έργο τους Theory of Games and

Economic Behavior κι εγκαινίασαν έναν καινούριο επιστημονικό

κλάδο, τη θεωρία παιγνίων. Οι Neumann και Morgenstern ουσιαστικά

τυποποίησαν με μαθηματικούς όρους το πρόβλημα της σύγκρουσης

συμφερόντων. Στις δεκαετίες που ακολούθησαν, η θεωρία παιγνίων έχει

επηρεάσει καταλυτικά αρκετούς κλάδους των κοινωνικών επιστημών και

κυρίως το επιστημονικό πεδίο των Διαπραγματεύσεων.

Η θεωρία παιγνίων θεωρείται μια από τις πιο σημαντικές

ανακαλύψεις του 20ου αιώνα. Βασικό της αξίωμα είναι ότι οι καταστάσεις

σύγκρουσης (όπως σε παίγνια συμμαχιών), τόσο τα συνεργατικά όσο

και τα ανταγωνιστικά συμφέροντα των μερών είναι αλληλένδετα.

Ωστόσο, η ανάπτυξη της θεωρίας παιγνίων σχετίζεται κυρίως με την

καθαρή ανταγωνιστική σύγκρουση, δηλαδή αυτή που συναντάται σε

παίγνια μηδενικού αθροίσματος.

Page 70: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

70

ΠΕΡΙΛΗΨΗ ΣΤΑ ΑΓΓΛΙΚΑ

In 1944, the Austro-Hungarian mathematician John Von Neumann and the

Austrian economist Oskar Morgenstern published the pioneering work Theory

of Games and Economic Behaviour, and launched a new science, the theory of

games. The Neumann and Morgenstern standardization essentially

mathematical terms the problem of conflict of interest. In the decades that

followed, the theory of games has affected several areas of catalyst science and

especially the scientific scope of negotiations.

The theory of games is considered one of the most important discoveries of the

20th century. Its basic premise is that the conflict (as in gaming alliance), both

collaborative and competitive interests of the parties are interdependent.

However, the development of the theory of games related mainly to the net

competitive conflict, namely that which occurs in zero-sum games.

Page 71: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

71

Βιβλιογραφία

Fisher, Ronald (1930) The Genetical Theory of Natural Selection

Clarendon Press, Oxford.

Luce, Duncan and Howard Raiffa Games and Decisions:

Introduction and Critical Survey Dover ISBN 0486659437

Maynard Smith, John Evolution and the Theory of Games,

Cambridge University Press 1982

Morgenstern, Oskar and John von Neumann (1947) The Theory

of Games and Economic Behavior Princeton University Press

Nash, John (1950) "Equilibrium points in n-person games"

Proceedings of the National Academy of the USA 36(1):48-49.

Poundstone, William Prisoner's Dilemma: John von Neumann,

Game Theory and the Puzzle of the Bomb, ISBN 038541580X

Ειδικότερη Βιβλιογραφία

Camerer, Colin (2003) Behavioral Game Theory Princeton

University Press ISBN 0691090394

Gauthier, David (1987) Morals by Agreement Oxford University

Press ISBN 0198249926

Grim, Patrick, Trina Kokalis, Ali Alai-Tafti, Nicholas Kilb, and Paul

St Denis (2004) "Making meaning happen." Journal of

Experimental & Theoretical Artificial Intelligence 16(4): 209-243.

Kavka, Gregory (1986) Hobbesian Moral and Political Theory

Princeton University Press. ISBN 069102765X

Lewis, David (1969) Convention: A Philosophical Study

Maynard Smith, J. and Harper, D. (2003) Animal Signals. Oxford

University Press. ISBN 0198526857

Page 72: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

72

Quine, W.v.O (1967) "Truth by Convention" in Philosophica

Essays for A.N. Whitehead Russel and Russel Publishers. ISBN

0846209705

Quine, W.v.O (1960) "Carnap and Logical Truth" Synthese

12(4):350-374.

Skyrms, Brian (1996) Evolution of the Social Contract Cambridge

University Press. ISBN 0521555833

Skyrms, Brian (2004) The Stag Hunt and the Evolution of Social

Structure Cambridge University Press. ISBN 0521533929.

Sober, Elliot and David Sloan Wilson (1999) Unto Others: The

Evolution and Psychology of Unselfish Behavior Harvard

University Press. ISBN 0674930479

Page 73: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

73

Ιστογραφία

Yale Economic Review: The Rise of Game Theory.

Paul Walker: History of Game Theory Page.

David Levine: Game Theory. Papers, Lecture Notes and much

more stuff.

Alvin Roth: Game Theory and Experimental Economics page -

Comprehensive list of links to game theory information on the

Web

Mike Shor: Game Theory .net - Lecture notes, interactive

illustrations and other information.

Jim Ratliff's Graduate Course in Game Theory (lecture notes).

Valentin Robu's software tool for simulation of bilateral

negotiation (bargaining)

Don Ross: Review Of Game Theory.

Bruno Verbeek and Christopher Morris: Game Theory and Ethics

Chris Yiu's Game Theory Lounge

Elmer G. Wiens: Game Theory - Introduction, worked examples,

play online two-person zero-sum games.

Web sites on game theory and social interactions

http://www.lygeros.org/1044-gr.php

http://www.ceid.upatras.gr/ceidsem/index.php?action=preview.200

8.33