Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
UNIVERSITE MONTPELLIER 1 – FACULTE DE DROIT
LA THEORIE DES JEUX
Mémoire présenté par Alexandre Marce
Master 2 - Droit du Marché
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 1 sur 33
SSOOMMMMAAIIRREE
Sommaire .................................................................................................................... 1
Introduction ................................................................................................................ 2
Chapitre 1 : L’équilibre dans les jeux non coopératifs ................................................. 8
Section 1 : l’equilibre dans les jeux non coopératifs avec information complète……8
§ 1 : L’équilibre de Nash .............................................................................................. .8
§ 2 : Les extensions à l’équilibre de Nash ....................................................................... 12
Section 2 : L’équilibre dans les jeux non coopératifs avec information incomplète .17
§ 1 : L’équilibre dans les jeux simultanés avec information incomplète .............................. 17
§ 2 : L’équilibre dans les jeux séquentiels avec information incomplète .............................. 20
Chapitre 2 : L’équilibre dans les jeux coopératifs ...................................................... 23
Section 1 : L’equilibre dans les jeux de négociation à deux joueurs ......................... 23
§ 1 : Les données du problème ..................................................................................... 23
§ 2 : La solution de Nash ............................................................................................. 24
Section 2 : L’équilibre dans les jeux coopératifs à utilité transférable ..................... 25
§ 1 : Définition et propriétés ......................................................................................... 26
§ 2 : Un concept interressant de solution : la valeur de Shapley ......................................... 27
Conclusion ................................................................................................................ 28
Bibliographie ............................................................................................................. 31
Table des matières ..................................................................................................... 33
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 2 sur 33
IINNTTRROODDUUCCTTIIOONN
Le terme de théorie des jeux désigne aujourd’hui une théorie mathématique des
interactions sociales au sens large. De prime abord, ce terme peut surprendre. Il faut remonter le
cours de son histoire (A) pour retrouver le sens de cette appellation (B).
AA.. LL’’hhiissttoorriiqquuee ddee llaa tthhééoorriiee ddeess jjeeuuxx
L’étude de l’évolution de la théorie des jeux nous ramène aux projets de quelques
mathématiciens qui visaient à élaborer une véritable théorie mathématique des jeux de société.
Selon Christian Schmidt1, on trouve trois étapes dans la construction de la théorie des
jeux. La première correspond au projet philosophique d’une théorie mathématique des jeux de
société, tel qu’il se trouve déjà formulé par Leibniz. La seconde, correspond au recours aux
mathématiques pour résoudre un problème technique posé par un jeu de hasard particulier,
comme chez James Waldegrave2 et Pierre Rémond de Montmort
3. Enfin, la troisième et dernière
étape est celle de la théorisation dans une mathématique appropriée des jeux de société. Cette
dernière peut s’effectuer, soit sur un jeu déterminé, comme celui des échecs pour un auteur
comme Zermelo4, soit à partir d’invariants présents dans un grand nombre de jeux, comme l’ont
entrepris Borel et Von Neumann5. Il semble s’agir au final dans cette ultime étape de la
réalisation du projet Leibnizien.
1 CHRISTIAN SCHMIDT, Quelques repères historiques sur la théorie des jeux, de Leibniz à Von Neuman, 2006.
2 JAMES WALDEGRAVE a été la première personne à discuter de ce qui deviendrait la théorie des jeux
rectangulaires dans une lettre en 1713 au sujet du jeu de le Her.
3 La première référence où les historiens observent l'élaboration d'une stratégie de jeu par recherche d'un maximin
est une lettre de novembre 1713 de PIERRE REMOND DE MONTMORT où il décrit une solution du jeu de Le
Her due à JAMES WALDEGRAVE qui est déjà ce qu'on appelle aujourd'hui une stratégie mixte.
4 A partir de la théorie des ensembles, ERNST ZERMELO a montré qu’il existait une stratégie optimale pour
chacun des joueurs dans un jeu d’échec, autrement dit qu’un ordinateur surpuissant pourrait trouver une stratégie
unique déterminée selon toutes les possibilités choisies par l’adversaire.
5 Le théorème du minimax de JOHN VON NEUMANN (parfois appelé théorème fondamental de la théorie des
jeux à deux joueurs), démontré en 1928, est un résultat important en théorie des jeux.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 3 sur 33
On peut voir que ces trois niveaux coïncident approximativement avec deux périodes
historiques bien différentes. Effectivement, l’histoire de la théorie des jeux commence au début
de XVIIIe siècle. Mais à l’exception de Leibniz, les contributions du siècle des Lumières restent
cantonnées au deuxième niveau, avec des découvertes techniques souvent ingénieuses mais
toujours limitées. Il faut attendre le XXe siècle pour que le programme de recherches leibnizien
prenne réellement corps. La dernière étape de la métamorphose se situe chez Von Neumann et
Morgenstern qui transformèrent, juste avant la Seconde Guerre mondiale, cette théorie des jeux
de société en une théorie des jeux sociaux applicable aux comportements économiques.
Von Neumann et Morgenstern6 dans leur ouvrage Theory of Games and Economic
Behavior7 ont proposé une solution dans le cas particulier d’un jeu où le gain d’un joueur
correspond exactement à la perte subie par l’autre (jeu à somme nulle ou duel). Le jeu d’échecs
est un exemple de jeu où l’antagonisme entre joueurs est ainsi poussé à l’extrême. Les cas
d’application en économie sont rares.
En 19518, Nash a généralisé la solution proposée par Von Neumann et Morgenstern en
essayant de construire une théorie de l’équilibre pour des jeux à somme variable.
Les applications de ce concept à l’économie se sont multipliées à partir des années 1970 et 1980.
C’est en économie industrielle que l’intérêt de ce concept est apparu avec le plus de force parce
qu’il permet d’étudier des situations de concurrence imparfaite où les entreprises adoptent des
comportements stratégiques.
6 En 1944, JOHN VON NEUMANN (1903-1957), mathématicien de génie d’origine hongroise, qui deviendra plus
tard l’un des inventeurs de l’ordinateur, et OSKAR MORGENSTERN (1902-1977), économiste d’origine
autrichienne, publient un impressionnant traité d’étude mathématisée du comportement stratégique intitulé Theory
of Games and Economic Behavior (Théorie des jeux et comportement économique). L’ouvrage, qui fait l’objet
d’une seconde édition en 1947, fonde définitivement la « théorie des jeux ».
7 JOHN VON NEUMANN & OSKAR MORGENSTERN, Theory of games and Economic Behaviour, Princeton
University Press, Second ed., Princeton, 1944.
8 JOHN FORBES NASH, propose sa théorie dans un article d'une page publié en 1950 et une thèse de Doctorat de
27 pages soutenue à l'Université de Princeton en mai 1950 et publié en 1951
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 4 sur 33
BB.. LLeess éélléémmeennttss ccoonnssttiittuuttiiffss ddee llaa tthhééoorriiee ddeess jjeeuuxx
Il convient de présenter la théorie des jeux de manière générale (1), afin de voir qu’il
existe différents types de jeux (2), et que son but est de trouver une solution d’équilibre (3).
11)) PPrréésseennttaattiioonn
Selon Jacques François Thisse9, la théorie des jeux est la discipline mathématique qui
étudie les situations où le sort de chaque participant dépend non seulement des décisions qu’il
prend, mais également des décisions prises par d’autres participants. Le choix optimal pour un
participant dépend généralement de ce que font les autres. Etant donné que chacun n’est pas
totalement maitre de son sort on dit que les participants sont en situation d’interaction
stratégique.
Les participants à un jeu sont appelés joueurs. Chacun d’eux agit pour son propre compte selon
le principe de rationalité économique. Selon ce principe, chacun cherche à prendre les
meilleures décisions pour lui-même.
Au final on peut définir un jeu comme une situation de décisions interactives dans lesquelles
l’utilité (le bien être) de chaque individu dépend des décisions des autres individus.
Les précédents propos de Jacques François Thisse rejoignent ceux de Murat
Yildizoglu10
. Selon lui, la théorie des jeux se base sur une double hypothèse. D’une part, les
décideurs sont rationnels et ils poursuivent des objectifs exogènes et indépendants, et d’autre
part, ils tiennent compte de la connaissance qu’ils ont ou des anticipations qu’ils font du
comportement des autres décideurs.
En définitive, on peut dire que c’est sur la base de ces deux hypothèses que la théorie des jeux
propose des modèles qui sont des représentations très abstraites de situations réelles.
La théorie des jeux utilise les mathématiques pour exprimer formellement ses idées, mais
ces idées ne sont pas essentiellement mathématiques. La formulation mathématique est utilisée
9 JACQUES FRANÇOIS THISSE, Théorie des Jeux : Une introduction.
10
MURAT YILDIZOGLU (enseignant chercheur à l’université d’Aix-Marseille) : Introduction à la théorie des
jeux, Dunod, 2003.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 5 sur 33
par commodité, dans le but de définir précisément les concepts et de vérifier leurs implications
avec rigueur.
22)) LLeess ddiifffféérreennttss ttyyppeess ddee jjeeuuxx
Différents contextes d’interaction induisent différents types de jeux entre les agents.
Selon Murat Yildizoglu un jeu est « une description de l’intérêt des joueurs et de l’interaction
stratégique qui spécifie les contraintes qui pèsent sur les actions que les joueurs peuvent
choisir ».
Et selon lui, une solution est « la description systématique des situations qui peuvent émerger
comme le résultat d’une famille de jeux ». La théorie des jeux propose donc des solutions
potentielles pour des familles de jeux et étudie leurs propriétés.
En des termes moins techniques on peut dire qu’un jeu est une situation où des joueurs
sont conduits à faire des choix stratégiques parmi un certain nombre d'actions possibles, et dans
un cadre défini à l'avance qui seront les règles du jeu, le résultat de ces choix constituant une
issue du jeu, à laquelle est associé un gain (ou payement), positif ou négatif, pour chacun des
participants.
On peut classer selon trois dimensions les différents contextes d’interaction. Ils peuvent
être basés en fonction du déroulement dans le temps, en fonction de l’information dont disposent
les agents, et enfin en fonction du type de relation entre les joueurs.
Concernant le déroulement dans le temps, on peut dire qu’un jeu peut être simultané ou
séquentiel. Un jeu simultané (ou stratégique) est le modèle d’une situation où chaque joueur
choisit son plan d’action complet une fois pour toutes au début du jeu. Dans ce cas on voit bien
que les choix de tous les joueurs sont simultanés. Par contre dans un jeu séquentiel, chaque
joueur considère son plan d’action non seulement au début du jeu mais aussi chaque fois qu’il
doit prendre une décision pendant le déroulement du jeu.
Ensuite les différents contextes d’interactions peuvent être basés en fonction de l’information
dont disposent les agents. Ainsi on dit que l’information est parfaite si chaque joueur est
parfaitement informé des actions passées des autres joueurs et l’information est imparfaite
quand un joueur ignore certains des choix qui ont été effectués avant le sien. En outre, un jeu
est à information incomplète si au moins un des joueurs ne connait pas parfaitement la structure
du jeu, et dans le cas contraire il sera à information complète.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 6 sur 33
Enfin concernant la distinction entre jeux coopératifs et jeux non coopératifs, on peut dire qu’un
joueur peut être interprété comme un individu seul ou un groupe d’individus prenant une
décision. Les jeux non coopératifs vont correspondre aux jeux dont les éléments de base sont les
actions des joueurs individuels, les jeux coopératifs correspondent à ceux basés sur les actions
jointes d’un groupe.
33)) LLeess ssoolluuttiioonnss eett ééqquuiilliibbrreess dd''uunn jjeeuu
Murat Yilzidoglu nous apprend que la théorie des jeux est basée sur une représentation
plus fine des stratégies des joueurs en fonction de la situation d’interaction et de la
représentation retenue du jeu.
D’une manière générale, une stratégie d’un joueur doit spécifier une action pour ce joueur
chaque fois qu’il est susceptible de joueur. Un profil de stratégies spécifie un déroulement
complet du jeu en précisant une stratégie par joueur.
La théorie des jeux, ou tout au moins l’usage qu’il en est fait en économie, centre
l’analyse autour de l’étude des équilibres. Un concept d’équilibre donne pour chaque jeu une
prédiction sur son issue, l’état d’équilibre étant soumis à la condition que si les joueurs s’y
trouvent, ils n’ont aucun intérêt à en dévier unilatéralement.
Cependant, un concept d’équilibre n’explicite pas la manière dont les joueurs vont se
coordonner sur un état d’équilibre. La question de la coordination est centrale à cause de la
nature auto-référentielle des problèmes d’optimisation des joueurs. Ce qui est bien pour le
joueur A dépend de ce que fait le joueur B, qui dépend également de ce que fait le joueur A, etc.
Ainsi, les joueurs n’adopteront la stratégie d’équilibre prescrite par le concept que s’ils ont de
bonnes raisons de penser que les autres joueurs l’adopteront aussi. La condition de stabilité de
l’équilibre n’est pas suffisante pour assurer que les joueurs vont se coordonner dessus.
Si les équilibres sont, en règle générale, des situations privilégiées par le modélisateur,
c’est parce qu’ils sont, par définition, des situations non éphémères, considérées comme des "
points d’attraction " du système.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 7 sur 33
L’équilibre est donc la meilleure solution d’un jeu. Il convient de s’interroger sur cette
notion, en se demandant comment se caractérise une solution d’équilibre en fonction des
différents types de jeux ?
Nous verrons que les concepts de solutions diffèrent selon les types de jeux. Ainsi, on
peut arriver à un résultat d’équilibre tout aussi bien dans les jeux non coopératifs (Chapitre 1)
que dans les jeux coopératifs (Chapitre 2).
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 8 sur 33
CCHHAAPPIITTRREE 11 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX NNOONN
CCOOOOPPÉÉRRAATTIIFFSS
Les jeux non coopératifs correspondent à des situations d’interaction entre individus
libres dans leurs choix et poursuivant des objectifs propres et indépendants. Ces individus ne
communiquent pas avant le jeu et n’ont pas nécessairement le moyen de s’engager à poursuivre
une stratégie particulière.
On peut trouver une solution d’équilibre dans ces jeux non coopératifs. Ces jeux peuvent
être à information complète, si tous les joueurs connaissent parfaitement la structure du jeu
(Section 1), ou à information incomplète si au moins un des joueurs ne connait pas parfaitement
la structure du jeu (Section 2).
SSEECCTTIIOONN 11 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX NNOONN CCOOOOPPÉÉRRAATTIIFFSS
AAVVEECC IINNFFOORRMMAATTIIOONN CCOOMMPPLLÈÈTTEE
Le concept de solution qui est le plus communément admis a été proposé par John Nash
en 1951 ; son application se veut générale pour certains jeux non coopératifs à information
complète que l’ont peut considérer comme « classiques » (§1), cependant il a fallu effectuer
quelques aménagements pour étendre ce concept à des situations d’interactions plus
« sophistiquées » (§2).
§§ 11 :: LL’’ééqquuiilliibbrree ddee NNaasshh
L’idée de l’équilibre de Nash est extrêmement simple en soi et cohérente avec l’essence
des jeux non-coopératifs. Mais cette notion n’est pas née du jour au lendemain, il y a eu des
prémisses (A) avant d’arriver à la définition actuelle de l’équilibre de Nash (B) qui revêt de
nombreux caractères (C).
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 9 sur 33
AA.. LLeess pprréémmiisssseess ddee ll’’ééqquuiilliibbrree ddee NNaasshh
Avant Nash, la détermination de situation stable n'avait pas de méthode formelle, même
si l'existence d'équilibres pour les jeux à somme nulle était connue depuis 1926, via le théorème
du minimax de Von Neumann.
Ce théorème du minimax de John Von Neumann (parfois appelé théorème fondamental
de la théorie des jeux à deux joueurs) a été démontré en 1928, il assure que, pour un jeu non-
coopératif synchrone à information complète opposant deux joueurs, il existe au moins une
situation d'interaction stable, à savoir une situation dans laquelle aucun des deux joueurs n'a
intérêt à changer sa stratégie mixte si l'autre ne la change pas.
John Nash, dans un article d'une page publié en 1950 et une thèse de Doctorat de 27
pages soutenue à l'Université de Princeton en mai 1950 et publié en 1951 vient généraliser le
théorème du minimax à diverses situations.
On peut dire que l'équilibre de Nash constitue la pierre angulaire de la théorie des jeux moderne.
Il caractérise l'issue "logique" du jeu, c'est à dire la manière dont devraient se comporter des
joueurs rationnels.
Même si la traduction courante d'un équilibre de Nash peut paraître simpliste, les
considérables possibilités de résolution ouvertes par Nash lui ont mérité le « Prix Nobel »
d'économie en 1994, conjointement à Reinhard Selten et John Harsanyi.
BB.. LLaa ddééffiinniittiioonn aaccttuueellllee ddee ll’’ééqquuiilliibbrree ddee NNaasshh
L'équilibre de Nash, est défini par Nicolas Eber comme « un ensemble de stratégies (une
par joueur) tel qu’aucun joueur ne peut obtenir un gain supplémentaire en changeant
unilatéralement de stratégie ».
Selon Gisèle Umbhauer11
, l’équilibre de Nash est « un profil de stratégies qui présentent
une stabilité minimale », c’est-à-dire la stabilité aux déviations unilatérales. Ainsi, un profil de
stratégies constitue un équilibre de Nash, si et seulement si aucun joueur ne peut améliorer son
utilité s’il est le seul à s’écarter de la stratégie prévue par le profil.
11 GISÈLE UMBHAUEUR (Maitre de conférence à l’Université de Strasbourg), La théorie des jeux appliquée à la
gestion, EMS Management & Société, 2002.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 10 sur 33
Autrement dit, l’équilibre de Nash correspond à une situation dans laquelle l'équilibre entre
plusieurs joueurs, connaissant leurs stratégies réciproques, est devenu stable du fait qu'aucun ne
modifie sa stratégie sans affaiblir sa position personnelle.
Dans ce contexte, l’équilibre de Nash cherche les résultats qui sont stables par rapport aux
déviations individuelles, donc unilatérales.
Au final l'équilibre de Nash renvoie à un critère "d'absence de regret". En effet, il
implique qu'aucun des joueurs ne regrette d'avoir joué comme il l'a fait, étant donné la manière
dont les autres joueurs ont joué.
Cette définition s'applique à des jeux avec n'importe quel nombre de joueurs. Nash a démontré
que tous les résultats trouvés avant lui conduisaient à des équilibres stables dans son sens.
Nous pouvons illustrer nos propos avec l’exemple du jeu pierre-papier-ciseaux qui
n'admet pas d'équilibre avec des stratégies pures (si on choisit à toutes les parties « pierre » par
exemple, l'autre personne augmentera son gain en choisissant « feuille ». Mais alors le premier
joueur choisira ensuite « ciseau ». Etc., on n'arrivera jamais à un équilibre). Par contre, si on
étend ce jeu aux stratégies mixtes, il y a un point d'équilibre d'après le théorème de Nash (et on
peut montrer qu'il est unique). Ce point est donné en choisissant (1/3) « pierre » + (1/3)
« ciseau » + (1/3) « papier », c'est-à-dire, du point de vue probabiliste, de jouer avec une
probabilité (1/3) chacune des trois possibilités.
CC.. LLeess iinnssuuffffiissaanncceess ddee ll’’ééqquuiilliibbrree ddee NNaasshh
La principale insuffisance de l’équilibre de Nash réside dans le fait qu’il n’est pas
forcément unique. Ce sera le cas dans lequel deux résultats seront vraisemblables.
Cette multiplicité des choix va poser quelques problèmes, et notamment au niveau de leur
coordination. On pourrait se demander quel choix effectuer, Thomas Schelling12
nous apporte
une réponse.
12 THOMAS CROMBIE SCHELLING (né le 14 avril 1921) est un économiste américain, ainsi qu'un professeur de
politique étrangère, de sécurité nationale, de stratégie nucléaire et de contrôle des armes à la School of Public Policy
de l'université du Maryland à College Park. Son ouvrage le plus célèbre, The Strategy of Conflict a ouvert la voie à
l'étude des paris et du comportement stratégique. On l'a cité parmi les 100 ouvrages qui ont "le plus influencé" la
pensée occidentale après la Seconde Guerre mondiale.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 11 sur 33
Le point de Schelling ou point focal est une solution à laquelle les participants à un jeu
de « coordination pure » qui ne peuvent pas communiquer entre eux sur ce sujet auront tendance
à se rallier, parce qu'elle leur semble présenter une caractéristique qui la fera choisir aussi par
l'autre.
C'est l'économiste américain Thomas Schelling qui l'a présentée pour la première fois en
1960 dans son plus fameux ouvrage, The Strategy of conflict (en français La Stratégie du conflit,
198613
).
Thomas Schelling donne en exemple l'incident qui l'a porté vers cette réflexion lors d'un
voyage, celui de deux personnes qui sont séparées fortuitement, sans avoir pu se donner rendez-
vous. Où ont-elles le plus de chances de se retrouver, chacune connaissant ses propres
préoccupations, ce que l'autre en sait, et celles de l'autre ? Les critères étant qu'on puisse le
trouver et l'atteindre facilement, il était arrivé à trois endroits : la mairie, le commissariat mais à
l'époque, le bureau de poste présentait un avantage de plus. Dans les années 1950, d'après un
questionnaire qu'il leur avait été remis, le point focal de ses étudiants à Yale était l'horloge de la
Grand Central Station à New York, parce que les filles étudiaient à des universités différentes et
qu'il fallait prendre le train pour se rencontrer. Celui des non étudiants, la poste centrale. À
Paris, on peut dire que le point focal est la Tour Eiffel.
Les théoriciens se sont empressés d'imaginer des situations plus formalisées,
artificiellement simplifiées, comme le jeu où on présente à deux participants isolés deux
panneaux identiques portant chacun quatre cases, en leur annonçant que si les deux choisissent
la même, ils recevront une récompense. Il suffit que l'une des cases présente une caractéristique
qui la distingue des autres (comme une couleur différente) pour que chacun, sachant que l'autre
peut l'observer aussi, trouve rationnel de la désigner. Et c'est ce que les expériences montrent
dans la plupart des cas.
En dernier lieu on peut dire que dans certains types de jeux la recherche d’un équilibre
de Nash tel qu’on vient de le présenter sera difficile. C’est pourquoi quelques ajustements, ou
élargissements de ce concept en vue de son application sont nécessaires.
13 THOMAS CROMBIE SCHELLING, La stratégie du conflit, PUF, 1986.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 12 sur 33
§§ 22 :: LLeess eexxtteennssiioonnss àà ll’’ééqquuiilliibbrree ddee NNaasshh
On trouve alors plusieurs extensions possibles à l’équilibre de Nash, notamment en
matière de sous jeux, dans lesquels il faudra rechercher un équilibre parfait (A). On étend aussi
l’équilibre de Nash aux jeux répétés (B).
AA.. EEqquuiilliibbrree PPaarrffaaiitt eenn SSoouuss JJeeuuxx
Il faut voir si il est possible d’identifier une solution d’équilibre lorsque nous sommes en
présence de sous jeux (1), et voir le cas échéant quelle en sera la méthode d’identification (2).
11)) SSoouuss jjeeuuxx eett EEqquuiilliibbrree ppaarrffaaiitt
Selon Nicolas Eber14
, dans son ouvrage Théorie des jeux15
, on appelle sous jeu « tout jeu
issu du jeu original, partant d'un nœud de décision isolé (c'est à dire un nœud dont l'ensemble
d'information ne contient aucun autre nœud) et comprenant tous les nœuds qui en découlent
directement ».
L'équilibre de Nash parfait en sous jeux, dû à Reinhard Selten16
en 197517
, constitue le premier
raffinement de l'équilibre de Nash.
Un équilibre de Nash est dit parfait en sous jeux si et seulement si il induit un équilibre de Nash
dans chacun des sous jeux considéré. Nous auront donc une multitude d’équilibre de Nash.
Au final le concept d'équilibre de Nash parfait en sous jeux permet de trier parmi les
équilibres de Nash, en en déterminant des plus raisonnables que d'autres. Plus précisément, le
critère de perfection en sous jeux vise à éliminer les équilibres de Nash qui reposent sur des
menaces non crédibles.
14 NICOLAS EBER est un professeur de sciences économiques à l'Institut d'études politiques de Strasbourg où il
enseigne la microéconomie et la théorie des jeux. Il est aussi membre du LARGE (Laboratoire de recherche en
gestion et économie).
15 NICOLAS EBER, Théorie des jeux, Dunod, 2007.
16 REINHARD SELTEN (né le 5 octobre 1930) est un économiste allemand, professeur émérite à l'Université de
Bonn. Il a recours à une simplification pour pouvoir remédier à la multiplicité des équilibres possibles d'un
oligopole. Il décide de décomposer les jeux en sous-jeux et développe le concept "d'équilibre en sous-jeu parfait",
17 REINHARD SELTEN, Reexamination of the perfectness concept for equilibrium points in extensive games,
International Journal of Game Theory 4, 25-55, 1975.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 13 sur 33
Mais qu’est-ce qu’une menace non crédible ? Prenons l’exemple d’un terroriste qui monte sur
l'avion Strasbourg-Paris. Après 10 minutes de vol, le terroriste s'approche du pilote et le menace
de faire exploser l'avion s'il n'atterrit pas à Damas. Le pilote a le choix entre continuer le vol
vers Paris ou prendre la direction de Damas. Après avoir observé le choix du pilote, le terroriste
a le choix entre faire exploser la bombe ou abandonner. Le pilote n'a qu'un seul nœud de
décision, ses stratégies contiennent alors une action unique : choisir entre Paris et Damas. Le
terroriste a deux nœuds de décisions : un après le choix de Damas par le pilote et un après Paris.
Ses stratégies doivent donc préciser une action à chacun de ces nœuds. Nous sommes donc face
à un sous jeu. Dans ces deux sous jeux le terroriste aura la possibilité de faire exploser l’avion,
ou alors d’abandonner. L'équilibre de Nash (Damas (abandon ou explosion) est soutenu par la
menace du terroriste de faire exploser l'avion si le pilote décide de prendre la direction de Paris.
Est-ce raisonnable ? En effet, si le pilote décide effectivement d'aller à Paris le terroriste aura au
regard de la théorie des jeux un gain plus important en abandonnant sa menace. Théoriquement,
faire exploser la bombe correspond à une menace non crédible, et cet équilibre est soutenu par
cette menace. L’équilibre de Nash le plus probable sera donc celui consistant à choisir Paris
pour le pilote, et à abandonner pour le terroriste (Paris, abandon), ce sera le choix le plus
rationnel.
La recherche des équilibres de Nash parfaits en sous-jeux est simplifiée par l’application
de la méthode de l’induction à rebours.
22)) LLee pprriinncciippee ddee BBeellllmmaann eett ll’’iinndduuccttiioonn àà rreebboouurrss
La Programmation Dynamique est une méthode exacte de résolution de problèmes
d’optimisation séquentielle, due essentiellement à Richard Bellman18
en 1957. L’induction à
rebours (en anglais : backward induction) est issue de ce raisonnement.
Le principe de Bellman veut que pour résoudre un problème d’optimisation dynamique, on
commence par chercher le choix optimal de la dernière période, puis on remonte le temps de
période en période en cherchant à chaque période le choix optimal, une fois qu’on a pris en
compte les choix optimaux des périodes antérieures.
18 RICHARD ERNEST BELLMAN (29 août 1920; 19 mars 1984) est un mathématicien américain. Il étudia les
mathématiques appliquées. Célèbre pour diverses contributions dans plusieurs domaines des mathématiques, il est
surtout l'inventeur de la programmation dynamique, qui résolut à son époque de façon inespérée l'optimisation des
sommes de fonctions monotones croissantes sous contraintes.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 14 sur 33
En 2002 Gisèle Umbhauer dans son ouvrage « La théorie des jeux appliquée à la
gestion » a proposé le terme de « rétroduction » qui semble plus commun.
Selon elle, la rétroduction conduit les acteurs à envisager leur action présente en fonction
d'actions futures, et, est de ce fait liée au sens inverse de la flèche du temps. Elle n'est pas pour
autant contre intuitive. Le fait est que la majeure partie des décisions réelles se prennent en
tenant compte des réactions futures qu'elles suscitent : le futur entre dans les actes présents.
BB.. EEqquuiilliibbrree ddeess JJeeuuxx RRééppééttééss
Nous avons présenté jusqu’à présent des situations où l’interaction entre les joueurs n’a
lieu qu’une seule fois. Cependant beaucoup d’interactions se déploient dans le temps de manière
répétée.
Il convient de présenter le sens de ces jeux répétés (1) et de souligner la particularité de certains
d’entre eux : les jeux répétés indéfiniment (2).
11)) LLeess jjeeuuxx rrééppééttééss :: iiddééeess ddee bbaassee
Selon Thierry Pénard19
un jeu répété est « un jeu ordinaire réitéré plusieurs fois de
suite ». Par jeu ordinaire, il faut entendre un jeu statique (joué une seule fois) dans lequel les
joueurs choisissent simultanément leurs stratégies.
Historiquement, la théorie des jeux est une théorie des jeux statiques. Il a fallu attendre les
années 1970 pour penser les jeux à plusieurs périodes comme des jeux à part entière. Il n’est pas
abusif de parler aujourd’hui d’une théorie des jeux répétés tant il est vrai que cette dernière a
acquis une véritable autonomie conceptuelle par rapport à la théorie des jeux statiques.
Un jeu répété (en anglais « repeated game ») au sens strict est un jeu répété stationnaire : c’est
le même jeu ordinaire, appelé jeu constituant, qui est répété de période en période. Les
conditions de jeu ne se modifient pas au cours du temps : même nombre de joueurs, mêmes
ensembles de stratégies, mêmes fonctions de gain, même facteur d’actualisation.
19 THIERRY PÉNARD (professeur d'économie à l'Université de Rennes 1) : La théorie des jeux répétés :
application à la concurrence oligopolistique, 1998.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 15 sur 33
Selon Nicolas Eber, les jeux répétés peuvent être vus comme des jeux dynamiques un
peu particuliers. De ce fait, ils seront résolus de la même manière, c'est à dire en recherchant
l'ensemble des équilibres de Nash parfaits en sous jeux par la méthode d'induction à rebours.
22)) LLeess jjeeuuxx rrééppééttééss uunn nnoommbbrree iinnffiinnii ddee ffooiiss
Nicolas Eber souligne un point particulier au sujet des jeux répétés indéfiniment. Dans
ces jeux, il s'agit en fait de supposer que le jeu se poursuit indéfiniment ou, que les joueurs
pensent que tel est le cas ou, d'une façon à peu près équivalente, mais plus réaliste, que les
joueurs n'ont aucune information sur la date de fin du jeu. Dans ce cas la dernière période n'est
plus identifiée et on ne peut plus appliquer la méthode d'induction à rebours.
Dans ce cas il est établi l'existence d'un très grand nombre d'équilibres de Nash parfaits en sous
jeux, sans possibilité de trier parmi ces équilibres. Cette multitude d'équilibres est synonyme
d'indétermination puisqu’aucune prédiction ne pourra être faite sur l'issue du jeu.
Alors comment sortir de ce dilemme ? Une première réponse apportée par le théorème «
folk » est de considérer que la situation responsable du dilemme n’est pas unique mais est
appelée à se renouveler régulièrement. Ce théorème doit son nom au fait qu'il n'est pas associé
nominativement à un auteur en particulier. Le folk theorem suggère que dans les cas de jeux
répétés, tout équilibre peut être sélectionné. De ce fait, des critères externes au jeu vont guider la
sélection. Ainsi, après un certain nombre de tours, un équilibre particulier peut se révéler porteur
de gains plus élevés que l'autre, sembler plus naturel, plus juste ou moins dangereux.
La coopération peut alors s’avérer une des solutions possibles car en coopérant, les acteurs
instaurent entre eux une relation de confiance qui leur permet de gagner davantage à chaque
rencontre que s’ils se trahissent dès le départ. Sur la durée, la coopération peut donc être
payante. Encore faut-il que les joueurs adoptent les stratégies adéquates.
Nous pouvons souligner une émergence de la coopération au sein de jeux qui à la base se
veulent être non coopératifs.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 16 sur 33
Nous pouvons illustrer nos propos en présentant un exemple concret. Il s’agit de
l’expérience de Robert Axelrod20
.
Il a étudié en 1984 le phénomène de la coopération en organisant un tournoi informatique
confrontant diverses stratégies. Pour cela, il avait invité des collègues de différentes disciplines à
soumettre un programme informatique pour jouer un dilemme du prisonnier répété 200 fois.
Chaque programme contenait la stratégie que désirait suivre le joueur. Ainsi, furent soumises
notamment la stratégie donnant-donnant, qui consiste à coopérer dans un premier temps pour
ensuite imiter les actions de l'autre joueur, ou encore la stratégie rancunière, qui consiste à
coopérer initialement mais à trahir jusqu’à la fin du jeu en cas de trahison de l’autre joueur.
Chaque programme était confronté à tous les autres, à lui-même et à un programme jouant au
hasard. Le programme ayant accumulé le gain total le plus élevé était déclaré vainqueur du
tournoi. Dans un premier temps, 14 programmes furent proposés. La stratégie donnant-donnant
remporta le tournoi. Devant ce résultat, Axelrod organisa un second tournoi. 62 programmes
provenant de 6 pays différents furent soumis. C’est à nouveau le programme donnant-donnant
qui l’emporta. On pourrait appeler aussi cette stratégie « œil pour œil, dent pour dent ».
L'analyse d’Axelrod montre qu'une bonne stratégie est caractérisée par quatre qualités qui en
garantissent le succès. Une bonne stratégie doit être bienveillante : elle ne doit jamais prendre
l’initiative de la première trahison. Elle doit aussi pouvoir être réactive : face à une action
hostile non sollicitée, elle doit répliquer. Elle doit être indulgente : après avoir puni son
adversaire, elle doit pouvoir coopérer de nouveau. Enfin, elle doit être transparente : les autres
joueurs doivent pouvoir anticiper les conséquences de leurs actions.
20 ROBERT AXELROD (né en 1943) est professeur de science politique à l’université du Michigan, lauréat du prix
MacArthur en 1987. Ses travaux sur l'évolution de la coopération, liée à la théorie des jeux, ont été cités dans plus
de cinq mille articles scientifiques. Il est président de l’American Political Science Association (APSA) pour
l'année 2006-2007.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 17 sur 33
SSEECCTTIIOONN 22 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX NNOONN CCOOOOPPÉÉRRAATTIIFFSS
AAVVEECC IINNFFOORRMMAATTIIOONN IINNCCOOMMPPLLÈÈTTEE
Comme nous l’avons déjà dit, un jeu à information incomplète est un jeu dans lequel au
moins un des joueurs ne connait pas parfaitement la structure du jeu. Ces jeux peuvent être
simultanés ou séquentiels. Dans un jeu simultané chaque joueur choisit son plan d’action
complet une fois pour toutes au début du jeu, à contrario dans un jeu séquentiel, chaque joueur
choisit son plan d’action à chaque fois qu’il doit prendre une décision pendant le déroulement du
jeu.
On va pouvoir trouver des solutions d’équilibre dans les jeux simultanés avec
information incomplète (§1) et des jeux séquentiels avec information complète (§2).
§§ 11 :: LL’’ééqquuiilliibbrree ddaannss lleess jjeeuuxx ssiimmuullttaannééss àà iinnffoorrmmaattiioonn iinnccoommppllèèttee
Les jeux en information incomplète (ou jeux bayésiens) cherchent à analyser le type de
situation où les joueurs ne connaissent pas parfaitement les données du jeu. Le problème dans ce
cas réside dans l’incomplétude, car si les joueurs ne connaissent pas parfaitement le jeu,
comment pourront-ils réagir de manière rationnelle et à quel type de résultat pourront nous
aboutir dans ce jeu ? On ne pourra pas trouver de résultat d’équilibre tant que l’on n’aura pas
corrigé cette situation.
Ce problème va pouvoir être corrigé avec la méthode de Harsanyi (A), et nous permettra
d’arriver à un équilibre de Nash bayésien (B).
AA.. LLaa mméétthhooddee ddee HHaarrssaannyyii
Jusqu'au milieu des années 1960, l'incomplétude de l'information posait un problème de
modélisation parce qu'elle ouvrait sur l'intersubjectivité, les paramètres inconnus faisant l'objet
d'anticipations croisées, ce qui conduit à des anticipations d'ordre infini qui interdisent
l’échange.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 18 sur 33
John Harsanyi21
a résolu ce problème en transformant des jeux en information incomplète (dans
lesquels chaque joueur connaît sa propre évaluation et ignore celles des autres) en des jeux ayant
la structure mathématique d'un jeu complet. Rappelons comment s’opère cette transformation.
Un acteur particulier, Nature, détermine par une loterie les valeurs effectives des
variables pertinentes du jeu sur lesquelles porte l'incertitude, c’est à dire les valeurs des vecteurs
c 1 ,…, ci,...,cn qui représentent les attributs de chacun des n joueurs. Le joueur i reçoit une
information partielle sur les valeurs de ces vecteurs puisqu'il connaît ses propres caractéristiques
(ci) mais ignore celles des autres. John Harsanyi nous dit que dans un jeu devenu complet, les
vecteurs ci doivent être interprétés comme des vecteurs aléatoires qui suivent une distribution de
probabilité objective connue de tous les n joueurs. Le vecteur ci qui exprime quelle est la
dotation aléatoire du joueur i s'interprète, selon Harsanyi, de deux façons : il représente soit
toute l'information disponible du joueur i vis à vis du jeu, soit les caractéristiques du joueur i,
par exemple, sa force physique, ses goûts… Quelle que soit l’interprétation, le vecteur ci inclut
toutes les variables susceptibles d’influencer l’estimation que formulera a priori le joueur i.
L'habitude a été prise de résumer la méthode d'Harsanyi par la formule « la Nature joue en
premier », puisque c'est elle qui organise une loterie dont le tirage donne la loi de probabilité
initiale qui définit la répartition des caractéristiques des joueurs. On a également pris l'habitude
d'exprimer ces hypothèses en considérant que le vecteur ci correspond à un type de joueur, que
chaque joueur connaît seulement son propre type et, en général, ne connaît pas celui des autres
joueurs. Les probabilités subjectives des agents sur les caractéristiques inconnues sont déduites
de la loi de probabilité initiale, étant données leurs informations privées. Par ce procédé,
l'intersubjectivité inhérente aux anticipations croisées disparaît, remplacée par des probabilités
subjectives. Les probabilités subjectives formulées par les joueurs s'analysent comme des
estimations personnelles de la loi de probabilité initiale venant de la Nature qui est tenue pour
objective. Ainsi, les croyances sur les autres ont cessé d’être le produit d’une spéculation sans
fin.
Prenons un exemple pour illustrer nos propos. Une entreprise B doit décider si elle se
lance dans la production d'un bien jusqu'alors fourni par une entreprise A. Comment peut-elle le
21 JOHN CHARLES HARSANYI (29 mai 1920 - 9 août 2000) est un économiste hongro-australien, naturalisé
américain. Il a contribué au développement de la théorie des jeux en mathématiques en approfondissant l'analyse
des jeux à information incomplète. Pour ses travaux en théorie des jeux, il reçoit en 1994, en même temps que
John Forbes Nash et Reinhard Selten, le « Prix Nobel » d'économie.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 19 sur 33
faire si elle ne connaît pas les coûts de A ? B sait seulement que si A a des coûts faibles, A a
intérêt à s'entendre avec B pour partager le marché et à refuser l'entente dans le cas contraire.
John Harsanyi propose d'introduire un joueur fictif qui décide du « type » de A : A1 si elle a des
coûts faibles, A2 dans le cas contraire. On peut alors affecter à chaque situation de manière
séquentielle des probabilités pour déterminer le chemin optimal de B.
La résolution des jeux à information incomplète nécessite un aménagement du concept
d'équilibre de Nash. Pour les jeux statiques, cet aménagement consiste à définir la notion
d'équilibre bayésien.
BB.. LL’’ééqquuiilliibbrree ddee NNaasshh bbaayyééssiieenn
Pour ce type de jeux, l'incertitude porte généralement sur une caractéristique d'un joueur,
c'est à dire sur ce qu'on appelle le type du joueur, qui correspond au paramètre de sa fonction
(paramètre du cout ou de demande par exemple).
Dans ce contexte d'incertitude, il convient de modifier un peu la notion de stratégie que nous
avons utilisée jusqu'à présent en introduisant le concept de stratégie contingente aux types.
Une stratégie contingente aux types d'un joueur est une règle d'action spécifiant une action
faisable pour chacun des types possibles du joueur.
Ce nouveau concept de stratégie permet de donner une définition de l'équilibre bayésien
similaire à celle de l'équilibre de Nash.
Nicolas Eber défini l'équilibre bayésien comme « un ensemble de stratégies contingentes
aux types (une par joueur) tel que chaque joueur maximise son espérance de gain étant donné les
stratégies contingentes aux types des autres joueurs et les distributions de probabilité sur les
types de ces autres joueurs ».
Un résultat théorique important est que tout jeu statique fini à information incomplète admet au
moins un équilibre bayésien. Au final on peut dire que ce résultat est une extension directe du
théorème de Nash pour ces jeux.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 20 sur 33
§§ 22 :: LL’’ééqquuiilliibbrree ddaannss lleess jjeeuuxx ssééqquueennttiieellss aavveecc iinnffoorrmmaattiioonn iinnccoommppllèèttee
Dans les jeux séquentiels avec information incomplète, on complète l’information
exactement de la même manière que pour les jeux statiques, en introduisant un coup initial par le
joueur fictif « Nature ».
Dans un jeu séquentiel, la présence de l’information incomplète implique une insuffisance de
l’équilibre parfait en sous jeux (A), ce qui implique le recours à l’équilibre bayésien parfait (B).
AA.. LL’’iinnssuuffffiissaannccee ddee ll’’ééqquuiilliibbrree ppaarrffaaiitt eenn ssoouuss jjeeuuxx
Murat Yildizoglu nous apprend que la perfection en sous jeux est une propriété désirable
des solutions des jeux en information incomplète, mais l’imperfection de l’information de
certains joueurs implique que quand c’est leur tour de jouer, ils ne sauront pas nécessairement
dans quel sous jeu ils se trouvent.
Michel Cavagnac22
, lui, nous apprend que dans les jeux dynamiques en information
incomplète, l’aspect dynamique du jeu ajoute à l’évolution de l’information explicitement
prévue par les règles du jeu une évolution de nature différente.
Effectivement, chaque joueur peut, par son comportement, émettre des signaux plus ou moins
informatifs sur le type qui le caractérise. Les croyances des différents participants sur les
caractéristiques de leurs partenaires peuvent ainsi évoluer en cours de jeu : elles deviennent
alors endogènes.
Par conséquent, la notion d’équilibre de Nash parfait en sous jeux, utilisée pour les jeux
dynamiques en information complète, ne peut pas être étendue de façon directe au contexte de
l’information incomplète. Les mécanismes de signal, engendrés par les comportements des
joueurs, doivent être pris en compte.
Au final, lorsqu’un joueur doit effectuer ses choix, il connait son type, mais ne peut se
référer qu’à ces croyances concernant les types des autres joueurs. Lorsque le jeu débute, ces
22 MICHEL CAVAGNAC (Professeur d'Economie à l'Université de Limoges depuis 1994, chercheur Associé à
Toulouse (LERNA), collaborateur au Centre de Droit et d’Economie du Sport (CDES) de Limoges ) : Théorie des jeux,
Gualino éditeur, 2006.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 21 sur 33
croyances correspondent aux probabilités que le joueur accorde aux différentes caractéristiques
possibles de ses partenaires sachant que lui-même est de tel type.
Dans le cadre d’un jeu simultané, ces croyances sont la référence pour l’autre joueur dans un jeu
car aucune information nouvelle ne vient s’ajouter à ces informations. Cependant ce n’est pas le
cas dans les jeux séquentiels, puisque l’observation des séquences de choix retenues par les
différents participants peut apporter des informations supplémentaires concernant leurs types.
Ainsi chaque joueur révise ses croyances au fur et à mesure qu’il reçoit des signaux informatifs.
Les croyances d’un joueur dépendent des stratégies retenues par les autres joueurs, et ces
stratégies dépendent de façon indirecte de leurs croyances.
C’est pour cela que pour les jeux dynamiques en information incomplète, il n’est plus
suffisant de définir un équilibre comme un ensemble de stratégies individuelles, mais il est
nécessaire d’élargir la notion d’équilibre pour associer stratégies et croyances. C’est ce qui est
fait grâce à la notion d’équilibre bayésien parfait.
BB.. LL’’ééqquuiilliibbrree bbaayyééssiieenn ppaarrffaaiitt
D’après Michel Cavagnac, la définition de l’équilibre bayésien parfait repose sur trois
conditions.
La première reprend les arguments de stabilité qui, de façon très générale, caractérisent un
équilibre. Ainsi un ensemble de stratégie ne peut constituer un équilibre que si la stratégie de
chaque joueur est une meilleure réponse aux stratégies des autres joueurs.
La deuxième condition concerne les stratégies elles-mêmes : elles doivent être crédibles.
Effectivement, un ensemble de stratégies ne peut être retenu comme équilibre dans un jeu
dynamique que si ces stratégies ne comportent que des séquences de choix crédibles.
La troisième et dernière condition porte sur les croyances des joueurs : la règle de Bayes doit
être respectée.
Murat Yildizoglu propose une définition de l’équilibre bayésien parfait en reprenant ces
conditions. Ainsi, selon lui, un équilibre bayésien parfait est une combinaison de stratégies et un
ensemble de croyances tels qu’à chaque nœud du jeu, les stratégies dans le reste du jeu sont des
meilleures réponses aux stratégies spécifiées par l’équilibre et étant données les croyances
d’équilibre. En outre, les croyances à chaque nœud sont rationnelles, étant données les
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 22 sur 33
connaissances fournies par le jeu jusqu’à ce point : elles sont actualisées, selon la règle de Bayes
quand cela est possible, à partir des croyances a priori et des actions observées des autres
joueurs, sous l’hypothèse qu’ils jouent leur stratégie d’équilibre.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 23 sur 33
CCHHAAPPIITTRREE 22 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX
CCOOOOPPÉÉRRAATTIIFFSS
Un jeu est coopératif lorsque des joueurs peuvent passer entre eux des accords qui les
lient de manière contraignante (par exemple, sous la forme d’un contrat qui prévoit une sanction
légale dans le cas du non respect de l’accord). On dit alors qu’ils forment une coalition dans
laquelle les membres agissent de concert.
On va pouvoir identifier des solutions d’équilibre dans ces types de jeux. Deux types de jeux
coopératifs vont retenir notre attention : les jeux à deux joueurs (Section 1), et les jeux à utilité
transférable (Section 2).
SSEECCTTIIOONN 11 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX DDEE NNÉÉGGOOCCIIAATTIIOONN ÀÀ
DDEEUUXX JJOOUUEEUURRSS
Deux agents (individus, firmes, pays, ...) ont la possibilité de collaborer ensemble afin
d’atteindre des situations mutuellement favorables.
Dans un tel jeu on peut se demander comment arriver à une solution d’équilibre, c'est-à-dire à la
meilleure solution pour les deux agents. Cette chose ne sera pas aisée, car les jeux de
négociations à deux joueurs présentent quelques difficultés d’appréhension. Il convient de
présenter les données du problème (§1) avant de présenter la solution d’équilibre proposée par
Nash en la matière (§2).
§§ 11 :: LLeess ddoonnnnééeess dduu pprroobbllèèmmee
Prenons un exemple. Soit un nouveau produit pour lequel deux technologies
incompatibles sont disponibles, et deux entreprises envisagent de le produire. On peut par
exemple penser au choix entre les standards VHS et Betamax pour les cassettes vidéo. Si les
deux entreprises se mettent d'accord sur une technologie, elles peuvent obtenir des ventes
importantes. En cas de désaccord, la nécessité pour le consommateur de s'équiper dans chacune
des deux technologies (avoir deux magnétoscopes) limite la taille du marché et entraîne des
ventes nettement plus faibles. Chacune des deux technologies est ainsi un équilibre de Nash du
jeu, mais celui-ci ne spécifie pas comment se coordonner sur cet équilibre.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 24 sur 33
Des joueurs rationnels vont coopérer sur l'une ou l'autre des stratégies et recevoir les
gains élevés. Pour ce faire, ils doivent pouvoir se coordonner, sous peine de se retrouver dans
une situation défavorable.
En l’absence de consensus, une solution par défaut de l’ensemble des réalisables est mis en
œuvre. Cette solution correspond au « point de désaccord » ou au « statu quo ».
Afin de déterminer la solution “plausible” d’un problème de négociation, Nash a formulé
certaines propriétés ou axiomes que la solution devra satisfaire.
§§ 22 :: LLaa ssoolluuttiioonn ddee NNaasshh
La solution de Nash consiste à maximiser le produit des gains nets des agents. Le gain
net d’un agent est défini comme la différence entre le résultat de l’accord et celui correspondant
au point de désaccord ou de la situation initiale que l’agent souhaite améliorer par la
négociation.
Sans entrer dans les complexes détails mathématiques, il convient de présenter
succinctement les 4 axiomes proposés par Nash.
Le premier axiome correspond à une optimalité au sens de Pareto (il ne doit pas exister
de situation plus favorable que la solution du problème de négociation pour chacun des deux
joueurs).
Le second axiome consiste en la symétrie des joueurs. La solution doit procurer à des joueurs
identiques des gains égaux en utilité.
Le troisième axiome impose une invariance d’échelle. Cet axiome permet sans perte de
généralité de normaliser à zéro les gains associés au point de désaccord.
Le dernier axiome est celui d’indépendance vis-à-vis des alternatives non pertinentes. Cet
axiome signifie que la solution ne doit pas changer si des solutions possibles, mais qui n’avaient
pas été retenues initialement, sont retirées sans que le point de désaccord n’ait été modifié.
Cette solution peut-être facilement généralisée pour les jeux avec un nombre de joueurs
supérieur à deux. Cependant, ce concept de solution ne permet pas de capturer le pouvoir dont
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 25 sur 33
dispose les coalitions de joueurs. C’est en étudiant les jeux coopératifs à utilité transférable
qu’on pourra tenir compte des effets de cette coalition de joueurs.
SSEECCTTIIOONN 22 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX CCOOOOPPÉÉRRAATTIIFFSS ÀÀ
UUTTIILLIITTÉÉ TTRRAANNSSFFÉÉRRAABBLLEE
Un jeu coopératif est à utilité transférable lorsque la négociation porte sur le partage d’un
bien qui est parfaitement transférable entre les joueurs et que chaque joueur évalue de la même
manière.
Il convient de présenter ces types de jeux (§1), et d’en présenter un concept de solution
(§2).
§§ 11 :: DDééffiinniittiioonn eett pprroopprriiééttééss
Dans les jeux à utilité transférable, la négociation porte sur le partage d’un bien
parfaitement transférable entre les joueurs et que ceux-ci peuvent évaluer de la même manière.
Le bien en question peut par exemple être une quantité d’argent, un pouvoir politique du conseil
de sécurité des Nations Unies…
Lorsque le partage porte sur un gain à répartir entre plusieurs agents, on assigne à chaque
coalition une valeur monétaire égale au surplus de leur coopération. Cette valeur résume le
résultat produit par chaque coalition de joueur.
Concernant la valeur d’un jeu, un jeu est sur additif quand le gain que peut obtenir un groupe de
joueurs excède la somme des gains que chaque joueur pourrait avoir isolément. Le jeu sera sous
additif quand le coût que doit supporter une coalition de joueurs est plus faible que la somme de
leurs coûts individuels.
Concernant l’imputation d’un jeu : une imputation est une distribution des gains entre les
joueurs vérifiant les conditions de rationalité individuelle et de rationalité collective. La
première condition pose qu’un agent n’acceptera pas un gain moindre ou un coût supérieur à ce
qu’il aurait en restant seul et la seconde assure que le gain ou le coût de la grande coalition doit
être intégralement distribué entre les joueurs quand le jeu est super ou sous additif.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 26 sur 33
Ces deux conditions renvoient aux deux premiers axiomes de la solution de Nash. Le problème
réside en l’existence d’une infinité d’imputations possibles. L’intérêt de la valeur de Shapley ou
du nucléole est de proposer une imputation particulière.
§§ 22 :: UUnn ccoonncceepptt ddee ssoolluuttiioonn iinnttéérreessssaanntt :: llaa vvaalleeuurr ddee SShhaapplleeyy
La valeur de Shapley23
consiste en une évaluation a priori du jeu plutôt que d'être le
résultat du jeu. Cette caractéristique en fait une solution qui, en quelque sorte, dispense de jouer.
Pour déterminer cette valeur, Shapley a adopté l'approche axiomatique qui revient à
sélectionner, l'ensemble de propriétés souhaitables qu'elle devrait avoir.
Le premier axiome stipule l’efficience de la solution. La totalité de la valeur de la grande
coalition qui est le gain maximum possible dans un jeu sur additif doit être intégralement réparti
entre les joueurs. Cet axiome correspond à celui d’optimalité Parétienne chez Nash.
Le deuxième axiome porte sur la symétrie des joueurs. Deux joueurs ayant des contributions
identiques au sein d’une coalition doivent recevoir la même part.
Le troisième axiome est celui de nullité. Un joueur qui n’apporte rien à la valeur d’une coalition
n’a droit à rien.
Ces trois axiomes rendent la valeur de Shapley particulièrement attrayante pour traiter le
problème du partage équitable des ressources communes à plusieurs agents économiques.
23 LLOYD STOWELL SHAPLEY, (né le 2 juin 1923) est un mathématicien et économiste américain. Il est
professeur émérite à l’Université de Californie à Los Angeles (UCLA). Il a contribué aux domaines de l’économie
mathématique et surtout de la théorie des jeux. Lloyd Shapley est considéré par de nombreux experts comme le plus
grand théoricien des jeux depuis les travaux de Von Neumann et Morgenstern en 1940. Sa thèse et son travail post-
doctoral ont prolongé les idées de Francis Ysidro Edgeworth en introduisant en théorie des jeux la valeur de
Shapley et le concept de solution noyau.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 27 sur 33
Conclusion
Après avoir étudié d’une manière gélobale les principaux aspects de la théorie des jeux,
et notamment son objectif, nous pouvons nous lancer dans une sorte d’appréciation de sa réelle
utilité.
Une théorie est, selon l’acception courante, un ensemble d’hypothèses ayant trait au
monde tel qu’il est dans le but d’en expliquer tel ou tel aspect. Toutefois, en sciences humaines,
et tout particulièrement en économie, le théoricien s’en tient très rarement à ce qui est : il ne
peut s’empêcher de dire ce qui doit être.
Sa démarche est normative. Alors, quid de la théorie des jeux ? La confusion règne à son
propos, certains auteurs prétendant qu’elle cherche à expliquer les phénomènes observés, ou à
faire des prédictions, d’autres qu’elle est prescriptive (normative), d’autres encore qu’elle est
l’une et l’autre.
Cette cacophonie à propos de la nature de la théorie des jeux sur ce qu’elle fait ou permettrait de
faire n’est pas accidentelle : elle découle du fait qu’en règle générale, elle ne résout rien et ne
propose rien aux joueurs.
Essentiellement, elle attire l’attention sur les problèmes que posent les choix d’individus
rationnels en interaction, lorsque toutes les hypothèses des modèles sont spécifiées.
Si les équilibres sont, en règle générale, des situations privilégiées par le modélisateur, c’est
parce qu’ils sont, par définition, des situations non éphémères, considérées comme des points
d’attraction du système (vers lesquels il tend ou autour desquels il se maintient).
Or les théoriciens des jeux utilisent le mot équilibre pour désigner leur principal concept de
solution : l’équilibre, ce qui revient en fait à désigner celui-ci comme la solution qui va de soi.
En définitive quand on a trouvé les équilibres d’un modèle, celui-ci est résolu, pour l’essentiel.
Mais qu’en est-il exactement ? Car si un équilibre satisfait la condition minimale de
rationalité, chaque joueur maximise compte tenu de ce qu’il pense que les autres feront. Il n’a
rien des caractéristiques d’un équilibre, tel qu’on l’entend habituellement.
En effet, s’il y a équilibre, c’est parce que chacun anticipe correctement ce que les autres vont
faire. En outre, les choix sont faits une seule fois et simultanément dans la plus part des cas :
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 28 sur 33
l’idée d’un processus menant à l’équilibre par modifications successives des anticipations n’a
pas de sens dans ce contexte.
L’application de la théorie des jeux au droit de la concurrence, et plus précisément au cas
des duopoles, va souligner ces limites.
Prenons l’exemple phare de la concurrence imparfaite : le modèle du duopole de
Cournot. Chaque entreprise fait une offre en anticipant celle de l’autre (et en pensant qu’elle ne
la modifiera pas), sans rien connaître à son propos. L’équilibre de Cournot-Nash du modèle est
tel que chaque entreprise fait son offre en prévoyant exactement l’offre de sa concurrente sans
rien savoir sur elle.
Que peut alors prédire le modèle ? Rien, si ce n’est que l’équilibre n’aura jamais lieu, sauf cas
très exceptionnel où chaque entreprise tombe par hasard sur l’offre de l’autre. Le théoricien va-t-
il prescrire cet équilibre aux entreprises ? Non, puisqu’elles peuvent toutes deux gagner plus en
se concertant.
Autrement dit, l’équilibre de Nash ne représente ni ce qui est ou pourrait être, ni ce qui devrait
être du point de vue du profit des entreprises.
Si on prend l’autre modèle classique du duopole, celui de Bertrand, où les entreprises proposent
des prix, alors on peut dire que l’équilibre de Nash n’aura jamais lieu. En effet, l’équilibre de ce
modèle est tel que chaque entreprise propose le même prix, égal au coût moyen supposé
constant. Comme à ce prix, leur profit est nul, elles ont toutes deux intérêt à proposer un prix
supérieur à ce coût, avec une chance sur deux de faire un profit strictement positif plutôt que
nul: par conséquent aucune d’entre elles ne choisira la stratégie d’équilibre.
On peut aussi revenir à notre exemple concernant un terroriste qui menace de faire
exploser une bombe dans le cas où pilote ne se rendrait pas à Damas. Du point de vue de la
théorie des jeux, la solution d’équilibre, qui serait la plus bénéfique pour les deux protagonistes,
serait de refuser de se rendre à Damas de la part du pilote la menace de faire exploser la bombe
serait du point de vue de la théorie des jeux une menace non crédible. Effectivement, elle
apporterait un bénéfice moindre au terroriste que de ne pas la faire exploser.
Cependant, la réalité est tout autre, le terroriste est là pour des considérations personnelles, la
plus part du temps cette personne est formatée pour cette attentat suicide. Il ne raisonnera pas
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 29 sur 33
rationnellement en se disant qu’il vaut mieux pour lui de ne pas faire exploser la bombe quoi
qu’il arrive.
Ainsi la théorie des jeux semble prend en compte des situations réelles, et propose des
solutions d’équilibre sans réellement prendre en considération la volonté des protagonistes. Ce
raisonnement mathématique ne semble pas adapter à la réalité qui doit d’avantage prendre en
compte les aspects sociologiques et psychologiques.
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 30 sur 33
BBIIBBLLIIOOGGRRAAPPHHIIEE
AA.. OOuuvvrraaggeess
Gaël Guiraud, La théorie des jeux, Champs, 2000.
Gisèle Umbhauer, Théorie des jeux appliquée à la gestion, EMS Management & Société, 2002.
John Von Neuman and Oskar Morgenstern, Theory of games and economic behavior, Princeton
University Press, 1944.
Murat Yildizoglu, Introduction à la théorie des jeux, Dunod, 2003.
Michel Cavagnac, Théorie des jeux, Gualion, 2006.
Nicolas Eber, Théorie des jeux, Théorie des jeux, Dunod, 2007.
Thomas C. Shelling, The stratégie of conflict, PUF, 1987.
BB.. RReevvuueess
Christian Schmidt, Quelques repères historiques sur la théorie des jeux, de Leibniz à Von
Neuman, Revue de Synthèse, Volume 127, Number 1, 141-158, DOI: 10.1007/BF02962625,
2006.
Jean-Christophe Péreau, Négociation et théorie des jeux : les « dessous » d'un accord
acceptable, Négociations 2/2009 (n° 12), p. 35-49.
John Charles Harsanyi, Games with incomplete information played by bayesian players,
Management science 14, 159-182,320-334,486-502, 1968-1969.
Reinhard Selten, Reexamination of the perfectness concept for equilibrium points in extensive
games, International Journal of Game Theory 4, 25-55, 1975.
CC.. SSoouurrcceess IInntteerrnneett
Jacques-François Thisse, Théorie des Jeux : Une introduction, disponible sur internet :
http://www.core.ucl.ac.be/staff/thisse%28micro_licence%29.pdf
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 31 sur 33
Sylvain Béal, Cours de Théorie des jeux coopératifs, 2010, disponible sur internet :
http://webs.unice.fr/droit/courbeal-L3Eco0809.pdf
Thierry Pénard, La théorie des jeux répétés : application à la concurrence oligopolistique, 1998,
disponible sur internet : http://perso.univ-rennes1.fr/thierry.penard/biblio/aix.pdf
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 32 sur 33
Table des matières
Sommaire ................................................................................................................... 1
Introduction ............................................................................................................... 2
A. L’historique de la théorie des jeux .......................................................................... 3
B. Les éléments constitutifs de la théorie des jeux ...................................................... 4
1) Présentation.……………………………………………………………………………4
2) Les différents types de jeux……………………………………………………………5
3) Les différentes stratégies………………………………………………………………6
4) Les solutions et équilibres d'un jeu…..………………………………………………7
Chapitre 1 : L’équilibre dans les jeux non coopératifs ........................................... 8
Section 1 : l’équilibre dans les jeux non coopératifs avec information
complète……………………………………………………………………… ..….8
§ 1 : L’équilibre de Nash ......................................................................................... 8
A. Les prémisses de l’équilibre de Nash..................................................................... 9
B. La définition actuelle de l’équilibre de Nash .......................................................... 9
C. Les insuffisances de l’équilibre de Nash ............................................................... 10
§ 2 : Les extensions à l’équilibre de Nash ............................................................. 12
A. Equilibre Parfait en Sous Jeux .............................................................................. 12
1) Sous jeux et équilibre parfait….………………………………………………………12
2) Le principe de Bellman et l'induction à rebours……………………………………13
B. Equilibre des Jeux Répétés .................................................................................... 14
1) Les jeux répétés de base………………………………………………………………14
2) Les jeux répétés un nombre infinis de fois….………………………………………15
Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché
Mémoire sur la théorie des jeux
Page 33 sur 33
Section 2 : L’équilibre dans les jeux non coopératifs avec information
incomplète………………………………………………………………..……. 17
§ 1 : L’équilibre dans les jeux simultanés avec information incomplète .............. 17
A. La méthode de Harsanyi ....................................................................................... 17
B. L’équilibre de Nash bayésien ................................................................................ 19
§ 2 : L’équilibre dans les jeux séquentiels avec information incomplète .............. 20
A. L’insuffisance de l’équilibre parfait en sous jeux.. ............................................... 20
B. L’équilibre bayésien parfait ................................................................................... 21
Chapitre 2 : L’équilibre dans les jeux coopératifs ................................................. 23
Section 1 : L’equilibre dans les jeux de négociation à deux joueurs ...................... 23
§ 1 : Les données du problème .............................................................................. 23
§ 2 : La solution de Nash ....................................................................................... 24
Section 2 : L’équilibre dans les jeux coopératifs à utilité transférable................... 25
§ 1 : Définition et propriétés .................................................................................. 25
§ 2 : Un concept interessant de solution : la valeur de Shapley ............................ 26
Conclusion ............................................................................................................... 28
Bibliographie ........................................................................................................... 31
A. Ouvrages .......................................................................................................... 31
B. Revues .............................................................................................................. 31
C. Sources Internet ............................................................................................... 31
Table des matières .................................................................................................. 32