LA THEORIE DES JEUX · Mémoire présenté par Alexandre Marce Master 2 - Droit du Marché . Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2

UNIVERSITE MONTPELLIER 1 – FACULTE DE DROIT

LA THEORIE DES JEUX

Mémoire présenté par Alexandre Marce

Master 2 - Droit du Marché

Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2 – Droit du Marché

Mémoire sur la théorie des jeux

Page 1 sur 33

SSOOMMMMAAIIRREE

Sommaire .................................................................................................................... 1

Introduction ................................................................................................................ 2

Chapitre 1 : L’équilibre dans les jeux non coopératifs ................................................. 8

Section 1 : l’equilibre dans les jeux non coopératifs avec information complète……8

§ 1 : L’équilibre de Nash .............................................................................................. .8

§ 2 : Les extensions à l’équilibre de Nash ....................................................................... 12

Section 2 : L’équilibre dans les jeux non coopératifs avec information incomplète .17

§ 1 : L’équilibre dans les jeux simultanés avec information incomplète .............................. 17

§ 2 : L’équilibre dans les jeux séquentiels avec information incomplète .............................. 20

Chapitre 2 : L’équilibre dans les jeux coopératifs ...................................................... 23

Section 1 : L’equilibre dans les jeux de négociation à deux joueurs ......................... 23

§ 1 : Les données du problème ..................................................................................... 23

§ 2 : La solution de Nash ............................................................................................. 24

Section 2 : L’équilibre dans les jeux coopératifs à utilité transférable ..................... 25

§ 1 : Définition et propriétés ......................................................................................... 26

§ 2 : Un concept interressant de solution : la valeur de Shapley ......................................... 27

Conclusion ................................................................................................................ 28

Bibliographie ............................................................................................................. 31

Table des matières ..................................................................................................... 33



Page 2 sur 33

IINNTTRROODDUUCCTTIIOONN

Le terme de théorie des jeux désigne aujourd’hui une théorie mathématique des

interactions sociales au sens large. De prime abord, ce terme peut surprendre. Il faut remonter le

cours de son histoire (A) pour retrouver le sens de cette appellation (B).

AA.. LL’’hhiissttoorriiqquuee ddee llaa tthhééoorriiee ddeess jjeeuuxx

L’étude de l’évolution de la théorie des jeux nous ramène aux projets de quelques

mathématiciens qui visaient à élaborer une véritable théorie mathématique des jeux de société.

Selon Christian Schmidt1, on trouve trois étapes dans la construction de la théorie des

jeux. La première correspond au projet philosophique d’une théorie mathématique des jeux de

société, tel qu’il se trouve déjà formulé par Leibniz. La seconde, correspond au recours aux

mathématiques pour résoudre un problème technique posé par un jeu de hasard particulier,

comme chez James Waldegrave2 et Pierre Rémond de Montmort

3. Enfin, la troisième et dernière

étape est celle de la théorisation dans une mathématique appropriée des jeux de société. Cette

dernière peut s’effectuer, soit sur un jeu déterminé, comme celui des échecs pour un auteur

comme Zermelo4, soit à partir d’invariants présents dans un grand nombre de jeux, comme l’ont

entrepris Borel et Von Neumann5. Il semble s’agir au final dans cette ultime étape de la

réalisation du projet Leibnizien.

1 CHRISTIAN SCHMIDT, Quelques repères historiques sur la théorie des jeux, de Leibniz à Von Neuman, 2006.

2 JAMES WALDEGRAVE a été la première personne à discuter de ce qui deviendrait la théorie des jeux

rectangulaires dans une lettre en 1713 au sujet du jeu de le Her.

3 La première référence où les historiens observent l'élaboration d'une stratégie de jeu par recherche d'un maximin

est une lettre de novembre 1713 de PIERRE REMOND DE MONTMORT où il décrit une solution du jeu de Le

Her due à JAMES WALDEGRAVE qui est déjà ce qu'on appelle aujourd'hui une stratégie mixte.

4 A partir de la théorie des ensembles, ERNST ZERMELO a montré qu’il existait une stratégie optimale pour

chacun des joueurs dans un jeu d’échec, autrement dit qu’un ordinateur surpuissant pourrait trouver une stratégie

unique déterminée selon toutes les possibilités choisies par l’adversaire.

5 Le théorème du minimax de JOHN VON NEUMANN (parfois appelé théorème fondamental de la théorie des

jeux à deux joueurs), démontré en 1928, est un résultat important en théorie des jeux.

http://www.worldlingo.com/ma/enwiki/fr/Game_theory



http://fr.wikipedia.org/wiki/1713

http://fr.wikipedia.org/wiki/Pierre_R%C3%A9mond_de_Montmort

http://fr.wikipedia.org/w/index.php?title=Le_Her&action=edit&redlink=1



http://fr.wikipedia.org/w/index.php?title=James_Waldegrave&action=edit&redlink=1

http://fr.wikipedia.org/wiki/Strat%C3%A9gie_mixte

http://fr.wikipedia.org/wiki/John_von_Neumann


http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux



Page 3 sur 33

On peut voir que ces trois niveaux coïncident approximativement avec deux périodes

historiques bien différentes. Effectivement, l’histoire de la théorie des jeux commence au début

de XVIIIe siècle. Mais à l’exception de Leibniz, les contributions du siècle des Lumières restent

cantonnées au deuxième niveau, avec des découvertes techniques souvent ingénieuses mais

toujours limitées. Il faut attendre le XXe siècle pour que le programme de recherches leibnizien

prenne réellement corps. La dernière étape de la métamorphose se situe chez Von Neumann et

Morgenstern qui transformèrent, juste avant la Seconde Guerre mondiale, cette théorie des jeux

de société en une théorie des jeux sociaux applicable aux comportements économiques.

Von Neumann et Morgenstern6 dans leur ouvrage Theory of Games and Economic

Behavior7 ont proposé une solution dans le cas particulier d’un jeu où le gain d’un joueur

correspond exactement à la perte subie par l’autre (jeu à somme nulle ou duel). Le jeu d’échecs

est un exemple de jeu où l’antagonisme entre joueurs est ainsi poussé à l’extrême. Les cas

d’application en économie sont rares.

En 19518, Nash a généralisé la solution proposée par Von Neumann et Morgenstern en

essayant de construire une théorie de l’équilibre pour des jeux à somme variable.

Les applications de ce concept à l’économie se sont multipliées à partir des années 1970 et 1980.

C’est en économie industrielle que l’intérêt de ce concept est apparu avec le plus de force parce

qu’il permet d’étudier des situations de concurrence imparfaite où les entreprises adoptent des

comportements stratégiques.

6 En 1944, JOHN VON NEUMANN (1903-1957), mathématicien de génie d’origine hongroise, qui deviendra plus

tard l’un des inventeurs de l’ordinateur, et OSKAR MORGENSTERN (1902-1977), économiste d’origine

autrichienne, publient un impressionnant traité d’étude mathématisée du comportement stratégique intitulé Theory

of Games and Economic Behavior (Théorie des jeux et comportement économique). L’ouvrage, qui fait l’objet

d’une seconde édition en 1947, fonde définitivement la « théorie des jeux ».

7 JOHN VON NEUMANN & OSKAR MORGENSTERN, Theory of games and Economic Behaviour, Princeton

University Press, Second ed., Princeton, 1944.

8 JOHN FORBES NASH, propose sa théorie dans un article d'une page publié en 1950 et une thèse de Doctorat de

27 pages soutenue à l'Université de Princeton en mai 1950 et publié en 1951



Page 4 sur 33

BB.. LLeess éélléémmeennttss ccoonnssttiittuuttiiffss ddee llaa tthhééoorriiee ddeess jjeeuuxx

Il convient de présenter la théorie des jeux de manière générale (1), afin de voir qu’il

existe différents types de jeux (2), et que son but est de trouver une solution d’équilibre (3).

11)) PPrréésseennttaattiioonn

Selon Jacques François Thisse9, la théorie des jeux est la discipline mathématique qui

étudie les situations où le sort de chaque participant dépend non seulement des décisions qu’il

prend, mais également des décisions prises par d’autres participants. Le choix optimal pour un

participant dépend généralement de ce que font les autres. Etant donné que chacun n’est pas

totalement maitre de son sort on dit que les participants sont en situation d’interaction

stratégique.

Les participants à un jeu sont appelés joueurs. Chacun d’eux agit pour son propre compte selon

le principe de rationalité économique. Selon ce principe, chacun cherche à prendre les

meilleures décisions pour lui-même.

Au final on peut définir un jeu comme une situation de décisions interactives dans lesquelles

l’utilité (le bien être) de chaque individu dépend des décisions des autres individus.

Les précédents propos de Jacques François Thisse rejoignent ceux de Murat

Yildizoglu10

. Selon lui, la théorie des jeux se base sur une double hypothèse. D’une part, les

décideurs sont rationnels et ils poursuivent des objectifs exogènes et indépendants, et d’autre

part, ils tiennent compte de la connaissance qu’ils ont ou des anticipations qu’ils font du

comportement des autres décideurs.

En définitive, on peut dire que c’est sur la base de ces deux hypothèses que la théorie des jeux

propose des modèles qui sont des représentations très abstraites de situations réelles.

La théorie des jeux utilise les mathématiques pour exprimer formellement ses idées, mais

ces idées ne sont pas essentiellement mathématiques. La formulation mathématique est utilisée

9 JACQUES FRANÇOIS THISSE, Théorie des Jeux : Une introduction.

10

MURAT YILDIZOGLU (enseignant chercheur à l’université d’Aix-Marseille) : Introduction à la théorie des

jeux, Dunod, 2003.



Page 5 sur 33

par commodité, dans le but de définir précisément les concepts et de vérifier leurs implications

avec rigueur.

22)) LLeess ddiifffféérreennttss ttyyppeess ddee jjeeuuxx

Différents contextes d’interaction induisent différents types de jeux entre les agents.

Selon Murat Yildizoglu un jeu est « une description de l’intérêt des joueurs et de l’interaction

stratégique qui spécifie les contraintes qui pèsent sur les actions que les joueurs peuvent

choisir ».

Et selon lui, une solution est « la description systématique des situations qui peuvent émerger

comme le résultat d’une famille de jeux ». La théorie des jeux propose donc des solutions

potentielles pour des familles de jeux et étudie leurs propriétés.

En des termes moins techniques on peut dire qu’un jeu est une situation où des joueurs

sont conduits à faire des choix stratégiques parmi un certain nombre d'actions possibles, et dans

un cadre défini à l'avance qui seront les règles du jeu, le résultat de ces choix constituant une

issue du jeu, à laquelle est associé un gain (ou payement), positif ou négatif, pour chacun des

participants.

On peut classer selon trois dimensions les différents contextes d’interaction. Ils peuvent

être basés en fonction du déroulement dans le temps, en fonction de l’information dont disposent

les agents, et enfin en fonction du type de relation entre les joueurs.

Concernant le déroulement dans le temps, on peut dire qu’un jeu peut être simultané ou

séquentiel. Un jeu simultané (ou stratégique) est le modèle d’une situation où chaque joueur

choisit son plan d’action complet une fois pour toutes au début du jeu. Dans ce cas on voit bien

que les choix de tous les joueurs sont simultanés. Par contre dans un jeu séquentiel, chaque

joueur considère son plan d’action non seulement au début du jeu mais aussi chaque fois qu’il

doit prendre une décision pendant le déroulement du jeu.

Ensuite les différents contextes d’interactions peuvent être basés en fonction de l’information

dont disposent les agents. Ainsi on dit que l’information est parfaite si chaque joueur est

parfaitement informé des actions passées des autres joueurs et l’information est imparfaite

quand un joueur ignore certains des choix qui ont été effectués avant le sien. En outre, un jeu

est à information incomplète si au moins un des joueurs ne connait pas parfaitement la structure

du jeu, et dans le cas contraire il sera à information complète.



Page 6 sur 33

Enfin concernant la distinction entre jeux coopératifs et jeux non coopératifs, on peut dire qu’un

joueur peut être interprété comme un individu seul ou un groupe d’individus prenant une

décision. Les jeux non coopératifs vont correspondre aux jeux dont les éléments de base sont les

actions des joueurs individuels, les jeux coopératifs correspondent à ceux basés sur les actions

jointes d’un groupe.

33)) LLeess ssoolluuttiioonnss eett ééqquuiilliibbrreess dd''uunn jjeeuu

Murat Yilzidoglu nous apprend que la théorie des jeux est basée sur une représentation

plus fine des stratégies des joueurs en fonction de la situation d’interaction et de la

représentation retenue du jeu.

D’une manière générale, une stratégie d’un joueur doit spécifier une action pour ce joueur

chaque fois qu’il est susceptible de joueur. Un profil de stratégies spécifie un déroulement

complet du jeu en précisant une stratégie par joueur.

La théorie des jeux, ou tout au moins l’usage qu’il en est fait en économie, centre

l’analyse autour de l’étude des équilibres. Un concept d’équilibre donne pour chaque jeu une

prédiction sur son issue, l’état d’équilibre étant soumis à la condition que si les joueurs s’y

trouvent, ils n’ont aucun intérêt à en dévier unilatéralement.

Cependant, un concept d’équilibre n’explicite pas la manière dont les joueurs vont se

coordonner sur un état d’équilibre. La question de la coordination est centrale à cause de la

nature auto-référentielle des problèmes d’optimisation des joueurs. Ce qui est bien pour le

joueur A dépend de ce que fait le joueur B, qui dépend également de ce que fait le joueur A, etc.

Ainsi, les joueurs n’adopteront la stratégie d’équilibre prescrite par le concept que s’ils ont de

bonnes raisons de penser que les autres joueurs l’adopteront aussi. La condition de stabilité de

l’équilibre n’est pas suffisante pour assurer que les joueurs vont se coordonner dessus.

Si les équilibres sont, en règle générale, des situations privilégiées par le modélisateur,

c’est parce qu’ils sont, par définition, des situations non éphémères, considérées comme des "

points d’attraction " du système.



Page 7 sur 33

L’équilibre est donc la meilleure solution d’un jeu. Il convient de s’interroger sur cette

notion, en se demandant comment se caractérise une solution d’équilibre en fonction des

différents types de jeux ?

Nous verrons que les concepts de solutions diffèrent selon les types de jeux. Ainsi, on

peut arriver à un résultat d’équilibre tout aussi bien dans les jeux non coopératifs (Chapitre 1)

que dans les jeux coopératifs (Chapitre 2).



Page 8 sur 33

CCHHAAPPIITTRREE 11 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX NNOONN

CCOOOOPPÉÉRRAATTIIFFSS

Les jeux non coopératifs correspondent à des situations d’interaction entre individus

libres dans leurs choix et poursuivant des objectifs propres et indépendants. Ces individus ne

communiquent pas avant le jeu et n’ont pas nécessairement le moyen de s’engager à poursuivre

une stratégie particulière.

On peut trouver une solution d’équilibre dans ces jeux non coopératifs. Ces jeux peuvent

être à information complète, si tous les joueurs connaissent parfaitement la structure du jeu

(Section 1), ou à information incomplète si au moins un des joueurs ne connait pas parfaitement

la structure du jeu (Section 2).

SSEECCTTIIOONN 11 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX NNOONN CCOOOOPPÉÉRRAATTIIFFSS

AAVVEECC IINNFFOORRMMAATTIIOONN CCOOMMPPLLÈÈTTEE

Le concept de solution qui est le plus communément admis a été proposé par John Nash

en 1951 ; son application se veut générale pour certains jeux non coopératifs à information

complète que l’ont peut considérer comme « classiques » (§1), cependant il a fallu effectuer

quelques aménagements pour étendre ce concept à des situations d’interactions plus

« sophistiquées » (§2).

§§ 11 :: LL’’ééqquuiilliibbrree ddee NNaasshh

L’idée de l’équilibre de Nash est extrêmement simple en soi et cohérente avec l’essence

des jeux non-coopératifs. Mais cette notion n’est pas née du jour au lendemain, il y a eu des

prémisses (A) avant d’arriver à la définition actuelle de l’équilibre de Nash (B) qui revêt de

nombreux caractères (C).



Page 9 sur 33

AA.. LLeess pprréémmiisssseess ddee ll’’ééqquuiilliibbrree ddee NNaasshh

Avant Nash, la détermination de situation stable n'avait pas de méthode formelle, même

si l'existence d'équilibres pour les jeux à somme nulle était connue depuis 1926, via le théorème

du minimax de Von Neumann.

Ce théorème du minimax de John Von Neumann (parfois appelé théorème fondamental

de la théorie des jeux à deux joueurs) a été démontré en 1928, il assure que, pour un jeu non-

coopératif synchrone à information complète opposant deux joueurs, il existe au moins une

situation d'interaction stable, à savoir une situation dans laquelle aucun des deux joueurs n'a

intérêt à changer sa stratégie mixte si l'autre ne la change pas.

John Nash, dans un article d'une page publié en 1950 et une thèse de Doctorat de 27

pages soutenue à l'Université de Princeton en mai 1950 et publié en 1951 vient généraliser le

théorème du minimax à diverses situations.

On peut dire que l'équilibre de Nash constitue la pierre angulaire de la théorie des jeux moderne.

Il caractérise l'issue "logique" du jeu, c'est à dire la manière dont devraient se comporter des

joueurs rationnels.

Même si la traduction courante d'un équilibre de Nash peut paraître simpliste, les

considérables possibilités de résolution ouvertes par Nash lui ont mérité le « Prix Nobel »

d'économie en 1994, conjointement à Reinhard Selten et John Harsanyi.

BB.. LLaa ddééffiinniittiioonn aaccttuueellllee ddee ll’’ééqquuiilliibbrree ddee NNaasshh

L'équilibre de Nash, est défini par Nicolas Eber comme « un ensemble de stratégies (une

par joueur) tel qu’aucun joueur ne peut obtenir un gain supplémentaire en changeant

unilatéralement de stratégie ».

Selon Gisèle Umbhauer11

, l’équilibre de Nash est « un profil de stratégies qui présentent

une stabilité minimale », c’est-à-dire la stabilité aux déviations unilatérales. Ainsi, un profil de

stratégies constitue un équilibre de Nash, si et seulement si aucun joueur ne peut améliorer son

utilité s’il est le seul à s’écarter de la stratégie prévue par le profil.

11 GISÈLE UMBHAUEUR (Maitre de conférence à l’Université de Strasbourg), La théorie des jeux appliquée à la

gestion, EMS Management & Société, 2002.


http://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_du_minimax_de_von_Neumann



http://fr.wikipedia.org/wiki/John_von_Neumann


http://fr.wikipedia.org/wiki/Strat%C3%A9gie_mixte

http://fr.wikipedia.org/wiki/Prix_de_la_Banque_de_Su%C3%A8de_en_sciences_%C3%A9conomiques_en_m%C3%A9moire_d%27Alfred_Nobel




http://fr.wikipedia.org/wiki/Reinhard_Selten

http://fr.wikipedia.org/wiki/John_Harsanyi



Page 10 sur 33

Autrement dit, l’équilibre de Nash correspond à une situation dans laquelle l'équilibre entre

plusieurs joueurs, connaissant leurs stratégies réciproques, est devenu stable du fait qu'aucun ne

modifie sa stratégie sans affaiblir sa position personnelle.

Dans ce contexte, l’équilibre de Nash cherche les résultats qui sont stables par rapport aux

déviations individuelles, donc unilatérales.

Au final l'équilibre de Nash renvoie à un critère "d'absence de regret". En effet, il

implique qu'aucun des joueurs ne regrette d'avoir joué comme il l'a fait, étant donné la manière

dont les autres joueurs ont joué.

Cette définition s'applique à des jeux avec n'importe quel nombre de joueurs. Nash a démontré

que tous les résultats trouvés avant lui conduisaient à des équilibres stables dans son sens.

Nous pouvons illustrer nos propos avec l’exemple du jeu pierre-papier-ciseaux qui

n'admet pas d'équilibre avec des stratégies pures (si on choisit à toutes les parties « pierre » par

exemple, l'autre personne augmentera son gain en choisissant « feuille ». Mais alors le premier

joueur choisira ensuite « ciseau ». Etc., on n'arrivera jamais à un équilibre). Par contre, si on

étend ce jeu aux stratégies mixtes, il y a un point d'équilibre d'après le théorème de Nash (et on

peut montrer qu'il est unique). Ce point est donné en choisissant (1/3) « pierre » + (1/3)

« ciseau » + (1/3) « papier », c'est-à-dire, du point de vue probabiliste, de jouer avec une

probabilité (1/3) chacune des trois possibilités.

CC.. LLeess iinnssuuffffiissaanncceess ddee ll’’ééqquuiilliibbrree ddee NNaasshh

La principale insuffisance de l’équilibre de Nash réside dans le fait qu’il n’est pas

forcément unique. Ce sera le cas dans lequel deux résultats seront vraisemblables.

Cette multiplicité des choix va poser quelques problèmes, et notamment au niveau de leur

coordination. On pourrait se demander quel choix effectuer, Thomas Schelling12

nous apporte

une réponse.

12 THOMAS CROMBIE SCHELLING (né le 14 avril 1921) est un économiste américain, ainsi qu'un professeur de

politique étrangère, de sécurité nationale, de stratégie nucléaire et de contrôle des armes à la School of Public Policy

de l'université du Maryland à College Park. Son ouvrage le plus célèbre, The Strategy of Conflict a ouvert la voie à

l'étude des paris et du comportement stratégique. On l'a cité parmi les 100 ouvrages qui ont "le plus influencé" la

pensée occidentale après la Seconde Guerre mondiale.

http://fr.wikipedia.org/wiki/14_avril


http://fr.wikipedia.org/wiki/%C3%89conomiste

http://fr.wikipedia.org/wiki/%C3%89tats-Unis

http://fr.wikipedia.org/wiki/Professeur_%28enseignant%29

http://fr.wikipedia.org/wiki/Universit%C3%A9_du_Maryland

http://fr.wikipedia.org/wiki/Pari

http://fr.wikipedia.org/wiki/Occident

http://fr.wikipedia.org/wiki/Seconde_Guerre_mondiale



Page 11 sur 33

Le point de Schelling ou point focal est une solution à laquelle les participants à un jeu

de « coordination pure » qui ne peuvent pas communiquer entre eux sur ce sujet auront tendance

à se rallier, parce qu'elle leur semble présenter une caractéristique qui la fera choisir aussi par

l'autre.

C'est l'économiste américain Thomas Schelling qui l'a présentée pour la première fois en

1960 dans son plus fameux ouvrage, The Strategy of conflict (en français La Stratégie du conflit,

198613

).

Thomas Schelling donne en exemple l'incident qui l'a porté vers cette réflexion lors d'un

voyage, celui de deux personnes qui sont séparées fortuitement, sans avoir pu se donner rendez-

vous. Où ont-elles le plus de chances de se retrouver, chacune connaissant ses propres

préoccupations, ce que l'autre en sait, et celles de l'autre ? Les critères étant qu'on puisse le

trouver et l'atteindre facilement, il était arrivé à trois endroits : la mairie, le commissariat mais à

l'époque, le bureau de poste présentait un avantage de plus. Dans les années 1950, d'après un

questionnaire qu'il leur avait été remis, le point focal de ses étudiants à Yale était l'horloge de la

Grand Central Station à New York, parce que les filles étudiaient à des universités différentes et

qu'il fallait prendre le train pour se rencontrer. Celui des non étudiants, la poste centrale. À

Paris, on peut dire que le point focal est la Tour Eiffel.

Les théoriciens se sont empressés d'imaginer des situations plus formalisées,

artificiellement simplifiées, comme le jeu où on présente à deux participants isolés deux

panneaux identiques portant chacun quatre cases, en leur annonçant que si les deux choisissent

la même, ils recevront une récompense. Il suffit que l'une des cases présente une caractéristique

qui la distingue des autres (comme une couleur différente) pour que chacun, sachant que l'autre

peut l'observer aussi, trouve rationnel de la désigner. Et c'est ce que les expériences montrent

dans la plupart des cas.

En dernier lieu on peut dire que dans certains types de jeux la recherche d’un équilibre

de Nash tel qu’on vient de le présenter sera difficile. C’est pourquoi quelques ajustements, ou

élargissements de ce concept en vue de son application sont nécessaires.

13 THOMAS CROMBIE SCHELLING, La stratégie du conflit, PUF, 1986.

http://fr.wikipedia.org/wiki/Thomas_Schelling


http://www.amazon.com/gp/product/0674840313/002-1919524-5720033?v=glance&n=283155

http://www.puf.com/Book.aspx?book_id=016824


http://fr.wikipedia.org/wiki/Grand_Central_Station

http://fr.wikipedia.org/wiki/Tour_Eiffel



Page 12 sur 33

§§ 22 :: LLeess eexxtteennssiioonnss àà ll’’ééqquuiilliibbrree ddee NNaasshh

On trouve alors plusieurs extensions possibles à l’équilibre de Nash, notamment en

matière de sous jeux, dans lesquels il faudra rechercher un équilibre parfait (A). On étend aussi

l’équilibre de Nash aux jeux répétés (B).

AA.. EEqquuiilliibbrree PPaarrffaaiitt eenn SSoouuss JJeeuuxx

Il faut voir si il est possible d’identifier une solution d’équilibre lorsque nous sommes en

présence de sous jeux (1), et voir le cas échéant quelle en sera la méthode d’identification (2).

11)) SSoouuss jjeeuuxx eett EEqquuiilliibbrree ppaarrffaaiitt

Selon Nicolas Eber14

, dans son ouvrage Théorie des jeux15

, on appelle sous jeu « tout jeu

issu du jeu original, partant d'un nœud de décision isolé (c'est à dire un nœud dont l'ensemble

d'information ne contient aucun autre nœud) et comprenant tous les nœuds qui en découlent

directement ».

L'équilibre de Nash parfait en sous jeux, dû à Reinhard Selten16

en 197517

, constitue le premier

raffinement de l'équilibre de Nash.

Un équilibre de Nash est dit parfait en sous jeux si et seulement si il induit un équilibre de Nash

dans chacun des sous jeux considéré. Nous auront donc une multitude d’équilibre de Nash.

Au final le concept d'équilibre de Nash parfait en sous jeux permet de trier parmi les

équilibres de Nash, en en déterminant des plus raisonnables que d'autres. Plus précisément, le

critère de perfection en sous jeux vise à éliminer les équilibres de Nash qui reposent sur des

menaces non crédibles.

14 NICOLAS EBER est un professeur de sciences économiques à l'Institut d'études politiques de Strasbourg où il

enseigne la microéconomie et la théorie des jeux. Il est aussi membre du LARGE (Laboratoire de recherche en

gestion et économie).

15 NICOLAS EBER, Théorie des jeux, Dunod, 2007.

16 REINHARD SELTEN (né le 5 octobre 1930) est un économiste allemand, professeur émérite à l'Université de

Bonn. Il a recours à une simplification pour pouvoir remédier à la multiplicité des équilibres possibles d'un

oligopole. Il décide de décomposer les jeux en sous-jeux et développe le concept "d'équilibre en sous-jeu parfait",

17 REINHARD SELTEN, Reexamination of the perfectness concept for equilibrium points in extensive games,

International Journal of Game Theory 4, 25-55, 1975.

http://fr.wikipedia.org/wiki/%C3%89conomie

http://fr.wikipedia.org/wiki/Institut_d%27%C3%A9tudes_politiques_de_Strasbourg

http://fr.wikipedia.org/wiki/Micro%C3%A9conomie




http://fr.wikipedia.org/wiki/Allemagne

http://fr.wikipedia.org/wiki/Universit%C3%A9_de_Bonn





Page 13 sur 33

Mais qu’est-ce qu’une menace non crédible ? Prenons l’exemple d’un terroriste qui monte sur

l'avion Strasbourg-Paris. Après 10 minutes de vol, le terroriste s'approche du pilote et le menace

de faire exploser l'avion s'il n'atterrit pas à Damas. Le pilote a le choix entre continuer le vol

vers Paris ou prendre la direction de Damas. Après avoir observé le choix du pilote, le terroriste

a le choix entre faire exploser la bombe ou abandonner. Le pilote n'a qu'un seul nœud de

décision, ses stratégies contiennent alors une action unique : choisir entre Paris et Damas. Le

terroriste a deux nœuds de décisions : un après le choix de Damas par le pilote et un après Paris.

Ses stratégies doivent donc préciser une action à chacun de ces nœuds. Nous sommes donc face

à un sous jeu. Dans ces deux sous jeux le terroriste aura la possibilité de faire exploser l’avion,

ou alors d’abandonner. L'équilibre de Nash (Damas (abandon ou explosion) est soutenu par la

menace du terroriste de faire exploser l'avion si le pilote décide de prendre la direction de Paris.

Est-ce raisonnable ? En effet, si le pilote décide effectivement d'aller à Paris le terroriste aura au

regard de la théorie des jeux un gain plus important en abandonnant sa menace. Théoriquement,

faire exploser la bombe correspond à une menace non crédible, et cet équilibre est soutenu par

cette menace. L’équilibre de Nash le plus probable sera donc celui consistant à choisir Paris

pour le pilote, et à abandonner pour le terroriste (Paris, abandon), ce sera le choix le plus

rationnel.

La recherche des équilibres de Nash parfaits en sous-jeux est simplifiée par l’application

de la méthode de l’induction à rebours.

22)) LLee pprriinncciippee ddee BBeellllmmaann eett ll’’iinndduuccttiioonn àà rreebboouurrss

La Programmation Dynamique est une méthode exacte de résolution de problèmes

d’optimisation séquentielle, due essentiellement à Richard Bellman18

en 1957. L’induction à

rebours (en anglais : backward induction) est issue de ce raisonnement.

Le principe de Bellman veut que pour résoudre un problème d’optimisation dynamique, on

commence par chercher le choix optimal de la dernière période, puis on remonte le temps de

période en période en cherchant à chaque période le choix optimal, une fois qu’on a pris en

compte les choix optimaux des périodes antérieures.

18 RICHARD ERNEST BELLMAN (29 août 1920; 19 mars 1984) est un mathématicien américain. Il étudia les

mathématiques appliquées. Célèbre pour diverses contributions dans plusieurs domaines des mathématiques, il est

surtout l'inventeur de la programmation dynamique, qui résolut à son époque de façon inespérée l'optimisation des

sommes de fonctions monotones croissantes sous contraintes.

http://fr.wikipedia.org/wiki/Math%C3%A9maticien


http://fr.wikipedia.org/wiki/Programmation_dynamique



Page 14 sur 33

En 2002 Gisèle Umbhauer dans son ouvrage « La théorie des jeux appliquée à la

gestion » a proposé le terme de « rétroduction » qui semble plus commun.

Selon elle, la rétroduction conduit les acteurs à envisager leur action présente en fonction

d'actions futures, et, est de ce fait liée au sens inverse de la flèche du temps. Elle n'est pas pour

autant contre intuitive. Le fait est que la majeure partie des décisions réelles se prennent en

tenant compte des réactions futures qu'elles suscitent : le futur entre dans les actes présents.

BB.. EEqquuiilliibbrree ddeess JJeeuuxx RRééppééttééss

Nous avons présenté jusqu’à présent des situations où l’interaction entre les joueurs n’a

lieu qu’une seule fois. Cependant beaucoup d’interactions se déploient dans le temps de manière

répétée.

Il convient de présenter le sens de ces jeux répétés (1) et de souligner la particularité de certains

d’entre eux : les jeux répétés indéfiniment (2).

11)) LLeess jjeeuuxx rrééppééttééss :: iiddééeess ddee bbaassee

Selon Thierry Pénard19

un jeu répété est « un jeu ordinaire réitéré plusieurs fois de

suite ». Par jeu ordinaire, il faut entendre un jeu statique (joué une seule fois) dans lequel les

joueurs choisissent simultanément leurs stratégies.

Historiquement, la théorie des jeux est une théorie des jeux statiques. Il a fallu attendre les

années 1970 pour penser les jeux à plusieurs périodes comme des jeux à part entière. Il n’est pas

abusif de parler aujourd’hui d’une théorie des jeux répétés tant il est vrai que cette dernière a

acquis une véritable autonomie conceptuelle par rapport à la théorie des jeux statiques.

Un jeu répété (en anglais « repeated game ») au sens strict est un jeu répété stationnaire : c’est

le même jeu ordinaire, appelé jeu constituant, qui est répété de période en période. Les

conditions de jeu ne se modifient pas au cours du temps : même nombre de joueurs, mêmes

ensembles de stratégies, mêmes fonctions de gain, même facteur d’actualisation.

19 THIERRY PÉNARD (professeur d'économie à l'Université de Rennes 1) : La théorie des jeux répétés :

application à la concurrence oligopolistique, 1998.



Page 15 sur 33

Selon Nicolas Eber, les jeux répétés peuvent être vus comme des jeux dynamiques un

peu particuliers. De ce fait, ils seront résolus de la même manière, c'est à dire en recherchant

l'ensemble des équilibres de Nash parfaits en sous jeux par la méthode d'induction à rebours.

22)) LLeess jjeeuuxx rrééppééttééss uunn nnoommbbrree iinnffiinnii ddee ffooiiss

Nicolas Eber souligne un point particulier au sujet des jeux répétés indéfiniment. Dans

ces jeux, il s'agit en fait de supposer que le jeu se poursuit indéfiniment ou, que les joueurs

pensent que tel est le cas ou, d'une façon à peu près équivalente, mais plus réaliste, que les

joueurs n'ont aucune information sur la date de fin du jeu. Dans ce cas la dernière période n'est

plus identifiée et on ne peut plus appliquer la méthode d'induction à rebours.

Dans ce cas il est établi l'existence d'un très grand nombre d'équilibres de Nash parfaits en sous

jeux, sans possibilité de trier parmi ces équilibres. Cette multitude d'équilibres est synonyme

d'indétermination puisqu’aucune prédiction ne pourra être faite sur l'issue du jeu.

Alors comment sortir de ce dilemme ? Une première réponse apportée par le théorème «

folk » est de considérer que la situation responsable du dilemme n’est pas unique mais est

appelée à se renouveler régulièrement. Ce théorème doit son nom au fait qu'il n'est pas associé

nominativement à un auteur en particulier. Le folk theorem suggère que dans les cas de jeux

répétés, tout équilibre peut être sélectionné. De ce fait, des critères externes au jeu vont guider la

sélection. Ainsi, après un certain nombre de tours, un équilibre particulier peut se révéler porteur

de gains plus élevés que l'autre, sembler plus naturel, plus juste ou moins dangereux.

La coopération peut alors s’avérer une des solutions possibles car en coopérant, les acteurs

instaurent entre eux une relation de confiance qui leur permet de gagner davantage à chaque

rencontre que s’ils se trahissent dès le départ. Sur la durée, la coopération peut donc être

payante. Encore faut-il que les joueurs adoptent les stratégies adéquates.

Nous pouvons souligner une émergence de la coopération au sein de jeux qui à la base se

veulent être non coopératifs.

http://fr.wikipedia.org/w/index.php?title=Folk_theorem&action=edit&redlink=1

http://fr.wikipedia.org/w/index.php?title=Jeux_r%C3%A9p%C3%A9t%C3%A9s&action=edit&redlink=1





Page 16 sur 33

Nous pouvons illustrer nos propos en présentant un exemple concret. Il s’agit de

l’expérience de Robert Axelrod20

.

Il a étudié en 1984 le phénomène de la coopération en organisant un tournoi informatique

confrontant diverses stratégies. Pour cela, il avait invité des collègues de différentes disciplines à

soumettre un programme informatique pour jouer un dilemme du prisonnier répété 200 fois.

Chaque programme contenait la stratégie que désirait suivre le joueur. Ainsi, furent soumises

notamment la stratégie donnant-donnant, qui consiste à coopérer dans un premier temps pour

ensuite imiter les actions de l'autre joueur, ou encore la stratégie rancunière, qui consiste à

coopérer initialement mais à trahir jusqu’à la fin du jeu en cas de trahison de l’autre joueur.

Chaque programme était confronté à tous les autres, à lui-même et à un programme jouant au

hasard. Le programme ayant accumulé le gain total le plus élevé était déclaré vainqueur du

tournoi. Dans un premier temps, 14 programmes furent proposés. La stratégie donnant-donnant

remporta le tournoi. Devant ce résultat, Axelrod organisa un second tournoi. 62 programmes

provenant de 6 pays différents furent soumis. C’est à nouveau le programme donnant-donnant

qui l’emporta. On pourrait appeler aussi cette stratégie « œil pour œil, dent pour dent ».

L'analyse d’Axelrod montre qu'une bonne stratégie est caractérisée par quatre qualités qui en

garantissent le succès. Une bonne stratégie doit être bienveillante : elle ne doit jamais prendre

l’initiative de la première trahison. Elle doit aussi pouvoir être réactive : face à une action

hostile non sollicitée, elle doit répliquer. Elle doit être indulgente : après avoir puni son

adversaire, elle doit pouvoir coopérer de nouveau. Enfin, elle doit être transparente : les autres

joueurs doivent pouvoir anticiper les conséquences de leurs actions.

20 ROBERT AXELROD (né en 1943) est professeur de science politique à l’université du Michigan, lauréat du prix

MacArthur en 1987. Ses travaux sur l'évolution de la coopération, liée à la théorie des jeux, ont été cités dans plus

de cinq mille articles scientifiques. Il est président de l’American Political Science Association (APSA) pour

l'année 2006-2007.

http://fr.wikipedia.org/wiki/Science_politique

http://fr.wikipedia.org/wiki/Prix_MacArthur




http://www.apsanet.org/



Page 17 sur 33

SSEECCTTIIOONN 22 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX NNOONN CCOOOOPPÉÉRRAATTIIFFSS

AAVVEECC IINNFFOORRMMAATTIIOONN IINNCCOOMMPPLLÈÈTTEE

Comme nous l’avons déjà dit, un jeu à information incomplète est un jeu dans lequel au

moins un des joueurs ne connait pas parfaitement la structure du jeu. Ces jeux peuvent être

simultanés ou séquentiels. Dans un jeu simultané chaque joueur choisit son plan d’action

complet une fois pour toutes au début du jeu, à contrario dans un jeu séquentiel, chaque joueur

choisit son plan d’action à chaque fois qu’il doit prendre une décision pendant le déroulement du

jeu.

On va pouvoir trouver des solutions d’équilibre dans les jeux simultanés avec

information incomplète (§1) et des jeux séquentiels avec information complète (§2).

§§ 11 :: LL’’ééqquuiilliibbrree ddaannss lleess jjeeuuxx ssiimmuullttaannééss àà iinnffoorrmmaattiioonn iinnccoommppllèèttee

Les jeux en information incomplète (ou jeux bayésiens) cherchent à analyser le type de

situation où les joueurs ne connaissent pas parfaitement les données du jeu. Le problème dans ce

cas réside dans l’incomplétude, car si les joueurs ne connaissent pas parfaitement le jeu,

comment pourront-ils réagir de manière rationnelle et à quel type de résultat pourront nous

aboutir dans ce jeu ? On ne pourra pas trouver de résultat d’équilibre tant que l’on n’aura pas

corrigé cette situation.

Ce problème va pouvoir être corrigé avec la méthode de Harsanyi (A), et nous permettra

d’arriver à un équilibre de Nash bayésien (B).

AA.. LLaa mméétthhooddee ddee HHaarrssaannyyii

Jusqu'au milieu des années 1960, l'incomplétude de l'information posait un problème de

modélisation parce qu'elle ouvrait sur l'intersubjectivité, les paramètres inconnus faisant l'objet

d'anticipations croisées, ce qui conduit à des anticipations d'ordre infini qui interdisent

l’échange.



Page 18 sur 33

John Harsanyi21

a résolu ce problème en transformant des jeux en information incomplète (dans

lesquels chaque joueur connaît sa propre évaluation et ignore celles des autres) en des jeux ayant

la structure mathématique d'un jeu complet. Rappelons comment s’opère cette transformation.

Un acteur particulier, Nature, détermine par une loterie les valeurs effectives des

variables pertinentes du jeu sur lesquelles porte l'incertitude, c’est à dire les valeurs des vecteurs

c 1 ,…, ci,...,cn qui représentent les attributs de chacun des n joueurs. Le joueur i reçoit une

information partielle sur les valeurs de ces vecteurs puisqu'il connaît ses propres caractéristiques

(ci) mais ignore celles des autres. John Harsanyi nous dit que dans un jeu devenu complet, les

vecteurs ci doivent être interprétés comme des vecteurs aléatoires qui suivent une distribution de

probabilité objective connue de tous les n joueurs. Le vecteur ci qui exprime quelle est la

dotation aléatoire du joueur i s'interprète, selon Harsanyi, de deux façons : il représente soit

toute l'information disponible du joueur i vis à vis du jeu, soit les caractéristiques du joueur i,

par exemple, sa force physique, ses goûts… Quelle que soit l’interprétation, le vecteur ci inclut

toutes les variables susceptibles d’influencer l’estimation que formulera a priori le joueur i.

L'habitude a été prise de résumer la méthode d'Harsanyi par la formule « la Nature joue en

premier », puisque c'est elle qui organise une loterie dont le tirage donne la loi de probabilité

initiale qui définit la répartition des caractéristiques des joueurs. On a également pris l'habitude

d'exprimer ces hypothèses en considérant que le vecteur ci correspond à un type de joueur, que

chaque joueur connaît seulement son propre type et, en général, ne connaît pas celui des autres

joueurs. Les probabilités subjectives des agents sur les caractéristiques inconnues sont déduites

de la loi de probabilité initiale, étant données leurs informations privées. Par ce procédé,

l'intersubjectivité inhérente aux anticipations croisées disparaît, remplacée par des probabilités

subjectives. Les probabilités subjectives formulées par les joueurs s'analysent comme des

estimations personnelles de la loi de probabilité initiale venant de la Nature qui est tenue pour

objective. Ainsi, les croyances sur les autres ont cessé d’être le produit d’une spéculation sans

fin.

Prenons un exemple pour illustrer nos propos. Une entreprise B doit décider si elle se

lance dans la production d'un bien jusqu'alors fourni par une entreprise A. Comment peut-elle le

21 JOHN CHARLES HARSANYI (29 mai 1920 - 9 août 2000) est un économiste hongro-australien, naturalisé

américain. Il a contribué au développement de la théorie des jeux en mathématiques en approfondissant l'analyse

des jeux à information incomplète. Pour ses travaux en théorie des jeux, il reçoit en 1994, en même temps que

John Forbes Nash et Reinhard Selten, le « Prix Nobel » d'économie.




http://fr.wikipedia.org/wiki/Australie


http://fr.wikipedia.org/wiki/Math%C3%A9matiques


http://fr.wikipedia.org/wiki/John_Forbes_Nash

http://fr.wikipedia.org/wiki/Reinhard_Selten




Page 19 sur 33

faire si elle ne connaît pas les coûts de A ? B sait seulement que si A a des coûts faibles, A a

intérêt à s'entendre avec B pour partager le marché et à refuser l'entente dans le cas contraire.

John Harsanyi propose d'introduire un joueur fictif qui décide du « type » de A : A1 si elle a des

coûts faibles, A2 dans le cas contraire. On peut alors affecter à chaque situation de manière

séquentielle des probabilités pour déterminer le chemin optimal de B.

La résolution des jeux à information incomplète nécessite un aménagement du concept

d'équilibre de Nash. Pour les jeux statiques, cet aménagement consiste à définir la notion

d'équilibre bayésien.

BB.. LL’’ééqquuiilliibbrree ddee NNaasshh bbaayyééssiieenn

Pour ce type de jeux, l'incertitude porte généralement sur une caractéristique d'un joueur,

c'est à dire sur ce qu'on appelle le type du joueur, qui correspond au paramètre de sa fonction

(paramètre du cout ou de demande par exemple).

Dans ce contexte d'incertitude, il convient de modifier un peu la notion de stratégie que nous

avons utilisée jusqu'à présent en introduisant le concept de stratégie contingente aux types.

Une stratégie contingente aux types d'un joueur est une règle d'action spécifiant une action

faisable pour chacun des types possibles du joueur.

Ce nouveau concept de stratégie permet de donner une définition de l'équilibre bayésien

similaire à celle de l'équilibre de Nash.

Nicolas Eber défini l'équilibre bayésien comme « un ensemble de stratégies contingentes

aux types (une par joueur) tel que chaque joueur maximise son espérance de gain étant donné les

stratégies contingentes aux types des autres joueurs et les distributions de probabilité sur les

types de ces autres joueurs ».

Un résultat théorique important est que tout jeu statique fini à information incomplète admet au

moins un équilibre bayésien. Au final on peut dire que ce résultat est une extension directe du

théorème de Nash pour ces jeux.



Page 20 sur 33

§§ 22 :: LL’’ééqquuiilliibbrree ddaannss lleess jjeeuuxx ssééqquueennttiieellss aavveecc iinnffoorrmmaattiioonn iinnccoommppllèèttee

Dans les jeux séquentiels avec information incomplète, on complète l’information

exactement de la même manière que pour les jeux statiques, en introduisant un coup initial par le

joueur fictif « Nature ».

Dans un jeu séquentiel, la présence de l’information incomplète implique une insuffisance de

l’équilibre parfait en sous jeux (A), ce qui implique le recours à l’équilibre bayésien parfait (B).

AA.. LL’’iinnssuuffffiissaannccee ddee ll’’ééqquuiilliibbrree ppaarrffaaiitt eenn ssoouuss jjeeuuxx

Murat Yildizoglu nous apprend que la perfection en sous jeux est une propriété désirable

des solutions des jeux en information incomplète, mais l’imperfection de l’information de

certains joueurs implique que quand c’est leur tour de jouer, ils ne sauront pas nécessairement

dans quel sous jeu ils se trouvent.

Michel Cavagnac22

, lui, nous apprend que dans les jeux dynamiques en information

incomplète, l’aspect dynamique du jeu ajoute à l’évolution de l’information explicitement

prévue par les règles du jeu une évolution de nature différente.

Effectivement, chaque joueur peut, par son comportement, émettre des signaux plus ou moins

informatifs sur le type qui le caractérise. Les croyances des différents participants sur les

caractéristiques de leurs partenaires peuvent ainsi évoluer en cours de jeu : elles deviennent

alors endogènes.

Par conséquent, la notion d’équilibre de Nash parfait en sous jeux, utilisée pour les jeux

dynamiques en information complète, ne peut pas être étendue de façon directe au contexte de

l’information incomplète. Les mécanismes de signal, engendrés par les comportements des

joueurs, doivent être pris en compte.

Au final, lorsqu’un joueur doit effectuer ses choix, il connait son type, mais ne peut se

référer qu’à ces croyances concernant les types des autres joueurs. Lorsque le jeu débute, ces

22 MICHEL CAVAGNAC (Professeur d'Economie à l'Université de Limoges depuis 1994, chercheur Associé à

Toulouse (LERNA), collaborateur au Centre de Droit et d’Economie du Sport (CDES) de Limoges ) : Théorie des jeux,

Gualino éditeur, 2006.



Page 21 sur 33

croyances correspondent aux probabilités que le joueur accorde aux différentes caractéristiques

possibles de ses partenaires sachant que lui-même est de tel type.

Dans le cadre d’un jeu simultané, ces croyances sont la référence pour l’autre joueur dans un jeu

car aucune information nouvelle ne vient s’ajouter à ces informations. Cependant ce n’est pas le

cas dans les jeux séquentiels, puisque l’observation des séquences de choix retenues par les

différents participants peut apporter des informations supplémentaires concernant leurs types.

Ainsi chaque joueur révise ses croyances au fur et à mesure qu’il reçoit des signaux informatifs.

Les croyances d’un joueur dépendent des stratégies retenues par les autres joueurs, et ces

stratégies dépendent de façon indirecte de leurs croyances.

C’est pour cela que pour les jeux dynamiques en information incomplète, il n’est plus

suffisant de définir un équilibre comme un ensemble de stratégies individuelles, mais il est

nécessaire d’élargir la notion d’équilibre pour associer stratégies et croyances. C’est ce qui est

fait grâce à la notion d’équilibre bayésien parfait.

BB.. LL’’ééqquuiilliibbrree bbaayyééssiieenn ppaarrffaaiitt

D’après Michel Cavagnac, la définition de l’équilibre bayésien parfait repose sur trois

conditions.

La première reprend les arguments de stabilité qui, de façon très générale, caractérisent un

équilibre. Ainsi un ensemble de stratégie ne peut constituer un équilibre que si la stratégie de

chaque joueur est une meilleure réponse aux stratégies des autres joueurs.

La deuxième condition concerne les stratégies elles-mêmes : elles doivent être crédibles.

Effectivement, un ensemble de stratégies ne peut être retenu comme équilibre dans un jeu

dynamique que si ces stratégies ne comportent que des séquences de choix crédibles.

La troisième et dernière condition porte sur les croyances des joueurs : la règle de Bayes doit

être respectée.

Murat Yildizoglu propose une définition de l’équilibre bayésien parfait en reprenant ces

conditions. Ainsi, selon lui, un équilibre bayésien parfait est une combinaison de stratégies et un

ensemble de croyances tels qu’à chaque nœud du jeu, les stratégies dans le reste du jeu sont des

meilleures réponses aux stratégies spécifiées par l’équilibre et étant données les croyances

d’équilibre. En outre, les croyances à chaque nœud sont rationnelles, étant données les



Page 22 sur 33

connaissances fournies par le jeu jusqu’à ce point : elles sont actualisées, selon la règle de Bayes

quand cela est possible, à partir des croyances a priori et des actions observées des autres

joueurs, sous l’hypothèse qu’ils jouent leur stratégie d’équilibre.



Page 23 sur 33

CCHHAAPPIITTRREE 22 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX

CCOOOOPPÉÉRRAATTIIFFSS

Un jeu est coopératif lorsque des joueurs peuvent passer entre eux des accords qui les

lient de manière contraignante (par exemple, sous la forme d’un contrat qui prévoit une sanction

légale dans le cas du non respect de l’accord). On dit alors qu’ils forment une coalition dans

laquelle les membres agissent de concert.

On va pouvoir identifier des solutions d’équilibre dans ces types de jeux. Deux types de jeux

coopératifs vont retenir notre attention : les jeux à deux joueurs (Section 1), et les jeux à utilité

transférable (Section 2).

SSEECCTTIIOONN 11 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX DDEE NNÉÉGGOOCCIIAATTIIOONN ÀÀ

DDEEUUXX JJOOUUEEUURRSS

Deux agents (individus, firmes, pays, ...) ont la possibilité de collaborer ensemble afin

d’atteindre des situations mutuellement favorables.

Dans un tel jeu on peut se demander comment arriver à une solution d’équilibre, c'est-à-dire à la

meilleure solution pour les deux agents. Cette chose ne sera pas aisée, car les jeux de

négociations à deux joueurs présentent quelques difficultés d’appréhension. Il convient de

présenter les données du problème (§1) avant de présenter la solution d’équilibre proposée par

Nash en la matière (§2).

§§ 11 :: LLeess ddoonnnnééeess dduu pprroobbllèèmmee

Prenons un exemple. Soit un nouveau produit pour lequel deux technologies

incompatibles sont disponibles, et deux entreprises envisagent de le produire. On peut par

exemple penser au choix entre les standards VHS et Betamax pour les cassettes vidéo. Si les

deux entreprises se mettent d'accord sur une technologie, elles peuvent obtenir des ventes

importantes. En cas de désaccord, la nécessité pour le consommateur de s'équiper dans chacune

des deux technologies (avoir deux magnétoscopes) limite la taille du marché et entraîne des

ventes nettement plus faibles. Chacune des deux technologies est ainsi un équilibre de Nash du

jeu, mais celui-ci ne spécifie pas comment se coordonner sur cet équilibre.

http://fr.wikipedia.org/wiki/Video_Home_System

http://fr.wikipedia.org/wiki/Betamax

http://fr.wikipedia.org/wiki/%C3%89quilibre_de_Nash



Page 24 sur 33

Des joueurs rationnels vont coopérer sur l'une ou l'autre des stratégies et recevoir les

gains élevés. Pour ce faire, ils doivent pouvoir se coordonner, sous peine de se retrouver dans

une situation défavorable.

En l’absence de consensus, une solution par défaut de l’ensemble des réalisables est mis en

œuvre. Cette solution correspond au « point de désaccord » ou au « statu quo ».

Afin de déterminer la solution “plausible” d’un problème de négociation, Nash a formulé

certaines propriétés ou axiomes que la solution devra satisfaire.

§§ 22 :: LLaa ssoolluuttiioonn ddee NNaasshh

La solution de Nash consiste à maximiser le produit des gains nets des agents. Le gain

net d’un agent est défini comme la différence entre le résultat de l’accord et celui correspondant

au point de désaccord ou de la situation initiale que l’agent souhaite améliorer par la

négociation.

Sans entrer dans les complexes détails mathématiques, il convient de présenter

succinctement les 4 axiomes proposés par Nash.

Le premier axiome correspond à une optimalité au sens de Pareto (il ne doit pas exister

de situation plus favorable que la solution du problème de négociation pour chacun des deux

joueurs).

Le second axiome consiste en la symétrie des joueurs. La solution doit procurer à des joueurs

identiques des gains égaux en utilité.

Le troisième axiome impose une invariance d’échelle. Cet axiome permet sans perte de

généralité de normaliser à zéro les gains associés au point de désaccord.

Le dernier axiome est celui d’indépendance vis-à-vis des alternatives non pertinentes. Cet

axiome signifie que la solution ne doit pas changer si des solutions possibles, mais qui n’avaient

pas été retenues initialement, sont retirées sans que le point de désaccord n’ait été modifié.

Cette solution peut-être facilement généralisée pour les jeux avec un nombre de joueurs

supérieur à deux. Cependant, ce concept de solution ne permet pas de capturer le pouvoir dont

http://fr.wikipedia.org/wiki/Rationalit%C3%A9



Page 25 sur 33

dispose les coalitions de joueurs. C’est en étudiant les jeux coopératifs à utilité transférable

qu’on pourra tenir compte des effets de cette coalition de joueurs.

SSEECCTTIIOONN 22 :: LL’’ÉÉQQUUIILLIIBBRREE DDAANNSS LLEESS JJEEUUXX CCOOOOPPÉÉRRAATTIIFFSS ÀÀ

UUTTIILLIITTÉÉ TTRRAANNSSFFÉÉRRAABBLLEE

Un jeu coopératif est à utilité transférable lorsque la négociation porte sur le partage d’un

bien qui est parfaitement transférable entre les joueurs et que chaque joueur évalue de la même

manière.

Il convient de présenter ces types de jeux (§1), et d’en présenter un concept de solution

(§2).

§§ 11 :: DDééffiinniittiioonn eett pprroopprriiééttééss

Dans les jeux à utilité transférable, la négociation porte sur le partage d’un bien

parfaitement transférable entre les joueurs et que ceux-ci peuvent évaluer de la même manière.

Le bien en question peut par exemple être une quantité d’argent, un pouvoir politique du conseil

de sécurité des Nations Unies…

Lorsque le partage porte sur un gain à répartir entre plusieurs agents, on assigne à chaque

coalition une valeur monétaire égale au surplus de leur coopération. Cette valeur résume le

résultat produit par chaque coalition de joueur.

Concernant la valeur d’un jeu, un jeu est sur additif quand le gain que peut obtenir un groupe de

joueurs excède la somme des gains que chaque joueur pourrait avoir isolément. Le jeu sera sous

additif quand le coût que doit supporter une coalition de joueurs est plus faible que la somme de

leurs coûts individuels.

Concernant l’imputation d’un jeu : une imputation est une distribution des gains entre les

joueurs vérifiant les conditions de rationalité individuelle et de rationalité collective. La

première condition pose qu’un agent n’acceptera pas un gain moindre ou un coût supérieur à ce

qu’il aurait en restant seul et la seconde assure que le gain ou le coût de la grande coalition doit

être intégralement distribué entre les joueurs quand le jeu est super ou sous additif.



Page 26 sur 33

Ces deux conditions renvoient aux deux premiers axiomes de la solution de Nash. Le problème

réside en l’existence d’une infinité d’imputations possibles. L’intérêt de la valeur de Shapley ou

du nucléole est de proposer une imputation particulière.

§§ 22 :: UUnn ccoonncceepptt ddee ssoolluuttiioonn iinnttéérreessssaanntt :: llaa vvaalleeuurr ddee SShhaapplleeyy

La valeur de Shapley23

consiste en une évaluation a priori du jeu plutôt que d'être le

résultat du jeu. Cette caractéristique en fait une solution qui, en quelque sorte, dispense de jouer.

Pour déterminer cette valeur, Shapley a adopté l'approche axiomatique qui revient à

sélectionner, l'ensemble de propriétés souhaitables qu'elle devrait avoir.

Le premier axiome stipule l’efficience de la solution. La totalité de la valeur de la grande

coalition qui est le gain maximum possible dans un jeu sur additif doit être intégralement réparti

entre les joueurs. Cet axiome correspond à celui d’optimalité Parétienne chez Nash.

Le deuxième axiome porte sur la symétrie des joueurs. Deux joueurs ayant des contributions

identiques au sein d’une coalition doivent recevoir la même part.

Le troisième axiome est celui de nullité. Un joueur qui n’apporte rien à la valeur d’une coalition

n’a droit à rien.

Ces trois axiomes rendent la valeur de Shapley particulièrement attrayante pour traiter le

problème du partage équitable des ressources communes à plusieurs agents économiques.

23 LLOYD STOWELL SHAPLEY, (né le 2 juin 1923) est un mathématicien et économiste américain. Il est

professeur émérite à l’Université de Californie à Los Angeles (UCLA). Il a contribué aux domaines de l’économie

mathématique et surtout de la théorie des jeux. Lloyd Shapley est considéré par de nombreux experts comme le plus

grand théoricien des jeux depuis les travaux de Von Neumann et Morgenstern en 1940. Sa thèse et son travail post-

doctoral ont prolongé les idées de Francis Ysidro Edgeworth en introduisant en théorie des jeux la valeur de

Shapley et le concept de solution noyau.

http://fr.wikipedia.org/wiki/2_juin

http://fr.wikipedia.org/wiki/Juin


http://fr.wikipedia.org/wiki/Math%C3%A9maticien



http://fr.wikipedia.org/wiki/Professeur_%C3%A9m%C3%A9rite

http://fr.wikipedia.org/wiki/Universit%C3%A9_de_Californie_%C3%A0_Los_Angeles


http://fr.wikipedia.org/wiki/Francis_Ysidro_Edgeworth

http://fr.wikipedia.org/wiki/Valeur_de_Shapley





Page 27 sur 33

Conclusion

Après avoir étudié d’une manière gélobale les principaux aspects de la théorie des jeux,

et notamment son objectif, nous pouvons nous lancer dans une sorte d’appréciation de sa réelle

utilité.

Une théorie est, selon l’acception courante, un ensemble d’hypothèses ayant trait au

monde tel qu’il est dans le but d’en expliquer tel ou tel aspect. Toutefois, en sciences humaines,

et tout particulièrement en économie, le théoricien s’en tient très rarement à ce qui est : il ne

peut s’empêcher de dire ce qui doit être.

Sa démarche est normative. Alors, quid de la théorie des jeux ? La confusion règne à son

propos, certains auteurs prétendant qu’elle cherche à expliquer les phénomènes observés, ou à

faire des prédictions, d’autres qu’elle est prescriptive (normative), d’autres encore qu’elle est

l’une et l’autre.

Cette cacophonie à propos de la nature de la théorie des jeux sur ce qu’elle fait ou permettrait de

faire n’est pas accidentelle : elle découle du fait qu’en règle générale, elle ne résout rien et ne

propose rien aux joueurs.

Essentiellement, elle attire l’attention sur les problèmes que posent les choix d’individus

rationnels en interaction, lorsque toutes les hypothèses des modèles sont spécifiées.

Si les équilibres sont, en règle générale, des situations privilégiées par le modélisateur, c’est

parce qu’ils sont, par définition, des situations non éphémères, considérées comme des points

d’attraction du système (vers lesquels il tend ou autour desquels il se maintient).

Or les théoriciens des jeux utilisent le mot équilibre pour désigner leur principal concept de

solution : l’équilibre, ce qui revient en fait à désigner celui-ci comme la solution qui va de soi.

En définitive quand on a trouvé les équilibres d’un modèle, celui-ci est résolu, pour l’essentiel.

Mais qu’en est-il exactement ? Car si un équilibre satisfait la condition minimale de

rationalité, chaque joueur maximise compte tenu de ce qu’il pense que les autres feront. Il n’a

rien des caractéristiques d’un équilibre, tel qu’on l’entend habituellement.

En effet, s’il y a équilibre, c’est parce que chacun anticipe correctement ce que les autres vont

faire. En outre, les choix sont faits une seule fois et simultanément dans la plus part des cas :



Page 28 sur 33

l’idée d’un processus menant à l’équilibre par modifications successives des anticipations n’a

pas de sens dans ce contexte.

L’application de la théorie des jeux au droit de la concurrence, et plus précisément au cas

des duopoles, va souligner ces limites.

Prenons l’exemple phare de la concurrence imparfaite : le modèle du duopole de

Cournot. Chaque entreprise fait une offre en anticipant celle de l’autre (et en pensant qu’elle ne

la modifiera pas), sans rien connaître à son propos. L’équilibre de Cournot-Nash du modèle est

tel que chaque entreprise fait son offre en prévoyant exactement l’offre de sa concurrente sans

rien savoir sur elle.

Que peut alors prédire le modèle ? Rien, si ce n’est que l’équilibre n’aura jamais lieu, sauf cas

très exceptionnel où chaque entreprise tombe par hasard sur l’offre de l’autre. Le théoricien va-t-

il prescrire cet équilibre aux entreprises ? Non, puisqu’elles peuvent toutes deux gagner plus en

se concertant.

Autrement dit, l’équilibre de Nash ne représente ni ce qui est ou pourrait être, ni ce qui devrait

être du point de vue du profit des entreprises.

Si on prend l’autre modèle classique du duopole, celui de Bertrand, où les entreprises proposent

des prix, alors on peut dire que l’équilibre de Nash n’aura jamais lieu. En effet, l’équilibre de ce

modèle est tel que chaque entreprise propose le même prix, égal au coût moyen supposé

constant. Comme à ce prix, leur profit est nul, elles ont toutes deux intérêt à proposer un prix

supérieur à ce coût, avec une chance sur deux de faire un profit strictement positif plutôt que

nul: par conséquent aucune d’entre elles ne choisira la stratégie d’équilibre.

On peut aussi revenir à notre exemple concernant un terroriste qui menace de faire

exploser une bombe dans le cas où pilote ne se rendrait pas à Damas. Du point de vue de la

théorie des jeux, la solution d’équilibre, qui serait la plus bénéfique pour les deux protagonistes,

serait de refuser de se rendre à Damas de la part du pilote la menace de faire exploser la bombe

serait du point de vue de la théorie des jeux une menace non crédible. Effectivement, elle

apporterait un bénéfice moindre au terroriste que de ne pas la faire exploser.

Cependant, la réalité est tout autre, le terroriste est là pour des considérations personnelles, la

plus part du temps cette personne est formatée pour cette attentat suicide. Il ne raisonnera pas



Page 29 sur 33

rationnellement en se disant qu’il vaut mieux pour lui de ne pas faire exploser la bombe quoi

qu’il arrive.

Ainsi la théorie des jeux semble prend en compte des situations réelles, et propose des

solutions d’équilibre sans réellement prendre en considération la volonté des protagonistes. Ce

raisonnement mathématique ne semble pas adapter à la réalité qui doit d’avantage prendre en

compte les aspects sociologiques et psychologiques.



Page 30 sur 33

BBIIBBLLIIOOGGRRAAPPHHIIEE

AA.. OOuuvvrraaggeess

Gaël Guiraud, La théorie des jeux, Champs, 2000.

Gisèle Umbhauer, Théorie des jeux appliquée à la gestion, EMS Management & Société, 2002.

John Von Neuman and Oskar Morgenstern, Theory of games and economic behavior, Princeton

University Press, 1944.

Murat Yildizoglu, Introduction à la théorie des jeux, Dunod, 2003.

Michel Cavagnac, Théorie des jeux, Gualion, 2006.

Nicolas Eber, Théorie des jeux, Théorie des jeux, Dunod, 2007.

Thomas C. Shelling, The stratégie of conflict, PUF, 1987.

BB.. RReevvuueess

Christian Schmidt, Quelques repères historiques sur la théorie des jeux, de Leibniz à Von

Neuman, Revue de Synthèse, Volume 127, Number 1, 141-158, DOI: 10.1007/BF02962625,

2006.

Jean-Christophe Péreau, Négociation et théorie des jeux : les « dessous » d'un accord

acceptable, Négociations 2/2009 (n° 12), p. 35-49.

John Charles Harsanyi, Games with incomplete information played by bayesian players,

Management science 14, 159-182,320-334,486-502, 1968-1969.

Reinhard Selten, Reexamination of the perfectness concept for equilibrium points in extensive

games, International Journal of Game Theory 4, 25-55, 1975.

CC.. SSoouurrcceess IInntteerrnneett

Jacques-François Thisse, Théorie des Jeux : Une introduction, disponible sur internet :

http://www.core.ucl.ac.be/staff/thisse%28micro_licence%29.pdf

http://www.springerlink.com/content/0035-1776/

http://www.springerlink.com/content/0035-1776/127/1/

http://www.core.ucl.ac.be/staff/thisse%28micro_licence%29.pdf



Page 31 sur 33

Sylvain Béal, Cours de Théorie des jeux coopératifs, 2010, disponible sur internet :

http://webs.unice.fr/droit/courbeal-L3Eco0809.pdf

Thierry Pénard, La théorie des jeux répétés : application à la concurrence oligopolistique, 1998,

disponible sur internet : http://perso.univ-rennes1.fr/thierry.penard/biblio/aix.pdf

http://webs.unice.fr/droit/courbeal-L3Eco0809.pdf

http://perso.univ-rennes1.fr/thierry.penard/biblio/aix.pdf



Page 32 sur 33

Table des matières

Sommaire ................................................................................................................... 1

Introduction ............................................................................................................... 2

A. L’historique de la théorie des jeux .......................................................................... 3

B. Les éléments constitutifs de la théorie des jeux ...................................................... 4

1) Présentation.……………………………………………………………………………4

2) Les différents types de jeux……………………………………………………………5

3) Les différentes stratégies………………………………………………………………6

4) Les solutions et équilibres d'un jeu…..………………………………………………7

Chapitre 1 : L’équilibre dans les jeux non coopératifs ........................................... 8

Section 1 : l’équilibre dans les jeux non coopératifs avec information

complète……………………………………………………………………… ..….8

§ 1 : L’équilibre de Nash ......................................................................................... 8

A. Les prémisses de l’équilibre de Nash..................................................................... 9

B. La définition actuelle de l’équilibre de Nash .......................................................... 9

C. Les insuffisances de l’équilibre de Nash ............................................................... 10

§ 2 : Les extensions à l’équilibre de Nash ............................................................. 12

A. Equilibre Parfait en Sous Jeux .............................................................................. 12

1) Sous jeux et équilibre parfait….………………………………………………………12

2) Le principe de Bellman et l'induction à rebours……………………………………13

B. Equilibre des Jeux Répétés .................................................................................... 14

1) Les jeux répétés de base………………………………………………………………14

2) Les jeux répétés un nombre infinis de fois….………………………………………15



Page 33 sur 33

Section 2 : L’équilibre dans les jeux non coopératifs avec information

incomplète………………………………………………………………..……. 17

§ 1 : L’équilibre dans les jeux simultanés avec information incomplète .............. 17

A. La méthode de Harsanyi ....................................................................................... 17

B. L’équilibre de Nash bayésien ................................................................................ 19

§ 2 : L’équilibre dans les jeux séquentiels avec information incomplète .............. 20

A. L’insuffisance de l’équilibre parfait en sous jeux.. ............................................... 20

B. L’équilibre bayésien parfait ................................................................................... 21

Chapitre 2 : L’équilibre dans les jeux coopératifs ................................................. 23

Section 1 : L’equilibre dans les jeux de négociation à deux joueurs ...................... 23

§ 1 : Les données du problème .............................................................................. 23

§ 2 : La solution de Nash ....................................................................................... 24

Section 2 : L’équilibre dans les jeux coopératifs à utilité transférable................... 25

§ 1 : Définition et propriétés .................................................................................. 25

§ 2 : Un concept interessant de solution : la valeur de Shapley ............................ 26

Conclusion ............................................................................................................... 28

Bibliographie ........................................................................................................... 31

A. Ouvrages .......................................................................................................... 31

B. Revues .............................................................................................................. 31

C. Sources Internet ............................................................................................... 31

Table des matières .................................................................................................. 32

Documents

LA THEORIE DES JEUX · Mémoire présenté par Alexandre Marce Master 2 - Droit du Marché . Université Montpellier I - Faculté de Droit - Année 2010/2011 Master 2