40
1 К. В. Григорьева Методические указания Часть 1. Бескоалиционные игры в нормальной форме. Факультет ПМ-ПУ СПбГУ 2007 г.

К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

1

К. В. Григорьева

Методические указания

Часть 1. Бескоалиционные игры в нормальной форме.

Факультет ПМ-ПУ СПбГУ 2007 г.

Page 2: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

2

ОГЛАВЛЕНИЕ ЗАНЯТИЕ №1 ............................................................................................................................................................. 3

1.1. СОДЕРЖАНИЕ ТЕОРИИ ИГР....................................................................................................................... 3 1.2. КЛАССИФИКАЦИЯ ИГР .............................................................................................................................. 3 1.3. ИГРА В НОРМАЛЬНОЙ ФОРМЕ ................................................................................................................. 5 1.4. РАВНОВЕСИЕ ПО НЭШУ............................................................................................................................. 6 1.5. ОПТИМАЛЬНОСТЬ ПО ПАРЕТО. ............................................................................................................... 7

ЗАНЯТИЕ №2 ............................................................................................................................................................. 8 2.1. АНТАГОНИСТИЧЕСКИЕ ИГРЫ. СЕДЛОВАЯ ТОЧКА ............................................................................ 8 2.2. ПРИНЦИП МАКСМИНА И МИНИМАКСА ............................................................................................... 9

ЗАНЯТИЕ №3 ........................................................................................................................................................... 11 3.1. СМЕШАННЫЕ СТРАТЕГИИ МАТРИЧНЫХ ИГР ................................................................................... 11 3.2. СИТУАЦИЯ РАВНОВЕСИЯ В СМЕШАННЫХ СТРАТЕГИЯХ............................................................. 13 3.3. СВОЙСТВА ОПТИМАЛЬНЫХ СМЕШАННЫХ СТРАТЕГИЙ .............................................................. 14 3.2. РАВНОВЕСИЕ ПО НЭШУ В СМЕШАННЫХ СТРАТЕГИЯХ В БИМАТРИЧНОЙ ИГРЕ .................. 16

ЗАНЯТИЕ №4. НАХОЖДЕНИЕ ЗНАЧЕНИЯ ИГРЫ ПРИ ПОМОЩИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ (ЛП)............................................................................................................................... 18 ЗАНЯТИЕ №5. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ( )−× n2 ЛИБО ( )−×2m МАТРИЧНЫХ ИГР............................................................................................................................................................................. 23 ЗАНЯТИЕ №6 ........................................................................................................................................................... 26

6.1 ДОМИНИРОВАНИЕ СТРАТЕГИЙ В БИМАТРИЧНОЙ ИГРЕ ............................................................... 26 6.2. ДОМИНИРОВАНИЕ СТРАТЕГИЙ В АНТАГОНИСТИЧЕСКОЙ ИГРЕ .............................................. 27

ЗАНЯТИЕ №7. ИТЕРАТИВНЫЕ МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР .................................................. 30 7.1. ИТЕРАТИВНЫЙ МЕТОД БРАУНА – РОБИНСОНА (МЕТОД ФИКТИВНОГО РАЗЫГРЫВАНИЯ) 30 7.2. МОНОТОННЫЙ ИТЕРАТИВНЫЙ АЛГОРИТМ РЕШЕНИЯ МИ ......................................................... 31

ПРИЛОЖЕНИЕ ........................................................................................................................................................ 35 ЛИТЕРАТУРА .......................................................................................................................................................... 40

Page 3: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

3

ЗАНЯТИЕ №1

1.1. СОДЕРЖАНИЕ ТЕОРИИ ИГР Теория игр (GT – Game Theory) – это раздел теории управления, в котором исследуются задачи о существовании и нахождении оптимального управления в условиях конфликта (в условиях столкновения сторон, каждая из которых стремится воздействовать на развитие конфликта в своих интересах).

Существует множество определений того, что есть GT и каковы ее задачи. «Теория игр — это теория рационального поведения людей с несовпадающими

интересами» (Aumann, 1989). «Теория игр — наука о стратегическом мышлении» (Dixit, Nalebuff, 1991). «Теория игр1 — это теория мат. моделей принятия решений в условиях

неопределенности, когда принимающий решение «игрок» располагает информацией лишь о множестве возможных ситуаций, в одной из которых он в действительности находится, о множестве решений («стратегий»), которые он может принять, и о количественной мере «выигрыша», который он мог бы получить, выбрав в данной ситуации данную стратегию». Неопределенность в GT является следствием сознательной деятельности другого лица (лиц), отстаивающего свои интересы. В связи с этим под «теорией игр понимается теория мат. моделей принятия оптимальных решений в условиях конфликтов» (Воробьев, 1984).

Таким образом, содержание теории игр – это установление принципов оптимального поведения в условиях неопределенности, доказательство существования решений, удовлетворяющих этим принципам, указание алгоритмов нахождения решений. Моделями GT описываются экономические и правовые конфликты, взаимодействие человека с природой, биологическая борьба за существование, военное дело и т. д. (Дюбин, Суздаль, 1981; Shubik, 1984; Moulin, 1983, 1986; Ordeshook, 1986; Rawls, 1971; Maynard, Smith 1974 и др.). Теоретико-игровой подход к изучению формирования коалиций является своего рода традицией в социальных и политических науках (Riker, 1962; Riker, Ordeshook, 1973; De Swan, 1973; Ordeshook, 1978, 1992; Van Deemen, 1997). В книге «Game Theory and the Law» (D.Baird, R. Gertner, С Picker, 1994) аппарат GT впервые применяется к анализу того, как законы влияют на поведение людей, партий и т.д. Особая роль теории игр выделяется в экономическом моделировании: «Суть теории игр в том, чтобы помочь экономистам понимать и предсказывать то, что будет происходить в экономическом контексте» (Kreps, 1990). «Аппарат теории равновесия и теории игр послужил основой для создания современных теорий международной торговли, налогообложения, общественных благ, монетарной экономики, теории производственных организаций» (Полтерович, 1997).

1.2. КЛАССИФИКАЦИЯ ИГР Все модели в GT принято называть играми. Математическое описание игры сводится к перечислению всех действующих в ней игроков, указанию для каждого игрока всех его стратегий, а также численного выигрыша, который он получит после того, как игроки выберут свои стратегии. В результате игра становится формальным объектом, который поддается математическому анализу. Игры можно классифицировать по различным признакам:

• по числу «игроков» (сторон) 2≥N ; • по числу ходов в игре:

1 Воробъев Н. Н. Философская энциклопедия. Т. 5. М., 1970. С. 208—210.

Page 4: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

4

многошаговые; бесконечные;

• математической структуре модели игры: рекурсивные; дифференциальные;

• по числу стратегий игры: конечные; бесконечные, если хотя бы у одного «игрока» число стратегий бесконечно;

• по взаимоотношениям игроков: кооперативные (коалиционные), в которых принимающие решение игроки объединены в фиксированные коалиции. Члены одной коалиции могут свободно обмениваться информацией и принимать полностью согласованные решения. Игроки могут вступать в коалицию и договариваться о совместных действиях.

бескоалиционные, в которых каждая коалиция или множество игроков, действующих совместно, состоит лишь из одного игрока. Теория бескоалиционных игр – это способ моделирования и анализа ситуаций, в которых оптимальные решения каждого игрока зависят от его представлений об игре оппонентов. Важнейшим моментом теории является то, что игроки не должны придерживаться произвольных представлений об игре своих оппонентов: каждый игрок должен пытаться предсказать игру своих оппонентов, используя свои знания правил игры и исходя из предположений, что его оппоненты сами рациональны, а потому пытаются сами также предсказать игру своих оппонентов и максимизировать свои собственные выигрыши. Однако так называемая кооперативная теория бескоалиционных игр допускает временные объединения игроков в коалиции в процессе игры с последующим разделением полученного выигрыша или принятие совместных решений;

• по степени информативности «игроков» в игре: детерминированные, когда условия, в которых принимаются решения, известны полностью;

стохастические, когда известно множество возможных вариантов условий и их вероятностное распределение;

неопределенные, когда известно множество возможных вариантов, но без какой-либо информации об их вероятностях;

• по выигрышу игры: антагонистические; игры с ненулевой суммой;

• по характеру получения информации: статические игры или игры в нормальной форме (игроки получают всю предназначенную им информацию до начала игры и ходят один раз, одновременно и независимо);

динамические игры или игры в позиционной форме (информация поступает игрокам в процессе развития игры);

• по полноте имеющейся у игроков информации: статические игры с полной информацией предполагают, что у игроков имеется вся «необходимая» информация друг о друге, включая выигрыши игроков;

если игрок знает свою функцию выигрыша, но может не знать функций выигрыша остальных игроков, то тогда участники должны иметь какие-то представления относительно предпочтений других участников, должны иметь представления об их представлениях о предпочтениях других и т.д. Здесь мы приходим к понятию Байесовых игр (статические игры с неполной информацией);

динамические игры с полной информацией и неполной информацией.

Page 5: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

5

1.3. ИГРА В НОРМАЛЬНОЙ ФОРМЕ Определение 1.1. Под игрой в нормальной (или стратегической) форме

понимается объект { }nn KKXXNG ,,,,,, 11 ……= ,

где { }nN ,1= – множество игроков; iX – конечное множество чистых стратегий ix i -го игрока, Ni∈ ; ix – чистая стратегия i -го игрока, ii XxNi ∈∈ , ; ( )ni xxK ,,1 … – вещественная функция выигрышей игрока i, определенная на декартовом произведении nXXXX ×××= …21 .

Набор стратегий ( ) Xxxxx n ∈= ,,,1 … , называется ситуацией игры. Рассмотрим простейшую статическую модель – игру в нормальной форме

( ) ( )

( ) ( )⎟⎟⎟

⎜⎜⎜

mnmnmm

nn

βαβα

βαβα

,,

,,

11

111111

…………

…,

в которой имеем: участие двух игроков { }2,1=N , конечное множество стратегий каждого из игроков: { }miiX ,11 == – стратегии первого игрока;

{ }njjX ,12 == – стратегии второго игрока; ситуация игры – пара стратегий ( )ji, ; ( ) ijjiK α=,1 – выигрыш первого игрока и ( ) ijjiK β=,2 – выигрыш второго игрока. Такая игра называется биматричной, т.к. ее можно представить в виде двух

матриц:

⎟⎟⎟

⎜⎜⎜

mnm

n

αα

αα

…………

1

111

и ⎟⎟⎟

⎜⎜⎜

mnm

n

ββ

ββ

…………

1

111

.

Отметим, что формально постановка игры в нормальной форме имеет следующую интерпретацию: игроки одновременно и независимо друг от друга выбирают свои стратегии ii Xx ∈ ; после этого возникает ситуация ( )nxx ,,1 … ; на этом игра прекращается, и i -ый игрок получает свой выигрыш ( )ni xxK ,,1 … , где Ni∈ .

Возникает следующая проблема: каждый игрок стремится максимизировать свой выигрыш. Такая постановка математически некорректна, т. к. игрок знает только свою стратегию ix и не знает других параметров. В связи с этим существуют различные подходы к понятию оптимального поведения.

В 1950 г. Джон Нэш (Нобелевский лауреат по экономике 1994 г.) ввел понятие ситуации равновесия как метода решений бескоалиционных игр.

Определение 1.2. Ситуация, образующаяся в результате выбора всеми игроками некоторых своих стратегий, называется равновесной, если ни одному из игроков невыгодно изменять свою стратегию при условии, что остальные игроки придерживаются равновесных стратегий.

Именно равновесие по Нэшу и его модификации признаются наиболее подходящими концепциями решения таких игр.

Page 6: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

6

1.4. РАВНОВЕСИЕ ПО НЭШУ Введем обозначения. Пусть ситуация игры ( )niii xxxxxx ,,,,,, 111 …… +−= . Вместо

стратегии ix игрок i использует стратегию ix : ( ) ( )niiii xxxxxxx ,,,,,,|| 111 …… +−= . Определение 1.3. Будем говорить, что ситуация x (это набор стратегий) является

равновесной по Нэшу (NE – Nash Equilibrium), если имеет место ( ) ( ) iiiii XxNixxKxK ∈∈∀≥ ,|| .

Если игроки договорились о выборе стратегии и возможна ситуация x , входящая в равновесие по Нэшу, то получается устойчивый договор, и в дальнейшем ни один из игроков в индивидуальном порядке не заинтересован в отклонении от равновесия по Нэшу, т.к. выигрыш может только уменьшиться. В то же время, равновесие по Нэшу не является устойчивым против отклонения группы игроков. Если сразу отойдет некоторая коалиция игроков, то они могут выиграть.

Пример 1.1. Семейный спор. { })(),( ЖженаМмужN = . Каждый имеет две альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. { }ФТ

ЖМ xxXX ,== . Если они вместе пойдут на футбол, то Он получит больше удовольствия, чем Она; если они вместе пойдут в театр, то – наоборот. Наконец, если они окажутся в разных местах, то они не получат никакого удовольствия. Рассматриваемая ситуация моделируется следующей игрой:

( ) ( )( ) ( ) ( )( )( ) ( )( ) ( ) ( )( )

( ) ( )( ) ( ) .

4,10,00,01,4

,,,,,,,,,,,,

2121

2121⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛ТФ

МxxKxxKxxKxxKxxKxxKxxKxxK

ТФЖ

ТЖ

ТМ

ТЖ

ТМ

ТЖ

ФМ

ТЖ

ФМ

ФЖ

ТМ

ФЖ

ТМ

ФЖ

ФМ

ФЖ

ФМ

Рассмотрим ситуацию (Ф,Ф). Запишем математически ( 1x – единственная альтернатива 1x , аналогично, 2x – единственная альтернатива 2x ):

( )( ) ( )( ) ( );,||

;,||

;,,,

2

1

2121

ТЖ

ФМ

ФЖ

ТМ

ФЖ

ФМ

xxxx

xxxx

xxxxxxx

=

=

===

( ) ( )

( ) ( ) .01;0||;04;0||;1;4

2211

21

>=>===

xxKxxKxKxK

Следовательно, ( )ФЖ

ФМ xxx ,= – NE. В ситуации (Ф,Ф) у мужа – ( ) ;41 =ФФK у жены –

( ) 12 =ФФK . Какие у игроков альтернативы? У мужа – ( ) ;01 =ТФK у жены – ( ) 02 =ФТK . Так как ( ) ( )ТФKФФK 11 > и ( ) ( )ФТKФФK 22 > , то (Ф,Ф) – NE.

Аналогично можно рассмотреть остальные комбинации, откуда получится, что здесь есть два равновесия по Нэшу в чистых стратегиях – (Ф,Ф) и (Т,Т).

Пример 1.2. Дилемма заключенного. Двое подозреваемых в совершении тяжкого преступления арестованы и помещены в одиночные камеры, причем они не имеют возможности передавать друг другу какие-либо сообщения. Их допрашивают поодиночке. Если оба признаются в совершении преступления, то им грозит, с учетом их признания, тюремное заключение сроком по 8 лет каждому. Если оба будут молчать, то они будут наказаны за совершение какого-то незначительного преступления (скажем, незаконное хранение оружия или что-нибудь другое) и получат в этом случае по 1 году тюремного заключения. Если же один из них сознается, а другой – нет, то первый, за содействие следствию, будет вовсе освобожден от наказания, тогда как второй будет приговорен к максимально возможному за данное преступление наказанию – 10-летнему тюремному заключению.

Описанная история может быть представлена следующей игрой:

Page 7: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

7

( ) ( )( ) ( ) .

1,10,1010,08,8

⎟⎟⎠

⎞⎜⎜⎝

⎛−−−

−−−НС

I

НСII

Рассмотрим каждую ситуацию в отдельности:

(СС): ( ) ( )

( ) ( );108

;10

;108

;10;8;8

21

21

−>−

−=

−>−

−=−=−=

СНKНСKССKССK

NE;

(СН): ( ) ( )

( ) ( )

;910

;8

;10

;1;10;0

21

21

−>/−

−=

−>

−=−==

ССKННKСНKСНK

не NE;

(НС): ( ) ( )( ) ( )

;10

;1

;810

;8;0;10

21

21

−>

−=

−>/−

−==−=

ННKССKНСKНСK

не NE;

(НН): ( ) ( )

( ) ( );01

;0

;01

;0;1;1

21

21

>/−

=

>/−

=−=−=

НСKСНKННKННK

не NE.

Следовательно, (СС) – NE.

1.5. ОПТИМАЛЬНОСТЬ ПО ПАРЕТО. Определение 1.4. Ситуация ( )**

1* ,, nxxx …= называется оптимальной по Парето,

если не существует никакой другой ситуации ( )nxxx ′′=′ ,,1 … такой что: 1) ( ) ( ) NixKxK ii ∈∀≥′ * ; 2) хотя бы для одного ( ) ( )*

0 00xKxKNi ii >′∈ .

Пример 1.3. Семейный спор. ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ;4;0;0;1

;1;0;0;4

2222

1111

========

ТТKТФKФТKФФKТТKТФKФТKФФK

(ФФ) : т.к. ( ) ( ) 4: 11 =>′′∃¬ ФФKxKx опт. по Парето;

(ФТ) : т.к. ( )( ) ( )( ) ( )ФТKФФK

ФТKФФKФФ

22

11:

>

>∃ не опт. по Парето;

(ТФ) : т.к. ( )( ) ( )( ) ( )ТФKФФK

ТФKФФKФФ

22

11:

>

>∃ не опт. по Парето;

(ТТ) : т.к. ( ) ( ) 4: 22 =>′′∃¬ ТТKxKx опт. по Парето. Пример 1.4. Дилемма заключенного.

( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ;1;0;10;8

;1;10;0;8

2222

1111

−==−=−=−=−==−=

ННKНСKСНKССKННKНСKСНKССK

(СС) : т.к. ( )( ) ( )( ) ( )ССKННK

ССKННKНН

22

11:

>

>∃ не опт. по Парето;

(СН) : т.к. ( ) ( ) 0: 11 =>′′∃¬ СНKxKx опт. по Парето;

Page 8: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

8

(НС) : т.к. ( ) ( ) 0: 22 =>′′∃¬ НСKxKx опт. по Парето;

(НН) : т.к. ( ) ( )( ) ( )⎪⎩

⎪⎨⎧

>′

>′′∃¬

ННKxK

ННKxKx

22

11: опт. по Парето.

САМОСТОЯТЕЛЬНАЯ РАБОТА № 1. ИССЛЕДОВАТЬ ВСЕ СИТУАЦИИ НА РАВНОВЕСИЕ ПО НЭШУ И ОПТИМАЛЬНОСТЬ ПО ПАРЕТО.

ЗАНЯТИЕ №2

2.1. АНТАГОНИСТИЧЕСКИЕ ИГРЫ. СЕДЛОВАЯ ТОЧКА Определение 2.1. Игра в нормальной форме называется игрой с нулевой суммой,

если для любого набора стратегий ( )nxxx ,,1 …= выполняется условие

( ) 0,,1

1 =∑=

n

ini xxK … .

Эта игра представляет собой замкнутую систему: все то, что кто-нибудь выиграл, должно быть кем-то проиграно. Большинство салонных игр являются играми такого типа.

Будем далее считать, что { }2,1=N . Определение 2.2. Игра двух лиц с нулевой суммой называется

антагонистической. В такой игре интересы игроков диаметрально противоположны, поскольку

выигрыш одного игрока равен проигрышу другого: ( ) ( ) 0,, 21 =+ jiKjiK

или ( ) ( ) 2121 ,,, XjXijiKjiK ∈∈∀−= .

Пример 2.1. Орел и решка. В этой игре каждый из двух игроков выбирает, независимо друг от друга, монетку повернутую вверх либо «Орлом», либо «Решкой». Если выбор игроков различен, то игрок 2 платит игроку 1 один доллар. Если выбор совпадает, то – наоборот. Матрица выигрышей такой игры:

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛−−−−

1,11,11,11,1

""""

""""

РешкаОрел

РешкаОрел.

Определение 2.3. Конечная антагонистическая игра AG называется матричной (МИ), поскольку выигрыши игроков полностью задаются матрицей A выигрышей первого игрока.

Рассмотрим вопрос об оптимальном поведении игроков в антагонистической игре AG . Напомним, что естественно в этой игре считать оптимальной такую ситуацию

( ) 2121, XXxx ×∈ , от которой ни одному из игроков невыгодно отклоняться. Такая ситуация ( )21, xx называется равновесной, а принцип оптимальности, основанный на построении равновесной ситуации, – принципом равновесия. Ниже будет показано, что для антагонистических игр принцип равновесия эквивалентен принципам минимакса и максимина. Разумеется, для этого необходимо существование равновесия, т. е. чтобы принцип оптимальности был реализуем.

Перепишем определение равновесия по Нэшу для антагонистической игры: ( ) ( )( ) ( ) .,;,

;,;,

,,212,211

,,212,211

jijiji

jijiji

xxKxxKxxKxxK

αβααβα−===−===

Откуда следует, что

Page 9: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

9

( ) ( )( ) ( )

.,

;,,

;,,

,,,

2,212,212

1,211,211

Xji

XjxxKxxK

XixxKxxK

jijiji

jiji

jiji

∈∀≤≤

∈∀−=≥−=

∈∀=≥=

ααα

αα

αα

Определение 2.4. В антагонистической игре AG ситуация ( )ji , называется ситуацией равновесия или седловой точкой, если

.,,,, Xjijijiji ∈∀≤≤ ααα

В седловой точке элемент матрицы ji ,α является одновременно минимумом в своей строке и максимумом в своем столбце.

Пример 2.2. Например, в игре с матрицей ( )

( ) ( )⎥⎥⎥

⎢⎢⎢

106835401

030

836

ситуация ( )2,2 является равновесной. Определение 2.5. Стратегия i или j , входящая в ситуацию равновесия,

называется оптимальной стратегией 1-го или, соответственно, 2-го игрока. Определение 2.6. Значение функции выигрыша в ситуации равновесия vji =,α

называется значением игры.

2.2. ПРИНЦИП МАКСМИНА И МИНИМАКСА Установим связь между принципом равновесия и принципами минимакса и

максимина в антагонистической игре. Пусть дана МИ с матрицей

⎟⎟⎟

⎜⎜⎜

⎛=

mnm

n

Aαα

αα

…………

1

111

,

которая полностью определяет выигрыши игроков. 1-ый выбирает играет строку i , 2-ой – выбирает столбец j . Выигрыш 1-го игрока стоит на пересечении i -ой строки и j -го столбца. Эта же величина есть проигрыш или выигрыш с обратным знаком 2-го игрока.

Итак, 1-ый игрок произвольно выбрал стратегию i . В каком выигрыше он может быть уверен? В минимальном, естественно, т.е. минимальное значение выигрыша ijj

αmin

при выбранной стратегии i ему обеспечено. Естественно выбрать такую стратегию i , при которой этот минимум максимален, т. е. естественно выбрать 0i , при которой достигается

vjijijji==⎥⎦

⎤⎢⎣⎡

0minminmax αα ,

где v – нижнее значение игры (нижняя цена игры). Определение 2.7. Стратегия 0i называется максминной стратегией 1-го игрока. Пусть теперь 2-ой игрок выбрал j -ый столбец и уверен, что он проиграет не

больше, чем ijiαmax . Естественно выбрать такую стратегию j , при которой этот

максимальный проигрыш минимален, т. е. выбрать такой столбец 0j , который минимизирует его проигрыш:

[ ]0

maxmaxmin ijiijijv αα == ,

где v – верхнее значение игры (верхняя цена игры).

Page 10: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

10

Определение 2.8. Стратегия 0j называется минимаксной стратегией 2-го игрока. Таким образом, минимакс и максимин для игры AG могут быть найдены по

следующей схеме:

v

v

ijji

mjj

jj

jj

mnmm

n

n

ijij

iniiiii

=

⎪⎪

⎪⎪

⎥⎥⎥⎥

⎢⎢⎢⎢

=

α

α

α

α

ααα

αααααα

α

ααα

minmax

min

minmin

maxmin

maxmaxmax

2

1

21

22221

11211

21

……

………………

Пример 2.3. Так, в игре с матрицей из примера 2.2 нижнее значение (максимин) v и максиминная стратегия 0i первого игрока 3=v , 20 =i , а верхнее значение (минимакс)

v и минимаксная стратегия 0j второго игрока – 3=v , 20 =j . А в игре с матрицей ( )

( ) ⎟⎟⎟

⎜⎜⎜

⎛−−

−/−/−

///

06421107

5510

011

5647

максминная стратегия 1-го игрока – 30 =i , нижнее значение игры – 0=v ;

минимаксная стратегия 2-го игрока – 20 =j , верхнее значение игры 4=v .

Лемма 2.1. В антагонистической игре AG vv ≥ . Теорема 2.1. Для того, чтобы в ( )nm× -МИ AG существовала ситуация равновесия

необходимо и достаточно, чтобы vv = , при этом максминная и минимаксная стратегия ( )00 , ji образует ситуацию равновесия.

Определение 2.9. Игры, в которых существуют ситуации равновесия, называются вполне определенными.

Поэтому данная теорема устанавливает критерий вполне определенной игры и может быть переформулирована следующим образом.

Теорема 2.2. Для того чтобы игра была вполне определена, необходимо и достаточно, чтобы существовали минимакс и максимин и выполнялось равенство vv = .

Замечание 2.1. Заметим, что в ( )nm× -МИ AG экстремумы, т. е. минимакс и максимин достигаются всегда, а, вот, ситуация, в которой максимальный элемент по столбцу и минимальный элемент по строке равны, очень редка. См. пример 2.3, где есть максминная и минимаксная стратегии, а ситуации равновесия нет и, соответственно, значения игры тоже нет.

Пример 2.4. Например, в игре с матрицей ( )

( ) ( )⎥⎥⎥

⎢⎢⎢

−− 720432141

221

742

ситуация ( )1,2 является равновесной. При этом .2maxminminmax == ijijijjiαα

С другой стороны, игра с матрицей 1001

не имеет ситуации равновесия в чистых

Page 11: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

11

стратегиях (седловых точек), т. к. .0minmax1maxmin =>= ijjiijijαα

Множество ситуации равновесия в антагонистической игре AG обладает свойствами, которые позволяют говорить об оптимальности ситуации равновесия и входящих в нее стратегий. Обозначим множество всех ситуаций равновесия через ( ) .21 XXGZ A ×⊂

Теорема 2.3. Пусть ( )11, ji , ( )22 , ji — две произвольные ситуации равновесия в антагонистической игре AG . Тогда

1) ;;12212211 ,,,, jijijiji αααα ==

2) ( ) ( ) ( ) ( ).,;, 1221 AA GZjiGZji ∈∈ Из теоремы следует, что любая пара оптимальных стратегий образует ситуацию

равновесия, а функция выигрыша в ней принимает одно и то же значение равное значению игры.

Пример 2.5. В игре с матрицей

( ) ( )

( )( )

( ) ( )( ) ( )⎥

⎥⎥

⎢⎢⎢

343638351401

330

3836

2

1

21

ii

jj

ситуации ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )4,2,;4,3,;2,3,;2,2, 21221211 ==== jijijiji являются равновесными. При этом ( ) ( ) ( ) ( ) 3,,,, 21221211 ===== jiKjiKjiKjiKv .

Из второй части теоремы следует: Утверждение 2.1. Пусть *

1X и *2X проекции множества ( )AGZ на 1X и 2X ,

соответственно, т. е. ( ) ( ){ }( ) ( ){ }.,,,

,,,,

12*2

21*1

A

A

GZjiXiXjjX

GZjiXjXiiX

∈∈∃∈=

∈∈∃∈=

Тогда множество ( )AGZ можно представить в виде ( ) .*

2*1 XXGZ A ×=

Определение 2.10. Множества *1X и *

2X в игре ( )AGZ называются множествами оптимальных стратегий, а их элементы – оптимальными стратегиями 1-го и 2-го игрока, соответственно.

САМОСТОЯТЕЛЬНАЯ РАБОТА № 2. НАЙТИ ВСЕ МАКСМИННЫЕ И МИНИМАКСНЫЕ СТРАТЕГИИ ИГРОКОВ, НИЖНЕЕ И ВЕРХНЕЕ ЗНАЧЕНИЯ ИГРЫ; УКАЗАТЬ ВСЕ СИТУАЦИИ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ, ЕСЛИ ОНИ ЕСТЬ.

ЗАНЯТИЕ №3

3.1. СМЕШАННЫЕ СТРАТЕГИИ МАТРИЧНЫХ ИГР В МИ с полной информацией игроки не делают тайны из своих равновесных

стратегий, которые гарантируют всем игрокам одновременно оптимальный максиминный «выигрыш» независимо от поведения противника. Однако в отсутствие седловой точки игроки не довольствуются своим максиминным «выигрышем»: кто из нас ограничится малым, если есть надежда на большее?

Рассмотрим МИ

.1,0,1001

2121

==⎥⎦

⎤⎢⎣

⎡VV

Page 12: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

12

Будем рассуждать так. Если играть 5 млн. раз, то возможный выигрыш 1-го игрока при выборе 1-й стратегии будет 1/2. Аналогично может действовать второй игрок, выбирая какой-либо столбец. 1-й игрок гарантирует, что он выиграет 1/2, а 2-й гарантирует, что он проиграет не более 1/2, т.е. игроки выбирают своими стратегиями ( )21,21 .

Таким образом, каждый игрок, манипулируя непредсказуемо для противника (например, по правилам известным только ему или случайно) чистыми стратегиями, убеждается, что при многократном повторении игры может улучшить свой максиминный «выигрыш».

Рассмотрим МИ nmA × , где { }mii ,1= – стратегии первого игрока; { }njj ,1= – стратегии второго игрока. Ситуация игры – пара стратегий ( )ji, .

Определение 3.1. Стратегию, полученную в многократно повторяемой игре при случайном механизме реализации чистых стратегий игрока, называют рандомизированной (смешанной) стратегией игрока.

Определение 3.2. Под смешанной стратегией 1-го игрока будем понимать m-мерный смешанный вектор ( ) m

mi Rx ∈= ξξξ ,...,,...,1 ,

mii

m

ii ,1,0,1

1=≥=∑

=

ξξ ,

где m - число строк матрицы выигрышей nmA × . Таких векторов x бесконечно много. Множество всех стратегий первого игрока

x обозначим I∑ (сигма I ). Определение 3.3. Аналогично смешанная стратегия 2-го игрока определяется как n

-мерный вектор ( )njy ηηη ,...,,...,1= , т. е.

njj

n

jj ,1,0,1

1=≥=∑

=

ηη ,

где n - число столбцов матрицы выигрышей nmA × . При этом 0≥iξ и 0≥jη — вероятности выбора чистых стратегий 1Xi∈ и 2Xj∈ ,

соответственно, при использовании игроками смешанных стратегий х и у. Множество всех стратегий второго игрока y обозначим II∑ (сигма II ).

Определение 3.4. Напомним, что вещественная функция, значения которой имеют определенную вероятность, называется случайной величиной.

Определение 3.5. Случайная величина, значениями которой являются стратегии игрока, называется его смешанной стратегией.

Учитывая введенное определение смешанных стратегий, прежние стратегии будем называть «чистыми». Так как случайная величина характеризуется своим распределением, то будем отождествлять в дальнейшем смешанную стратегию с вероятностным распределением на множестве чистых стратегий. Таким образом, вектор x может быть интерпретирован следующим образом. Это набор вероятностей, с которыми 1-й игрок выбирает соответствующие строки матрицы. 1ξ – вероятность выбора 1-й стратегии, iξ – вероятность выбора i -й стратегии, mξ – m -й стратегии, сумма этих вероятностей равна 1.

Аналогично, y – это набор вероятностей, в соответствии с которыми 2-й игрок выбирает столбцы матрицы: 1-й – выбор 1-го столбца, j – j -го столбца, n – n -го столбца, сумма их равна 1.

Определение 3.6. Чистая стратегия является частным случаем смешанной стратегии, она заключается в выборе i -й строки и имеет вид: ( )

m

iix 0,...,1,...,0= , т. е. i -я

Page 13: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

13

строка выбирается с вероятностью 1. Соответственно, чистая стратегия для 2-го игрока ( )

n

jjy 0,...,0,1,0,...,0= . Таким образом, чистые стратегии – выбор номеров строк или

столбцов. У 1-го игрока – m чистых стратегий, у 2-го – n чистых стратегий. Определение 3.7. Если игроки выбрали свои смешанные стратегии, то пара ( )yx,

смешанных стратегий игроков в матричной игре AG называется ситуацией в смешанных стратегиях.

В ситуации ( )yx, в смешанных стратегиях пара чистых стратегий ( )ji, реализуется с вероятностью jiηξ . Если такая пара появляется, то выигрыш 1-го игрока есть ijα , отсюда следует, что вероятность выигрыша ijα является jiηξ , следовательно, выигрыш

ijα является случайной величиной. Поэтому выигрыш игрока 1 в ситуации ( )yx, в смешанных стратегиях для ( )nm× -МИ AG можно определить как математическое ожидание его выигрыша, т. е. сумма этих всевозможных вероятностей jiij ηξα :

( ) ∑∑= =

===m

i

n

jjiij AyxyxAyxE

1 1,,, ηξα ,

где , – скалярное произведение. При этом функция ( )yxE , является непрерывной по Ix ∑∈ и IIy ∑∈ . Если играть 10 млн. раз при выборе 1-м игроком i -й стратегии, а 2-м – j -ой, то

средний выигрыш за эти 10 млн. раз повторений игры будет для 1-го игрока ( ) 10, ⋅yxE млн., выигрыш 2-го игрока есть - ( ) 10, ⋅yxE млн.

Определим смешанное расширение МИ. Определение 3.8. Антагонистическая игра AG называется смешанным

расширением игры AG , если задается следующим образом: ( ){ }yxEIII ,;; ∑∑=Γ .

Игроки 1 и 2 выбирают стратегии III yx ∑∈∑∈ , , для 1-го игрока реализуется выигрыш ( )yxE , , для 2-го игрока – ( )yxE ,− . Игра AG является подыгрой для AG , т. е.

.AA GG ⊂

3.2. СИТУАЦИЯ РАВНОВЕСИЯ В СМЕШАННЫХ СТРАТЕГИЯХ Определение 3.9. Ситуация ( )yx, в игре AG образует ситуацию равновесия, а

число ( )yxEv ,= является значением игры AG если ( ) ( ) ( ) .,,,, III yxyxEyxEyxE ∑∈∑∈∀≤≤ (3.1)

В ситуации за 10 млн. раз игры, если отклонение от ситуации ( )yx, будет происходить достаточно часто, то выигрыш для 1-го игрока может уменьшиться, а для 2-го – потери увеличиться.

Теорема 3.1. В любой МИ существует ситуация равновесия в смешанных стратегиях.

Эквивалентная формулировка. В любом смешанном расширении МИ существует ситуация равновесия.

Определение 3.10. Соответственно, смешанные стратегии, образующие ситуацию равновесия называются оптимальными смешанными стратегиями.

Заметим, что выигрыши ( )yiE , , ( )jxE , при применении первым или вторым игроком чистой стратегии i или j, соответственно, а другим — смешанной стратегии (у или х) имеют вид

Page 14: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

14

( ) ( ) miyyiEyxEn

jijiji ,1;,,

1

==== ∑=

αηα ;

( ) ( ) njxjxEyxE jm

iiiji ,1,,,

1==== ∑

=

αξα ;

где ji αα , — i-я строка и j-й столбец соответственно ( )nm× -матрицы А.

Пусть ( ) ∑∑= =

=m

i

n

jjiijyxE

1 1

, ηξα . Тогда, если вместо x использовать чистую стратегию,

то

( ) ( )yiEyxEm

ii

m

i

n

jjiji ,,

11 1∑∑ ∑== =

=⎟⎟⎠

⎞⎜⎜⎝

⎛= ξηαξ .

Аналогично, если, вместо y использовать чистую стратегию, то

( ) ( )∑∑ ∑== =

=⎟⎟⎠

⎞⎜⎜⎝

⎛=

n

jj

n

i

m

jiijj jxEyxE

11 1,, ηξαη .

Следовательно,

( ) ( ) ( ) .,,,1 111∑∑∑∑= ===

===m

i

n

jjiij

n

jj

m

ii jxEyiEyxE ηξαηξ

Пусть ( ) IIIyx ∑×∑∈, – ситуация в смешанных стратегиях в игре AG . Оказывается, что для проверки ситуации ( )yx, на равновесность, неравенства (3.1) достаточно проверять не для всех Ix ∑∈ и IIy ∑∈ , а лишь для 1Xi∈ и 2Xj∈ , поскольку справедливо следующее утверждение.

Теорема 3.2. Необходимое и достаточное условие существования равновесия. Для того чтобы ситуация ( )yx, и число ( )yxEv ,= были, соответственно,

ситуацией равновесия в смешанных стратегиях и значением игры необходимо и достаточно, чтобы имели место следующие неравенства:

( ) ( ) 21 ,,, XjXijxEvyiE ∈∈∀≤≤ . (3.2) Лемма 3.1. Если в игре существует ситуация равновесия в чистых стратегиях, то

она является ситуацией равновесия в смешанных стратегиях, и значение игры в чистых стратегиях равно значению игры в смешанных стратегиях.

Эквивалентная формулировка. Пусть ( )yx, — ситуация равновесия в игре AG . Тогда ситуация ( )yx, равновесна и в игре AG .

Пример 3.1. «Орел или решка».

( ) ( )( ) ( )

po

po

⎟⎟⎠

⎞⎜⎜⎝

⎛−−

−−1,11,11,11,1

Легко видеть, что в этой игре нет ситуации равновесия в чистых стратегиях, так как в любой ситуации одному из игроков выгодно отклониться от выбранной стратегии при условии, что другой игрок в этой ситуации придерживается своей стратегии. Однако, как мы увидим, пара смешанных стратегий ( )yx, , где ( ) ( )21,21,21,21 == yx , в которых каждый из игроков играет свои чистые стратегии с равными вероятностями, образует ситуацию равновесия в смешанных стратегиях.

3.3. СВОЙСТВА ОПТИМАЛЬНЫХ СМЕШАННЫХ СТРАТЕГИЙ Рассмотрим свойства оптимальных стратегий, которые в ряде случаев помогают

находить значение игры и ситуацию равновесия. Теорема 3.3. Пусть ( )mx ξξ ,...,1= – оптимальная смешанная стратегия 1-го игрока,

Page 15: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

15

v - значение игры и y – оптимальная смешанная стратегия 2-го игрока. Тогда, если ( ) vyiE <, , (3.3)

то вероятность выбора i -ой стратегии первым игроком в ситуации равновесия обязательно должна быть

0=iξ . (3.4) Согласно теореме 3.2 условие равновесия ( ) ( ) ( ) jijxEyxEyiE ,,,, ∀≤≤ . Пусть x

и y оптимальны. Тогда ( ) vyxE =, . Если для какого-либо i неравенство слева выполняется строго, то 1-ый игрок, отклонившись на чистую стратегию i , свой выигрыш уменьшит, следовательно, вероятность выбора первым игроком в ситуации равновесия чистой стратегии i должна быть равной нулю.

Теорема 3.4. Пусть ( )ny ηη ,...,1= – оптимальная стратегия 2-го игрока, v - значение игры, x – оптимальная стратегия 1-го игрока. Тогда, если

( ) vjxE >, , (3.5) то вероятность выбора j -ой стратегии обязательно должна быть

0=jη . (3.6) Теоремы 3.3 и 3.4 обосновывают процедуру выбора стратегии, которая

обеспечивает успешный поиск. Теорема 3.5. Пусть x и y – оптимальные стратегии 1-го и 2-го игроков, v –

значение игры. Тогда ( ) vjxE

nj=

=,min

,1 (3.7)

и ( ) vyiE

mi=

=,max

,1. (3.8)

Теорема 3.6. Пусть AG – ( )nm× -МИ. Для того чтобы ситуация в смешаных стратегиях ( )yx, была равновесной в игре AG , необходимо и достаточно выполнение равенства

( ) ( )jxEyiEnjmi

,min,max11 ≤≤≤≤

= . (3.9)

Теорема 3.7. Для МИ AG справедливы следующие соотношения: ( ) ( ),,maxmin,minmax yiEvjxE

iyjx== (3.10)

причем экстремумы по смешанным стратегиям x и y в (3.10) достигаются на оптимальных стратегиях игроков.

Пример 3.2. Возьмем матрицу ;622241423

⎥⎥⎥

⎢⎢⎢

⎡−

− 2=v – по строкам, 3=v – по

столбцу. Следовательно, в чистых стратегиях ситуации равновесия не существует. Будем искать ситуацию равновесия в смешанных стратегиях.

( ) ( )

⎪⎪⎪⎪

⎪⎪⎪⎪

=≥

=≥

∀≤≤

=

=

.1,0

,1,0

.,;,,

1

1

m

iii

n

jjj

jijxEvyiE

ξξ

ηη Всего 14 неравенств.

Решение может не получиться, так как могут быть отрицательные числа. Нужно пользоваться многими комбинациями. Если всюду ставить равенства, то задача не

Page 16: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

16

решается. Можно поставить строгие неравенства. Не везде. Распишем эти неравенства.

.624622;24224

;23423

321321

321321

321321

ξξξηηηξξξηηη

ξξξηηη

++≤≤++++−≤≤++−

+−≤≤+−

vv

v

.624;622;242;24

;23;423

321321

321321

321321

vvvv

vv

>++=++=++−=++−

=+−<+−

ξξξηηηξξξηηη

ξξξηηη

Составим квадратную матрицу, учитывая равенства. Следовательно, должно быть, если ( ) vyiE <, , то 0=iξ , если ( ) vjxE >, , то 0=jη . Примем, 0;0 31 == ηξ . Тогда

)6(.62)3(22)5(;24)2(4)4(;2)1(23

3221

3221

3221

vvvvvv

>+=+=+=+−=+−<−

ξξηηξξηηξξηη

Вычтем (4) из (5). 02 =⇒ ξ , 13 =⇒ ξ 2=⇒ V 521 =⇒ η 532 12 =−=⇒ ηη v . Следовательно, оптимальная стратегия ( )1,0,0=x и ( )0,53,52=y .

3.2. РАВНОВЕСИЕ ПО НЭШУ В СМЕШАННЫХ СТРАТЕГИЯХ В БИМАТРИЧНОЙ ИГРЕ

Обобщим понятие ситуации равновесия на игру из N игроков. Введем обозначения, используемые в игре в смешанных стратегиях.

{ }nN ,1= – множество игроков; ∏

=

∑=∑ni

i,1

– множество ситуаций в смешанных стратегиях;

{ }ii σ=∑ – множество смешанных стратегий iσ i -го игрока, Ni∈ ; ik – число чистых стратегий i -го игрока;

{ }jii σσ = – j -ая смешанная стратегия i -го игрока, iii kjNi ,1,, =∑∈∈ σ ; j

iσ – вероятность выбора i -м игроком j -ой чистой стратегии, т. е. элемент вектора

iσ , iii kjNi ,1,, =∑∈∈ σ ; ( ) ( )nii EE σσσ ,,1 …= – функция выигрыша i-го игрока; Набор стратегий ( ) Niiin ∈∀∑∈= ,,,,1 σσσσ … , называется ситуацией игры. Определение 3.11. Если iX – конечное множество чистых стратегий игрока i, то

смешанная стратегия [ ]1,0: →ii Xσ ставит в соответствие каждой чистой стратегии

ij

i Xx ∈ вероятность 0≥jiσ того, что она будет играться, причем 1

,1

=∑= ikj

jiσ .

Определение 3.12. Выигрыш игрока i, соответствующий ситуации σ , есть

( ) ( )∑ ∏∈ =

⎟⎟⎠

⎞⎜⎜⎝

⎛=

Xxi

n

k

jki xEE

1

σσ . (3.11)

В случае биматричной игры формула (3.11) имеет вид ( ) ( )∑∑∑ ==

nxi

xxi ixExE 2,1,. 2121

1

σσσσ … .

Пример 3.4. Рассмотрим игру ( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )⎟

⎟⎟

⎜⎜⎜

8,26,90,36,34,81,22,61,53,4

IIIIII

IIIIII

.

Page 17: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

17

Пусть ( )31,3

1,31

1 =σ (это означает, что смешанная стратегия игрока 1

предписывает ему играть стратегии I, II и III с вероятностями 31 каждую),

( )21,2

1,02 =σ (эта смешанная стратегия игрока 2 предписывает играть стратегии II и III

с равными вероятностями и не играть стратегию I вовсе). В данном случае мы получаем в ситуации ( )21 , σσσ = :

( ) ( )

( ) ( ) .6

27

,2

112219

2130

313

218

2120

316

215

2140

31

2212

1211

==

=⎟⎠⎞

⎜⎝⎛ ⋅+⋅+⋅+⎟

⎠⎞

⎜⎝⎛ ⋅+⋅+⋅+⎟

⎠⎞

⎜⎝⎛ ⋅+⋅+⋅==

x

x

xEE

xEE

σσσ

σσσ

Определение 3.13. Смешанным расширением игры ( ){ }xKXNG ,,= называется

игра ( ){ }σENG ,,Σ= . Введем следующие обозначения для чистых и смешанных стратегий:

( ) ( ) ( )kkkkkkkkkk jn

ji

ji

ji

ji

jn

ji

ji

ji

j xxxxxxxxxxxxx ,,,,,,||;,,,,,, 111111 ………… +−+− == ;

( )niii σσσσσσ ,,,,,, 111 …… +−= ; ( ) ( )niiii σσσσσσσ ,,,,,,|| 111 …… +−= ; nikk i ,1,,1 == ; ( ) ( ) ( ) ( )kkkkk j

nj

ij

ij

ij

inij

iij

i xxxxxxx ,,,,,,||;,,,,,,|| 111111 ………… +−+− == σσσσσσσ . Определение 3.14. Ситуация (набор смешанных стратегий) ( )nσσσ ,...,1= является

равновесием по Нэшу в игре { } { }{ }ii E,ΣN,G = , если для любого Ni∈ ( ) ( ) .|| iiiii EE Σ∈∀≥ σσσσ

Теорема 3.8. Пусть ii XX ⊂+ – множество чистых стратегий, которые игрок i играет с положительной вероятностью в ситуации ( )nσσσ ,...,1= . Ситуация σ является

NE в смешанном расширении G игры G тогда и только тогда, когда для всех Ni∈ ( ) ( )

( ) ( ) .,||||

,||||++

+

∉∈∀≥

∈∀=

ij

iij

ij

iij

ii

ij

ij

ij

iij

ii

XxXxxExE

XxxxExE

σσ

σσ (3.12)

Таким образом, необходимые и достаточные условия того, что ситуация σ – NE, состоят в том, что: 1) каждый игрок при данном распределении стратегий, которые играют его противники, безразличен между чистыми стратегиями, которые он играет с положительной вероятностью; 2) эти чистые стратегии не хуже тех, которые он играет с нулевой вероятностью.

Это свойство можно использовать для нахождения NE в смешанных стратегиях. Пример 3.5. Рассмотрим следующую игру:

( ) ( )( ) ( )

BA

BA

⎟⎟⎠

⎞⎜⎜⎝

⎛100,10000,00,01000,100

.

Очевидно, что ситуации (А, А) и (В, В) являются NE (в чистых стратегиях). Найдем равновесия по Нэшу в смешанных стратегиях. Предположим, что в таком равновесии игрок 1 играет смешанную стратегию ( )pp −1, , а второй – ( )qq −1, , причем ( )1,0, ∈qp .

Тогда, получаем, что ожидаемый выигрыш игрока 2 от игры при использовании стратегии А есть ( )pp −+ 101000 , а от игры при использовании стратегии В есть

( ) pp 01100 +−⋅ , а значит, ( ) ( ) .01100011000 pppp ⋅+−⋅=⋅−+

Отсюда 1001100 =p и, следовательно, 111=p . Аналогично 111=q .

Page 18: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

18

Пример 3.6. «Семейный спор». Как в предыдущем примере, Она, выбирая «Ф», получает ( )pp −+⋅ 101 , а выбирая «Т», получает ( )pp −+⋅ 120 . Следовательно, ( ) pp =−12 . Отсюда 23 =p , а, следовательно, 32=p . Аналогично получаем

( ) ( )110012 qqqq −+⋅=⋅−+ , а значит, 13 =q и 31=q . Таким образом, в смешанном равновесии Он играет «Ф» с вероятностью 32 , а Она играет «Ф» с вероятностью 31 .

Пример 3.7. «Голосование». Рассмотрим следующую ситуацию – три игрока 1, 2, 3 и три альтернативы – A, B, C.

Игроки голосуют одновременно за одну из альтернатив, воздержаться невозможно. Таким образом, пространство стратегий { }CBAX i ,,= . Альтернатива, получившая большинство, побеждает. Если ни одна из альтернатив не получает большинства, то выбирается альтернатива A. Функции выигрышей таковы: ( ) ( ) ( ) 2321 === CEBEAE ,

( ) ( ) ( ) 1321 === AECEBE , ( ) ( ) ( ) 0321 === BEAECE . В этой игре три равновесных исхода (в чистых стратегиях): A, B и C. Посмотрим на

равновесия (их больше 3): если игроки 1 и 3 голосуют за A, то игрок 2 не изменит исход, как бы он ни голосовал, и игроку 3 безразлично, как он голосует. Таким образом, ( )AAA ,, и ( )ABA ,, – NE, но ( )BAA ,, – не NE, т. к. второму лучше голосовать за B.

ЗАНЯТИЕ №4. НАХОЖДЕНИЕ ЗНАЧЕНИЯ ИГРЫ ПРИ ПОМОЩИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ (ЛП)

Напомним, что существует 3 формы задачи ЛП (ЗЛП)

∑=

→m

iii xc

1max : (4.1)

• Общая задача (ограничения трех типов);

pjbxa j

n

iiij ,1,

1=≤∑

=

spjbxa j

n

iiij ,1,

1

+=≥∑=

(4.2)

msjbxa j

n

iiij ,1,

1+==∑

=

nixi ,1,0 =≥

• Основная задача (все ограничения – уравнения);

mjbxa j

n

iiij ,1,

1==∑

=

(4.3)

nixi ,1,0 =≥ • Каноническая задача:

mjbxa j

n

iiij ,1,

1

=≤∑=

(4.4)

nixi ,1,0 =≥ . Задача нахождения cx

xmin при ограничениях

0, ≥≤ xbxA , (4.5) где А – ( )nm× -матрица, nm RbRxc ∈∈ ,, называется прямой стандартной ЗЛП, а задача, заключающаяся в определении by

ymax при ограничениях

0, ≥≥ ycAy , (4.6)

Page 19: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

19

где nRy∈ называется двойственной ЗЛП. Прямая задача (ПЗ) Двойственная задача (ДЗ)

∑=

→m

iii xc

1max ∑

=

→n

jjj yb

1min

sjbxa j

m

iiij ,1,

1

=≤∑=

kicya i

n

jjij ,1,

1=≥∑

=

nsjbxa j

m

iiij ,1,

1

+==∑=

mkicya i

n

jjij ,1,

1+==∑

=

kixi ,1,0 =≥ sjy j ,1,0 =≥ .

Вектор mRx∈ , удовлетворяющий системе (4.5), называется допустимым решением задачи (4.5). Аналогично вводится понятие допустимого решения nRy∈ задачи (4.6). Допустимое решение ( )yx называется оптимальным решением задачи (4.5) [(4.6)], если на нем достигается минимум (максимум) функции ( )bycx на множестве всех допустимых решений. Справедливо следующее утверждение. Теорема 4.1 (двойственности). Если обе задачи (4.5), (4.6) имеют допустимые решения, то они обе имеют оптимальные решения x и y , соответственно, при этом

ybxc = . Напомним, что множество всех ситуаций равновесия в МИ мы обозначили как ( ).AGZ

Лемма 4.1 (о масштабе). Пусть AG и AG ′ две антагонистические игры, причем ,,0, constBAA =>+=′ ααα (4.7)

а { }jiconstB ij ,∀=== ββ . Тогда ( ) ( ) ., βα +==

′′ AA GGAA vvGZGZ (4.8) Иными словами, оптимальность поведения игроков не изменится, если в игре

множества стратегий остаются прежними, а функция выигрыша умножается на положительную константу или (и) к ней прибавляется постоянное число.

Содержательно данная лемма говорит о стратегической эквивалентности двух игр, отличающихся лишь началом отсчета выигрышей, а также масштабом их измерения.

Замечание 4.1. Если две МИ AG и AG ′ находятся в условиях этой леммы, то смешанные расширения также стратегически эквивалентны.

Лемма 4.2. Пусть AG и AG ′ — две матричные ( )nm× -игры, причем ,,0, constBAA =>+=′ ααα

а { }jiconstB ij ,∀=== ββ . Тогда ( ) ( )AA GZGZ =′ , βα +=′ AA vv , где AG ′ и AG —

смешанные расширения игр AG ′ и AG соответственно, a AA vv ,′ — значения игр AG ′ и AG . Пример 4.1. Проверим, что стратегии ( ) ( )41,41,21,41,41,21 == xy

оптимальны, а 0=Av – значение игры AG с матрицей

⎟⎟⎟

⎜⎜⎜

−−−−

−−=

131311111

A .

Упростим матрицу А (с целью получения максимального числа нулей). Прибавляя ко всем элементам матрицы А единицу, получим матрицу

Page 20: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

20

⎟⎟⎟

⎜⎜⎜

⎛=′

040400002

A .

Каждый элемент матрицы А' разделим на 2. Новая матрица принимает вид

⎟⎟⎟

⎜⎜⎜

⎛=′′

020200001

A .

По лемме 4.2 значение игр связано равенством ( )121

21 +== ′′′′ AAA vvv .

Таким образом, требуется проверить, что значение игры AG ′′ равно 21 . Действительно, ( ) 21,, =′′= yAxyxE . С другой стороны, для каждой стратегии IIy ∑∈ ,

( )321 ,, ηηη=y имеем ( ) 2112

12

12

12

1, 321 =⋅=++= ηηηyxE , а для всех ( )321 ,, ξξξ=x ,

Xx∈ , ( ) 21

21

21

21, 321 =++= ξξξyxE . Следовательно, указанные стратегии ( )yx,

являются оптимальными, а 0=Av . Докажем теорему 3.1. Теорема 3.1. Всякая МИ имеет ситуацию равновесия в смешанных стратегиях. Доказательство. ЗЛП в определенном смысле эквивалентна МИ AG . Рассмотрим ПЗ и ДЗ ЛП

;0,

min

≥≥

xwxAxu

T и ,0

,max

≥≤

yuAy

ywT (4.9), (4.10)

где ( ) ( ) nTmT RwRu ∈=∈= 1...,,1,1...,,1 , а матрица { }njmiA ij ,1,,10 ==∀>= α , т. е. строго положительная, откуда следует, что существует такой вектор 0>x , для которого

TwxA ≥ , т. е. задача (4.9) имеет допустимое решение. С другой стороны вектор 0=y является допустимым решением задачи (4.10), поэтому по теореме 4.1 двойственности ЛП обе задачи (4.9) и (4.10) имеют оптимальные решения ** , yx ответственно, при этом

.0** >== θwyux (4.11) Пусть теперь AG – произвольная ( )nm× -МИ. Покажем, что в этом случае теорема

справедлива. Рассмотрим векторы θ*xx = и θ*yy = и покажем, что они являются

оптимальными стратегиями игроков 1 и 2 соответственно в игре AG , при этом значение игры равно θ1 .

Действительно, из (4.11) имеем ( ) ( ) ,1** ==== wywyuxux θθ

а из допустимости *x и *y для задач (4.9), (4.10) следует, что 0* ≥= θxx и 0* ≥= θyy , т. е. x и y – смешанные стратегии игроков 1 и 2 в игре AG .

Вычислим выигрыш игрока 1 в ситуации ( )yx, . ( ) .,,, 2** θyAxyAxyxE == (4.12)

С другой стороны, из допустимости векторов *x и *y для задач (4.9), (4.10) и равенства (4.11) имеем

.,, ****** θθ =≤=≤= uxAyxyAxwy

Page 21: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

21

Таким образом, θ=** , yAx , из (4.12) получаем, что

( ) .1, θ=yxE (4.13) Пусть ∑∈yx, – произвольные смешанные стратегии игроков 1 и 2. Тогда

выполняются неравенства ( ) ( ) ;1,,, * θθθ =≥== wyyAxyAxyxE (4.14)

( ) ( ) .1,,, * θθθ =≤== xuAyxyAxyxE (4.15)

Сравнивая (4.14)–(4.15), получаем, что ( )yx, — ситуация равновесия, а θ1 — значение игры AG со строго положительной матрицей А.

Теперь рассмотрим ( )nm× -МИ AG ′ с произвольной матрицей { }ijA α ′=′ . Тогда существует такая константа 0>β , что матрица BAA +′= — строго положительна, где

{ } ( )nmB ij ×−= β -матрица, njmiij ,1,,1, === ββ . В игре AG существует ситуация

равновесия ( )yx, в смешанных стратегиях, а значение игры равно θ1=Av , где θ определяется как в (4.11).

Из леммы 4.2 следует, что ( ) ( )AGZyx ′∈, – ситуация равновесия в игре AG ′ в смешанных стратегиях, а значение игры равно βθβ −=−=′ 1AA vv . Теорема доказана.

Следует отметить, что не всегда в антагонистических играх существует решение в смешанных стратегиях.

Доказательство теоремы сводит решение МИ к ЗЛП. Алгоритм решения игры AG ′ следующий.

1. По матрице А' строится строго положительная матрица BAA +′= , где { }ijB β= , 0>= ββ ij .

2. Решаются ЗЛП (4.9), (4.10). Находятся векторы ** , yx и число θ [см. (4.11)]. 3. Строятся оптимальные стратегии игроков 1 и 2 соответственно

., ** θθ yyxx == 4. Вычисляется значение игры AG ′ βθ −=′ 1Av .

Пример 4.2. Рассмотрим МИ AG , определенную матрицей ⎟⎟⎠

⎞⎜⎜⎝

⎛⎥⎦

⎤⎢⎣

⎡=

3204

A .

Соответствующие ей ЗЛП имеют следующий вид:

,0,0,13

,124,min

21

2

21

21

≥≥≥

≥++

ξξξ

ξξξξ

.0,0,132

,14,max

21

21

1

21

≥≥≤+

≤+

ηηηη

ηηη

Введем 43,ξξ – базисные переменные, 21,ξξ – свободные переменные. Заметим, что эти задачи в эквивалентной форме могут быть записаны для ограничений типа равенств:

,0,0,0,0,13

,124,min

4321

42

321

21

≥≥≥≥=−

=−++

ξξξξξξ

ξξξξξ

.0,0,0,0,132

,14,max

4321

421

31

21

≥≥≥≥=++

=++

ηηηηηηη

ηηηη

Таким образом, методы решения ЗЛП могут быть приспособлены для решения МИ.

Page 22: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

22

⎩⎨⎧

=+−=+−+

⎪⎩

⎪⎨⎧

≥=−

=−+

→++−−==+−++−−=+=→+=

;13;124

.0,,,;13

;124min542

31241min;

242

1321

4321

42

321

4321

423212121

RR

RRF

ξξξξξ

ξξξξξξ

ξξξξξξξ

ξξξξξϕξξ

1ξ 2ξ 3ξ 4ξ 1R 2R

1R 4 2 -1 0 1 0 1

2R 0 3* 0 -1 0 1 1 ϕ 4 5 -1 -1 0 0 2

1R 4* 0 -1 2/3 1 -2/3 1/3

2ξ 0 1 0 -1/3 0 1/3 1/3 ϕ 4 0 -1 2/3 0 -5/3 2-5/3

1ξ 1 0 -1/4 1/6 1/4 -1/6 1/12

2ξ 0 1 0 -1/3 0 1/3 1/3 ϕ 0 0 0 0 -1 -1 0

1ξ 2ξ 3ξ 4ξ

1ξ 1 0 -1/4 1/6 1/12

2ξ 0 1 0 -1/3 1/3 F -1/4 -1/6 5/12

.125

61

41

;31

31

;121

61

41

;31

;121

43

42

431

2

1

=−−

=−

=+−

=

=

ξξ

ξξ

ξξξ

ξ

ξ

F

0,...,132

14max

41

421

31

21

≥=++

=++

ηηηηη

ηηηη

1η 2η 3η 4η

2η 4* 0 1 0 1

4η 2 3 0 1 1 F 1 1 0 0 0

1η 1 0 1/4 0 1/4

4η 0 3* -1/2 1 1/2 F 0 1 -1/4 0 -1/4

1η 1 0 1/4 0 1/4

2η 0 1 -1/6 1/3 1/6 F 0 0 -1/12 -1/3 -5/12

( )

( ).52,5

312561,

12541

125~

.54,5

112531,

125121

125~

125~~

=⎟⎟⎠

⎞⎜⎜⎝

⎛==

=⎟⎟⎠

⎞⎜⎜⎝

⎛==⇒

===⇒

yy

xx

uyux θ

Пусть X и Y – множества оптимальных решений задач (4.9) и (4.10), соответственно. Обозначим

.0,1,1>

⎭⎬⎫

⎩⎨⎧

∈=⎭⎬⎫

⎩⎨⎧

∈= θθθθθ

YyyYXxxX

Напомним, что множество оптимальных смешанных стратегий обозначается ( )AGZ , а проекции множества оптимальных стратегий ( )AGZ на IΣ и IIΣ – *

IΣ и *IIΣ ,

соответственно, т. е.

Page 23: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

23

( ) ( ){ }( ) ( ){ }.,,,

,,,,***

2***

******

AIII

AIIII

GZyxxXyy

GZyxyxx

∈Σ∈∃∈=Σ

∈Σ∈∃Σ∈=Σ

Теорема 4.2. Пусть AG — ( )nm× -игра с положительной матрицей А и даны две двойственные задачи ЛП (4.9) и (4.10). Тогда имеет место:

1. Обе ЗЛП имеют решение ( OX /≠ и OY /≠ ), при этом .maxmin ywxuyx

==θ

2. Значение Av игры AG равно θ1=Av , а стратегии θθyyxx == ** , , являются

оптимальными, где Xx ∈ – оптимальное решение прямой задачи (4.9),а Yy∈ – двойственной задачи (4.10).

3. Любые оптимальные стратегии **Ix Σ∈ и **

IIy Σ∈ игроков могут быть построены

указанным способом, т. е. .1,1 ** YX III θθ=Σ=Σ

САМОСТОЯТЕЛЬНАЯ РАБОТА № 3. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ПРИ ПОМОЩИ ЛП. СДЕЛАТЬ

ПРОВЕРКУ.

ЗАНЯТИЕ №5. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ( )−× n2 ЛИБО ( )−×2m МАТРИЧНЫХ ИГР

Распространенный способ решения МИ путем сведения ее к ЗЛП обладает тем недостатком, что процесс решения ЗЛП существенно усложняется для матриц большой размерности. В таких случаях обычно используют методы декомпозиции ЗЛП, когда вместо решения задачи с исходной матрицей строится координирующая задача с матрицей, у которой мало строк, но много столбцов, или наоборот.

Напомним некоторые сведения из теории выпуклых множеств и систем линейных неравенств.

Определение 5.1. Множество mRM ⊂ называется выпуклым, если вместе с любыми двумя точками этого множества Mxx ∈21 , в нем содержатся все точки отрезка

( ) [ ]1,0,1 21 ∈−+ λλλ xx . Понятие выпуклого множества можно сформулировать в более общем, но

эквивалентном виде. Определение 5.2. Множество mRM ⊂ называется выпуклым, если вместе с

точками kxx ,,1 … из M оно содержит и все точки вида

1,0,11

=≥= ∑∑==

k

iii

k

iii xx λλλ .

Пересечение выпуклых множеств всегда выпукло. Определение 5.3. Рассмотрим систему линейных неравенств bxA ≤ или

{ }nNjxa jj ,1, =∈≤ β , (5.1)

где [ ]NjaA j ∈= , – ( )nm× -матрица, ( ) nn

m RbRx ∈=∈ ββ ,,, 1 … . Обозначим

{ }bxAxX ≤=~ множество решений системы (5.1). Непосредственно из определения

следует, что X~ – выпуклое множество. Множество X~ называется выпуклым многогранным множеством, заданным системой ограничений (5.1).

Определение 5.4. Точка Mx∈ , где M – выпуклое множество, называется крайней точкой, если из условия ( ) ( )1,0,,,1 2121 ∈∈−+= λλλ Mxxxxx следует, что

xxx == 21 . Содержательно определение означает, что Mx∈ – крайняя точка, если не существует отрезка, содержащего две точки из M , для которого x является внутренней.

Page 24: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

24

Заметим, что крайняя точка выпуклого множества всегда является граничной, обратное неверно.

Определение 5.5. Выпуклой оболочкой множества Р ( )Pconv будем называть пересечение всех выпуклых множеств, содержащих Р. Данное определение эквивалентно следующему. Выпуклая оболочка множества Р состоит из всех выпуклых линейных комбинаций всевозможных точек из Р, т. е.

( )⎭⎬⎫

⎩⎨⎧

∈≥=== ∑∑==

PxxxxPconv ii

n

ii

n

iii ,0,1,

11λλλ .

Определение 5.6. Выпуклая оболочка конечного числа точек называется выпуклым многогранником, порожденным своими крайними точками.

Определение 5.7. Напомним, что функция 1: RM →ϕ , где mRM ⊂ – выпуклое множество, называется выпуклой, если

( )( ) ( ) ( ) ( )2121 11 xxxx ϕλλϕλλϕ −+≤−+ (5.2) для любых Mxx ∈21 , и [ ]1,0∈λ . Если же в (5.2) выполняется обратное неравенство, то функция ϕ называется вогнутой.

Лемма 5.1. Пусть ( )xiϕ — выпуклые на М функции ni ,1= . Тогда верхняя огибающая ( )xψ этого семейства функций

( ) ( )xx iniϕψ

,1max=

= (5.3)

является выпуклой на М, а нижняя огибающая (в (5.3) берется минимум по i) является вогнутой.

Теорема 5.1. В МИ AG множества оптимальных смешанных стратегий *IΣ и *

IIΣ игроков являются выпуклыми многогранниками.

Вернемся к теореме 3.7. В качестве примера использования теоремы приведем геометрическое решение игр с двумя стратегиями у одного из игроков ( ( )−× n2 и ( )−×2m игры). Такой подход называется графоаналитическим методом решения ( )−× n2 , либо ( )−×2m МИ. В основе графоаналитических методов лежит свойство оптимальных стратегий *x и *y доставлять экстремумы в критических точках

( ) ( ).,maxmin,minmax yiEjxEviyjxA ==

Пример 5.1. ( ( )−× n2 игра). Рассмотрим игру, в которой игрок 1 имеет две стратегии, а игрок 2 – п стратегий. Матрица имеет вид

⎟⎟⎠

⎞⎜⎜⎝

⎛=

n

nA22221

11211

...

...αααααα

.

Пусть игрок 1 выбрал смешанную стратегию ( )ξξ −= 1,x , а игрок 2 чистую стратегию Nj∈ . Тогда выигрыш игрока 1 в ситуации ( )jx, равен

( ) ( ) .1, 21 jjjxE αξξα −+= (5.4) Геометрически он представляет собой прямую в координатах ( )E,ξ . Таким образом, каждой чистой стратегии j соответствует своя прямая. Графиком функции ( ) ( )jxEH

j,min=ξ является нижняя огибающая семейства прямых (5.4). Эта функция

вогнута как нижняя огибающая семейства вогнутых (в данном случае линейных) функций (лемма 5.1). Точка *ξ , в которой достигается максимум функции ( )ξH по [ ]1,0∈ξ , и дает требуемый оптимальный набор стратегий ( )*** 1, ξξ −=x и значение игры ( )*ξHvA = .

Для определенности рассмотрим игру с матрицей

Page 25: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

25

⎟⎟⎠

⎞⎜⎜⎝

⎛=

04124131

A .

Для каждого 4,1=j имеем: ( ) ( ) 122,,21, +=+−= ξξ xExE , ( ) 433, +−= ξxE , ( ) .44, ξ=xE Нижняя огибающая ( )ξH семейства прямых ( ){ }jxE , и сами прямые ( )jxE , ,

4,1=j , изображены на рис. 5.1. Максимум ( )*ξH функции ( )ξH находится на пересечении первой и четвертой

прямых. Таким образом, *ξ – решение уравнения .24 **

Av=+−= ξξ

Рис. 5.1.

Откуда получаем оптимальную стратегию ( )53,52* =x игрока 1 и значение игры 58=Av . Оптимальную стратегию игрока 2 найдем из следующих соображений. Заметим,

что в рассматриваемом случае ( ) ( ) .584,1, ** === AvxExE Для оптимальной стратегии ( )*

4*3

*2

*1

* ,,, ηηηη=y должно выполняться равенство ( ) ( ) ( ) ( ) ( ).4,3,2,1,, **

4**

3**

2**

1** xExExExEyxEvA ηηηη +++==

При этом ( ) ( ) 583,,582, ** >> xExE , следовательно, 0*3

*2 ==ηη , а *

4*1 , ηη можно найти

из условия (5.3) .582,584 *

1*4

*1 ==+ ηηη

Таким образом, 54*1 =η и 51*

4 =η и оптимальная стратегия игрока 2 равна ( )51,0,0,54* =y . Пример 5.2. ( ( )2×m -игра). В этом примере две стратегии имеет игрок 2, а игрок 1

– т стратегий. Тогда матрица А имеет вид

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

21

2221

1211

mm

A

αα

αααα

…….

Анализ этой игры проводится аналогично. Действительно, пусть ( )ηη −= 1,y – произвольная смешанная стратегия игрока 2. Тогда игрока 1 в ситуации ( )yi, равен

( ) ( ) ( ) .1, 22121 iiiiiyiE αηααηαηα +−=−+=

Page 26: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

26

График функции ( )yiE , – прямая. Рассмотрим верхнюю огибающую этих прямых, т. е. функцию

( ) ( )[ ].max 221 iiiiH αηααη +−=

Функция ( )ηH выпуклая (как верхняя огибающая семейства выпуклых функций). Точка минимума *η функции ( )ηH дает оптимальную стратегию ( )*** 1, ηη −=y и

значение игры ( )[ ]

( )ηηη

HHvA 1,0

* min∈

== .

САМОСТОЯТЕЛЬНАЯ РАБОТА № 4. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ГРАФОАНАЛИТИЧЕСКИМ

МЕТОДОМ.

ЗАНЯТИЕ №6

6.1 ДОМИНИРОВАНИЕ СТРАТЕГИЙ В БИМАТРИЧНОЙ ИГРЕ Покажем на примере, что существуют стратегии, которые заведомо выбирать не

нужно, и вероятность выбора которых, согласно теоремам 3.3–3.4, должна быть нулевой. Эта идея позволяет осуществлять замену первоначальной матрицы на матрицу выигрышей меньшей размерности.

Пример 6.1. Рассмотрим следующую игру:

( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )

yyy

x

x

x

IIIIII

IIIIII

⎟⎟⎟

⎜⎜⎜

8,26,90,36,34,81,22,61,53,4

.

Независимо от того, как играет игрок 1, yIII дает игроку 2 строго больший выигрыш, нежели yII . В этом смысле стратегия yII строго доминируема, поэтому рациональный игрок 2 не должен играть yII . Далее, если игрок 1 знает (т. к. он сам рационален и знает, что другой рационален), что игрок 2 не будет играть yII , то для него

xI будет лучше, чем xII или xIII . Наконец, если игрок 2 знает, что игрок 1 знает, что игрок 2 не будет играть yII , то игрок 2 знает, что 1 будет играть xI , а тогда 2 должен играть yI . Естественно, что строго доминируемые стратегии надо удалять и в результате последовательного удаления строго доминируемых стратегий остается пара стратегий ( )yx II , .

Пример 6.2. Посмотрим теперь на следующую игру:

( ) ( )( ) ( )( ) ( )

yy

x

x

x

III

IIIIII

⎟⎟⎟

⎜⎜⎜

0,20,10,00,00,10,4

.

Здесь xII не доминируется строго ни стратегией xI , ни стратегией xIII . Однако, если игрок 1 играет xI с вероятностью 21 и xIII – с вероятностью 21 , он обеспечивает себе выигрыш 21 независимо от того, как играет игрок 2. Следовательно, чистая стратегия может строго доминироваться смешанной стратегией, даже если она не доминируется строго никакой чистой стратегией.

Определение 6.1. Чистая стратегия ix игрока i в игре G строго доминируема, если существует другая чистая стратегия ix , такая, что

Page 27: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

27

( ) ( ) ijnjXxxKxxK jiii ≠=∈∀≥ ,,1,|| . (6.1) В этом случае говорят, что стратегия ix , доминирует стратегию ix .

Определение 6.2. Стратегия ix слабо доминируется, если существует такая ix , что (6.1) выполняется как нестрогое неравенство, но хотя бы для одного набора { }ijnjx j ≠= ,,1 – неравенство строгое.

Аналогично определение и для смешанных стратегий: Определение 6.3. Смешанная стратегия iσ строго доминируется в игре G , если

существует другая стратегия iσ :

( ) ( ) ijnjEE jiii ≠=Σ∈∀≥ ,,1,|| σσσσ . (6.2)

Стратегия iσ называется строго доминирующей стратегией для игрока i в игре G , если она строго доминирует любую другую стратегию из i∑ .

Заметим, что для проверки строгой доминируемости iσ стратегией iσ , нам нужно знать «поведение» этих двух стратегий против чистых стратегий оппонентов игрока i.

( ) ( ) ijnjEE jiii ≠=Σ∈∀≥ ,,1,|| σσσσ тогда и только тогда, когда

( ) ( ) ijnjXxxExE jiiii ≠=∈∀> ,,1,|||| σσ . Смешанная стратегия может быть строго доминируемой, если она использует с

положительной вероятностью чистые стратегии, которые даже не слабо доминируемы. Пример 6.3. Действительно, рассмотрим следующую игру:

( ) ( )( ) ( )( ) ( )

yy

x

x

x

III

IIIIII

⎟⎟⎟

⎜⎜⎜

⎛−

1,01,03,10,20,23,1

.

Стратегия игрока 1 ( )0,21,21 дает ожидаемый выигрыш 21− вне зависимости от того, что играет игрок 2, а следовательно, строго доминируется стратегией xIII .

Пример 6.4. Рассмотрим игру, где выигрыши могут принимать значения yy

x

x

III

III

⎟⎟⎠

⎞⎜⎜⎝

⎛− )30,40()20,100(

)20,15()10,20(

Очевидно, что здесь стратегия yI доминируется стратегией yII , но проигрыш игрока 1 в ситуации ( )yx III , слишком велик, поэтому вполне можно допустить, что игрок 1 может не рискнуть сыграть стратегию xII , допуская возможность случайной ошибки игрока 2.

6.2. ДОМИНИРОВАНИЕ СТРАТЕГИЙ В АНТАГОНИСТИЧЕСКОЙ ИГРЕ Определение 6.4. Говорят, что стратегия x′ игрока 1 доминирует стратегию x ′′

в ( )nm× -игре AG , если для всех чистых стратегий nj ,1= игрока 2 выполняются неравенства

jj axax ′′≥′ . (6.3)

Например, в матрице ⎟⎟⎟

⎜⎜⎜

234352

3-я строка доминируется 2-ой: ( )0,1,0=′x ,

Page 28: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

28

( ) ⇒=′′ 1,0,0x

.214050204150;313020303120

⋅+⋅+⋅≥⋅+⋅+⋅⋅+⋅+⋅≥⋅+⋅+⋅

Аналогично, стратегия y′ игрока 2 доминирует его стратегию y ′′ , если для всех чистых стратегий mi ,1= игрока 1

yaya ii ′′≤′ . (6.4) Если неравенства (6.3), (6.4) выполняются как строгие, то говорят о строгом доминировании. Частным случаем доминирования стратегий является их эквивалентность.

Определение 6.5. Будем называть стратегии x′ и x ′′ игрока 1 эквивалентными в игре AG , если для всех nj ,1=

jj axax ′′=′ (6.3') и обозначать x′~ x ′′ . Для двух эквивалентных стратегий x′ и x ′′ выполняется (для каждого IIy Σ∈ ) равенство

( ) ( )yxEyxE ,, ′′=′ . Аналогично, стратегии y′ и y ′′ игрока 2 эквивалентны ( y′ ~ y ′′ ) в игре AG , если для всех mi ,1=

ii ayay ′′=′ . (6.4') Отсюда имеем, что для любой смешанной стратегии Ix Σ∈ игрока 1 выполняется равенство

( ) ( )yxEyxE ′′=′ ,, . Для чистых стратегий введенные определения трансформируются следующим

образом. Если чистая стратегия i′ игрока 1 доминирует чистую стратегию i ′′ , а чистая стратегия j′ игрока 2 – чистую стратегию j ′′ того же игрока, то для всех

njmi ,1,,.1 == выполняются неравенства

jijijiji ′′′′′′ ≤≥ αααα , . Покажем, что игроки могут не использовать доминируемые стратегии. Этот факт

устанавливает следующую теорему. Теорема 6.1. Если в игре AG стратегия x′ одного из игроков доминирует

оптимальную стратегию *x этого игрока, то стратегия x′ также оптимальна. Отсюда вывод, что оптимальная стратегия может быть доминируема лишь

оптимальной стратегией. С другой стороны, никакая оптимальная стратегия не является строго доминируемой, поэтому строго доминируемые стратегии не могут быть оптимальными.

Теорема 6.2. Если в игре AG стратегия *x одного из игроков оптимальна, то *x – недоминируема строго.

Обратное утверждение неверно.

Пример 6.5. Так, в игре с матрицей ⎥⎦

⎤⎢⎣

⎡2001

1-я и 2-я чистые стратегии игрока 1

недоминируемы строго, но они неоптимальны. С другой стороны, если i-я строка (j-й столбец) матрицы А доминируемы, то нет

необходимости приписывать ей (ему) положительную вероятность в ситуации равновесия. Таким образом, для нахождения оптимальных стратегий вместо игры AG достаточно решить подыгру AG ′ , где A′ – матрица, получаемая из матрицы A вычеркиванием доминируемых строк и столбцов.

Page 29: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

29

Определение 6.6. Если ( ) Imx Σ∈= ξξ ,...,1 и 11 +≤≤ mi , то расширением стратегии x на i-м месте будем называть вектор ( ) 1

11 ,...,,0,,..., +− ∈= m

miii Rx ξξξξ . Пример 6.6. Так, расширением вектора ( )31,32,31 на 2-м месте является вектор

( )31,32,0,31 ; расширением на 4-м месте – вектор ( )0,31,32,31 ; расширением на 1-м месте – вектор ( )31,32,31,0 .

Теорема 6.3. Пусть дана AG – ( )nm× -МИ. Предположим, что i-я строка матрицы А доминируема (т. е. доминируема чистая стратегия i первого игрока) и пусть дана AG ′ – игра с матрицей A′ , получаемой из матрицы А вычеркиванием i-й строки. Тогда справедливы следующие утверждения.

1. AA vv ′= . 2. Всякая оптимальная стратегия *y игрока 2 в игре AG ′ является оптимальной и в

игре AG . 3. Если *x – произвольная оптимальная стратегия игрока 1 в игре AG ′ и *

ix — расширение стратегии *x на i-м месте, то *

ix — оптимальная стратегия этого игрока в игре AG .

4. Если i-я строка матрицы А строго доминируема, то оптимальная стратегия *x игрока 1 в игре AG может быть получена из оптимальной стратегии *x в игре AG ′ расширением на i-м месте.

Сформулируем теорему о доминировании для второго игрока. Теорема 6.3. Пусть дана AG – ( )nm× -МИ. Предположим, что j-й столбец матрицы

А доминируем и пусть дана AG ′ – игра с матрицей A′ , получаемой из матрицы А вычеркиванием j-го столбца. Тогда справедливы следующие утверждения:

1. AA vv ′= . 2. Всякая оптимальная стратегия *x игрока 1 в игре AG ′ является оптимальной и в

игре AG . 3. Если *y – произвольная оптимальная стратегия игрока 2 в игре AG ′ и *

jy –

расширение стратегии *y на j-м месте, то *jy — оптимальная стратегия этого

игрока в игре AG . 4. Далее, если j-й столбец матрицы А строго доминируем, то оптимальная стратегия

*y игрока 2 в игре AG может быть получена из оптимальной стратегии *y в игре

AG ′ расширением на j-м месте. Обобщим полученные результаты. Теоремы 5.3–5.4 дают алгоритм понижения

размерности матрицы игры. Так, если строка (столбец) матрицы не больше (не меньше) некоторой выпуклой линейной комбинации остальных строк (столбцов) этой матрицы, то для нахождения решения игры можно эту строку (столбец) вычеркнуть. При этом соответствующее расширение оптимальных стратегий в игре с усеченной матрицей даст оптимальное решение исходной игры. Если неравенства выполнялись как строгие, то множество оптимальных стратегий в первоначальной игре можно получить расширением множества оптимальных стратегий усеченной игры, в противном случае при такой процедуре оптимальные стратегии можно потерять.

Пример 6.7. Рассматривается игра с матрицей

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

6030021331320112

A .

Page 30: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

30

Так как каждое значение 3-ей строки 3a , превосходит соответствующее значение первой ( )13 aa ≥ , то, вычеркивая первую строку, получаем

⎟⎟⎟

⎜⎜⎜

⎛=

603002133132

1A .

В этой матрице каждое значение 3-го столбца 3a не превосходит соответствующее значение 1-го столбца 1a . Поэтому получаем

⎟⎟⎟

⎜⎜⎜

⎛=

603021313

2A .

В последней матрице никакая строка (столбец) не доминируется другой строкой (столбцом). Вместе с тем 1-й столбец 1a превосходит выпуклую линейную комбинацию столбцов 2a и 3a , так как 321 2121 aaa +≥ , поскольку ,321213 ⋅+> ,0212211 ⋅+⋅=

6212103 ⋅+⋅= . Исключая 1-й столбец, получаем

⎟⎟⎟

⎜⎜⎜

600231

.

В этой матрице 1-я строка эквивалентна смешанной стратегии ( )21,21,0=x , поскольку 2162103,2102211 ⋅+⋅=⋅+⋅= . Таким образом, исключая 1-ю строку, получаем

матрицу

⎟⎟⎠

⎞⎜⎜⎝

⎛6002

.

Оптимальные стратегии *x и *y игроков в игре с этой матрицей равны ( )41,43** == yx , при этом значение v игры равно 23 .

Последняя матрица получена вычеркиванием первых двух строк и столбцов, поэтому оптимальными стратегиями игроков в исходной игре являются расширения указанных стратегий на 1-м и 2-м местах, т. е. ( )41,43,0,0*

12*12 == yx .

Заметим, что, в силу того, что в решении использовалось нестрогое доминирование, то могут быть потеряны другие оптимальные стратегии. САМОСТОЯТЕЛЬНАЯ РАБОТА № 5. РАССМОТРЕТЬ ИГРУ НА ДОМИНИРОВАНИЕ И

НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ.

ЗАНЯТИЕ №7. ИТЕРАТИВНЫЕ МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР

7.1. ИТЕРАТИВНЫЙ МЕТОД БРАУНА – РОБИНСОНА (МЕТОД ФИКТИВНОГО РАЗЫГРЫВАНИЯ)

Идея метода – многократное фиктивное разыгрывание игры с заданной матрицей выигрыша. Одно повторение игры будем называть партией. Пусть разыгрывается игра с ( )nm× - матрицей { }ijA α= . В 1-й партии оба игрока выбирают совершенно произвольные чистые стратегии. В k-й партии каждый игрок выбирает ту чистую стратегию, которая максимизирует его ожидаемый выигрыш против наблюдаемого эмпирического вероятностного распределения противника за ( )1−k партий.

Итак, предположим, что за первые k разыгрываний игрок 1 использовал i-ю стратегию k

iξ раз ( )mi ,1= , а игрок 2 – j-ю стратегию kjη раз ( )nj ,1= . Тогда в ( )1+k -й

Page 31: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

31

партии игрок 1 будет использовать 1+ki -ю стратегию, а игрок 2 – свою 1+kj -ю стратегию, где

∑∑ +==

j

kjji

j

kjiji

kk

v ηαηα1

max и ∑∑ +==

i

kiij

i

kiijj

kk

v ξαξα1

min .

Пусть v — значение МИ AG . Рассмотрим отношения

∑∑ +==

j

kj

jij

kj

iji

k

kkkv

k

ηαηα1

max , (7.1)

∑∑ +==

i

ki

iji

ki

ijj

k

kkkv

k

ξαξα1

min . (7.2)

Векторы ( )kkx km

kk ξξ ..,,.1= и ( )kky kn

kk ηη ...,,1= являются смешанными стратегиями игроков 1 и 2, соответственно, поэтому по определению значения игры имеем

.minmax kvvkv k

k

k

k≤≤

Таким образом, получен некоторый итеративный процесс, позволяющий находить приближенное решение МИ, при этом степень близости приближения к истинному значению игры определяется длиной интервала [ ]kvkv k

k

k

kmin,max . Сходимость

алгоритма гарантируется следующей теоремой. Теорема 7.1.

( ) ( ) .maxlimminlim vkvkv k

kk

k

kk==

∞→∞→

Пример 7.1. Найти приближенное решение игры с матрицей

.121103312cba

A⎥⎥⎥

⎢⎢⎢

⎡=γβα

Обозначим γβα ,, стратегии игрока 1 и cba ,, – стратегии игрока 2. Пусть сначала игроки выбрали стратегии α и a соответственно. Если игрок 1 выбрал стратегию α , то игрок 2 может потерять один из выигрышей ( )3,1,2 −−− . Если игрок 2 выбрал стратегию a , то игрок 1 может получить один из выигрышей ( )1,3,2 . Во 2-й и 3-й партиях игрок 1 выбирает стратегию β , а игрок 2 – b , поскольку эти стратегии обеспечивают наилучший результат и т. д.

В табл. 7.1 приведены результаты разыгрываний, в этой таблице указаны стратегия игрока, накопленный выигрыш и средний выигрыш.

Таким образом, за 12 партий мы получили приближение решения ( )127,61,4112 =x , ( )125,21,12112 =y , а точность может быть оценена числом 21 .

Основным недостатком рассмотренного метода является его малая скорость сходимости, которая уменьшается с ростом размерности матрицы. Это является также следствием немонотонности последовательностей kv k и kvk .

Рассмотрим другой итеративный алгоритм, который избавлен от указанного недостатка.

7.2. МОНОТОННЫЙ ИТЕРАТИВНЫЙ АЛГОРИТМ РЕШЕНИЯ МИ Рассмотрим смешанное расширение ( )KYXGA ,,= МИ с ( )nm× - матрицей А. Обозначим ( ) I

Nm

NNx Σ∈= ξξ ,...,1 приближение оптимальной стратегии игрока 1 на N-й итерации и ( )N

nNNnN cRc γγ ,...,, 1=∈ – вспомогательный вектор. Алгоритм позволяет

находить (точно и приближенно) оптимальную стратегию игрока 1 и значение игры v .

Page 32: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

32

Итеративный процесс строится следующим образом. В начале процесса игрок 1 выбирает произвольную чистую стратегию 0i , т. е. ( )0,...,1,...,0

0

0ix = , и вспомогательный

вектор вида 0

0iac = , где

0ia – строка матрицы А, имеющая номер 0i .

Пусть выполнена 1−N итерация и получены векторы 11 , −− NN cx . Тогда Nx и Nc вычисляются по следующим итеративным формулам:

( ) ;~1 1 NN

NN

N xxx αα +−= − (7.3) ( ) ,~1 1 N

NN

NN ccc αα +−= − (7.4)

где параметр 10 ≤≤ Nα . Векторы Nx~ и Nc~ будут получены ниже. Рассмотрим вектор ( )11

11 ,..., −−− = N

nNNc γγ и выберем такие индексы kj , на которых

достигается минимум ....min 1111

,1 21

−−−−

===== N

jNj

Nj

Nj

nj kγγγγ

Обозначим через 1

,1

1 min −

=

− = Nj

nj

Nv γ (7.5)

и { }kN jjJ ,...,1

1 =− множество индексов, на которых достигается 1

,1min −

=

Njnj

γ .

Пусть AN GG ⊂ – подыгра игры AG с матрицей { } miA N

ijN ,1,1 == −α , а индекс

1−∈ NJj . Решаем подыгру и находим стратегию Xx N ∈~ игрока 1. Пусть ( )Nm

NNx ξξ ~,...,~~1= .

Вычислим вектор ∑=

=m

ii

Ni

N ac1

~~ ξ . Пусть вектор Nc~ имеет компоненты

( )Nn

NNc γγ ~,...,~~1= . Рассмотрим ( )n×2 - игру с матрицей

⎟⎟⎠

⎞⎜⎜⎝

⎛ −−

Nn

N

Nn

N

γγγγ~...,,~

...,,

1

111 .

Найдем оптимальную стратегию ( ) 10,1, ≤≤− NNN ααα , игрока 1 в этой подыгре. Подставляя найденные значения NNN cx α,~,~ в (7.3), (7.4), находим Nx и Nc .

Процесс продолжаем до тех пор, пока не выполнится равенство 0=Nα или не будет достигнута требуемая точность вычислений. Сходимость алгоритма гарантируется следующей теоремой.

Теорема 7.2. Пусть { } { }NN xv , — итеративные последовательности, определяемые (7.3), (7.5). Тогда справедливы следующие утверждения.

1. 1−> NN vv , т. е. последовательность { }1−Nv строго монотонно возрастает. 2. .lim vvv N

N==

∞→ (7.6)

3. *lim xx N

N=

∞→, где **

Ix Σ∈ — оптимальная стратегия игрока 1.

Пример 7.2. Решим, используя монотонный алгоритм, игру с матрицей

⎟⎟⎟

⎜⎜⎜

⎛=

121103312

A .

Итерация 0). Пусть игрок 1 выбрал 1-ю строку матрицы А, т. е. ( )0,0,10 =x и ( )3,1,21

0 == ac . Вычислим { }2,1min 002

00 ==== Jv jjγγ .

Page 33: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

33

( ) ( ) ( ) ( ){ } { }

( ) ( ) ( ) ( ){ } { } ;13;;2max010113;020011;010312min1min1

;31;;2max010211;010013;030112max1max1

11

11

==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==

==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==

1

3

ijiiijj

iijjiji

v

v

ξα

ηα

( ) ( ) ( ) ( ){ } { }

( ) ( ) ( ) ( ){ } { } ;2124;;25max01211213;02210211;01213212min2min2

;2323;;23max01212211;01210213;03211212max2max2

22

22

==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==

==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==

21

23

ijiiijj

iijjiji

v

v

ξα

ηα

( ) ( ) ( ) ( ){ } { }

( ) ( ) ( ) ( ){ } { } .3135;;38max321313;311;323312min3min3

;35;1;34max322311;313;321312max3max3

33

33

==⋅+⋅⋅⋅+⋅==

==⋅+⋅⋅⋅+⋅==

31

35

ijiiijj

iijjiji

v

v

ξα

ηα

Таблица 7.1. Выигрыш игрока 1 Проигрыш игрока 2 k i j

k

kαξ

k

kβξ

k

kγξ

k

kaη

k

kbη

k

kcη α β γ a b c k

v k

kvk

ε

1. α a 1 0 0 1 0 0 2 3 1 2 1 3 3 1 2 2. β b 21 21 0 21 21 0 312 =+ 3=+ 03 321 =+ 532 =+ 1=+ 01 413 =+ 23 21 1 3. β b 31 32 0 31 32 0 4 3 5 8 1 5 35 31 34 4. γ b 41 42 41 41 43 0 5 3 7 9 3 6 47 43 1 5. γ b 51 52 52 51 54 0 6 3 9 10 5 7 59 55 54 6. γ b 61 62 63 61 65 0 7 3 11 11 7 8 611 67 64 7. γ b 71 72 74 71 76 0 8 3 13 12 9 9 713 79 74 8. γ c 81 82 85 81 86 81 1138 =+ 413 =+ 14=+113 13 11 10 814 810 84 9. γ c 91 92 96 91 96 92 14 5 15 14 13 11 915 911 94 10 γ c 101 102 107 101 106 103 17 6 16 15 15 12 1017 1012 105 11 α c 112 112 117 111 116 114 20 7 17 17215 =+ 16115 =+ 15=+ 312 1120 1115 115 12 α c 123 122 127 121 126 125 23 8 18 19 17 18 1223 1217 126

Page 34: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

34

Итерация 1). Рассмотрим подыгру AGG ⊂1 с матрицей ⎟⎟⎟

⎜⎜⎜

⎛=

201

1A .

Оптимальной стратегией 1~x игрока 1 является вектор ( )1,0,0~1 =x . Тогда ( )1,2,1~3

1 == ac .

Решаем ( )32× - игру с матрицей ⎟⎟⎠

⎞⎜⎜⎝

⎛121312

. Заметим, что 3-й столбец матрицы

доминируем, поэтому смотрим матрицу ⎟⎟⎠

⎞⎜⎜⎝

⎛2112

. В силу симметрии оптимальной стратегией

игрока 1 в этой игре является вектор ( ) ( )21,2

11, =− NN αα .

Вычисляем 1x и 1c по формулам (1), (2). Имеем ( )( )

.123min

,2,23,23~2121,21,0,21~2121

012

11

11

101

101

=>====

=+=

=+=

vv

cccxxx

jjγγγ

Множество индексов имеет вид { }2,11 =J .

Итерация 2). Рассмотрим подыгру AGG ⊂2 с матрицей ⎟⎟⎟

⎜⎜⎜

⎛=

210312

2A . Первая строка в

этой матрице доминируема, поэтому достаточно рассмотреть подматрицу ⎟⎟⎠

⎞⎜⎜⎝

⎛2103

.

Оптимальной стратегией игрока 1 в этой игре является вектор ( )43,4

1 , поэтому

( )43,4

1,0~2 =x . Вычислим ( )1,23,2343

41~

322 =+= aac и рассмотрим ( )32× игру с

матрицей ⎟⎟⎠

⎞⎜⎜⎝

⎛1232322323

. Первая стратегия игрока 1 доминирует вторую, поэтому 01 =α .

Таким образом, вычисления закончены ( )21,0,2

11* == xx , значение v игры равно

231 == vv , а оптимальная стратегия игрока 2 имеет вид ( )0,21,2

1* =y (см. пример 7.1,

вторая строка в табл. 7.1). САМОСТОЯТЕЛЬНАЯ РАБОТА № 6. НАЙТИ ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ

СТРАТЕГИЯХ С ПОМОЩЬЮ ИТЕРАТИВНЫХ МЕТОДОВ.

Page 35: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

35

ПРИЛОЖЕНИЕ САМОСТОЯТЕЛЬНАЯ РАБОТА № 1. ИССЛЕДОВАТЬ ВСЕ СИТУАЦИИ НА

РАВНОВЕСИЕ ПО НЭШУ И ОПТИМАЛЬНОСТЬ ПО ПАРЕТО. 1. 2. 3. 4. 5. ( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛6,43,01,22,1

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛4,43,01,22,3

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛6,51,10,22,5

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛5,53,10,22,3

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛4,51,21,24,3

6. 7. 8 9. 10. ( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛3,51,20,24,1

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛6,41,23,22,5

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛3,51,22,36,5

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛6,43,22,34,5

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛4,71,22,35,7

11. 12 13. 14 15. ( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛8,53,22,35,6

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛5,74,23,37,6

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛5,61,22,34,7

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛8,91,22,47,8

( ) ( )( ) ( )⎟⎟⎠

⎞⎜⎜⎝

⎛5,81,53,46,9

САМОСТОЯТЕЛЬНАЯ РАБОТА № 2. НАЙТИ ВСЕ МАКСМИННЫЕ И МИНИМАКСНЫЕ

СТРАТЕГИИ ИГРОКОВ, НИЖНЕЕ И ВЕРХНЕЕ ЗНАЧЕНИЯ ИГРЫ; УКАЗАТЬ ВСЕ СИТУАЦИИ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ, ЕСЛИ ОНИ ЕСТЬ.

1. 2. 3.

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−−

−−−

57411321

24131132

⎟⎟⎟

⎜⎜⎜

−−−

−−

0344213512153342

⎟⎟⎟

⎜⎜⎜

91112543341135432

4. 5. 6.

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−

−−

143327511

51312112

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−

−−

61331511405133312

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

31771174018107188411040

7. 8 9.

⎟⎟⎟

⎜⎜⎜

136122137412101

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−

125851311210211243221

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−

3512714833351121101

10. 11. 12

⎟⎟⎟

⎜⎜⎜

⎛−−

311121124311112

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−

6563521131123111

⎟⎟⎟

⎜⎜⎜

11192813124521

13. 14 15

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎛−

181831115231204122

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−

−−

7402752452032121

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−31324111

103737241

Page 36: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

36

Пример 1. Решим каноническую задачу симплекс–методом. max23 21 →+= xxz

⎪⎪⎪

⎪⎪⎪

≥≤+≤+

≤≤+−

;0,;82;62

;2;1

21

21

21

2

21

xxxxxx

xxx

Введем базисные

переменные 4,1, =isi .

21 , xx – свободные переменные

min23 21 →−−= xxF

⎪⎪⎪

⎪⎪⎪

≥=+−+=+−+

=+−=+−+−

;0,;082;062

;02;01

21

421

321

22

121

xxsxxsxx

sxsxx

Определение 1. Решение системы (2), соответствующее нулевым значениям свободных переменных, называется базисным. Очевидно, что базисное решение будет допустимым, если все 4,1,0 =≥ isi .

Составим симплекс – таблицу.

2x 1x 1s 2s 3s 4s

1s 1* -1 1 0 0 0 1

2s 1 0 0 1 0 0 2

3s 2 1 0 0 1 0 6

4s 1 2 0 0 0 1 8

F 2 3 0 0 0 0 0

Если все элементы последнего столбца меньше нуля (кроме последнего элемента последней строки F ), то решение неограниченное и оптимального решения не существует.

Условия оптимальности: если все

элементы последней строки 0≤F , то полученное решение оптимально.

Выбор генерального столбца (кроме последнего): в последней строке выбираем положительной элемент.

Выбор генеральной строки: за генеральную строку берется та строка (кроме последней), в которой отношение свободного члена к положительному элементу генерального столбца было бы минимальным.

2x 1x 1s 2s 3s 4s 2x 1x 1s 2s 3s 4s

2x 1 -1 1 0 0 0 1 2x 1 0 0 1 0 0 2

2s 0 1* -1 1 0 0 1 1x 0 1 -1 1 0 0 1

3s 0 3 -2 0 1 0 4 3s 0 0 1* -3 1 0 1

4s 0 3 -1 0 0 1 7 4s 0 0 2 -3 0 1 4

F 0 5 -2 0 0 0 -2

F 0 0 3 -5 0 0 -7

2x 1x 1s 2s 3s 4s 2x 1x 1s 2s 3s 4s

2x 1 0 0 1 0 0 2 2x 1 0 0 0 2/3 -1/3 4/3

1x 0 1 0 -2 1 0 2 1x 0 1 0 0 -1/3 2/3 10/3

1s 0 0 1 -3 1 0 1 1s 0 0 1 0 -1 1 3

4s 0 0 0 3* -2 1 2 2s 0 0 0 1 -2/3 1/3 2/3

F 0 0 0 4 -3 0 -10

F 0 0 0 0 -1/3 -4/3 3212−

.34;3

10;32123

212 21maxmin ===⇒−= xxzF

Page 37: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

37

Пример 2. Метод искусственного базиса для основной задачи.

⎪⎪⎩

⎪⎪⎨

=≥

=−+−−=−−

→+−=

.3,1,0

;1123;222

max432

321

321

321

jx

xxxxxx

xxxz

j

Умножив обе части первого уравнения на (-1) и прибавив к левым частям обоих уравнений

искусственные неизвестные 1w и

2w , получим расширенную систему. Составим на множестве планов расширенной системы вспомогательную функцию.

( ) min21 →+= wwxϕ

⎪⎪⎩

⎪⎪⎨

=≥

=+−+−=+++−

.3,1,0

;1123;222

2321

1321

jx

wxxxwxxx

j

( )( ) ;1353

;53132311222

321

32132132121

=−+−+−+=+−++−−+=+=

xxxxxxxxxxxxxwwx

ϕϕ

1x 2x 3x 1w 2w Св. чл.

1w -2 2* 1 1 0 2 2I

2w -1 3 -2 0 1 11 23 III ⋅−

( )xϕ -3 5 -1 0 0 13 25 IIII ⋅−

2x -1 1 1/2 1/2 0 1 2III +

2w 2* 0 -7/2 -3/2 1 8 2II

ϕ 2 0 -7/2 -5/2 0 8 IIIII −

2x 0 1 -5/4 -1/4 1/2 5

1x 1 0 -7/4 -3/4 1/2 4

ϕ 0 0 0 -1 -1 0

так как 0min =ϕ , решим задачу:

⎪⎩

⎪⎨⎧

=−

=−

→+−=

;447

;545

max432

31

32

321

xx

xx

xxxz

( ) ( ) 3333 415744

5534742 xxxxz +−=++−+=

3321 4157432 xxxxF −=−+−=

1x 2x 3x

2x 0 1 -5/4 5 2I

1x 1 0 -7/4 4 23III − F 0 0 -15/4 7 25IIII −

Следовательно, оптимального плана не существует.

Page 38: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

38

Пример 3. Рассмотрим общую задачу. Двухфазный симплекс – метод. min4 21 →+= xxz

⎪⎪⎩

⎪⎪⎨

≥≤+≥+=+

;0,;42;634

;33

21

21

21

21

xxxxxx

xx

min21 →+= RRϕ

⎪⎪⎩

⎪⎪⎨

≥=++

=+−+=++

;0,;42

;634;33

21

221

2121

121

xxsxx

RsxxRxx

т. к. «=»;

т. к. 06001

21 <−===

xxs ;

т. к. «все нормально»; => s2 - базисный

;47934633 1211212121 sxxsxxxxRR +−−=+−−+−−=+=ϕ 1x 2x 1s 1R 2R 2s 1R 3* 1 0 1 0 0 3 2R 4 3 -1 0 1 0 6 2s 1 2 0 0 0 1 4 ϕ 7 4 -1 0 0 0 9

1x 1 1/3 0 1/3 0 0 1 2R 0 5/3* -1 -4/3 1 0 2 2s 0 5/3 0 -1/3 0 1 3 ϕ 0 5/3 -1 -7/3 0 0 2

1x 1 0 1/5 3/5 -1/5 0 3/52x 0 1 -3/5 -4/5 3/5 0 6/52s 0 0 1 1 -1 1 1 ϕ 0 0 0 -1 -1 0 0 так как 0min =ϕ , решим задачу:

( ) ( )

⎪⎩

⎪⎨⎧

+=

−=

−=++−=

;53

56

;51

53

51

518

53

56

51

534

12

11

111

sx

sx

sssz

1x 2x 1s

1x 1 0 1/5 3/5

2x 0 1 -3/5 6/5

2s 0 0 1* 1 z 0 0 1/5 18/5

1x 1 0 0 2/5 2x 0 1 0 9/5

1s 0 0 1 1 z 0 0 0 17/5

5175

95

2

min

2

1

=

=

=⇒

z

x

x

Д/з: решить П3 и Д3 симплекс-методом.

⎪⎪

⎪⎪

=≥

=−−+−≤−++−

≤+−+

→+−++=

.5,1,0

;123;822

;12432max7135421

54321

54321

5421

54321

jx

xxxxxxxxxx

xxxxxxxxxz

j

⎪⎪⎪⎪

⎪⎪⎪⎪

≥≥−−−=−+−

=+=−−≥++

→++=

.0,;724

;132;52

;43;2132

min812

21

321

321

32

321

321

321

yyyyyyyy

yyyyy

yyyyyyf

Page 39: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

39

САМОСТОЯТЕЛЬНАЯ РАБОТА № 3. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ПРИ ПОМОЩИ ЛП. СДЕЛАТЬ ПРОВЕРКУ.

1. 2. 3. 4. 5. 6. 7.

⎟⎟⎟

⎜⎜⎜

321450132

⎟⎟⎟

⎜⎜⎜

−−

421121342

⎟⎟⎟

⎜⎜⎜

154411432

⎟⎟⎟

⎜⎜⎜

⎛ −−

511131112

⎟⎟⎟

⎜⎜⎜

−−

114513

312

⎟⎟⎟

⎜⎜⎜

⎛−431112

324

⎟⎟⎟

⎜⎜⎜

612374101

8 9. 10. 11. 12 13. 14.

⎟⎟⎟

⎜⎜⎜

−−

851121112

⎟⎟⎟

⎜⎜⎜

− 333112101

⎟⎟⎟

⎜⎜⎜

⎛−−

11121431112

⎟⎟⎟

⎜⎜⎜

−−−

563211132

⎟⎟⎟

⎜⎜⎜

− 1928312521

⎟⎟⎟

⎜⎜⎜

−−

183120

322

⎟⎟⎟

⎜⎜⎜

−−

514265121

15 16. 17 18 19. 20. 21.

⎟⎟⎟

⎜⎜⎜

−−−−

111373

241

⎟⎟⎟

⎜⎜⎜

⎛−431112

321

⎟⎟⎟

⎜⎜⎜

311312123

⎟⎟⎟

⎜⎜⎜

−−

314451

132

⎟⎟⎟

⎜⎜⎜

−−

974432435

⎟⎟⎟

⎜⎜⎜

124352431

⎟⎟⎟

⎜⎜⎜

−143837312

САМОСТОЯТЕЛЬНАЯ РАБОТА № 4. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ

ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ГРАФОАНАЛИТИЧЕСКИМ МЕТОДОМ. 1. 2. 3. 4. 5. 6. 7. 8. 9.

⎟⎟⎠

⎞⎜⎜⎝

⎛ −450132

⎟⎟⎟

⎜⎜⎜

⎛−

512112

⎟⎟⎠

⎞⎜⎜⎝

⎛−411432

⎟⎟⎟

⎜⎜⎜

−−

6311

12

⎟⎟⎠

⎞⎜⎜⎝

⎛− 124

342

⎟⎟⎟

⎜⎜⎜

832022

⎟⎟⎠

⎞⎜⎜⎝

⎛ −374101

⎟⎟⎟

⎜⎜⎜

− 531201

⎟⎟⎠

⎞⎜⎜⎝

⎛−

−121342

10. 11. 12. 13. 14. 15. 16. 17. 18.

⎟⎟⎟

⎜⎜⎜

245231

⎟⎟⎠

⎞⎜⎜⎝

⎛ −431112

⎟⎟⎟

⎜⎜⎜

1213112

⎟⎟⎠

⎞⎜⎜⎝

⎛− 1884

10412

⎟⎟⎟

⎜⎜⎜

201221

⎟⎟⎠

⎞⎜⎜⎝

⎛−−

−−373

221

⎟⎟⎟

⎜⎜⎜

146021

⎟⎟⎠

⎞⎜⎜⎝

⎛−

−112

324

⎟⎟⎟

⎜⎜⎜

− 311223

САМОСТОЯТЕЛЬНАЯ РАБОТА № 5. РАССМОТРЕТЬ ИГРУ НА ДОМИНИРОВАНИЕ И

НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ. 1. 2. 3.

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−−

−−−

57411321

24131132

⎟⎟⎟

⎜⎜⎜

−−

−−

0344213512153342

⎟⎟⎟

⎜⎜⎜

9111543341135432

4. 5. 6.

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−

−−

143327511

51312112

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−

−−

61331511405133312

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−31771

174018107188411040

7. 8 9.

⎟⎟⎟

⎜⎜⎜

136122137412101

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−

125851311210211243221

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−

35127148333

51121101

Page 40: К В Григорьева · 2010. 12. 22. · альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. {Т Ф} XМ=X Ж= x , x. Если

40

10. 11. 12

⎟⎟⎟

⎜⎜⎜

⎛−−

31112124311112

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−

6563521131123191

⎟⎟⎟

⎜⎜⎜

11192813124521

13. 14 15

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎛−

181831115231204122

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−

−−

7402752452032121

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−31324111

103737241

16. 17 18

⎟⎟⎟

⎜⎜⎜

⎛−−

164317111225321

⎟⎟⎟

⎜⎜⎜

−−

−−

243111431237123

⎟⎟⎟

⎜⎜⎜

−−−−−−

2431435451

22132

19. 20.

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

161294127464325431

⎟⎟⎟

⎜⎜⎜

− 51243131186745312

САМОСТОЯТЕЛЬНАЯ РАБОТА № 6. НАЙТИ ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ

СТРАТЕГИЯХ С ПОМОЩЬЮ ИТЕРАТИВНОГО МЕТОДА. 1. 2. 3. 4. 5. 6. 7.

⎟⎟⎟

⎜⎜⎜

321450132

⎟⎟⎟

⎜⎜⎜

−−

421121342

⎟⎟⎟

⎜⎜⎜

154411432

⎟⎟⎟

⎜⎜⎜

⎛ −−

511131112

⎟⎟⎟

⎜⎜⎜

−−

114513

312

⎟⎟⎟

⎜⎜⎜

40181018841040

⎟⎟⎟

⎜⎜⎜

612374101

8 9. 10. 11. 12 13. 14.

⎟⎟⎟

⎜⎜⎜

−−

851121112

⎟⎟⎟

⎜⎜⎜

− 333112101

⎟⎟⎟

⎜⎜⎜

⎛−−

11121431112

⎟⎟⎟

⎜⎜⎜

−−−

563211112

⎟⎟⎟

⎜⎜⎜

1928312521

⎟⎟⎟

⎜⎜⎜

−−

183120

322

⎟⎟⎟

⎜⎜⎜

−−

514265121

15 16. 17 18 19. 20. 21.

⎟⎟⎟

⎜⎜⎜

−−−−

111373

241

⎟⎟⎟

⎜⎜⎜

⎛−431112

324

⎟⎟⎟

⎜⎜⎜

311312123

⎟⎟⎟

⎜⎜⎜

−−

314451

132

⎟⎟⎟

⎜⎜⎜

−−

974432435

⎟⎟⎟

⎜⎜⎜

−143837312

⎟⎟⎟

⎜⎜⎜

124352431

ЛИТЕРАТУРА 1. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. — М.: Высшая школа, 1998. 2. Печерский С. Л., Беляева А. А. Теория игр для экономистов. — СПб.: Изд-во

Европейского университета, 2001.