Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
1
К. В. Григорьева
Методические указания
Часть 1. Бескоалиционные игры в нормальной форме.
Факультет ПМ-ПУ СПбГУ 2007 г.
2
ОГЛАВЛЕНИЕ ЗАНЯТИЕ №1 ............................................................................................................................................................. 3
1.1. СОДЕРЖАНИЕ ТЕОРИИ ИГР....................................................................................................................... 3 1.2. КЛАССИФИКАЦИЯ ИГР .............................................................................................................................. 3 1.3. ИГРА В НОРМАЛЬНОЙ ФОРМЕ ................................................................................................................. 5 1.4. РАВНОВЕСИЕ ПО НЭШУ............................................................................................................................. 6 1.5. ОПТИМАЛЬНОСТЬ ПО ПАРЕТО. ............................................................................................................... 7
ЗАНЯТИЕ №2 ............................................................................................................................................................. 8 2.1. АНТАГОНИСТИЧЕСКИЕ ИГРЫ. СЕДЛОВАЯ ТОЧКА ............................................................................ 8 2.2. ПРИНЦИП МАКСМИНА И МИНИМАКСА ............................................................................................... 9
ЗАНЯТИЕ №3 ........................................................................................................................................................... 11 3.1. СМЕШАННЫЕ СТРАТЕГИИ МАТРИЧНЫХ ИГР ................................................................................... 11 3.2. СИТУАЦИЯ РАВНОВЕСИЯ В СМЕШАННЫХ СТРАТЕГИЯХ............................................................. 13 3.3. СВОЙСТВА ОПТИМАЛЬНЫХ СМЕШАННЫХ СТРАТЕГИЙ .............................................................. 14 3.2. РАВНОВЕСИЕ ПО НЭШУ В СМЕШАННЫХ СТРАТЕГИЯХ В БИМАТРИЧНОЙ ИГРЕ .................. 16
ЗАНЯТИЕ №4. НАХОЖДЕНИЕ ЗНАЧЕНИЯ ИГРЫ ПРИ ПОМОЩИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ (ЛП)............................................................................................................................... 18 ЗАНЯТИЕ №5. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ( )−× n2 ЛИБО ( )−×2m МАТРИЧНЫХ ИГР............................................................................................................................................................................. 23 ЗАНЯТИЕ №6 ........................................................................................................................................................... 26
6.1 ДОМИНИРОВАНИЕ СТРАТЕГИЙ В БИМАТРИЧНОЙ ИГРЕ ............................................................... 26 6.2. ДОМИНИРОВАНИЕ СТРАТЕГИЙ В АНТАГОНИСТИЧЕСКОЙ ИГРЕ .............................................. 27
ЗАНЯТИЕ №7. ИТЕРАТИВНЫЕ МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР .................................................. 30 7.1. ИТЕРАТИВНЫЙ МЕТОД БРАУНА – РОБИНСОНА (МЕТОД ФИКТИВНОГО РАЗЫГРЫВАНИЯ) 30 7.2. МОНОТОННЫЙ ИТЕРАТИВНЫЙ АЛГОРИТМ РЕШЕНИЯ МИ ......................................................... 31
ПРИЛОЖЕНИЕ ........................................................................................................................................................ 35 ЛИТЕРАТУРА .......................................................................................................................................................... 40
3
ЗАНЯТИЕ №1
1.1. СОДЕРЖАНИЕ ТЕОРИИ ИГР Теория игр (GT – Game Theory) – это раздел теории управления, в котором исследуются задачи о существовании и нахождении оптимального управления в условиях конфликта (в условиях столкновения сторон, каждая из которых стремится воздействовать на развитие конфликта в своих интересах).
Существует множество определений того, что есть GT и каковы ее задачи. «Теория игр — это теория рационального поведения людей с несовпадающими
интересами» (Aumann, 1989). «Теория игр — наука о стратегическом мышлении» (Dixit, Nalebuff, 1991). «Теория игр1 — это теория мат. моделей принятия решений в условиях
неопределенности, когда принимающий решение «игрок» располагает информацией лишь о множестве возможных ситуаций, в одной из которых он в действительности находится, о множестве решений («стратегий»), которые он может принять, и о количественной мере «выигрыша», который он мог бы получить, выбрав в данной ситуации данную стратегию». Неопределенность в GT является следствием сознательной деятельности другого лица (лиц), отстаивающего свои интересы. В связи с этим под «теорией игр понимается теория мат. моделей принятия оптимальных решений в условиях конфликтов» (Воробьев, 1984).
Таким образом, содержание теории игр – это установление принципов оптимального поведения в условиях неопределенности, доказательство существования решений, удовлетворяющих этим принципам, указание алгоритмов нахождения решений. Моделями GT описываются экономические и правовые конфликты, взаимодействие человека с природой, биологическая борьба за существование, военное дело и т. д. (Дюбин, Суздаль, 1981; Shubik, 1984; Moulin, 1983, 1986; Ordeshook, 1986; Rawls, 1971; Maynard, Smith 1974 и др.). Теоретико-игровой подход к изучению формирования коалиций является своего рода традицией в социальных и политических науках (Riker, 1962; Riker, Ordeshook, 1973; De Swan, 1973; Ordeshook, 1978, 1992; Van Deemen, 1997). В книге «Game Theory and the Law» (D.Baird, R. Gertner, С Picker, 1994) аппарат GT впервые применяется к анализу того, как законы влияют на поведение людей, партий и т.д. Особая роль теории игр выделяется в экономическом моделировании: «Суть теории игр в том, чтобы помочь экономистам понимать и предсказывать то, что будет происходить в экономическом контексте» (Kreps, 1990). «Аппарат теории равновесия и теории игр послужил основой для создания современных теорий международной торговли, налогообложения, общественных благ, монетарной экономики, теории производственных организаций» (Полтерович, 1997).
1.2. КЛАССИФИКАЦИЯ ИГР Все модели в GT принято называть играми. Математическое описание игры сводится к перечислению всех действующих в ней игроков, указанию для каждого игрока всех его стратегий, а также численного выигрыша, который он получит после того, как игроки выберут свои стратегии. В результате игра становится формальным объектом, который поддается математическому анализу. Игры можно классифицировать по различным признакам:
• по числу «игроков» (сторон) 2≥N ; • по числу ходов в игре:
1 Воробъев Н. Н. Философская энциклопедия. Т. 5. М., 1970. С. 208—210.
4
многошаговые; бесконечные;
• математической структуре модели игры: рекурсивные; дифференциальные;
• по числу стратегий игры: конечные; бесконечные, если хотя бы у одного «игрока» число стратегий бесконечно;
• по взаимоотношениям игроков: кооперативные (коалиционные), в которых принимающие решение игроки объединены в фиксированные коалиции. Члены одной коалиции могут свободно обмениваться информацией и принимать полностью согласованные решения. Игроки могут вступать в коалицию и договариваться о совместных действиях.
бескоалиционные, в которых каждая коалиция или множество игроков, действующих совместно, состоит лишь из одного игрока. Теория бескоалиционных игр – это способ моделирования и анализа ситуаций, в которых оптимальные решения каждого игрока зависят от его представлений об игре оппонентов. Важнейшим моментом теории является то, что игроки не должны придерживаться произвольных представлений об игре своих оппонентов: каждый игрок должен пытаться предсказать игру своих оппонентов, используя свои знания правил игры и исходя из предположений, что его оппоненты сами рациональны, а потому пытаются сами также предсказать игру своих оппонентов и максимизировать свои собственные выигрыши. Однако так называемая кооперативная теория бескоалиционных игр допускает временные объединения игроков в коалиции в процессе игры с последующим разделением полученного выигрыша или принятие совместных решений;
• по степени информативности «игроков» в игре: детерминированные, когда условия, в которых принимаются решения, известны полностью;
стохастические, когда известно множество возможных вариантов условий и их вероятностное распределение;
неопределенные, когда известно множество возможных вариантов, но без какой-либо информации об их вероятностях;
• по выигрышу игры: антагонистические; игры с ненулевой суммой;
• по характеру получения информации: статические игры или игры в нормальной форме (игроки получают всю предназначенную им информацию до начала игры и ходят один раз, одновременно и независимо);
динамические игры или игры в позиционной форме (информация поступает игрокам в процессе развития игры);
• по полноте имеющейся у игроков информации: статические игры с полной информацией предполагают, что у игроков имеется вся «необходимая» информация друг о друге, включая выигрыши игроков;
если игрок знает свою функцию выигрыша, но может не знать функций выигрыша остальных игроков, то тогда участники должны иметь какие-то представления относительно предпочтений других участников, должны иметь представления об их представлениях о предпочтениях других и т.д. Здесь мы приходим к понятию Байесовых игр (статические игры с неполной информацией);
динамические игры с полной информацией и неполной информацией.
5
1.3. ИГРА В НОРМАЛЬНОЙ ФОРМЕ Определение 1.1. Под игрой в нормальной (или стратегической) форме
понимается объект { }nn KKXXNG ,,,,,, 11 ……= ,
где { }nN ,1= – множество игроков; iX – конечное множество чистых стратегий ix i -го игрока, Ni∈ ; ix – чистая стратегия i -го игрока, ii XxNi ∈∈ , ; ( )ni xxK ,,1 … – вещественная функция выигрышей игрока i, определенная на декартовом произведении nXXXX ×××= …21 .
Набор стратегий ( ) Xxxxx n ∈= ,,,1 … , называется ситуацией игры. Рассмотрим простейшую статическую модель – игру в нормальной форме
( ) ( )
( ) ( )⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
mnmnmm
nn
βαβα
βαβα
,,
,,
11
111111
…………
…,
в которой имеем: участие двух игроков { }2,1=N , конечное множество стратегий каждого из игроков: { }miiX ,11 == – стратегии первого игрока;
{ }njjX ,12 == – стратегии второго игрока; ситуация игры – пара стратегий ( )ji, ; ( ) ijjiK α=,1 – выигрыш первого игрока и ( ) ijjiK β=,2 – выигрыш второго игрока. Такая игра называется биматричной, т.к. ее можно представить в виде двух
матриц:
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
mnm
n
αα
αα
…………
…
1
111
и ⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
mnm
n
ββ
ββ
…………
…
1
111
.
Отметим, что формально постановка игры в нормальной форме имеет следующую интерпретацию: игроки одновременно и независимо друг от друга выбирают свои стратегии ii Xx ∈ ; после этого возникает ситуация ( )nxx ,,1 … ; на этом игра прекращается, и i -ый игрок получает свой выигрыш ( )ni xxK ,,1 … , где Ni∈ .
Возникает следующая проблема: каждый игрок стремится максимизировать свой выигрыш. Такая постановка математически некорректна, т. к. игрок знает только свою стратегию ix и не знает других параметров. В связи с этим существуют различные подходы к понятию оптимального поведения.
В 1950 г. Джон Нэш (Нобелевский лауреат по экономике 1994 г.) ввел понятие ситуации равновесия как метода решений бескоалиционных игр.
Определение 1.2. Ситуация, образующаяся в результате выбора всеми игроками некоторых своих стратегий, называется равновесной, если ни одному из игроков невыгодно изменять свою стратегию при условии, что остальные игроки придерживаются равновесных стратегий.
Именно равновесие по Нэшу и его модификации признаются наиболее подходящими концепциями решения таких игр.
6
1.4. РАВНОВЕСИЕ ПО НЭШУ Введем обозначения. Пусть ситуация игры ( )niii xxxxxx ,,,,,, 111 …… +−= . Вместо
стратегии ix игрок i использует стратегию ix : ( ) ( )niiii xxxxxxx ,,,,,,|| 111 …… +−= . Определение 1.3. Будем говорить, что ситуация x (это набор стратегий) является
равновесной по Нэшу (NE – Nash Equilibrium), если имеет место ( ) ( ) iiiii XxNixxKxK ∈∈∀≥ ,|| .
Если игроки договорились о выборе стратегии и возможна ситуация x , входящая в равновесие по Нэшу, то получается устойчивый договор, и в дальнейшем ни один из игроков в индивидуальном порядке не заинтересован в отклонении от равновесия по Нэшу, т.к. выигрыш может только уменьшиться. В то же время, равновесие по Нэшу не является устойчивым против отклонения группы игроков. Если сразу отойдет некоторая коалиция игроков, то они могут выиграть.
Пример 1.1. Семейный спор. { })(),( ЖженаМмужN = . Каждый имеет две альтернативы: пойти – в театр (Т) или на футбол (Ф), т.е. { }ФТ
ЖМ xxXX ,== . Если они вместе пойдут на футбол, то Он получит больше удовольствия, чем Она; если они вместе пойдут в театр, то – наоборот. Наконец, если они окажутся в разных местах, то они не получат никакого удовольствия. Рассматриваемая ситуация моделируется следующей игрой:
( ) ( )( ) ( ) ( )( )( ) ( )( ) ( ) ( )( )
( ) ( )( ) ( ) .
4,10,00,01,4
,,,,,,,,,,,,
2121
2121⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛ТФ
МxxKxxKxxKxxKxxKxxKxxKxxK
ТФЖ
ТЖ
ТМ
ТЖ
ТМ
ТЖ
ФМ
ТЖ
ФМ
ФЖ
ТМ
ФЖ
ТМ
ФЖ
ФМ
ФЖ
ФМ
Рассмотрим ситуацию (Ф,Ф). Запишем математически ( 1x – единственная альтернатива 1x , аналогично, 2x – единственная альтернатива 2x ):
( )( ) ( )( ) ( );,||
;,||
;,,,
2
1
2121
ТЖ
ФМ
ФЖ
ТМ
ФЖ
ФМ
xxxx
xxxx
xxxxxxx
=
=
===
( ) ( )
( ) ( ) .01;0||;04;0||;1;4
2211
21
>=>===
xxKxxKxKxK
Следовательно, ( )ФЖ
ФМ xxx ,= – NE. В ситуации (Ф,Ф) у мужа – ( ) ;41 =ФФK у жены –
( ) 12 =ФФK . Какие у игроков альтернативы? У мужа – ( ) ;01 =ТФK у жены – ( ) 02 =ФТK . Так как ( ) ( )ТФKФФK 11 > и ( ) ( )ФТKФФK 22 > , то (Ф,Ф) – NE.
Аналогично можно рассмотреть остальные комбинации, откуда получится, что здесь есть два равновесия по Нэшу в чистых стратегиях – (Ф,Ф) и (Т,Т).
Пример 1.2. Дилемма заключенного. Двое подозреваемых в совершении тяжкого преступления арестованы и помещены в одиночные камеры, причем они не имеют возможности передавать друг другу какие-либо сообщения. Их допрашивают поодиночке. Если оба признаются в совершении преступления, то им грозит, с учетом их признания, тюремное заключение сроком по 8 лет каждому. Если оба будут молчать, то они будут наказаны за совершение какого-то незначительного преступления (скажем, незаконное хранение оружия или что-нибудь другое) и получат в этом случае по 1 году тюремного заключения. Если же один из них сознается, а другой – нет, то первый, за содействие следствию, будет вовсе освобожден от наказания, тогда как второй будет приговорен к максимально возможному за данное преступление наказанию – 10-летнему тюремному заключению.
Описанная история может быть представлена следующей игрой:
7
( ) ( )( ) ( ) .
1,10,1010,08,8
⎟⎟⎠
⎞⎜⎜⎝
⎛−−−
−−−НС
I
НСII
Рассмотрим каждую ситуацию в отдельности:
(СС): ( ) ( )
( ) ( );108
;10
;108
;10;8;8
21
21
−>−
−=
−>−
−=−=−=
СНKНСKССKССK
NE;
(СН): ( ) ( )
( ) ( )
;910
;8
;10
;1;10;0
21
21
−>/−
−=
−>
−=−==
ССKННKСНKСНK
не NE;
(НС): ( ) ( )( ) ( )
;10
;1
;810
;8;0;10
21
21
−>
−=
−>/−
−==−=
ННKССKНСKНСK
не NE;
(НН): ( ) ( )
( ) ( );01
;0
;01
;0;1;1
21
21
>/−
=
>/−
=−=−=
НСKСНKННKННK
не NE.
Следовательно, (СС) – NE.
1.5. ОПТИМАЛЬНОСТЬ ПО ПАРЕТО. Определение 1.4. Ситуация ( )**
1* ,, nxxx …= называется оптимальной по Парето,
если не существует никакой другой ситуации ( )nxxx ′′=′ ,,1 … такой что: 1) ( ) ( ) NixKxK ii ∈∀≥′ * ; 2) хотя бы для одного ( ) ( )*
0 00xKxKNi ii >′∈ .
Пример 1.3. Семейный спор. ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ;4;0;0;1
;1;0;0;4
2222
1111
========
ТТKТФKФТKФФKТТKТФKФТKФФK
(ФФ) : т.к. ( ) ( ) 4: 11 =>′′∃¬ ФФKxKx опт. по Парето;
(ФТ) : т.к. ( )( ) ( )( ) ( )ФТKФФK
ФТKФФKФФ
22
11:
>
>∃ не опт. по Парето;
(ТФ) : т.к. ( )( ) ( )( ) ( )ТФKФФK
ТФKФФKФФ
22
11:
>
>∃ не опт. по Парето;
(ТТ) : т.к. ( ) ( ) 4: 22 =>′′∃¬ ТТKxKx опт. по Парето. Пример 1.4. Дилемма заключенного.
( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ;1;0;10;8
;1;10;0;8
2222
1111
−==−=−=−=−==−=
ННKНСKСНKССKННKНСKСНKССK
(СС) : т.к. ( )( ) ( )( ) ( )ССKННK
ССKННKНН
22
11:
>
>∃ не опт. по Парето;
(СН) : т.к. ( ) ( ) 0: 11 =>′′∃¬ СНKxKx опт. по Парето;
8
(НС) : т.к. ( ) ( ) 0: 22 =>′′∃¬ НСKxKx опт. по Парето;
(НН) : т.к. ( ) ( )( ) ( )⎪⎩
⎪⎨⎧
>′
>′′∃¬
ННKxK
ННKxKx
22
11: опт. по Парето.
САМОСТОЯТЕЛЬНАЯ РАБОТА № 1. ИССЛЕДОВАТЬ ВСЕ СИТУАЦИИ НА РАВНОВЕСИЕ ПО НЭШУ И ОПТИМАЛЬНОСТЬ ПО ПАРЕТО.
ЗАНЯТИЕ №2
2.1. АНТАГОНИСТИЧЕСКИЕ ИГРЫ. СЕДЛОВАЯ ТОЧКА Определение 2.1. Игра в нормальной форме называется игрой с нулевой суммой,
если для любого набора стратегий ( )nxxx ,,1 …= выполняется условие
( ) 0,,1
1 =∑=
n
ini xxK … .
Эта игра представляет собой замкнутую систему: все то, что кто-нибудь выиграл, должно быть кем-то проиграно. Большинство салонных игр являются играми такого типа.
Будем далее считать, что { }2,1=N . Определение 2.2. Игра двух лиц с нулевой суммой называется
антагонистической. В такой игре интересы игроков диаметрально противоположны, поскольку
выигрыш одного игрока равен проигрышу другого: ( ) ( ) 0,, 21 =+ jiKjiK
или ( ) ( ) 2121 ,,, XjXijiKjiK ∈∈∀−= .
Пример 2.1. Орел и решка. В этой игре каждый из двух игроков выбирает, независимо друг от друга, монетку повернутую вверх либо «Орлом», либо «Решкой». Если выбор игроков различен, то игрок 2 платит игроку 1 один доллар. Если выбор совпадает, то – наоборот. Матрица выигрышей такой игры:
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛−−−−
1,11,11,11,1
""""
""""
РешкаОрел
РешкаОрел.
Определение 2.3. Конечная антагонистическая игра AG называется матричной (МИ), поскольку выигрыши игроков полностью задаются матрицей A выигрышей первого игрока.
Рассмотрим вопрос об оптимальном поведении игроков в антагонистической игре AG . Напомним, что естественно в этой игре считать оптимальной такую ситуацию
( ) 2121, XXxx ×∈ , от которой ни одному из игроков невыгодно отклоняться. Такая ситуация ( )21, xx называется равновесной, а принцип оптимальности, основанный на построении равновесной ситуации, – принципом равновесия. Ниже будет показано, что для антагонистических игр принцип равновесия эквивалентен принципам минимакса и максимина. Разумеется, для этого необходимо существование равновесия, т. е. чтобы принцип оптимальности был реализуем.
Перепишем определение равновесия по Нэшу для антагонистической игры: ( ) ( )( ) ( ) .,;,
;,;,
,,212,211
,,212,211
jijiji
jijiji
xxKxxKxxKxxK
αβααβα−===−===
Откуда следует, что
9
( ) ( )( ) ( )
.,
;,,
;,,
,,,
2,212,212
1,211,211
Xji
XjxxKxxK
XixxKxxK
jijiji
jiji
jiji
∈∀≤≤
∈∀−=≥−=
∈∀=≥=
ααα
αα
αα
Определение 2.4. В антагонистической игре AG ситуация ( )ji , называется ситуацией равновесия или седловой точкой, если
.,,,, Xjijijiji ∈∀≤≤ ααα
В седловой точке элемент матрицы ji ,α является одновременно минимумом в своей строке и максимумом в своем столбце.
Пример 2.2. Например, в игре с матрицей ( )
( ) ( )⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
106835401
030
836
ситуация ( )2,2 является равновесной. Определение 2.5. Стратегия i или j , входящая в ситуацию равновесия,
называется оптимальной стратегией 1-го или, соответственно, 2-го игрока. Определение 2.6. Значение функции выигрыша в ситуации равновесия vji =,α
называется значением игры.
2.2. ПРИНЦИП МАКСМИНА И МИНИМАКСА Установим связь между принципом равновесия и принципами минимакса и
максимина в антагонистической игре. Пусть дана МИ с матрицей
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
mnm
n
Aαα
αα
…………
…
1
111
,
которая полностью определяет выигрыши игроков. 1-ый выбирает играет строку i , 2-ой – выбирает столбец j . Выигрыш 1-го игрока стоит на пересечении i -ой строки и j -го столбца. Эта же величина есть проигрыш или выигрыш с обратным знаком 2-го игрока.
Итак, 1-ый игрок произвольно выбрал стратегию i . В каком выигрыше он может быть уверен? В минимальном, естественно, т.е. минимальное значение выигрыша ijj
αmin
при выбранной стратегии i ему обеспечено. Естественно выбрать такую стратегию i , при которой этот минимум максимален, т. е. естественно выбрать 0i , при которой достигается
vjijijji==⎥⎦
⎤⎢⎣⎡
0minminmax αα ,
где v – нижнее значение игры (нижняя цена игры). Определение 2.7. Стратегия 0i называется максминной стратегией 1-го игрока. Пусть теперь 2-ой игрок выбрал j -ый столбец и уверен, что он проиграет не
больше, чем ijiαmax . Естественно выбрать такую стратегию j , при которой этот
максимальный проигрыш минимален, т. е. выбрать такой столбец 0j , который минимизирует его проигрыш:
[ ]0
maxmaxmin ijiijijv αα == ,
где v – верхнее значение игры (верхняя цена игры).
10
Определение 2.8. Стратегия 0j называется минимаксной стратегией 2-го игрока. Таким образом, минимакс и максимин для игры AG могут быть найдены по
следующей схеме:
v
v
ijji
mjj
jj
jj
mnmm
n
n
ijij
iniiiii
=
⎪⎪
⎭
⎪⎪
⎬
⎫
⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
=
α
α
α
α
ααα
αααααα
α
ααα
minmax
min
minmin
maxmin
maxmaxmax
2
1
21
22221
11211
21
……
………………
…
Пример 2.3. Так, в игре с матрицей из примера 2.2 нижнее значение (максимин) v и максиминная стратегия 0i первого игрока 3=v , 20 =i , а верхнее значение (минимакс)
v и минимаксная стратегия 0j второго игрока – 3=v , 20 =j . А в игре с матрицей ( )
( ) ⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−
−/−/−
///
06421107
5510
011
5647
максминная стратегия 1-го игрока – 30 =i , нижнее значение игры – 0=v ;
минимаксная стратегия 2-го игрока – 20 =j , верхнее значение игры 4=v .
Лемма 2.1. В антагонистической игре AG vv ≥ . Теорема 2.1. Для того, чтобы в ( )nm× -МИ AG существовала ситуация равновесия
необходимо и достаточно, чтобы vv = , при этом максминная и минимаксная стратегия ( )00 , ji образует ситуацию равновесия.
Определение 2.9. Игры, в которых существуют ситуации равновесия, называются вполне определенными.
Поэтому данная теорема устанавливает критерий вполне определенной игры и может быть переформулирована следующим образом.
Теорема 2.2. Для того чтобы игра была вполне определена, необходимо и достаточно, чтобы существовали минимакс и максимин и выполнялось равенство vv = .
Замечание 2.1. Заметим, что в ( )nm× -МИ AG экстремумы, т. е. минимакс и максимин достигаются всегда, а, вот, ситуация, в которой максимальный элемент по столбцу и минимальный элемент по строке равны, очень редка. См. пример 2.3, где есть максминная и минимаксная стратегии, а ситуации равновесия нет и, соответственно, значения игры тоже нет.
Пример 2.4. Например, в игре с матрицей ( )
( ) ( )⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
−− 720432141
221
742
ситуация ( )1,2 является равновесной. При этом .2maxminminmax == ijijijjiαα
С другой стороны, игра с матрицей 1001
не имеет ситуации равновесия в чистых
11
стратегиях (седловых точек), т. к. .0minmax1maxmin =>= ijjiijijαα
Множество ситуации равновесия в антагонистической игре AG обладает свойствами, которые позволяют говорить об оптимальности ситуации равновесия и входящих в нее стратегий. Обозначим множество всех ситуаций равновесия через ( ) .21 XXGZ A ×⊂
Теорема 2.3. Пусть ( )11, ji , ( )22 , ji — две произвольные ситуации равновесия в антагонистической игре AG . Тогда
1) ;;12212211 ,,,, jijijiji αααα ==
2) ( ) ( ) ( ) ( ).,;, 1221 AA GZjiGZji ∈∈ Из теоремы следует, что любая пара оптимальных стратегий образует ситуацию
равновесия, а функция выигрыша в ней принимает одно и то же значение равное значению игры.
Пример 2.5. В игре с матрицей
( ) ( )
( )( )
( ) ( )( ) ( )⎥
⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
343638351401
330
3836
2
1
21
ii
jj
ситуации ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )4,2,;4,3,;2,3,;2,2, 21221211 ==== jijijiji являются равновесными. При этом ( ) ( ) ( ) ( ) 3,,,, 21221211 ===== jiKjiKjiKjiKv .
Из второй части теоремы следует: Утверждение 2.1. Пусть *
1X и *2X проекции множества ( )AGZ на 1X и 2X ,
соответственно, т. е. ( ) ( ){ }( ) ( ){ }.,,,
,,,,
12*2
21*1
A
A
GZjiXiXjjX
GZjiXjXiiX
∈∈∃∈=
∈∈∃∈=
Тогда множество ( )AGZ можно представить в виде ( ) .*
2*1 XXGZ A ×=
Определение 2.10. Множества *1X и *
2X в игре ( )AGZ называются множествами оптимальных стратегий, а их элементы – оптимальными стратегиями 1-го и 2-го игрока, соответственно.
САМОСТОЯТЕЛЬНАЯ РАБОТА № 2. НАЙТИ ВСЕ МАКСМИННЫЕ И МИНИМАКСНЫЕ СТРАТЕГИИ ИГРОКОВ, НИЖНЕЕ И ВЕРХНЕЕ ЗНАЧЕНИЯ ИГРЫ; УКАЗАТЬ ВСЕ СИТУАЦИИ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ, ЕСЛИ ОНИ ЕСТЬ.
ЗАНЯТИЕ №3
3.1. СМЕШАННЫЕ СТРАТЕГИИ МАТРИЧНЫХ ИГР В МИ с полной информацией игроки не делают тайны из своих равновесных
стратегий, которые гарантируют всем игрокам одновременно оптимальный максиминный «выигрыш» независимо от поведения противника. Однако в отсутствие седловой точки игроки не довольствуются своим максиминным «выигрышем»: кто из нас ограничится малым, если есть надежда на большее?
Рассмотрим МИ
.1,0,1001
2121
==⎥⎦
⎤⎢⎣
⎡VV
12
Будем рассуждать так. Если играть 5 млн. раз, то возможный выигрыш 1-го игрока при выборе 1-й стратегии будет 1/2. Аналогично может действовать второй игрок, выбирая какой-либо столбец. 1-й игрок гарантирует, что он выиграет 1/2, а 2-й гарантирует, что он проиграет не более 1/2, т.е. игроки выбирают своими стратегиями ( )21,21 .
Таким образом, каждый игрок, манипулируя непредсказуемо для противника (например, по правилам известным только ему или случайно) чистыми стратегиями, убеждается, что при многократном повторении игры может улучшить свой максиминный «выигрыш».
Рассмотрим МИ nmA × , где { }mii ,1= – стратегии первого игрока; { }njj ,1= – стратегии второго игрока. Ситуация игры – пара стратегий ( )ji, .
Определение 3.1. Стратегию, полученную в многократно повторяемой игре при случайном механизме реализации чистых стратегий игрока, называют рандомизированной (смешанной) стратегией игрока.
Определение 3.2. Под смешанной стратегией 1-го игрока будем понимать m-мерный смешанный вектор ( ) m
mi Rx ∈= ξξξ ,...,,...,1 ,
mii
m
ii ,1,0,1
1=≥=∑
=
ξξ ,
где m - число строк матрицы выигрышей nmA × . Таких векторов x бесконечно много. Множество всех стратегий первого игрока
x обозначим I∑ (сигма I ). Определение 3.3. Аналогично смешанная стратегия 2-го игрока определяется как n
-мерный вектор ( )njy ηηη ,...,,...,1= , т. е.
njj
n
jj ,1,0,1
1=≥=∑
=
ηη ,
где n - число столбцов матрицы выигрышей nmA × . При этом 0≥iξ и 0≥jη — вероятности выбора чистых стратегий 1Xi∈ и 2Xj∈ ,
соответственно, при использовании игроками смешанных стратегий х и у. Множество всех стратегий второго игрока y обозначим II∑ (сигма II ).
Определение 3.4. Напомним, что вещественная функция, значения которой имеют определенную вероятность, называется случайной величиной.
Определение 3.5. Случайная величина, значениями которой являются стратегии игрока, называется его смешанной стратегией.
Учитывая введенное определение смешанных стратегий, прежние стратегии будем называть «чистыми». Так как случайная величина характеризуется своим распределением, то будем отождествлять в дальнейшем смешанную стратегию с вероятностным распределением на множестве чистых стратегий. Таким образом, вектор x может быть интерпретирован следующим образом. Это набор вероятностей, с которыми 1-й игрок выбирает соответствующие строки матрицы. 1ξ – вероятность выбора 1-й стратегии, iξ – вероятность выбора i -й стратегии, mξ – m -й стратегии, сумма этих вероятностей равна 1.
Аналогично, y – это набор вероятностей, в соответствии с которыми 2-й игрок выбирает столбцы матрицы: 1-й – выбор 1-го столбца, j – j -го столбца, n – n -го столбца, сумма их равна 1.
Определение 3.6. Чистая стратегия является частным случаем смешанной стратегии, она заключается в выборе i -й строки и имеет вид: ( )
m
iix 0,...,1,...,0= , т. е. i -я
13
строка выбирается с вероятностью 1. Соответственно, чистая стратегия для 2-го игрока ( )
n
jjy 0,...,0,1,0,...,0= . Таким образом, чистые стратегии – выбор номеров строк или
столбцов. У 1-го игрока – m чистых стратегий, у 2-го – n чистых стратегий. Определение 3.7. Если игроки выбрали свои смешанные стратегии, то пара ( )yx,
смешанных стратегий игроков в матричной игре AG называется ситуацией в смешанных стратегиях.
В ситуации ( )yx, в смешанных стратегиях пара чистых стратегий ( )ji, реализуется с вероятностью jiηξ . Если такая пара появляется, то выигрыш 1-го игрока есть ijα , отсюда следует, что вероятность выигрыша ijα является jiηξ , следовательно, выигрыш
ijα является случайной величиной. Поэтому выигрыш игрока 1 в ситуации ( )yx, в смешанных стратегиях для ( )nm× -МИ AG можно определить как математическое ожидание его выигрыша, т. е. сумма этих всевозможных вероятностей jiij ηξα :
( ) ∑∑= =
===m
i
n
jjiij AyxyxAyxE
1 1,,, ηξα ,
где , – скалярное произведение. При этом функция ( )yxE , является непрерывной по Ix ∑∈ и IIy ∑∈ . Если играть 10 млн. раз при выборе 1-м игроком i -й стратегии, а 2-м – j -ой, то
средний выигрыш за эти 10 млн. раз повторений игры будет для 1-го игрока ( ) 10, ⋅yxE млн., выигрыш 2-го игрока есть - ( ) 10, ⋅yxE млн.
Определим смешанное расширение МИ. Определение 3.8. Антагонистическая игра AG называется смешанным
расширением игры AG , если задается следующим образом: ( ){ }yxEIII ,;; ∑∑=Γ .
Игроки 1 и 2 выбирают стратегии III yx ∑∈∑∈ , , для 1-го игрока реализуется выигрыш ( )yxE , , для 2-го игрока – ( )yxE ,− . Игра AG является подыгрой для AG , т. е.
.AA GG ⊂
3.2. СИТУАЦИЯ РАВНОВЕСИЯ В СМЕШАННЫХ СТРАТЕГИЯХ Определение 3.9. Ситуация ( )yx, в игре AG образует ситуацию равновесия, а
число ( )yxEv ,= является значением игры AG если ( ) ( ) ( ) .,,,, III yxyxEyxEyxE ∑∈∑∈∀≤≤ (3.1)
В ситуации за 10 млн. раз игры, если отклонение от ситуации ( )yx, будет происходить достаточно часто, то выигрыш для 1-го игрока может уменьшиться, а для 2-го – потери увеличиться.
Теорема 3.1. В любой МИ существует ситуация равновесия в смешанных стратегиях.
Эквивалентная формулировка. В любом смешанном расширении МИ существует ситуация равновесия.
Определение 3.10. Соответственно, смешанные стратегии, образующие ситуацию равновесия называются оптимальными смешанными стратегиями.
Заметим, что выигрыши ( )yiE , , ( )jxE , при применении первым или вторым игроком чистой стратегии i или j, соответственно, а другим — смешанной стратегии (у или х) имеют вид
14
( ) ( ) miyyiEyxEn
jijiji ,1;,,
1
==== ∑=
αηα ;
( ) ( ) njxjxEyxE jm
iiiji ,1,,,
1==== ∑
=
αξα ;
где ji αα , — i-я строка и j-й столбец соответственно ( )nm× -матрицы А.
Пусть ( ) ∑∑= =
=m
i
n
jjiijyxE
1 1
, ηξα . Тогда, если вместо x использовать чистую стратегию,
то
( ) ( )yiEyxEm
ii
m
i
n
jjiji ,,
11 1∑∑ ∑== =
=⎟⎟⎠
⎞⎜⎜⎝
⎛= ξηαξ .
Аналогично, если, вместо y использовать чистую стратегию, то
( ) ( )∑∑ ∑== =
=⎟⎟⎠
⎞⎜⎜⎝
⎛=
n
jj
n
i
m
jiijj jxEyxE
11 1,, ηξαη .
Следовательно,
( ) ( ) ( ) .,,,1 111∑∑∑∑= ===
===m
i
n
jjiij
n
jj
m
ii jxEyiEyxE ηξαηξ
Пусть ( ) IIIyx ∑×∑∈, – ситуация в смешанных стратегиях в игре AG . Оказывается, что для проверки ситуации ( )yx, на равновесность, неравенства (3.1) достаточно проверять не для всех Ix ∑∈ и IIy ∑∈ , а лишь для 1Xi∈ и 2Xj∈ , поскольку справедливо следующее утверждение.
Теорема 3.2. Необходимое и достаточное условие существования равновесия. Для того чтобы ситуация ( )yx, и число ( )yxEv ,= были, соответственно,
ситуацией равновесия в смешанных стратегиях и значением игры необходимо и достаточно, чтобы имели место следующие неравенства:
( ) ( ) 21 ,,, XjXijxEvyiE ∈∈∀≤≤ . (3.2) Лемма 3.1. Если в игре существует ситуация равновесия в чистых стратегиях, то
она является ситуацией равновесия в смешанных стратегиях, и значение игры в чистых стратегиях равно значению игры в смешанных стратегиях.
Эквивалентная формулировка. Пусть ( )yx, — ситуация равновесия в игре AG . Тогда ситуация ( )yx, равновесна и в игре AG .
Пример 3.1. «Орел или решка».
( ) ( )( ) ( )
po
po
⎟⎟⎠
⎞⎜⎜⎝
⎛−−
−−1,11,11,11,1
Легко видеть, что в этой игре нет ситуации равновесия в чистых стратегиях, так как в любой ситуации одному из игроков выгодно отклониться от выбранной стратегии при условии, что другой игрок в этой ситуации придерживается своей стратегии. Однако, как мы увидим, пара смешанных стратегий ( )yx, , где ( ) ( )21,21,21,21 == yx , в которых каждый из игроков играет свои чистые стратегии с равными вероятностями, образует ситуацию равновесия в смешанных стратегиях.
3.3. СВОЙСТВА ОПТИМАЛЬНЫХ СМЕШАННЫХ СТРАТЕГИЙ Рассмотрим свойства оптимальных стратегий, которые в ряде случаев помогают
находить значение игры и ситуацию равновесия. Теорема 3.3. Пусть ( )mx ξξ ,...,1= – оптимальная смешанная стратегия 1-го игрока,
15
v - значение игры и y – оптимальная смешанная стратегия 2-го игрока. Тогда, если ( ) vyiE <, , (3.3)
то вероятность выбора i -ой стратегии первым игроком в ситуации равновесия обязательно должна быть
0=iξ . (3.4) Согласно теореме 3.2 условие равновесия ( ) ( ) ( ) jijxEyxEyiE ,,,, ∀≤≤ . Пусть x
и y оптимальны. Тогда ( ) vyxE =, . Если для какого-либо i неравенство слева выполняется строго, то 1-ый игрок, отклонившись на чистую стратегию i , свой выигрыш уменьшит, следовательно, вероятность выбора первым игроком в ситуации равновесия чистой стратегии i должна быть равной нулю.
Теорема 3.4. Пусть ( )ny ηη ,...,1= – оптимальная стратегия 2-го игрока, v - значение игры, x – оптимальная стратегия 1-го игрока. Тогда, если
( ) vjxE >, , (3.5) то вероятность выбора j -ой стратегии обязательно должна быть
0=jη . (3.6) Теоремы 3.3 и 3.4 обосновывают процедуру выбора стратегии, которая
обеспечивает успешный поиск. Теорема 3.5. Пусть x и y – оптимальные стратегии 1-го и 2-го игроков, v –
значение игры. Тогда ( ) vjxE
nj=
=,min
,1 (3.7)
и ( ) vyiE
mi=
=,max
,1. (3.8)
Теорема 3.6. Пусть AG – ( )nm× -МИ. Для того чтобы ситуация в смешаных стратегиях ( )yx, была равновесной в игре AG , необходимо и достаточно выполнение равенства
( ) ( )jxEyiEnjmi
,min,max11 ≤≤≤≤
= . (3.9)
Теорема 3.7. Для МИ AG справедливы следующие соотношения: ( ) ( ),,maxmin,minmax yiEvjxE
iyjx== (3.10)
причем экстремумы по смешанным стратегиям x и y в (3.10) достигаются на оптимальных стратегиях игроков.
Пример 3.2. Возьмем матрицу ;622241423
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡−
− 2=v – по строкам, 3=v – по
столбцу. Следовательно, в чистых стратегиях ситуации равновесия не существует. Будем искать ситуацию равновесия в смешанных стратегиях.
( ) ( )
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
=≥
=≥
∀≤≤
∑
∑
=
=
.1,0
,1,0
.,;,,
1
1
m
iii
n
jjj
jijxEvyiE
ξξ
ηη Всего 14 неравенств.
Решение может не получиться, так как могут быть отрицательные числа. Нужно пользоваться многими комбинациями. Если всюду ставить равенства, то задача не
16
решается. Можно поставить строгие неравенства. Не везде. Распишем эти неравенства.
.624622;24224
;23423
321321
321321
321321
ξξξηηηξξξηηη
ξξξηηη
++≤≤++++−≤≤++−
+−≤≤+−
vv
v
.624;622;242;24
;23;423
321321
321321
321321
vvvv
vv
>++=++=++−=++−
=+−<+−
ξξξηηηξξξηηη
ξξξηηη
Составим квадратную матрицу, учитывая равенства. Следовательно, должно быть, если ( ) vyiE <, , то 0=iξ , если ( ) vjxE >, , то 0=jη . Примем, 0;0 31 == ηξ . Тогда
)6(.62)3(22)5(;24)2(4)4(;2)1(23
3221
3221
3221
vvvvvv
>+=+=+=+−=+−<−
ξξηηξξηηξξηη
Вычтем (4) из (5). 02 =⇒ ξ , 13 =⇒ ξ 2=⇒ V 521 =⇒ η 532 12 =−=⇒ ηη v . Следовательно, оптимальная стратегия ( )1,0,0=x и ( )0,53,52=y .
3.2. РАВНОВЕСИЕ ПО НЭШУ В СМЕШАННЫХ СТРАТЕГИЯХ В БИМАТРИЧНОЙ ИГРЕ
Обобщим понятие ситуации равновесия на игру из N игроков. Введем обозначения, используемые в игре в смешанных стратегиях.
{ }nN ,1= – множество игроков; ∏
=
∑=∑ni
i,1
– множество ситуаций в смешанных стратегиях;
{ }ii σ=∑ – множество смешанных стратегий iσ i -го игрока, Ni∈ ; ik – число чистых стратегий i -го игрока;
{ }jii σσ = – j -ая смешанная стратегия i -го игрока, iii kjNi ,1,, =∑∈∈ σ ; j
iσ – вероятность выбора i -м игроком j -ой чистой стратегии, т. е. элемент вектора
iσ , iii kjNi ,1,, =∑∈∈ σ ; ( ) ( )nii EE σσσ ,,1 …= – функция выигрыша i-го игрока; Набор стратегий ( ) Niiin ∈∀∑∈= ,,,,1 σσσσ … , называется ситуацией игры. Определение 3.11. Если iX – конечное множество чистых стратегий игрока i, то
смешанная стратегия [ ]1,0: →ii Xσ ставит в соответствие каждой чистой стратегии
ij
i Xx ∈ вероятность 0≥jiσ того, что она будет играться, причем 1
,1
=∑= ikj
jiσ .
Определение 3.12. Выигрыш игрока i, соответствующий ситуации σ , есть
( ) ( )∑ ∏∈ =
⎟⎟⎠
⎞⎜⎜⎝
⎛=
Xxi
n
k
jki xEE
1
σσ . (3.11)
В случае биматричной игры формула (3.11) имеет вид ( ) ( )∑∑∑ ==
nxi
xxi ixExE 2,1,. 2121
1
σσσσ … .
Пример 3.4. Рассмотрим игру ( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )⎟
⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
8,26,90,36,34,81,22,61,53,4
IIIIII
IIIIII
.
17
Пусть ( )31,3
1,31
1 =σ (это означает, что смешанная стратегия игрока 1
предписывает ему играть стратегии I, II и III с вероятностями 31 каждую),
( )21,2
1,02 =σ (эта смешанная стратегия игрока 2 предписывает играть стратегии II и III
с равными вероятностями и не играть стратегию I вовсе). В данном случае мы получаем в ситуации ( )21 , σσσ = :
( ) ( )
( ) ( ) .6
27
,2
112219
2130
313
218
2120
316
215
2140
31
2212
1211
==
=⎟⎠⎞
⎜⎝⎛ ⋅+⋅+⋅+⎟
⎠⎞
⎜⎝⎛ ⋅+⋅+⋅+⎟
⎠⎞
⎜⎝⎛ ⋅+⋅+⋅==
∑
∑
x
x
xEE
xEE
σσσ
σσσ
Определение 3.13. Смешанным расширением игры ( ){ }xKXNG ,,= называется
игра ( ){ }σENG ,,Σ= . Введем следующие обозначения для чистых и смешанных стратегий:
( ) ( ) ( )kkkkkkkkkk jn
ji
ji
ji
ji
jn
ji
ji
ji
j xxxxxxxxxxxxx ,,,,,,||;,,,,,, 111111 ………… +−+− == ;
( )niii σσσσσσ ,,,,,, 111 …… +−= ; ( ) ( )niiii σσσσσσσ ,,,,,,|| 111 …… +−= ; nikk i ,1,,1 == ; ( ) ( ) ( ) ( )kkkkk j
nj
ij
ij
ij
inij
iij
i xxxxxxx ,,,,,,||;,,,,,,|| 111111 ………… +−+− == σσσσσσσ . Определение 3.14. Ситуация (набор смешанных стратегий) ( )nσσσ ,...,1= является
равновесием по Нэшу в игре { } { }{ }ii E,ΣN,G = , если для любого Ni∈ ( ) ( ) .|| iiiii EE Σ∈∀≥ σσσσ
Теорема 3.8. Пусть ii XX ⊂+ – множество чистых стратегий, которые игрок i играет с положительной вероятностью в ситуации ( )nσσσ ,...,1= . Ситуация σ является
NE в смешанном расширении G игры G тогда и только тогда, когда для всех Ni∈ ( ) ( )
( ) ( ) .,||||
,||||++
+
∉∈∀≥
∈∀=
ij
iij
ij
iij
ii
ij
ij
ij
iij
ii
XxXxxExE
XxxxExE
σσ
σσ (3.12)
Таким образом, необходимые и достаточные условия того, что ситуация σ – NE, состоят в том, что: 1) каждый игрок при данном распределении стратегий, которые играют его противники, безразличен между чистыми стратегиями, которые он играет с положительной вероятностью; 2) эти чистые стратегии не хуже тех, которые он играет с нулевой вероятностью.
Это свойство можно использовать для нахождения NE в смешанных стратегиях. Пример 3.5. Рассмотрим следующую игру:
( ) ( )( ) ( )
BA
BA
⎟⎟⎠
⎞⎜⎜⎝
⎛100,10000,00,01000,100
.
Очевидно, что ситуации (А, А) и (В, В) являются NE (в чистых стратегиях). Найдем равновесия по Нэшу в смешанных стратегиях. Предположим, что в таком равновесии игрок 1 играет смешанную стратегию ( )pp −1, , а второй – ( )qq −1, , причем ( )1,0, ∈qp .
Тогда, получаем, что ожидаемый выигрыш игрока 2 от игры при использовании стратегии А есть ( )pp −+ 101000 , а от игры при использовании стратегии В есть
( ) pp 01100 +−⋅ , а значит, ( ) ( ) .01100011000 pppp ⋅+−⋅=⋅−+
Отсюда 1001100 =p и, следовательно, 111=p . Аналогично 111=q .
18
Пример 3.6. «Семейный спор». Как в предыдущем примере, Она, выбирая «Ф», получает ( )pp −+⋅ 101 , а выбирая «Т», получает ( )pp −+⋅ 120 . Следовательно, ( ) pp =−12 . Отсюда 23 =p , а, следовательно, 32=p . Аналогично получаем
( ) ( )110012 qqqq −+⋅=⋅−+ , а значит, 13 =q и 31=q . Таким образом, в смешанном равновесии Он играет «Ф» с вероятностью 32 , а Она играет «Ф» с вероятностью 31 .
Пример 3.7. «Голосование». Рассмотрим следующую ситуацию – три игрока 1, 2, 3 и три альтернативы – A, B, C.
Игроки голосуют одновременно за одну из альтернатив, воздержаться невозможно. Таким образом, пространство стратегий { }CBAX i ,,= . Альтернатива, получившая большинство, побеждает. Если ни одна из альтернатив не получает большинства, то выбирается альтернатива A. Функции выигрышей таковы: ( ) ( ) ( ) 2321 === CEBEAE ,
( ) ( ) ( ) 1321 === AECEBE , ( ) ( ) ( ) 0321 === BEAECE . В этой игре три равновесных исхода (в чистых стратегиях): A, B и C. Посмотрим на
равновесия (их больше 3): если игроки 1 и 3 голосуют за A, то игрок 2 не изменит исход, как бы он ни голосовал, и игроку 3 безразлично, как он голосует. Таким образом, ( )AAA ,, и ( )ABA ,, – NE, но ( )BAA ,, – не NE, т. к. второму лучше голосовать за B.
ЗАНЯТИЕ №4. НАХОЖДЕНИЕ ЗНАЧЕНИЯ ИГРЫ ПРИ ПОМОЩИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ (ЛП)
Напомним, что существует 3 формы задачи ЛП (ЗЛП)
∑=
→m
iii xc
1max : (4.1)
• Общая задача (ограничения трех типов);
pjbxa j
n
iiij ,1,
1=≤∑
=
spjbxa j
n
iiij ,1,
1
+=≥∑=
(4.2)
msjbxa j
n
iiij ,1,
1+==∑
=
nixi ,1,0 =≥
• Основная задача (все ограничения – уравнения);
mjbxa j
n
iiij ,1,
1==∑
=
(4.3)
nixi ,1,0 =≥ • Каноническая задача:
mjbxa j
n
iiij ,1,
1
=≤∑=
(4.4)
nixi ,1,0 =≥ . Задача нахождения cx
xmin при ограничениях
0, ≥≤ xbxA , (4.5) где А – ( )nm× -матрица, nm RbRxc ∈∈ ,, называется прямой стандартной ЗЛП, а задача, заключающаяся в определении by
ymax при ограничениях
0, ≥≥ ycAy , (4.6)
19
где nRy∈ называется двойственной ЗЛП. Прямая задача (ПЗ) Двойственная задача (ДЗ)
∑=
→m
iii xc
1max ∑
=
→n
jjj yb
1min
sjbxa j
m
iiij ,1,
1
=≤∑=
kicya i
n
jjij ,1,
1=≥∑
=
nsjbxa j
m
iiij ,1,
1
+==∑=
mkicya i
n
jjij ,1,
1+==∑
=
kixi ,1,0 =≥ sjy j ,1,0 =≥ .
Вектор mRx∈ , удовлетворяющий системе (4.5), называется допустимым решением задачи (4.5). Аналогично вводится понятие допустимого решения nRy∈ задачи (4.6). Допустимое решение ( )yx называется оптимальным решением задачи (4.5) [(4.6)], если на нем достигается минимум (максимум) функции ( )bycx на множестве всех допустимых решений. Справедливо следующее утверждение. Теорема 4.1 (двойственности). Если обе задачи (4.5), (4.6) имеют допустимые решения, то они обе имеют оптимальные решения x и y , соответственно, при этом
ybxc = . Напомним, что множество всех ситуаций равновесия в МИ мы обозначили как ( ).AGZ
Лемма 4.1 (о масштабе). Пусть AG и AG ′ две антагонистические игры, причем ,,0, constBAA =>+=′ ααα (4.7)
а { }jiconstB ij ,∀=== ββ . Тогда ( ) ( ) ., βα +==
′′ AA GGAA vvGZGZ (4.8) Иными словами, оптимальность поведения игроков не изменится, если в игре
множества стратегий остаются прежними, а функция выигрыша умножается на положительную константу или (и) к ней прибавляется постоянное число.
Содержательно данная лемма говорит о стратегической эквивалентности двух игр, отличающихся лишь началом отсчета выигрышей, а также масштабом их измерения.
Замечание 4.1. Если две МИ AG и AG ′ находятся в условиях этой леммы, то смешанные расширения также стратегически эквивалентны.
Лемма 4.2. Пусть AG и AG ′ — две матричные ( )nm× -игры, причем ,,0, constBAA =>+=′ ααα
а { }jiconstB ij ,∀=== ββ . Тогда ( ) ( )AA GZGZ =′ , βα +=′ AA vv , где AG ′ и AG —
смешанные расширения игр AG ′ и AG соответственно, a AA vv ,′ — значения игр AG ′ и AG . Пример 4.1. Проверим, что стратегии ( ) ( )41,41,21,41,41,21 == xy
оптимальны, а 0=Av – значение игры AG с матрицей
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−−−
−−=
131311111
A .
Упростим матрицу А (с целью получения максимального числа нулей). Прибавляя ко всем элементам матрицы А единицу, получим матрицу
20
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=′
040400002
A .
Каждый элемент матрицы А' разделим на 2. Новая матрица принимает вид
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=′′
020200001
A .
По лемме 4.2 значение игр связано равенством ( )121
21 +== ′′′′ AAA vvv .
Таким образом, требуется проверить, что значение игры AG ′′ равно 21 . Действительно, ( ) 21,, =′′= yAxyxE . С другой стороны, для каждой стратегии IIy ∑∈ ,
( )321 ,, ηηη=y имеем ( ) 2112
12
12
12
1, 321 =⋅=++= ηηηyxE , а для всех ( )321 ,, ξξξ=x ,
Xx∈ , ( ) 21
21
21
21, 321 =++= ξξξyxE . Следовательно, указанные стратегии ( )yx,
являются оптимальными, а 0=Av . Докажем теорему 3.1. Теорема 3.1. Всякая МИ имеет ситуацию равновесия в смешанных стратегиях. Доказательство. ЗЛП в определенном смысле эквивалентна МИ AG . Рассмотрим ПЗ и ДЗ ЛП
;0,
min
≥≥
xwxAxu
T и ,0
,max
≥≤
yuAy
ywT (4.9), (4.10)
где ( ) ( ) nTmT RwRu ∈=∈= 1...,,1,1...,,1 , а матрица { }njmiA ij ,1,,10 ==∀>= α , т. е. строго положительная, откуда следует, что существует такой вектор 0>x , для которого
TwxA ≥ , т. е. задача (4.9) имеет допустимое решение. С другой стороны вектор 0=y является допустимым решением задачи (4.10), поэтому по теореме 4.1 двойственности ЛП обе задачи (4.9) и (4.10) имеют оптимальные решения ** , yx ответственно, при этом
.0** >== θwyux (4.11) Пусть теперь AG – произвольная ( )nm× -МИ. Покажем, что в этом случае теорема
справедлива. Рассмотрим векторы θ*xx = и θ*yy = и покажем, что они являются
оптимальными стратегиями игроков 1 и 2 соответственно в игре AG , при этом значение игры равно θ1 .
Действительно, из (4.11) имеем ( ) ( ) ,1** ==== wywyuxux θθ
а из допустимости *x и *y для задач (4.9), (4.10) следует, что 0* ≥= θxx и 0* ≥= θyy , т. е. x и y – смешанные стратегии игроков 1 и 2 в игре AG .
Вычислим выигрыш игрока 1 в ситуации ( )yx, . ( ) .,,, 2** θyAxyAxyxE == (4.12)
С другой стороны, из допустимости векторов *x и *y для задач (4.9), (4.10) и равенства (4.11) имеем
.,, ****** θθ =≤=≤= uxAyxyAxwy
21
Таким образом, θ=** , yAx , из (4.12) получаем, что
( ) .1, θ=yxE (4.13) Пусть ∑∈yx, – произвольные смешанные стратегии игроков 1 и 2. Тогда
выполняются неравенства ( ) ( ) ;1,,, * θθθ =≥== wyyAxyAxyxE (4.14)
( ) ( ) .1,,, * θθθ =≤== xuAyxyAxyxE (4.15)
Сравнивая (4.14)–(4.15), получаем, что ( )yx, — ситуация равновесия, а θ1 — значение игры AG со строго положительной матрицей А.
Теперь рассмотрим ( )nm× -МИ AG ′ с произвольной матрицей { }ijA α ′=′ . Тогда существует такая константа 0>β , что матрица BAA +′= — строго положительна, где
{ } ( )nmB ij ×−= β -матрица, njmiij ,1,,1, === ββ . В игре AG существует ситуация
равновесия ( )yx, в смешанных стратегиях, а значение игры равно θ1=Av , где θ определяется как в (4.11).
Из леммы 4.2 следует, что ( ) ( )AGZyx ′∈, – ситуация равновесия в игре AG ′ в смешанных стратегиях, а значение игры равно βθβ −=−=′ 1AA vv . Теорема доказана.
Следует отметить, что не всегда в антагонистических играх существует решение в смешанных стратегиях.
Доказательство теоремы сводит решение МИ к ЗЛП. Алгоритм решения игры AG ′ следующий.
1. По матрице А' строится строго положительная матрица BAA +′= , где { }ijB β= , 0>= ββ ij .
2. Решаются ЗЛП (4.9), (4.10). Находятся векторы ** , yx и число θ [см. (4.11)]. 3. Строятся оптимальные стратегии игроков 1 и 2 соответственно
., ** θθ yyxx == 4. Вычисляется значение игры AG ′ βθ −=′ 1Av .
Пример 4.2. Рассмотрим МИ AG , определенную матрицей ⎟⎟⎠
⎞⎜⎜⎝
⎛⎥⎦
⎤⎢⎣
⎡=
3204
A .
Соответствующие ей ЗЛП имеют следующий вид:
,0,0,13
,124,min
21
2
21
21
≥≥≥
≥++
ξξξ
ξξξξ
.0,0,132
,14,max
21
21
1
21
≥≥≤+
≤+
ηηηη
ηηη
Введем 43,ξξ – базисные переменные, 21,ξξ – свободные переменные. Заметим, что эти задачи в эквивалентной форме могут быть записаны для ограничений типа равенств:
,0,0,0,0,13
,124,min
4321
42
321
21
≥≥≥≥=−
=−++
ξξξξξξ
ξξξξξ
.0,0,0,0,132
,14,max
4321
421
31
21
≥≥≥≥=++
=++
ηηηηηηη
ηηηη
Таким образом, методы решения ЗЛП могут быть приспособлены для решения МИ.
22
⎩⎨⎧
=+−=+−+
⎪⎩
⎪⎨⎧
≥=−
=−+
→++−−==+−++−−=+=→+=
;13;124
.0,,,;13
;124min542
31241min;
242
1321
4321
42
321
4321
423212121
RR
RRF
ξξξξξ
ξξξξξξ
ξξξξξξξ
ξξξξξϕξξ
1ξ 2ξ 3ξ 4ξ 1R 2R
1R 4 2 -1 0 1 0 1
2R 0 3* 0 -1 0 1 1 ϕ 4 5 -1 -1 0 0 2
1R 4* 0 -1 2/3 1 -2/3 1/3
2ξ 0 1 0 -1/3 0 1/3 1/3 ϕ 4 0 -1 2/3 0 -5/3 2-5/3
1ξ 1 0 -1/4 1/6 1/4 -1/6 1/12
2ξ 0 1 0 -1/3 0 1/3 1/3 ϕ 0 0 0 0 -1 -1 0
1ξ 2ξ 3ξ 4ξ
1ξ 1 0 -1/4 1/6 1/12
2ξ 0 1 0 -1/3 1/3 F -1/4 -1/6 5/12
.125
61
41
;31
31
;121
61
41
;31
;121
43
42
431
2
1
=−−
=−
=+−
=
=
ξξ
ξξ
ξξξ
ξ
ξ
F
0,...,132
14max
41
421
31
21
≥=++
=++
ηηηηη
ηηηη
1η 2η 3η 4η
2η 4* 0 1 0 1
4η 2 3 0 1 1 F 1 1 0 0 0
1η 1 0 1/4 0 1/4
4η 0 3* -1/2 1 1/2 F 0 1 -1/4 0 -1/4
1η 1 0 1/4 0 1/4
2η 0 1 -1/6 1/3 1/6 F 0 0 -1/12 -1/3 -5/12
( )
( ).52,5
312561,
12541
125~
.54,5
112531,
125121
125~
125~~
=⎟⎟⎠
⎞⎜⎜⎝
⎛==
=⎟⎟⎠
⎞⎜⎜⎝
⎛==⇒
===⇒
yy
xx
uyux θ
Пусть X и Y – множества оптимальных решений задач (4.9) и (4.10), соответственно. Обозначим
.0,1,1>
⎭⎬⎫
⎩⎨⎧
∈=⎭⎬⎫
⎩⎨⎧
∈= θθθθθ
YyyYXxxX
Напомним, что множество оптимальных смешанных стратегий обозначается ( )AGZ , а проекции множества оптимальных стратегий ( )AGZ на IΣ и IIΣ – *
IΣ и *IIΣ ,
соответственно, т. е.
23
( ) ( ){ }( ) ( ){ }.,,,
,,,,***
2***
******
AIII
AIIII
GZyxxXyy
GZyxyxx
∈Σ∈∃∈=Σ
∈Σ∈∃Σ∈=Σ
Теорема 4.2. Пусть AG — ( )nm× -игра с положительной матрицей А и даны две двойственные задачи ЛП (4.9) и (4.10). Тогда имеет место:
1. Обе ЗЛП имеют решение ( OX /≠ и OY /≠ ), при этом .maxmin ywxuyx
==θ
2. Значение Av игры AG равно θ1=Av , а стратегии θθyyxx == ** , , являются
оптимальными, где Xx ∈ – оптимальное решение прямой задачи (4.9),а Yy∈ – двойственной задачи (4.10).
3. Любые оптимальные стратегии **Ix Σ∈ и **
IIy Σ∈ игроков могут быть построены
указанным способом, т. е. .1,1 ** YX III θθ=Σ=Σ
САМОСТОЯТЕЛЬНАЯ РАБОТА № 3. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ПРИ ПОМОЩИ ЛП. СДЕЛАТЬ
ПРОВЕРКУ.
ЗАНЯТИЕ №5. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ ( )−× n2 ЛИБО ( )−×2m МАТРИЧНЫХ ИГР
Распространенный способ решения МИ путем сведения ее к ЗЛП обладает тем недостатком, что процесс решения ЗЛП существенно усложняется для матриц большой размерности. В таких случаях обычно используют методы декомпозиции ЗЛП, когда вместо решения задачи с исходной матрицей строится координирующая задача с матрицей, у которой мало строк, но много столбцов, или наоборот.
Напомним некоторые сведения из теории выпуклых множеств и систем линейных неравенств.
Определение 5.1. Множество mRM ⊂ называется выпуклым, если вместе с любыми двумя точками этого множества Mxx ∈21 , в нем содержатся все точки отрезка
( ) [ ]1,0,1 21 ∈−+ λλλ xx . Понятие выпуклого множества можно сформулировать в более общем, но
эквивалентном виде. Определение 5.2. Множество mRM ⊂ называется выпуклым, если вместе с
точками kxx ,,1 … из M оно содержит и все точки вида
1,0,11
=≥= ∑∑==
k
iii
k
iii xx λλλ .
Пересечение выпуклых множеств всегда выпукло. Определение 5.3. Рассмотрим систему линейных неравенств bxA ≤ или
{ }nNjxa jj ,1, =∈≤ β , (5.1)
где [ ]NjaA j ∈= , – ( )nm× -матрица, ( ) nn
m RbRx ∈=∈ ββ ,,, 1 … . Обозначим
{ }bxAxX ≤=~ множество решений системы (5.1). Непосредственно из определения
следует, что X~ – выпуклое множество. Множество X~ называется выпуклым многогранным множеством, заданным системой ограничений (5.1).
Определение 5.4. Точка Mx∈ , где M – выпуклое множество, называется крайней точкой, если из условия ( ) ( )1,0,,,1 2121 ∈∈−+= λλλ Mxxxxx следует, что
xxx == 21 . Содержательно определение означает, что Mx∈ – крайняя точка, если не существует отрезка, содержащего две точки из M , для которого x является внутренней.
24
Заметим, что крайняя точка выпуклого множества всегда является граничной, обратное неверно.
Определение 5.5. Выпуклой оболочкой множества Р ( )Pconv будем называть пересечение всех выпуклых множеств, содержащих Р. Данное определение эквивалентно следующему. Выпуклая оболочка множества Р состоит из всех выпуклых линейных комбинаций всевозможных точек из Р, т. е.
( )⎭⎬⎫
⎩⎨⎧
∈≥=== ∑∑==
PxxxxPconv ii
n
ii
n
iii ,0,1,
11λλλ .
Определение 5.6. Выпуклая оболочка конечного числа точек называется выпуклым многогранником, порожденным своими крайними точками.
Определение 5.7. Напомним, что функция 1: RM →ϕ , где mRM ⊂ – выпуклое множество, называется выпуклой, если
( )( ) ( ) ( ) ( )2121 11 xxxx ϕλλϕλλϕ −+≤−+ (5.2) для любых Mxx ∈21 , и [ ]1,0∈λ . Если же в (5.2) выполняется обратное неравенство, то функция ϕ называется вогнутой.
Лемма 5.1. Пусть ( )xiϕ — выпуклые на М функции ni ,1= . Тогда верхняя огибающая ( )xψ этого семейства функций
( ) ( )xx iniϕψ
,1max=
= (5.3)
является выпуклой на М, а нижняя огибающая (в (5.3) берется минимум по i) является вогнутой.
Теорема 5.1. В МИ AG множества оптимальных смешанных стратегий *IΣ и *
IIΣ игроков являются выпуклыми многогранниками.
Вернемся к теореме 3.7. В качестве примера использования теоремы приведем геометрическое решение игр с двумя стратегиями у одного из игроков ( ( )−× n2 и ( )−×2m игры). Такой подход называется графоаналитическим методом решения ( )−× n2 , либо ( )−×2m МИ. В основе графоаналитических методов лежит свойство оптимальных стратегий *x и *y доставлять экстремумы в критических точках
( ) ( ).,maxmin,minmax yiEjxEviyjxA ==
Пример 5.1. ( ( )−× n2 игра). Рассмотрим игру, в которой игрок 1 имеет две стратегии, а игрок 2 – п стратегий. Матрица имеет вид
⎟⎟⎠
⎞⎜⎜⎝
⎛=
n
nA22221
11211
...
...αααααα
.
Пусть игрок 1 выбрал смешанную стратегию ( )ξξ −= 1,x , а игрок 2 чистую стратегию Nj∈ . Тогда выигрыш игрока 1 в ситуации ( )jx, равен
( ) ( ) .1, 21 jjjxE αξξα −+= (5.4) Геометрически он представляет собой прямую в координатах ( )E,ξ . Таким образом, каждой чистой стратегии j соответствует своя прямая. Графиком функции ( ) ( )jxEH
j,min=ξ является нижняя огибающая семейства прямых (5.4). Эта функция
вогнута как нижняя огибающая семейства вогнутых (в данном случае линейных) функций (лемма 5.1). Точка *ξ , в которой достигается максимум функции ( )ξH по [ ]1,0∈ξ , и дает требуемый оптимальный набор стратегий ( )*** 1, ξξ −=x и значение игры ( )*ξHvA = .
Для определенности рассмотрим игру с матрицей
25
⎟⎟⎠
⎞⎜⎜⎝
⎛=
04124131
A .
Для каждого 4,1=j имеем: ( ) ( ) 122,,21, +=+−= ξξ xExE , ( ) 433, +−= ξxE , ( ) .44, ξ=xE Нижняя огибающая ( )ξH семейства прямых ( ){ }jxE , и сами прямые ( )jxE , ,
4,1=j , изображены на рис. 5.1. Максимум ( )*ξH функции ( )ξH находится на пересечении первой и четвертой
прямых. Таким образом, *ξ – решение уравнения .24 **
Av=+−= ξξ
Рис. 5.1.
Откуда получаем оптимальную стратегию ( )53,52* =x игрока 1 и значение игры 58=Av . Оптимальную стратегию игрока 2 найдем из следующих соображений. Заметим,
что в рассматриваемом случае ( ) ( ) .584,1, ** === AvxExE Для оптимальной стратегии ( )*
4*3
*2
*1
* ,,, ηηηη=y должно выполняться равенство ( ) ( ) ( ) ( ) ( ).4,3,2,1,, **
4**
3**
2**
1** xExExExEyxEvA ηηηη +++==
При этом ( ) ( ) 583,,582, ** >> xExE , следовательно, 0*3
*2 ==ηη , а *
4*1 , ηη можно найти
из условия (5.3) .582,584 *
1*4
*1 ==+ ηηη
Таким образом, 54*1 =η и 51*
4 =η и оптимальная стратегия игрока 2 равна ( )51,0,0,54* =y . Пример 5.2. ( ( )2×m -игра). В этом примере две стратегии имеет игрок 2, а игрок 1
– т стратегий. Тогда матрица А имеет вид
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
21
2221
1211
mm
A
αα
αααα
…….
Анализ этой игры проводится аналогично. Действительно, пусть ( )ηη −= 1,y – произвольная смешанная стратегия игрока 2. Тогда игрока 1 в ситуации ( )yi, равен
( ) ( ) ( ) .1, 22121 iiiiiyiE αηααηαηα +−=−+=
26
График функции ( )yiE , – прямая. Рассмотрим верхнюю огибающую этих прямых, т. е. функцию
( ) ( )[ ].max 221 iiiiH αηααη +−=
Функция ( )ηH выпуклая (как верхняя огибающая семейства выпуклых функций). Точка минимума *η функции ( )ηH дает оптимальную стратегию ( )*** 1, ηη −=y и
значение игры ( )[ ]
( )ηηη
HHvA 1,0
* min∈
== .
САМОСТОЯТЕЛЬНАЯ РАБОТА № 4. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ГРАФОАНАЛИТИЧЕСКИМ
МЕТОДОМ.
ЗАНЯТИЕ №6
6.1 ДОМИНИРОВАНИЕ СТРАТЕГИЙ В БИМАТРИЧНОЙ ИГРЕ Покажем на примере, что существуют стратегии, которые заведомо выбирать не
нужно, и вероятность выбора которых, согласно теоремам 3.3–3.4, должна быть нулевой. Эта идея позволяет осуществлять замену первоначальной матрицы на матрицу выигрышей меньшей размерности.
Пример 6.1. Рассмотрим следующую игру:
( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )
yyy
x
x
x
IIIIII
IIIIII
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
8,26,90,36,34,81,22,61,53,4
.
Независимо от того, как играет игрок 1, yIII дает игроку 2 строго больший выигрыш, нежели yII . В этом смысле стратегия yII строго доминируема, поэтому рациональный игрок 2 не должен играть yII . Далее, если игрок 1 знает (т. к. он сам рационален и знает, что другой рационален), что игрок 2 не будет играть yII , то для него
xI будет лучше, чем xII или xIII . Наконец, если игрок 2 знает, что игрок 1 знает, что игрок 2 не будет играть yII , то игрок 2 знает, что 1 будет играть xI , а тогда 2 должен играть yI . Естественно, что строго доминируемые стратегии надо удалять и в результате последовательного удаления строго доминируемых стратегий остается пара стратегий ( )yx II , .
Пример 6.2. Посмотрим теперь на следующую игру:
( ) ( )( ) ( )( ) ( )
yy
x
x
x
III
IIIIII
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
0,20,10,00,00,10,4
.
Здесь xII не доминируется строго ни стратегией xI , ни стратегией xIII . Однако, если игрок 1 играет xI с вероятностью 21 и xIII – с вероятностью 21 , он обеспечивает себе выигрыш 21 независимо от того, как играет игрок 2. Следовательно, чистая стратегия может строго доминироваться смешанной стратегией, даже если она не доминируется строго никакой чистой стратегией.
Определение 6.1. Чистая стратегия ix игрока i в игре G строго доминируема, если существует другая чистая стратегия ix , такая, что
27
( ) ( ) ijnjXxxKxxK jiii ≠=∈∀≥ ,,1,|| . (6.1) В этом случае говорят, что стратегия ix , доминирует стратегию ix .
Определение 6.2. Стратегия ix слабо доминируется, если существует такая ix , что (6.1) выполняется как нестрогое неравенство, но хотя бы для одного набора { }ijnjx j ≠= ,,1 – неравенство строгое.
Аналогично определение и для смешанных стратегий: Определение 6.3. Смешанная стратегия iσ строго доминируется в игре G , если
существует другая стратегия iσ :
( ) ( ) ijnjEE jiii ≠=Σ∈∀≥ ,,1,|| σσσσ . (6.2)
Стратегия iσ называется строго доминирующей стратегией для игрока i в игре G , если она строго доминирует любую другую стратегию из i∑ .
Заметим, что для проверки строгой доминируемости iσ стратегией iσ , нам нужно знать «поведение» этих двух стратегий против чистых стратегий оппонентов игрока i.
( ) ( ) ijnjEE jiii ≠=Σ∈∀≥ ,,1,|| σσσσ тогда и только тогда, когда
( ) ( ) ijnjXxxExE jiiii ≠=∈∀> ,,1,|||| σσ . Смешанная стратегия может быть строго доминируемой, если она использует с
положительной вероятностью чистые стратегии, которые даже не слабо доминируемы. Пример 6.3. Действительно, рассмотрим следующую игру:
( ) ( )( ) ( )( ) ( )
yy
x
x
x
III
IIIIII
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−
−
1,01,03,10,20,23,1
.
Стратегия игрока 1 ( )0,21,21 дает ожидаемый выигрыш 21− вне зависимости от того, что играет игрок 2, а следовательно, строго доминируется стратегией xIII .
Пример 6.4. Рассмотрим игру, где выигрыши могут принимать значения yy
x
x
III
III
⎟⎟⎠
⎞⎜⎜⎝
⎛− )30,40()20,100(
)20,15()10,20(
Очевидно, что здесь стратегия yI доминируется стратегией yII , но проигрыш игрока 1 в ситуации ( )yx III , слишком велик, поэтому вполне можно допустить, что игрок 1 может не рискнуть сыграть стратегию xII , допуская возможность случайной ошибки игрока 2.
6.2. ДОМИНИРОВАНИЕ СТРАТЕГИЙ В АНТАГОНИСТИЧЕСКОЙ ИГРЕ Определение 6.4. Говорят, что стратегия x′ игрока 1 доминирует стратегию x ′′
в ( )nm× -игре AG , если для всех чистых стратегий nj ,1= игрока 2 выполняются неравенства
jj axax ′′≥′ . (6.3)
Например, в матрице ⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
234352
3-я строка доминируется 2-ой: ( )0,1,0=′x ,
28
( ) ⇒=′′ 1,0,0x
.214050204150;313020303120
⋅+⋅+⋅≥⋅+⋅+⋅⋅+⋅+⋅≥⋅+⋅+⋅
Аналогично, стратегия y′ игрока 2 доминирует его стратегию y ′′ , если для всех чистых стратегий mi ,1= игрока 1
yaya ii ′′≤′ . (6.4) Если неравенства (6.3), (6.4) выполняются как строгие, то говорят о строгом доминировании. Частным случаем доминирования стратегий является их эквивалентность.
Определение 6.5. Будем называть стратегии x′ и x ′′ игрока 1 эквивалентными в игре AG , если для всех nj ,1=
jj axax ′′=′ (6.3') и обозначать x′~ x ′′ . Для двух эквивалентных стратегий x′ и x ′′ выполняется (для каждого IIy Σ∈ ) равенство
( ) ( )yxEyxE ,, ′′=′ . Аналогично, стратегии y′ и y ′′ игрока 2 эквивалентны ( y′ ~ y ′′ ) в игре AG , если для всех mi ,1=
ii ayay ′′=′ . (6.4') Отсюда имеем, что для любой смешанной стратегии Ix Σ∈ игрока 1 выполняется равенство
( ) ( )yxEyxE ′′=′ ,, . Для чистых стратегий введенные определения трансформируются следующим
образом. Если чистая стратегия i′ игрока 1 доминирует чистую стратегию i ′′ , а чистая стратегия j′ игрока 2 – чистую стратегию j ′′ того же игрока, то для всех
njmi ,1,,.1 == выполняются неравенства
jijijiji ′′′′′′ ≤≥ αααα , . Покажем, что игроки могут не использовать доминируемые стратегии. Этот факт
устанавливает следующую теорему. Теорема 6.1. Если в игре AG стратегия x′ одного из игроков доминирует
оптимальную стратегию *x этого игрока, то стратегия x′ также оптимальна. Отсюда вывод, что оптимальная стратегия может быть доминируема лишь
оптимальной стратегией. С другой стороны, никакая оптимальная стратегия не является строго доминируемой, поэтому строго доминируемые стратегии не могут быть оптимальными.
Теорема 6.2. Если в игре AG стратегия *x одного из игроков оптимальна, то *x – недоминируема строго.
Обратное утверждение неверно.
Пример 6.5. Так, в игре с матрицей ⎥⎦
⎤⎢⎣
⎡2001
1-я и 2-я чистые стратегии игрока 1
недоминируемы строго, но они неоптимальны. С другой стороны, если i-я строка (j-й столбец) матрицы А доминируемы, то нет
необходимости приписывать ей (ему) положительную вероятность в ситуации равновесия. Таким образом, для нахождения оптимальных стратегий вместо игры AG достаточно решить подыгру AG ′ , где A′ – матрица, получаемая из матрицы A вычеркиванием доминируемых строк и столбцов.
29
Определение 6.6. Если ( ) Imx Σ∈= ξξ ,...,1 и 11 +≤≤ mi , то расширением стратегии x на i-м месте будем называть вектор ( ) 1
11 ,...,,0,,..., +− ∈= m
miii Rx ξξξξ . Пример 6.6. Так, расширением вектора ( )31,32,31 на 2-м месте является вектор
( )31,32,0,31 ; расширением на 4-м месте – вектор ( )0,31,32,31 ; расширением на 1-м месте – вектор ( )31,32,31,0 .
Теорема 6.3. Пусть дана AG – ( )nm× -МИ. Предположим, что i-я строка матрицы А доминируема (т. е. доминируема чистая стратегия i первого игрока) и пусть дана AG ′ – игра с матрицей A′ , получаемой из матрицы А вычеркиванием i-й строки. Тогда справедливы следующие утверждения.
1. AA vv ′= . 2. Всякая оптимальная стратегия *y игрока 2 в игре AG ′ является оптимальной и в
игре AG . 3. Если *x – произвольная оптимальная стратегия игрока 1 в игре AG ′ и *
ix — расширение стратегии *x на i-м месте, то *
ix — оптимальная стратегия этого игрока в игре AG .
4. Если i-я строка матрицы А строго доминируема, то оптимальная стратегия *x игрока 1 в игре AG может быть получена из оптимальной стратегии *x в игре AG ′ расширением на i-м месте.
Сформулируем теорему о доминировании для второго игрока. Теорема 6.3. Пусть дана AG – ( )nm× -МИ. Предположим, что j-й столбец матрицы
А доминируем и пусть дана AG ′ – игра с матрицей A′ , получаемой из матрицы А вычеркиванием j-го столбца. Тогда справедливы следующие утверждения:
1. AA vv ′= . 2. Всякая оптимальная стратегия *x игрока 1 в игре AG ′ является оптимальной и в
игре AG . 3. Если *y – произвольная оптимальная стратегия игрока 2 в игре AG ′ и *
jy –
расширение стратегии *y на j-м месте, то *jy — оптимальная стратегия этого
игрока в игре AG . 4. Далее, если j-й столбец матрицы А строго доминируем, то оптимальная стратегия
*y игрока 2 в игре AG может быть получена из оптимальной стратегии *y в игре
AG ′ расширением на j-м месте. Обобщим полученные результаты. Теоремы 5.3–5.4 дают алгоритм понижения
размерности матрицы игры. Так, если строка (столбец) матрицы не больше (не меньше) некоторой выпуклой линейной комбинации остальных строк (столбцов) этой матрицы, то для нахождения решения игры можно эту строку (столбец) вычеркнуть. При этом соответствующее расширение оптимальных стратегий в игре с усеченной матрицей даст оптимальное решение исходной игры. Если неравенства выполнялись как строгие, то множество оптимальных стратегий в первоначальной игре можно получить расширением множества оптимальных стратегий усеченной игры, в противном случае при такой процедуре оптимальные стратегии можно потерять.
Пример 6.7. Рассматривается игра с матрицей
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
6030021331320112
A .
30
Так как каждое значение 3-ей строки 3a , превосходит соответствующее значение первой ( )13 aa ≥ , то, вычеркивая первую строку, получаем
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
603002133132
1A .
В этой матрице каждое значение 3-го столбца 3a не превосходит соответствующее значение 1-го столбца 1a . Поэтому получаем
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
603021313
2A .
В последней матрице никакая строка (столбец) не доминируется другой строкой (столбцом). Вместе с тем 1-й столбец 1a превосходит выпуклую линейную комбинацию столбцов 2a и 3a , так как 321 2121 aaa +≥ , поскольку ,321213 ⋅+> ,0212211 ⋅+⋅=
6212103 ⋅+⋅= . Исключая 1-й столбец, получаем
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
600231
.
В этой матрице 1-я строка эквивалентна смешанной стратегии ( )21,21,0=x , поскольку 2162103,2102211 ⋅+⋅=⋅+⋅= . Таким образом, исключая 1-ю строку, получаем
матрицу
⎟⎟⎠
⎞⎜⎜⎝
⎛6002
.
Оптимальные стратегии *x и *y игроков в игре с этой матрицей равны ( )41,43** == yx , при этом значение v игры равно 23 .
Последняя матрица получена вычеркиванием первых двух строк и столбцов, поэтому оптимальными стратегиями игроков в исходной игре являются расширения указанных стратегий на 1-м и 2-м местах, т. е. ( )41,43,0,0*
12*12 == yx .
Заметим, что, в силу того, что в решении использовалось нестрогое доминирование, то могут быть потеряны другие оптимальные стратегии. САМОСТОЯТЕЛЬНАЯ РАБОТА № 5. РАССМОТРЕТЬ ИГРУ НА ДОМИНИРОВАНИЕ И
НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ.
ЗАНЯТИЕ №7. ИТЕРАТИВНЫЕ МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР
7.1. ИТЕРАТИВНЫЙ МЕТОД БРАУНА – РОБИНСОНА (МЕТОД ФИКТИВНОГО РАЗЫГРЫВАНИЯ)
Идея метода – многократное фиктивное разыгрывание игры с заданной матрицей выигрыша. Одно повторение игры будем называть партией. Пусть разыгрывается игра с ( )nm× - матрицей { }ijA α= . В 1-й партии оба игрока выбирают совершенно произвольные чистые стратегии. В k-й партии каждый игрок выбирает ту чистую стратегию, которая максимизирует его ожидаемый выигрыш против наблюдаемого эмпирического вероятностного распределения противника за ( )1−k партий.
Итак, предположим, что за первые k разыгрываний игрок 1 использовал i-ю стратегию k
iξ раз ( )mi ,1= , а игрок 2 – j-ю стратегию kjη раз ( )nj ,1= . Тогда в ( )1+k -й
31
партии игрок 1 будет использовать 1+ki -ю стратегию, а игрок 2 – свою 1+kj -ю стратегию, где
∑∑ +==
j
kjji
j
kjiji
kk
v ηαηα1
max и ∑∑ +==
i
kiij
i
kiijj
kk
v ξαξα1
min .
Пусть v — значение МИ AG . Рассмотрим отношения
∑∑ +==
j
kj
jij
kj
iji
k
kkkv
k
ηαηα1
max , (7.1)
∑∑ +==
i
ki
iji
ki
ijj
k
kkkv
k
ξαξα1
min . (7.2)
Векторы ( )kkx km
kk ξξ ..,,.1= и ( )kky kn
kk ηη ...,,1= являются смешанными стратегиями игроков 1 и 2, соответственно, поэтому по определению значения игры имеем
.minmax kvvkv k
k
k
k≤≤
Таким образом, получен некоторый итеративный процесс, позволяющий находить приближенное решение МИ, при этом степень близости приближения к истинному значению игры определяется длиной интервала [ ]kvkv k
k
k
kmin,max . Сходимость
алгоритма гарантируется следующей теоремой. Теорема 7.1.
( ) ( ) .maxlimminlim vkvkv k
kk
k
kk==
∞→∞→
Пример 7.1. Найти приближенное решение игры с матрицей
.121103312cba
A⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=γβα
Обозначим γβα ,, стратегии игрока 1 и cba ,, – стратегии игрока 2. Пусть сначала игроки выбрали стратегии α и a соответственно. Если игрок 1 выбрал стратегию α , то игрок 2 может потерять один из выигрышей ( )3,1,2 −−− . Если игрок 2 выбрал стратегию a , то игрок 1 может получить один из выигрышей ( )1,3,2 . Во 2-й и 3-й партиях игрок 1 выбирает стратегию β , а игрок 2 – b , поскольку эти стратегии обеспечивают наилучший результат и т. д.
В табл. 7.1 приведены результаты разыгрываний, в этой таблице указаны стратегия игрока, накопленный выигрыш и средний выигрыш.
Таким образом, за 12 партий мы получили приближение решения ( )127,61,4112 =x , ( )125,21,12112 =y , а точность может быть оценена числом 21 .
Основным недостатком рассмотренного метода является его малая скорость сходимости, которая уменьшается с ростом размерности матрицы. Это является также следствием немонотонности последовательностей kv k и kvk .
Рассмотрим другой итеративный алгоритм, который избавлен от указанного недостатка.
7.2. МОНОТОННЫЙ ИТЕРАТИВНЫЙ АЛГОРИТМ РЕШЕНИЯ МИ Рассмотрим смешанное расширение ( )KYXGA ,,= МИ с ( )nm× - матрицей А. Обозначим ( ) I
Nm
NNx Σ∈= ξξ ,...,1 приближение оптимальной стратегии игрока 1 на N-й итерации и ( )N
nNNnN cRc γγ ,...,, 1=∈ – вспомогательный вектор. Алгоритм позволяет
находить (точно и приближенно) оптимальную стратегию игрока 1 и значение игры v .
32
Итеративный процесс строится следующим образом. В начале процесса игрок 1 выбирает произвольную чистую стратегию 0i , т. е. ( )0,...,1,...,0
0
0ix = , и вспомогательный
вектор вида 0
0iac = , где
0ia – строка матрицы А, имеющая номер 0i .
Пусть выполнена 1−N итерация и получены векторы 11 , −− NN cx . Тогда Nx и Nc вычисляются по следующим итеративным формулам:
( ) ;~1 1 NN
NN
N xxx αα +−= − (7.3) ( ) ,~1 1 N
NN
NN ccc αα +−= − (7.4)
где параметр 10 ≤≤ Nα . Векторы Nx~ и Nc~ будут получены ниже. Рассмотрим вектор ( )11
11 ,..., −−− = N
nNNc γγ и выберем такие индексы kj , на которых
достигается минимум ....min 1111
,1 21
−−−−
===== N
jNj
Nj
Nj
nj kγγγγ
Обозначим через 1
,1
1 min −
=
− = Nj
nj
Nv γ (7.5)
и { }kN jjJ ,...,1
1 =− множество индексов, на которых достигается 1
,1min −
=
Njnj
γ .
Пусть AN GG ⊂ – подыгра игры AG с матрицей { } miA N
ijN ,1,1 == −α , а индекс
1−∈ NJj . Решаем подыгру и находим стратегию Xx N ∈~ игрока 1. Пусть ( )Nm
NNx ξξ ~,...,~~1= .
Вычислим вектор ∑=
=m
ii
Ni
N ac1
~~ ξ . Пусть вектор Nc~ имеет компоненты
( )Nn
NNc γγ ~,...,~~1= . Рассмотрим ( )n×2 - игру с матрицей
⎟⎟⎠
⎞⎜⎜⎝
⎛ −−
Nn
N
Nn
N
γγγγ~...,,~
...,,
1
111 .
Найдем оптимальную стратегию ( ) 10,1, ≤≤− NNN ααα , игрока 1 в этой подыгре. Подставляя найденные значения NNN cx α,~,~ в (7.3), (7.4), находим Nx и Nc .
Процесс продолжаем до тех пор, пока не выполнится равенство 0=Nα или не будет достигнута требуемая точность вычислений. Сходимость алгоритма гарантируется следующей теоремой.
Теорема 7.2. Пусть { } { }NN xv , — итеративные последовательности, определяемые (7.3), (7.5). Тогда справедливы следующие утверждения.
1. 1−> NN vv , т. е. последовательность { }1−Nv строго монотонно возрастает. 2. .lim vvv N
N==
∞→ (7.6)
3. *lim xx N
N=
∞→, где **
Ix Σ∈ — оптимальная стратегия игрока 1.
Пример 7.2. Решим, используя монотонный алгоритм, игру с матрицей
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
121103312
A .
Итерация 0). Пусть игрок 1 выбрал 1-ю строку матрицы А, т. е. ( )0,0,10 =x и ( )3,1,21
0 == ac . Вычислим { }2,1min 002
00 ==== Jv jjγγ .
33
( ) ( ) ( ) ( ){ } { }
( ) ( ) ( ) ( ){ } { } ;13;;2max010113;020011;010312min1min1
;31;;2max010211;010013;030112max1max1
11
11
==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==
==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==
∑
∑
1
3
ijiiijj
iijjiji
v
v
ξα
ηα
( ) ( ) ( ) ( ){ } { }
( ) ( ) ( ) ( ){ } { } ;2124;;25max01211213;02210211;01213212min2min2
;2323;;23max01212211;01210213;03211212max2max2
22
22
==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==
==⋅+⋅+⋅⋅+⋅+⋅⋅+⋅+⋅==
∑
∑
21
23
ijiiijj
iijjiji
v
v
ξα
ηα
( ) ( ) ( ) ( ){ } { }
( ) ( ) ( ) ( ){ } { } .3135;;38max321313;311;323312min3min3
;35;1;34max322311;313;321312max3max3
33
33
==⋅+⋅⋅⋅+⋅==
==⋅+⋅⋅⋅+⋅==
∑
∑
31
35
ijiiijj
iijjiji
v
v
ξα
ηα
Таблица 7.1. Выигрыш игрока 1 Проигрыш игрока 2 k i j
k
kαξ
k
kβξ
k
kγξ
k
kaη
k
kbη
k
kcη α β γ a b c k
v k
kvk
ε
1. α a 1 0 0 1 0 0 2 3 1 2 1 3 3 1 2 2. β b 21 21 0 21 21 0 312 =+ 3=+ 03 321 =+ 532 =+ 1=+ 01 413 =+ 23 21 1 3. β b 31 32 0 31 32 0 4 3 5 8 1 5 35 31 34 4. γ b 41 42 41 41 43 0 5 3 7 9 3 6 47 43 1 5. γ b 51 52 52 51 54 0 6 3 9 10 5 7 59 55 54 6. γ b 61 62 63 61 65 0 7 3 11 11 7 8 611 67 64 7. γ b 71 72 74 71 76 0 8 3 13 12 9 9 713 79 74 8. γ c 81 82 85 81 86 81 1138 =+ 413 =+ 14=+113 13 11 10 814 810 84 9. γ c 91 92 96 91 96 92 14 5 15 14 13 11 915 911 94 10 γ c 101 102 107 101 106 103 17 6 16 15 15 12 1017 1012 105 11 α c 112 112 117 111 116 114 20 7 17 17215 =+ 16115 =+ 15=+ 312 1120 1115 115 12 α c 123 122 127 121 126 125 23 8 18 19 17 18 1223 1217 126
34
Итерация 1). Рассмотрим подыгру AGG ⊂1 с матрицей ⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
201
1A .
Оптимальной стратегией 1~x игрока 1 является вектор ( )1,0,0~1 =x . Тогда ( )1,2,1~3
1 == ac .
Решаем ( )32× - игру с матрицей ⎟⎟⎠
⎞⎜⎜⎝
⎛121312
. Заметим, что 3-й столбец матрицы
доминируем, поэтому смотрим матрицу ⎟⎟⎠
⎞⎜⎜⎝
⎛2112
. В силу симметрии оптимальной стратегией
игрока 1 в этой игре является вектор ( ) ( )21,2
11, =− NN αα .
Вычисляем 1x и 1c по формулам (1), (2). Имеем ( )( )
.123min
,2,23,23~2121,21,0,21~2121
012
11
11
101
101
=>====
=+=
=+=
vv
cccxxx
jjγγγ
Множество индексов имеет вид { }2,11 =J .
Итерация 2). Рассмотрим подыгру AGG ⊂2 с матрицей ⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
210312
2A . Первая строка в
этой матрице доминируема, поэтому достаточно рассмотреть подматрицу ⎟⎟⎠
⎞⎜⎜⎝
⎛2103
.
Оптимальной стратегией игрока 1 в этой игре является вектор ( )43,4
1 , поэтому
( )43,4
1,0~2 =x . Вычислим ( )1,23,2343
41~
322 =+= aac и рассмотрим ( )32× игру с
матрицей ⎟⎟⎠
⎞⎜⎜⎝
⎛1232322323
. Первая стратегия игрока 1 доминирует вторую, поэтому 01 =α .
Таким образом, вычисления закончены ( )21,0,2
11* == xx , значение v игры равно
231 == vv , а оптимальная стратегия игрока 2 имеет вид ( )0,21,2
1* =y (см. пример 7.1,
вторая строка в табл. 7.1). САМОСТОЯТЕЛЬНАЯ РАБОТА № 6. НАЙТИ ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ
СТРАТЕГИЯХ С ПОМОЩЬЮ ИТЕРАТИВНЫХ МЕТОДОВ.
35
ПРИЛОЖЕНИЕ САМОСТОЯТЕЛЬНАЯ РАБОТА № 1. ИССЛЕДОВАТЬ ВСЕ СИТУАЦИИ НА
РАВНОВЕСИЕ ПО НЭШУ И ОПТИМАЛЬНОСТЬ ПО ПАРЕТО. 1. 2. 3. 4. 5. ( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛6,43,01,22,1
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛4,43,01,22,3
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛6,51,10,22,5
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛5,53,10,22,3
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛4,51,21,24,3
6. 7. 8 9. 10. ( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛3,51,20,24,1
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛6,41,23,22,5
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛3,51,22,36,5
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛6,43,22,34,5
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛4,71,22,35,7
11. 12 13. 14 15. ( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛8,53,22,35,6
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛5,74,23,37,6
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛5,61,22,34,7
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛8,91,22,47,8
( ) ( )( ) ( )⎟⎟⎠
⎞⎜⎜⎝
⎛5,81,53,46,9
САМОСТОЯТЕЛЬНАЯ РАБОТА № 2. НАЙТИ ВСЕ МАКСМИННЫЕ И МИНИМАКСНЫЕ
СТРАТЕГИИ ИГРОКОВ, НИЖНЕЕ И ВЕРХНЕЕ ЗНАЧЕНИЯ ИГРЫ; УКАЗАТЬ ВСЕ СИТУАЦИИ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ, ЕСЛИ ОНИ ЕСТЬ.
1. 2. 3.
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−−−
−−−
57411321
24131132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−−
−−
0344213512153342
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
91112543341135432
4. 5. 6.
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−
−−
143327511
51312112
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−
−−
61331511405133312
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
31771174018107188411040
7. 8 9.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
136122137412101
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−−
−
125851311210211243221
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−−
3512714833351121101
10. 11. 12
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−
311121124311112
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−
6563521131123111
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
11192813124521
13. 14 15
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛−
181831115231204122
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−−
−−
7402752452032121
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−31324111
103737241
36
Пример 1. Решим каноническую задачу симплекс–методом. max23 21 →+= xxz
⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
≥≤+≤+
≤≤+−
;0,;82;62
;2;1
21
21
21
2
21
xxxxxx
xxx
Введем базисные
переменные 4,1, =isi .
21 , xx – свободные переменные
min23 21 →−−= xxF
⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
≥=+−+=+−+
=+−=+−+−
;0,;082;062
;02;01
21
421
321
22
121
xxsxxsxx
sxsxx
Определение 1. Решение системы (2), соответствующее нулевым значениям свободных переменных, называется базисным. Очевидно, что базисное решение будет допустимым, если все 4,1,0 =≥ isi .
Составим симплекс – таблицу.
2x 1x 1s 2s 3s 4s
1s 1* -1 1 0 0 0 1
2s 1 0 0 1 0 0 2
3s 2 1 0 0 1 0 6
4s 1 2 0 0 0 1 8
F 2 3 0 0 0 0 0
Если все элементы последнего столбца меньше нуля (кроме последнего элемента последней строки F ), то решение неограниченное и оптимального решения не существует.
Условия оптимальности: если все
элементы последней строки 0≤F , то полученное решение оптимально.
Выбор генерального столбца (кроме последнего): в последней строке выбираем положительной элемент.
Выбор генеральной строки: за генеральную строку берется та строка (кроме последней), в которой отношение свободного члена к положительному элементу генерального столбца было бы минимальным.
2x 1x 1s 2s 3s 4s 2x 1x 1s 2s 3s 4s
2x 1 -1 1 0 0 0 1 2x 1 0 0 1 0 0 2
2s 0 1* -1 1 0 0 1 1x 0 1 -1 1 0 0 1
3s 0 3 -2 0 1 0 4 3s 0 0 1* -3 1 0 1
4s 0 3 -1 0 0 1 7 4s 0 0 2 -3 0 1 4
F 0 5 -2 0 0 0 -2
⇒
F 0 0 3 -5 0 0 -7
2x 1x 1s 2s 3s 4s 2x 1x 1s 2s 3s 4s
2x 1 0 0 1 0 0 2 2x 1 0 0 0 2/3 -1/3 4/3
1x 0 1 0 -2 1 0 2 1x 0 1 0 0 -1/3 2/3 10/3
1s 0 0 1 -3 1 0 1 1s 0 0 1 0 -1 1 3
4s 0 0 0 3* -2 1 2 2s 0 0 0 1 -2/3 1/3 2/3
F 0 0 0 4 -3 0 -10
⇒
F 0 0 0 0 -1/3 -4/3 3212−
.34;3
10;32123
212 21maxmin ===⇒−= xxzF
37
Пример 2. Метод искусственного базиса для основной задачи.
⎪⎪⎩
⎪⎪⎨
⎧
=≥
=−+−−=−−
→+−=
.3,1,0
;1123;222
max432
321
321
321
jx
xxxxxx
xxxz
j
Умножив обе части первого уравнения на (-1) и прибавив к левым частям обоих уравнений
искусственные неизвестные 1w и
2w , получим расширенную систему. Составим на множестве планов расширенной системы вспомогательную функцию.
( ) min21 →+= wwxϕ
⎪⎪⎩
⎪⎪⎨
⎧
=≥
=+−+−=+++−
.3,1,0
;1123;222
2321
1321
jx
wxxxwxxx
j
( )( ) ;1353
;53132311222
321
32132132121
=−+−+−+=+−++−−+=+=
xxxxxxxxxxxxxwwx
ϕϕ
1x 2x 3x 1w 2w Св. чл.
1w -2 2* 1 1 0 2 2I
2w -1 3 -2 0 1 11 23 III ⋅−
( )xϕ -3 5 -1 0 0 13 25 IIII ⋅−
2x -1 1 1/2 1/2 0 1 2III +
2w 2* 0 -7/2 -3/2 1 8 2II
ϕ 2 0 -7/2 -5/2 0 8 IIIII −
2x 0 1 -5/4 -1/4 1/2 5
1x 1 0 -7/4 -3/4 1/2 4
ϕ 0 0 0 -1 -1 0
так как 0min =ϕ , решим задачу:
⎪⎩
⎪⎨⎧
=−
=−
→+−=
;447
;545
max432
31
32
321
xx
xx
xxxz
( ) ( ) 3333 415744
5534742 xxxxz +−=++−+=
3321 4157432 xxxxF −=−+−=
1x 2x 3x
2x 0 1 -5/4 5 2I
1x 1 0 -7/4 4 23III − F 0 0 -15/4 7 25IIII −
Следовательно, оптимального плана не существует.
38
Пример 3. Рассмотрим общую задачу. Двухфазный симплекс – метод. min4 21 →+= xxz
⎪⎪⎩
⎪⎪⎨
⎧
≥≤+≥+=+
;0,;42;634
;33
21
21
21
21
xxxxxx
xx
min21 →+= RRϕ
⎪⎪⎩
⎪⎪⎨
⎧
≥=++
=+−+=++
;0,;42
;634;33
21
221
2121
121
xxsxx
RsxxRxx
т. к. «=»;
т. к. 06001
21 <−===
xxs ;
т. к. «все нормально»; => s2 - базисный
;47934633 1211212121 sxxsxxxxRR +−−=+−−+−−=+=ϕ 1x 2x 1s 1R 2R 2s 1R 3* 1 0 1 0 0 3 2R 4 3 -1 0 1 0 6 2s 1 2 0 0 0 1 4 ϕ 7 4 -1 0 0 0 9
1x 1 1/3 0 1/3 0 0 1 2R 0 5/3* -1 -4/3 1 0 2 2s 0 5/3 0 -1/3 0 1 3 ϕ 0 5/3 -1 -7/3 0 0 2
1x 1 0 1/5 3/5 -1/5 0 3/52x 0 1 -3/5 -4/5 3/5 0 6/52s 0 0 1 1 -1 1 1 ϕ 0 0 0 -1 -1 0 0 так как 0min =ϕ , решим задачу:
( ) ( )
⎪⎩
⎪⎨⎧
+=
−=
−=++−=
;53
56
;51
53
51
518
53
56
51
534
12
11
111
sx
sx
sssz
1x 2x 1s
1x 1 0 1/5 3/5
2x 0 1 -3/5 6/5
2s 0 0 1* 1 z 0 0 1/5 18/5
1x 1 0 0 2/5 2x 0 1 0 9/5
1s 0 0 1 1 z 0 0 0 17/5
5175
95
2
min
2
1
=
=
=⇒
z
x
x
Д/з: решить П3 и Д3 симплекс-методом.
⎪⎪
⎩
⎪⎪
⎨
⎧
=≥
=−−+−≤−++−
≤+−+
→+−++=
.5,1,0
;123;822
;12432max7135421
54321
54321
5421
54321
jx
xxxxxxxxxx
xxxxxxxxxz
j
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
≥≥−−−=−+−
=+=−−≥++
→++=
.0,;724
;132;52
;43;2132
min812
21
321
321
32
321
321
321
yyyyyyyy
yyyyy
yyyyyyf
39
САМОСТОЯТЕЛЬНАЯ РАБОТА № 3. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ПРИ ПОМОЩИ ЛП. СДЕЛАТЬ ПРОВЕРКУ.
1. 2. 3. 4. 5. 6. 7.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
321450132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
421121342
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
154411432
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛ −−
511131112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
114513
312
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−431112
324
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
612374101
8 9. 10. 11. 12 13. 14.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
851121112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
− 333112101
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−
11121431112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−−
563211132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
− 1928312521
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
183120
322
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−−
514265121
15 16. 17 18 19. 20. 21.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−−−
−
111373
241
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−431112
321
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
311312123
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
314451
132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
974432435
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
124352431
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−143837312
САМОСТОЯТЕЛЬНАЯ РАБОТА № 4. НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ И ЗНАЧЕНИЕ
ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ ГРАФОАНАЛИТИЧЕСКИМ МЕТОДОМ. 1. 2. 3. 4. 5. 6. 7. 8. 9.
⎟⎟⎠
⎞⎜⎜⎝
⎛ −450132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−
512112
⎟⎟⎠
⎞⎜⎜⎝
⎛−411432
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
6311
12
⎟⎟⎠
⎞⎜⎜⎝
⎛− 124
342
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
832022
⎟⎟⎠
⎞⎜⎜⎝
⎛ −374101
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
− 531201
⎟⎟⎠
⎞⎜⎜⎝
⎛−
−121342
10. 11. 12. 13. 14. 15. 16. 17. 18.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
245231
⎟⎟⎠
⎞⎜⎜⎝
⎛ −431112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
1213112
⎟⎟⎠
⎞⎜⎜⎝
⎛− 1884
10412
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
201221
⎟⎟⎠
⎞⎜⎜⎝
⎛−−
−−373
221
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
146021
⎟⎟⎠
⎞⎜⎜⎝
⎛−
−112
324
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
− 311223
САМОСТОЯТЕЛЬНАЯ РАБОТА № 5. РАССМОТРЕТЬ ИГРУ НА ДОМИНИРОВАНИЕ И
НАЙТИ СИТУАЦИЮ РАВНОВЕСИЯ. 1. 2. 3.
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−−−
−−−
57411321
24131132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−−
0344213512153342
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
9111543341135432
4. 5. 6.
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−
−−
143327511
51312112
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−
−−
61331511405133312
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−31771
174018107188411040
7. 8 9.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
136122137412101
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−−
−
125851311210211243221
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−
−
35127148333
51121101
40
10. 11. 12
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−
31112124311112
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−
6563521131123191
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
11192813124521
13. 14 15
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛−
181831115231204122
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−−
−−
7402752452032121
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−−−31324111
103737241
16. 17 18
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−
164317111225321
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−−
243111431237123
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−−−−−
−
2431435451
22132
19. 20.
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
161294127464325431
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
− 51243131186745312
САМОСТОЯТЕЛЬНАЯ РАБОТА № 6. НАЙТИ ЗНАЧЕНИЕ ИГРЫ В СМЕШАННЫХ
СТРАТЕГИЯХ С ПОМОЩЬЮ ИТЕРАТИВНОГО МЕТОДА. 1. 2. 3. 4. 5. 6. 7.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
321450132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
421121342
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
154411432
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛ −−
511131112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
114513
312
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
40181018841040
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
612374101
8 9. 10. 11. 12 13. 14.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
851121112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
− 333112101
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−
11121431112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−−
563211112
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
1928312521
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
183120
322
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−−
514265121
15 16. 17 18 19. 20. 21.
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−−−
−
111373
241
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−431112
324
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−
−
311312123
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
−
314451
132
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−−
974432435
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
−143837312
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
124352431
ЛИТЕРАТУРА 1. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. — М.: Высшая школа, 1998. 2. Печерский С. Л., Беляева А. А. Теория игр для экономистов. — СПб.: Изд-во
Европейского университета, 2001.