39
Теорема об ожидаемой полезности и антагонистические игры И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 1 / 24

Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Embed Size (px)

Citation preview

Page 1: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Теорема об ожидаемой полезности иантагонистические игры

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 1 / 24

Page 2: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Пример

Рассмотрим игру, похожую на покер. В данный момент есть две возможности -играть или ”спасовать”. При игре сравниваются карты и в случае выигрыша мыполучаем 90 рублей, в случае проигрыша теряем 60 рублей.Известно, что с вероятностью 1

3 мы выиграем. Альтернатива - пасовать иполучить−20.Стоит ли играть?

Математическое ожидание равно

90 · 13− 60 · 2

3= −10 > −20.

Но правильно ли его использовать?

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 2 / 24

Page 3: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Пример

Рассмотрим игру, похожую на покер. В данный момент есть две возможности -играть или ”спасовать”. При игре сравниваются карты и в случае выигрыша мыполучаем 90 рублей, в случае проигрыша теряем 60 рублей.Известно, что с вероятностью 1

3 мы выиграем. Альтернатива - пасовать иполучить−20.Стоит ли играть?Математическое ожидание равно

90 · 13− 60 · 2

3= −10 > −20.

Но правильно ли его использовать?

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 2 / 24

Page 4: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Примеры

А. Альтернатива:1. Получить $1М2. С вероятностью 0.5 получить $2М

Б. Вероятности и выигрыши

1/2 1/4 1/8 1/16 1/32 ...2 4 8 16 32 ...

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 3 / 24

Page 5: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Примеры

А. Альтернатива:1. Получить $1М2. С вероятностью 0.5 получить $2М

Б. Вероятности и выигрыши

1/2 1/4 1/8 1/16 1/32 ...2 4 8 16 32 ...

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 3 / 24

Page 6: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Полезность

Полезность - мера удовлетворенности агента.

Предположение - для каждого агента существует функция полезности и онстремится максимизировать ее мат. ожидание.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 4 / 24

Page 7: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Полезность

Полезность - мера удовлетворенности агента.

Предположение - для каждого агента существует функция полезности и онстремится максимизировать ее мат. ожидание.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 4 / 24

Page 8: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Полезность

Полезность - мера удовлетворенности агента.

Предположение - для каждого агента существует функция полезности и онстремится максимизировать ее мат. ожидание.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 4 / 24

Page 9: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:

.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.

.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.

.Аксиома (Непрерывность)..

......

Если x > y > z, то существует такое число α ∈ (0, 1), что

αx+ (1− α)z > y.

.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 5 / 24

Page 10: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.

.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.

.Аксиома (Непрерывность)..

......

Если x > y > z, то существует такое число α ∈ (0, 1), что

αx+ (1− α)z > y.

.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 5 / 24

Page 11: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.

.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.

.Аксиома (Непрерывность)..

......

Если x > y > z, то существует такое число α ∈ (0, 1), что

αx+ (1− α)z > y.

.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 5 / 24

Page 12: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.

.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.

.Аксиома (Непрерывность)..

......

Если x > y > z, то существует такое число α ∈ (0, 1), что

αx+ (1− α)z > y.

.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 5 / 24

Page 13: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.

.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.

.Аксиома (Непрерывность)..

......

Если x > y > z, то существует такое число α ∈ (0, 1), что

αx+ (1− α)z > y.

.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 5 / 24

Page 14: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Теорема об ожидаемой полезности

.Теорема..

......

Если отношение предпочтения удовлетворяет аксиомам (1)-(4), тосуществует такая функция U : X → R, что для любых x, y ∈ ∆(X)

x > y ⇔ EU(x) > EU(y).

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 6 / 24

Page 15: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

План доказательства

1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция

2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 7 / 24

Page 16: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

План доказательства

1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)

3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 7 / 24

Page 17: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

План доказательства

1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают

4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 7 / 24

Page 18: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

План доказательства

1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число

5. Доказываем, что построенная функция нам подходит

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 7 / 24

Page 19: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

План доказательства

1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 7 / 24

Page 20: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Домашнее задание

1. Пусть X - конечное множество. Придумайте отношение предпочтения ” > ” на∆(X), которое удовлетворяет трем из четырех аксиом в теореме фон Неймана(соответственно, задача содержит 4 пункта).

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 8 / 24

Page 21: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Антагонистические игры

Бескоалиционная игра (в нормальной форме)

Γ = {N, {Xi}i∈N, {Ki}i∈N}.

Здесь N - конечное множество игроков,Xi, i ∈ N− множество стратегий игрока i ∈ N,Ki :

∏i∈N Xi → R− функция выигрыша игрока i ∈ N,

Конечная антагонистическая игра: |N| = 2,N = {1, 2}, X1,X2 конечны,K1(x1, x2) + K2(x1, x2) = 0(const) для всех x1 ∈ X1, x2 ∈ X2.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 9 / 24

Page 22: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Антагонистические игры

Бескоалиционная игра (в нормальной форме)

Γ = {N, {Xi}i∈N, {Ki}i∈N}.

Здесь N - конечное множество игроков,Xi, i ∈ N− множество стратегий игрока i ∈ N,Ki :

∏i∈N Xi → R− функция выигрыша игрока i ∈ N,

Конечная антагонистическая игра: |N| = 2,N = {1, 2}, X1,X2 конечны,K1(x1, x2) + K2(x1, x2) = 0(const) для всех x1 ∈ X1, x2 ∈ X2.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 9 / 24

Page 23: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Антагонистические игры

Каждая конечная антагонистическая игра с X1 = {1, ...,m}, X2 = {1, ..., n}полностью задается m× n матрицей

A =

a11, ..., a1na21, ..., a2n... ... ...am1, ..., amn

,

где aij = K1(i, j).Поэтому конечные антагонистические игры называются матричными.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 10 / 24

Page 24: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Пример

A =

1 2 0 −32 −1 −1 −1−2 0 0 14 1 0 −2

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 11 / 24

Page 25: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Седловые точки

.Упражнение..

......

Покажите, что для произвольных i, j

maxi

minjaij ≤ min

jmax

iaij

Седловой точкой называется пара (i∗, j∗), для которой выполняется равенство (вточках i∗,j∗ достигаются внешние экстремумы)

maxi

minjaij = min

jmax

iaij

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 12 / 24

Page 26: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Седловые точки

.Упражнение..

......

Покажите, что для произвольных i, j

maxi

minjaij ≤ min

jmax

iaij

Седловой точкой называется пара (i∗, j∗), для которой выполняется равенство (вточках i∗,j∗ достигаются внешние экстремумы)

maxi

minjaij = min

jmax

iaij

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 12 / 24

Page 27: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Смешанные стратегииСмешанной стратегией игрока называется вероятностное распределение намножестве его первоначальных, чистых стратегий. В матричной игресмешанной стратегией игрока 1 является вектор

x =

x1x2...xm

, xi ≥ 0,

m∑i=1

xi = 1,

а смешанной стратегией игрока 2 – вектор

y =

y1y2...yn

, yj ≥ 0,

n∑j=1

yj = 1.

Если игрок 1 применяет смешанную стратегию x, а игрок 2 – смешаннуюстратегию y, то ожидаемый выигрыш игрока 1 равен

A(x, y) = xTAy =m∑i=1

n∑j=1

aijxiyj.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 13 / 24

Page 28: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Теорема о минимаксе

.Теорема (Теорема о минимаксе, фон Нейман (1928))..

......maxx

miny

xTAy = miny

maxx

xTAy.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 14 / 24

Page 29: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Двойственная задача ЛП

Прямая задача:

Ax ≤ b, x ≥ 0

cTx → max

Двойственная задача:

ATy ≥ c, y ≥ 0

bTy → min

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 15 / 24

Page 30: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Пример

A =

1 −2 0 −32 −1 1 −1−2 0 0 14 1 0 −2

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 16 / 24

Page 31: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Вполне смешанные игры

Оптимальные стратегии (x∗, y∗) называются вполне смешанными, еслиx∗i > 0, y∗j > 0 для всех i, j. Игра, у которой любые оптимальные стратегииигроков вполне смешанные, называется вполне смешанной..Утверждение..

......

Если матричная игра вполне смешанная, то m = n, а оптимальныестратегии игроков x∗, y∗ единственные.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 17 / 24

Page 32: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Диагональные игры

Диагональные матричные игры:

A =

a11 0 . . . 00 a22 . . . 0

. . . . . . . . . . . .0 0 . . . ann

,

где aii > 0, i = 1, . . . , n.

.Утверждение........Любая диагональная игра является вполне смешанной.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 18 / 24

Page 33: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Диагональные игры

Диагональные матричные игры:

A =

a11 0 . . . 00 a22 . . . 0

. . . . . . . . . . . .0 0 . . . ann

,

где aii > 0, i = 1, . . . , n..Утверждение........Любая диагональная игра является вполне смешанной.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 18 / 24

Page 34: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Домашнее задание

2. Оптимальные стратегии (x∗, y∗) называются вполне смешанными, еслиx∗i > 0, y∗j > 0 для всех i, j. Игра, у которой любые оптимальные стратегииигроков вполне смешанные, называется вполне смешанной. Докажите, что еслиматричная игра вполне смешанная, то количества чистых стратегий у игроковсовпадают, а оптимальные стратегии игроков x∗, y∗ единственные.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 19 / 24

Page 35: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Домашнее задание

3. Квадратная матрица a = ∥aij∥ называется кососимметрической, еслиaij = −aji для всех i, j. Матричная игра называется симметричной, если еематрица кососимметрична. Докажите, чтоа. выигрыши игроков при использовании оптимальных стратегий равны нулю.б. множества оптимальных стратегий игроков в симметричной игре совпадают.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 20 / 24

Page 36: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Домашнее задание

4. Игрок 2 прячет предмет в один из n ящиков. Первый игрок пытается найти его,открывая последовательно 2 ящика. Если он обнаружит предмет в ящикеk = 1, ..., n , то его выигрыш равен δk > 0, , в противном случае его выигрышравен нулю. Найти значение игры и оптимальные стратегии игроков.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 21 / 24

Page 37: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Домашнее задание

5. Петя и Вася хотят назначить Ане свидание. Никто из молодых людей не знаетточно, когда она будет дома. Известно, что она с равной вероятностью можетвозвратиться домой в 3, 4 и 5 часов. Каждый может позвонить в один из этихчасов. Дозвонившийся первым назначает свидание. Если оба позвонятодновременно, Аня отдаст предпочтение Пете. Выигрыш каждого из игроков —Пети и Васи — равен 1, если ему удастся назначить свидание, 0, если свиданиене состоится и -1, если Аня идет на свидание с другим.Составить матрицу выигрышей и найти оптимальные стратегии Пети и Васи, т.е.вероятности звонков в 3,4 и 5 часов соответственно.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 22 / 24

Page 38: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Домашнее задание

6. Пусть элементы матрицы размера m× n являются независимыми одинаковораспределенными величинами с плотностью вероятностей f(x). Найтивероятность наличия в матрице седловой точки.

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 23 / 24

Page 39: Теория игр, весна 2015: Теорема об ожидаемой полезности и матричные игры

Домашнее задание

7. Имеется доска размером 3х3. На неглавной диагонали стоят числаa13 = a22 = a31 = 0. Остальные клетки свободны. У игрока 1 имеются фишки счислами 1,2,3. У игрока 2 – фишки с числами -1,-2,-3. По очереди, начиная с ходаигрока 1, игроки ставят свои фишки в свободные клетки. После того как вся досказаполнена, игрок 1 выигрывает число, равное значению игры получившейсяматрицы. Показать, что у игрока 1 есть стратегия, выбирая которую он никогдане проиграет (т.е. его выигрыш будет неотрицательный).

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2015 24 / 24