Математическая модель принятия решения в условиях...

Preview:

DESCRIPTION

Математическая модель принятия решения в условиях риска. Критерии в условиях риска. Математическая модель принятия решения в условиях риска. Математическая модель принятия решения в условиях риска. Y -множество состояний среды и оно конечно - PowerPoint PPT Presentation

Citation preview

Математическая модель принятия решения в условиях риска.Критерии в условиях риска

Математическая модель принятия решения в условиях риска

Математическая модель принятия решения в условиях риска

Y-множество состояний среды и оно конечно

Существует вероятностный вектор y=(y1,y2,…, ym) – показывает вероятность появления того или иного состояния среды.

Задача принятия решения в условиях риска представляет собой матрицу или таблицу выигрышей

Случайная величина

Вывод: т.о. сравнение двух

альтернатив i1 и i2 это есть по cути

двух случайных величин zi1 и zi2

mjniaij ,1,,1

альтернативы y1 … jyj … mym

1 a11 a1j a1m

… … … … … …

i aj1 aij ajm

… … … … … …

n an1 anj anm

mjjyY 1}{

)......( 1 imijii aaaz

/3

/2

/1 ,, TTT

/1T

ПРИМЕР. Выбор варианта продаваемого товараФирма А выставляет на продажу 1 из товаров Т1 или Т2

Фирма В –

Т1 и - конкурирующиеТ1 и - дополнительныеОстальные пары нейтральныПрибыль фирмы А зависит от сочетания товаров выставляемых на продажу

обеими фирмами

Фирма В выставляет на продажу товар в 3 раза реже, чем и в 4 раза реже чем

Какой товар следует выставить на продажу фирме А?

/1T/

3T

/3T/

2T

/3T /

1T/

2T

Т1 8 18 40

Т2 18 15 14

Решение

Вероятность выставления - x, тогда - 3x, -4x

X+3x+4x=1

X=1/8

y=(1/8;1/2;3/8)

E(T1)=8*1/8+18*1/2+40*3/8=25

E(T2)=18*1/8+15*1/2+14*3/8=15

/3T /

2T/1T

Т1 -17 -7 15

Т2 3 0 -1

/1T

/2T /

3T

Т1 8 18 40

Т2 18 15 14

/1T /

2T /3T

Критерии в условиях риска

Критерий ожидаемого значения

Критерий ожидаемого значения

Использование критерия ожидаемого значения, обусловленное стремлением max ожидаемую прибыль (или min ожидаемые затраты), представляет собой естественный переход от условий полной определенности.

Количественно критерий можно выразить в денежных единицах или вединицах полезности денег. Разницы между деньгами и их полезностью

Предположим, что инвестиции в 20 000 $ дают с равными вероятностямилибо нулевой валовый доход, либо доход в 100 000 $. В денежных единицах ожидаемый чистый доход составляет:100 000х0,5+0х0.5—20 000=30 000 $ Вывод: можно было бы заключить, что решение вложить 20 000 $ является оптимальным. Подобное решение не в одинаковой степени приемлемо для всех вкладчиков.

Критерий ожидаемого значения

Полезность не обязательно пропорциональна массе денег. Хотя

методы построения кривых полезности (т. е. зависимостей полезности от

массы денег) достаточно разработаны, полезность является тонким

понятием, что его нелегко определить количественно.

Что выбирать при расчете ожидаемого значения — полезность или массу

денег непосредственно – неясно.

Критерий ожидаемого значения

Пусть Z — случайная величина с математическим ожиданием Еz и дисперсией 2. Если (z1, • • • zn) —случайная выборка объема п, то выборочное среднeе Zср=(z1+z2+,..+zn)/n имеет дисперсию 2/n. Таким образом, когда n∞, т.е. становится очень большим, 2/n →0 и Zср приближаются к Еz. При достаточно большом объеме выборки разница между Zср и Еz и стремится к 0.

Использование критерия ожидаемого значения допустимо лишь в случае, когда одно и то же решение приходится принимать достаточно большое число раз. Напротив, если необходимость в принятии некоторого решения встречается редко, то выборочное среднее может значительно отличаться от Еz.

Вывод: ориентация на ожидания будет приводить к неверным результатам для решений, которые приходится принимать небольшое число раз.

Критерий ожидаемого значения. Пример

Необходимость в проведении профилактического ремонта оборудования

требует принятия решений о том, когда следует проводить ремонт какого-

нибудь станка (или другого вида оборудования) чтобы минимизировать

потери из-за неисправности (отказа). Если весь временной горизонт разбит

на временные периоды, то решение заключается в, определении

оптимального числа периодов между двумя последующими ремонтами. В

случае когда они производятся слишком часто, затраты на обслуживание

будут большими при малых потерях из-за случайных отказов. Компромисс

между двумя крайними случаями предусматривает сбалансированный выбор

между затратами на ремонт и потерями из-за случайных отказов.

Необходимо вычислить вероятность того, что станок выйдет из строя в

период времени t. Это и есть элемент «риска» в процессе принятия

решения.

РешениеСтанок из группы в n станков ремонтируется индивидуально, если он остановился из-за неисправности. Через Т интервалов времени выполняется профилактический ремонт всех n станков. Определить оптимальное значения T, при котором min общие затраты на ремонт вышедших из строя станков и проведение профилактического ремонта в расчете на один интервал времени. Пусть pt— вероятность выхода из строя одного станка в момент t, nt-случайная величина, представляющая число всех вышедших из строя станков в тот же момент. Предположим, что с1— затраты на ремонт вышедшего из строя станка с2— затраты на профилактический ремонт одного станка.

Решение

ЕС(Т)=(с1 Е{пt+ c2n) /T, Е{пt}-математическое ожидание числа вышедших из строя станков в

момент t.

Так как nt имеет биномиальное распределение с параметрами (n, pt), то

Е{nt}=nрt.

EC(T)=[n(c1 pt +c2)/T Необходимые условия оптимальности для Т*

имеют вид:

EС(T*-1) EС(T*)

EС(T*+1) EС(T*)

Положим C1=100 $., С2=10 $ n=50.

Значения рt приведены в виде таблицы.

T pt Σ pt EC(T)

1 0,05 0 500

2 0,07 0,05 375

3 0,10 0,12 366,7

4 0,13 0,22 400

5 0,18 0,35 450

Критерий «ожидаемое значение—дисперсия»

Критерий «ожидаемое значение—дисперсия»

Можно применить и для редко повторяющихся ситуаций.

z — случайная величина с дисперсией 2, то выборочное среднее z имеет дисперсию 2/n, где n — объем выборки.

Следовательно, если 2 уменьшается, то дисперсия zср также уменьшается, и вероятность того, что z близко к Е{z}, увеличивается.

Показывает целесообразность введения критерия, в котором максимизация ожидаемого значения прибыли сочетается с минимизацией ее дисперсии. Возможным критерием, отвечающим этой цели, является максимум выражения

E{z}- Kvar{z},

z—случайная величина, представляющая прибыль,

var (z)— ее дисперсия

К - заданная постоянная(уровень несклонности к риску ).

Критерий «ожидаемое значение—дисперсия» Пример

Необходимо вычислить дисперсию затрат за один интервал, т. е.Дисперсию СT=(с1 пt+ c2n) /T nt (t=1, ..., T—1) — случайная величина, имеет биномиальное распределение со средним npt и дисперсией npt (1—pt)СT тоже случайная.

Е{СT}==ЕС(Т) (из примера выше), критерием будет минимум выражения

EC(T)+K var {CT}При K=1 получаем задачу: минимизировать

1

1

1

1

1

1

1

1

2222

11

1var

1var

T

t

T

t

T

t

T

tT ptpt

T

cnptnpt

T

cnt

T

cC

T

t

T

ttT T

ctp

T

cp

T

c

T

cnCTEC

1 1

22

2

2 2111var

Пример

EС(T*)+ДС(Т*) EС(T*-1)+ДС(Т*)-1

EС(T*)+ДС(Т*) EС(T*+1)+ДС(Т*)-1

Т EC(T)+var{C}

1 0,05 0,0025 0 0 500,00

2 0,07 0,0049 0,05 0,0025 6312,50

3 0,10 0,0100 0,12 0,0074 6622,22

4 0,13 0,0169 0,22 0,0174 6731,25

5 0,18 0,0324 0,35 0,0343 6764,00

Tp 2Tp

1

1

T

ttp

1

1

2T

ttp

Критерий предельного уровня

Критерий предельного уровня

Не дает оптимального решения, скорее показывает приемлемый

способ действий в данной ситуации. Критерий применим в тех

случаях, когда в момент принятия решения нет полного

представления о множестве возможных альтернатив

ПримерПредположим, что величина спроса х в единицу времени (интенсивность спроса) на некоторый товар задается непрерывной функциейраспределения f(x). Если запасы в начальный момент времени невелики, в дальнейшем возможен дефицит товара. В противном случае к концу рассматриваемого периода запасы нереализованного товара могут оказаться очень большими. В обоих случаях неизбежны потери. Так как определить потери от дефицита очень трудно, то лицо, принимающее решение, может установить необходимый уровень запасов таким образом, чтобы величина ожидаемого дефицита не превышала А1 единиц, а величина ожидаемых излишков не превышала А2 единиц.

Пусть I – определяемый уровень запасов.

Ожидаемый дефицит = , Ожидаемые излишки = .

I

AdxxfIx 1)()(

I

AdxxfxI0

2)()(

Пример

При произвольном выборе А1 и А2 указанные условия могут оказаться

противоречивыми. В этом случае необходимо ослабить одно из

ограничений, чтобы обеспечить допустимость.

.0

,2010,/20)(

2

случаепротивномв

хеслиxxf

Решение

20 20

21

20

20ln20

20

I I

I

Idx

xIxdxxfIx

Применение критерия предельного уровня приводит к неравенствам

Например, если А1=2 и А2=4 , неравенства принимают вид

I I I

Idx

xxIdxxfxI

10 102

110

10ln20

20

,20/996.1120/20ln20/ln 11 AAII

,20/302.1120/10ln10/ln 21 AAII

,896,120/ln II 102,110/ln II

Решение

I 10 11 12 13 14 15 16 17 18 19 20

InI-I/20 1.8

1.84

1.88

1.91 1.94

1.96 1.97 1.98 1.99 1.99 1.99

InI-I/20 1.3

1.29

1.28

1.26 1.24

1.21 1.17 1.13 1.09 1.04 0.99

Таблица показывает, что оба условия выполняются для значений I, принадлежащих промежутку [13,17].

Значение I должно находится между 10 и 20, так как именно в этих пределах изменяется спрос.

Критерий наиболее вероятного исхода

Критерий наиболее вероятного исхода

Критерий основан на преобразовании случайной ситуации в детерминированную путем замены случайной величины единственным значением, имеющим наибольшую плотность реализации.

Пусть доход от изделия j равен Cj и Pj(Cj) - дискретная плотность

Распределения Cj . Пусть выбрано так, что для

всех Cj. Тогда можно рассматривать как детерминированное значение дохода от изделия j.

*jc )(max)( *

jjjj cpcp

Принятие решений при известных

априорных вероятностях

Принятие решений при известныхаприорных вероятностях

Ситуация ПР в условиях риска возникает в случаях, когда известны

априорные вероятности состояний природы

р(Q1), р(Q2), … , р(Qn),

(5)

Для каждой операции аi находят взвешенные суммы полезностей

i=1,2, …, m , (6)

выбирают операцию , для которой взвешенная сумма полезностей

в (6) максимальна,

n

jjQp

11)(

n

jj ijQpAi

1

,)(~

.~)~(max01

AiAimi

Пример

Пусть р(Q1)=0.25, р(Q2)=0.75

Таблица1- матрица полезностей

= 10.25 + 110.75 = 8.5,

= 100.25 + 60.75 = 7.0,

= 00.25 + 140.75 = 10.5,

max (8.5; 7.0; 10.5) = 10.5.

Qs

ai

Q1 Q2

a1 1 11

a2 10 6

a3 0 14

1~А

2~А

3~А

Пример

Наилучшей операцией операция а3, если р(Q1)=0.25, р(Q2)=0.75.

Но при других значениях априорных вероятностей состояний природы

возможен и другой выбор. Используя данные таблицы 1-матрица

полезностей и формулу для каждой операции

аi, i = 1,2,3,

= р +11(1 – p) = 11 – 10p,

= 10p +6(1 – p) = 6 + 4p,

= 14(1 – p) = 14 – 14p.

(p)~

(p)~

(p)~

n

jj ijQpAi

1

,)(~

Пример

р

Рис.А

В

Принятие решений в условиях риска

Принятие решений в условиях риска

К перечисленным условиям добавляется еще одно – значения априорных вероятностей состояний окружающей среды (природы): p(Q1), p(Q2), ..., p(Qn) (7)

Для каждой стратегии определяется усредненная по всем состояниям природы средняя полезность : (8)

U(Si,Qj) – полезность стратегии при состоянии природы Q. находится по

,,...,2,1, iS i

)(SU~

i

n

1jjjii 1,2,...i),)p(QQ,U(S)(SU

~

i

pjjiii PaQSU

1

),(

Принятие решений в условиях риска. Пример

Из множества выбираем max элемент:

Стратегия ,обладающая максимальной средней полезностью,

называется байесовской стратегией, ,

Пусть р(Q1) = 0.6, p(Q2) = 0.4.

Таблица 2

вычислим среднюю полезность для каждой допустимой стратегии, по

и данным таблицы

S i0

)(SU~

)(SU~

i0i ,...,2,1i

)(SU~

))(SU~

(max0ii

i0

)}(SU~

{ i ,...,2,1i }...,,2,1{i0

)(SU~

i

Si

Qj

S1 _

S2

S3 S4 _

S5

_

S6

S7 S8

Q1 10 8.8 8.8 7.6 6.4 5.2 5.2 4 Q2 0 1,4 5 4.9 2.1 5 5.6 7

n

1jjjii 1,2,...i),)p(QQ,U(S)(SU

~

Решение

= 100.6 + 00.4 = 6,

= 8.80.6 + 50.4 = 6.68,

= 7.60.6 + 4.90.4 = 6.52,

= 5.20.6 +5.60.4 =5.36,

= 40.6 + 70.4 =5.2

(S3) *

Проведение эксперимента в рассмотренной ситуации выгодно. Если

эксперимент не проводить, то по данным табл.3

Таблица 3

)(SU~

1

)(SU~

3

)(SU~

4

)(SU~

7

)(SU~

8

6.68.5.2) 5.36, 6.52, 6.68, ,6max(

.2.54.076.04)(aU~

,64.006.010)(aU~

2

1

Qi ai Q1 Q2

a1 10 0

a2 4 7

Пример

Байесовской операцией (стратегией) является операция а1, средняя

полезность которой равна 6 ед.

Дальше понадобиться объединить выражения

и в одно,

Меняя порядок суммирования в правой части последнего равенства,

получим

(10)*

n

1jjjii ))p(QQ,U(S)(SU

~

ji

n

=1j

t

=1jji )/QP(z)p(Q)(SU

~

.t...,2,1,=i,)/QP(z)p(Q)(SU~ t

1=

n

1=jjijji

i

pjjiii PaQSU

1

),(

Использование формулы Байеса

Использование формулы Байеса

Распределение вероятностей называется оприорными , если они были либо

известны либо могли быть найдены.

Иногда возможно провести эксперимент над исследуемой системой и

изменить оприорные вероятности в соответствии с полученной

информацией. Полученные вероятности будут называются

апостериорными

Использование формулы Байеса

число допустимых стратегий Si, i = 1, 2,…,, может быть очень велико, и поэтому пользоваться формулой Байеса [3, 8, 13]. Проводя эксперимент,

оценивают новые апостериорные вероятности состояний природы P(Qj/z), j = 1, 2, …, n, = 1, 2, …, t. Используя эти уточненные вероятности состояний природы, находят оптимальную операцию ai, i {1, 2, …, m}, обычным способом. Для простоты предположим, что распределения дискретные. Согласно формуле Байеса для апостериорной вероятности

состояния природы Qj при результате эксперимента z имеем:

j= 1, 2,…,n, =1, 2,…, t, (15) - известная условная вероятность получить результат

эксперимента z при состоянии природы Qj p(Qj) – априорная вероятность состояния природы Qj,

P(z) – полная вероятность результата эксперимента z

j

j QpzP

QzPzQP

j

jQzP

Использование формулы Байеса

(16)

Фиксируя , {1, 2,…, t}, для каждой операции ai, i =1, 2, … ,m,

находим среднюю полезность U (ai ) по формуле

(17)

– условная вероятность, определяемая из равенства (15), i j –

полезность операции a i при состоянии природы Qj. Далее при

фиксированном значении находим

Операцию,i {1, 2,…, m},считаем оптимальной для данного результата

эксперимента z, {1, 2,…, t},

j

n

jj QQzPzP p

1

ij

n

jji zQPaU

1

zQP j

)(max ii

milaUaU

Umax arg imil

i aa

Использование формулы Байеса

Покажем, что таким путем получается байесовская стратегия

SB = .

В силу формул и

и имеем:

(18)

Находится максимальная усредненная по всем результатам эксперимента

средняя полезность по формуле:

i=1,2,…,m, (19)

U(ai) определяется из равенства .

)a ,...,a ,...,a ,(21 tiiiia

j

j QpzP

QzPzQP

j

j

n

jj QQzPzP p

1

ij

n

jji zQPaU

1

n

jijjj

ijj

n

j

ji

QQzPzP

QzP

QzPaU

1

1

p 1

p

t

1βiββ ),(aU

imax)P(zu

~~

ij

n

jji zQPaU

1

Пример

Таблица 4 Таблица 3

Таблица 5

z1 – ожидается теплая погода,

z2 – ожидается холодная погода,

z3 – прогноз неизвестен.

Найдем оптимальную стратегию SB, используя второй метод, т.е.

формулы и

Qj

ai

Q1 Q2

a1 10 0

a2 4 7

Qj z

Q1 Q2

z1 0.6 0.3

z2 0.2 0.5

z3 0.2 0.2

j

j QpzP

QzPzQP

j

ij

n

jji zQPaU

1

S1

zB

S1 S2 S3 S4 S5 S6 S7 S8

z1 a1 a1 a1 a1 a2 a2 a2 a2

z2a1 a1 a2 a2 a1 a1 a2 a2

z3a1 a2 a1 a2

a1 a2a1 a2

Решение

= 1 находим U1(a1),U1(a2),

i = 1, 2

при z1 оптимальной операцией является а1, дающая 7.5 ед. полезности, P(z1)

= 0.48

2

11111 ,)/()(

jjj zQPaU

2

12121 ,)/()(

jjj zQPaU

)()(

)/()/( 1

1

1111 Qp

zP

QzPzQP

)()/()()/()( 2211111 QpQzPQpQzPzP )/(1)/( 1112 zQPzQP

48.04.03.06.06.0)( 1 zP

75.048.0

6.06.0)/( 11

zQP 25.075.01)/( 12 zQP

5.7025.01075.0)( 11 aU 75.4725.0475.0)( 21 aU

5.7)(max 1 ii

aU

Решение

=2 находим U2(a1), U2(a2),

i = 1, 2 при z2 оптимальной операцией является a2, дающая 5.875ед. полезности,

P(z2)=0.32

2

11212 )/()(

jjj zQPaU

2

12222 )/()(

jjj zQPaU

)()(

)/()/( 1

2

1221 Qp

zP

QzPzQP

)()/()()/()( 2221122 QpQzPQpQzPzP )/(1)/( 2122 zQPzQP

32.04.05.06.02.0)( 2 zP

375.032.0

6.02.0)/( 21

zQP 625.0375.01)/( 22 zQP

75.30625.010375.0)( 12 aU 875.57625.04375.0)( 22 aU

875.5)(max 2 ii

aU

Решение

=3 находим U3(a1), U3(a2),

при z3 оптимальной операцией является a1, дающая 6 ед. полезности,

P(z3)=0.20

2

11313 )/()(

jjj zQPaU

2

12323 )/()(

jjj zQPaU

)()(

)/()/( 1

3

1331 Qp

zP

QzPzQP

)()/()()/()( 2231133 QpQzPQpQzPzP )/(1)/( 3132 zQPzQP

,20.04.02.06.02.0)( 3 zP

6.020.0

6.02.0)/( 31

zQP ,4.06.01/ 32 zQP

604.0106.0)( 13 aU 2.574.046.0)( 23 aU

6)(max 3 ii

aU

Вывод

Оптимальной, байесовской стратегией является стратегия

совпадающая со стратегией S3, полученной при использовании формул

и

Вычислим максимальную (усредненную по трем результатам

эксперимента) среднюю полезность по формуле:

что совпадает со значением , полученным ранее.

),,( 121 aaaSB

n

1jjjii 1,2,...i),)p(QQ,U(S)(SU

~

i

pjjiii PaQSU

1

),(

t

1βiββ ),(aU

imax)P(zu

~~

68.6620.0875.532.05.748.0~~ u

)(~

3SU

Многоэтапное принятие решений

Многоэтапное принятие решений

Многоэтапность приводит к тому, что схема принятия решения может быть

представлена в виде дерева, в каждой вершине которого осуществляется

либо:

1 Сознательный выбор между двумя и более альтернативами

2 Случайный переход из одной ветви в другую под воздействием внешних

факторов

Сознательное принятие решения

Случайная вершина

Пример

Фирма может принять решение о строительстве крупного или мелкого

предприятия. Строительство крупного предприятия относительно дешевле,

в случае если будет высокий спрос на производимые товары, мелкое

предприятие можно расширить. Деятельность фирмы рассматривается в

течение 10 лет, причём в случае строительства мелкого предприятия,

вопрос о расширении будет рассматриваться через два года. Спрос заранее

неизвестен.

Пример

Введём градацию спроса: высокий и низкий . Затраты и доходы:

строительство крупного предприятия – 5 млн. $; строительство мелкого – 1

млн. $; затраты на расширение – 4,2 млн. $; крупное предприятие при

высоком спросе даёт доход – 1 млн. $ ежегодно, а при низком – 300 тыс. $;

мелкое предприятие при высоком спросе – 250 тыс. $ ежегодно, при низком

– 200 тыс. $.

Расширенное предприятие в случае высокого спроса приносит доход – 900

тыс. $ в год, и при низком спросе – 200 тыс. $; мелкое предприятие без

расширения при высоком спросе на производимый продукт приносит в

течение 2ух лет по 250 тыс. $ ежегодно, а в течение следующих 8ми по

200 тыс. $.

Решение

5

6

4

3

2

1

крупное

мелкое

p=0,75

p=0,25

p=0,25

p=0,75

p=0,75

p=0,25

p=0,75

p=0,25

расш

без расш.

1,0

0,3

0,9

0,2

0,25

0,2

0,2

2 года 8 лет

Решение

Начнём с последнего четвёртого шага: подсчитаем средний выигрыш:

Исходя из полученного результата, оптимальным будем сразу строить

крупное предприятие

3,125,0*10*2,075,0*25,0*29,1

25,30,510*25,0*3,075,0*1

9,18*25,0*2,075,0*25,0

6,12,48*25,0*2,075,0*9,0

1

1

4

4

мелк

круп

расшбез

расш

a

a

a

a

Задача о секретарше

Директор собирается принять на работу секретаршу. Прежний опыт делит

секретарш на три категории: отличных (3 балла), хороших (2 балла) и

посредственных (1 балл).

Анализ учебных заведений по подготовке секретарш даёт статистику

выпускниц заведений: вероятность взять на работу отличную секретаршу –

0,2, хорошую – 0,5, посредственную – 0,3.

Директор может испытать только трёх претенденток, причём в случае

отказа директора кандидат убывает на другую работу

Решение

1

p=0,2

продолжить 2

3

p=0,3

p=0,5

a=1

a=3

a=2

p=0,3

p=0,2

p=0,5

stop

stop

stop

a=1

a=3

a=2

stop

stop

stop

продолжить

продолжить

продолжить

p=0,3

p=0,2

p=0,5

stop

stop

stop

Начнём искать оптимальное решение с последнего шага. Определим МО

«выигрыша» секретарши, если мы испытываем трёх кандидаток:

Во втором испытании, если попалась хорошая секретарша, надо

остановиться, а в первом испытании, надо остановиться только если

попалась отличная, а в третье испытании берём любую. Найдём средний

оптимальный выигрыш после всех испытаний:

17.23.0*9.15.0*22.0*3

9.13.0*15.0*22.0*3

3

3

a

a

336.23.0*17.25.0*17.22.0*3 отлa

Recommended