· .

максимизируется средний выигрыш статистика

· Показатель оптимальности стратегии - величина среднего риска.

За оптимальную стратегию принимается чистая стратегия , при которой минимизируется средний риск

Байесовское решение является оптимальным не в каждом отдельном случае, а в среднем. Такого рода оптимальность реально может проявить себя лишь при многократном проведении операции , когда среднее значение постепенно стабилизируется.

Применение критерия Байеса оправданно, если ситуация, в которой принимается решение, характеризуется признаками :

известны и не зависят от времени;

§ решение реализуется большое (теоретически бесконечное) число раз.

Пример 2 . Фирма купила станок за 100 ден. ед. Для его ремонта можно купить специальное оборудование за 50 ед. или обойтись старым оборудованием. Если станок выходит из строя, его ремонт с помощью спецоборудования обходится в 10 ед., без спецоборудования - в 40 ед.

Известно, что в течение срока эксплуатации станок выходит из строя не более трех раз: вероятность того, что станок не сломается - 0,3; сломается 1 раз - 0,4; сломается 2 раза - 0,2; сломается 3 раза - 0,1.

Требуется определить целесообразность приобретения специализированного ремонтного оборудования.

Формализация . Первый игрок имеет две чистые стратегии: покупать и не покупать специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей:

Выход станка из строя
Ремонтное оборудование ни разу 1 раз 2 раза 3 раза
не купить -100 -140 -180 -220
купить -150 -160 -170 -180

Решение.

Рассмотрим сначала эту задачу как антагонистическую игру .

В матрице методом минимакса находим седловую точку: (2,4), таким образом, x* = (0, 1), y* = (0, 0, 0, 1), цена игры v* = - 180 ден. ед.

Ответ : нужно купить специализированное оборудование.

Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = (0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа. Запишем эти вероятности внизу платежной матрицы.

Выход станка из строя
Ремонтное оборудование ни разу 1 раз 2 раза 3 раза
не купить -100 -140 -180 -220
купить -150 -160 -170 -180

Вероятности 0,3 0,4 0,2 0,1

Если же человек - первый игрок - будет продолжать играть оптимально (применит вторую стратегию «купить»), то его выигрыш составит

v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161;

а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит

v(x") = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .

Таким образом, первому игроку выгодно играть неоптимально!

Ответ : не покупать специализированное оборудование.

Существенное различие между значениями v(x*) и v(x") объясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии, «недополучает» 36 ден. единиц выигрыша.

3.2. Критерий Лапласа недостаточного основания – «ориентируйся на среднее»

Если состояния природы в равной мере правдоподобны, то их полагают равновероятными, т.е. .

· Показатель оптимальности стратегии - величина среднего выигрыша .

Оптимальной считается чистая стратегия , обеспечивающая максимум среднего выигрыша при одинаковых априорных вероятностях:

. (6)

Применение критерия Лапласа оправданно, если ситуация, в которой принимается решение, характеризуется признаками :

§ вероятности состояний природы неизвестны, не зависят от времени и равны;

§ решение реализуется большое (теоретически бесконечное) число раз;

§ для небольшого числа реализаций допускается некоторый неоцениваемый риск .

Пример 3. Найти оптимальное решение статистической игры, заданной платежной матрицей , применяя критерий Лапласа, считая, что состояния природы равновозможны, т.е. .

Решение

Найдем средние выигрыши статистика :

Найдем наибольший средний выигрыш : .

Значит, по критерию Лапласа оптимальной стратегией статистика, который считает состояния природы равновозможными, будет чистая стратегия .

Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.

Контрольные вопросы

1. Перечислите источники неопределенности и риска.

2. Дайте классификацию решений, принимаемых в различных условиях.

3. Назовите несколько определений риска.

4. По каким признакам классифицируются риски?

5. Что значит «управлять риском»?

6. Перечислите правила, с помощью которых проводится выбор способа управления риском и варианта решения.

7. Что понимается под качественной и количественной оценками риска?

8. Что понимается под играми с природой?

9. Какие критерии применяются для выбора оптимальной стратегии в условиях риска?

10. Как найти средний выигрыш игрока при известных вероятностях стратегий и при неизвестных вероятностях?

11. Поясните принципы использования моделей теории игр в экономических задачах в условиях неопределенности (игры с природой).

12. Что понимается под риском игрока?

13. Как найти элементы матрицы рисков? Что показывают эти величины?

14. Когда пользуются критериями Байеса и Лапласа? Опишите правила выбора оптимальной стратегии статистика с применением этих критериев. Что показывают вероятности в этих критериях?

Если при принятии решения ОПР известны вероятности Рj состояний Пj, то будем считать, что рассматривается ситуация в условиях частичной неопределенности.

Игрок принимает i-то решение (использовать стратегию Аi) в условиях частичной неопределенности. Он ожидает получить доход aij при реализации состояния Пj, который является случайной величиной Qi с рядом распределения, представленных в табл. 3.9.

Таблица 3.9. Ряд распределения случайной величины Qi

В этом случае для принятия решения можно использовать один из следующих критериев.

Критерий Байеса

Это критерий максимизации среднего ожидаемого дохода. Критерий Байеса называется также критерию максимума среднего выигрыша.

Как известно, математическое ожидание М (Qi) случайной величины Qi представляет собой средний ожидаемый доход, который сказывается также Qi можно найти по формуле (3.21):

Для каждой стратегии Аi (i-го варианта решения) следует рассчитать средний ожидаемый доход (математическое ожидание) по формуле (3.21), и в соответствии с критерием Байеса следует выбирать вариант (стратегию Аi), для которого достигается наибольшее значение:

Критерий Байеса используют в ситуации, в которой принимается решение, задовальняе следующим условиям:

вероятность появления состояния Пj известна и не зависит от времени; принято решение теоретически допускает бесконечную большое количество реализаций;

допускается некоторый риск при малых числах реализаций.

варианте решения достигается наибольший средний доход и какова величина этого дохода.

Решение. Запишем матрицу выигрышей с дополнительным строкой с вероятностями состояний Пj в виде таблицы 3.10.

Таблица 3.10. Матрица выигрышей игры

Найдем для каждой стратегии Аi средний ожидаемый доход по формуле (3.21):

При применении стратегии Аи ОПР может получить доход, который отличается от максимального, что и принимается за величину риска. Риск случайной величиной Ri с рядом распределения, который приведен в табл. 3.11.

Таблица 3.11. Ряд распределения случайной величины Ri

Для каждой стратегии Аi (i-го варианта решения) следует рассчитать средний ожидаемый риск (математическое ожидание) по формуле (3.23), и в соответствии с критерием Байеса следует выбирать вариант, для которого достигается наименьшее значение:

В этом случае критерий Байеса выступает как критерий минимизации среднего ожидаемого риска. Критерий Байеса можно назвать как критерий минимума среднего проигрыша.

Пример 3.9. Для выходных данных примера 3.8 на основе матрицы рисков по критерию Байеса выяснить, при каком варианте решения достигается наименьший средний риск и какова величина этого риска.

Разгрузка Обязательства. Запишем матрицу рисков игры с дополнительным строкой с вероятностями состояний Пи в виде таблицы 3.12.

Таблица 3.12. Матрица рисков игры

Найдем для каждой стратегии Аi средний ожидаемый риск по формуле (3.23):

Критерий Бернулли-Лапласа

Критерий Бернулли-Лапласа используют в случае, когда можно предположить, что любой из вариантов среды не более вероятен, чем другой. Здесь предполагается, что все состояния среды (все варианты реальной ситуации) равновероятны.

Для каждой стратегии Аи (и го варианта решения) следует рассчитать средний ожидаемый доход (математическое ожидание) по формуле (3.25), и в соответствии с критерием Бернулли-Лапласа следует выбирать вариант (стратегию Аi), для которого достигается наибольшее значение:

Пример 3.10. Пусть для игры, которую задано матрицей выигрышей в примере 3.2, ОПР считает ровно вероятными все состояние природы

выяснить при каком варианте решения достигается наибольший средний доход и какова величина этого дохода.

Решение. Запишем матрицу выигрышей с дополнительным строкой с вероятностями состояний Пj в виде таблицы 3.13.

Таблица 3.13

Найдем для каждой стратегии Аi средний ожидаемый доход по формуле (3.25):

Рассмотрим риск как случайную величину Ri с рядом распределения, который приведен в табл. 3.14.

Таблица 3.14. Ряд распределения случайной величины Ri

Математическое ожидание М (Ri) случайной величины Ri представляет собой средний ожидаемый риск, что вычисляется по формуле (3.27)

Для каждой стратегии Аi (i-го варианта решения) следует рассчитать средний ожидаемый риск (математическое ожидание) по формуле (3.27), и в соответствии с критерием Бернулли-Лапласа следует выбирать стратегию (вариант), для которой достигается наименьшее значение:

Пример 3.11. Для выходных данных примера 3.10 на основе матрицы рисков по критерию Бернулли-Лапласа выяснить, при каком варианте решения достигается наименьший средний риск и какова величина этого риска.

Решение. Запишем матрицу рисков игры с дополнительным строкой с вероятностями состояний Пj в виде таблицы 3.15.

Таблица 3.15. Матрица рисков игры

Найдем для каждой стратегии Аi средний ожидаемый риск по формуле (3.27):

Следует отметить, что критерий Бернулли-Лапласа непосредственно не относится к случаю частичной неопределенности, и его применяют в условиях полной неопределенности.

При поиске оптимальных решений обычно используют различные критерии, дающие некоторую схему принятия решений. Рассмотрим некоторые из них.

Критерий Байеса. При использовании критерия Байеса статистику известны вероятности q k наступления события П к. Обычно вероятности q k определяются путем проведения экспериментов. Такие вероятности называются апостериорными. В качестве оптимальной по критерию Байеса принимается чистая стратегия A i , при которой средний выигрыш статистика , становится максимальным.

Критерий Лапласа. Критерий Лапласа отличается от критерия Байеса тем, что апостериорные вероятности неизвестны. Тогда их принимают равными и рассчитывают по формуле

Критерий Сэвиджа. Этот критерий является критерием крайнего пессимизма, т.е. статистик исходит из предположения, что природа действует против него наихудшим образом. Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту чистую стратегию A i , при которой максимальный риск является минимальным. Такой риск называется минимаксом и рассчитывается по формуле

Критерий Вальда. Как и критерий Сэвиджа, критерий Вальда является критерием крайнего пессимизма. Поэтому статистик выбирает такую чистую стратегию А, при которой наименьший выигрыш будет максимальным. Этот выигрыш называется максимином и вычисляется по формуле

Критерий Гурвица. Этот критерий является критерием пессимизма-оптимизма и рекомендует применять нечто среднее. В этом случае статистик выбирает такую чистую стратегию А i , для которой справедливо условие:

где γ=0÷1 выбирается из субъективных соображений. При γ = 1 Критерий Гурвица преобразуется в критерий Вальда.

Пример 4.6. Создается ателье для ремонта телевизоров в стационарных условиях. Для простоты принимаем, что поток заявок на ремонт выражается числами 2, 4, 6 и 8 тыс. заявок в год. Из опыта известно, что прибыль от ремонта одного телевизора составляет 9 ден. ед. в год. Потери, вызванные отказом в ремонте ввиду недостатка мощностей, - 5 ден. ед. Убытки от простоя специалистов и оборудования при отсутствии заявок - 6 ден. ед. за каждую заявку.



Дать информацию о мощности создаваемого ателье, используя приведенные критерии.

Решение. В качестве игрока А здесь выступает орган, принимающий решение о мощности создаваемого ателье. Его чистыми стратегиями являются:

■ А 1 - открытие ателье мощностью 2 тыс. телевизоров в год;

§ A 2 - открытие ателье мощностью 4 тыс. телевизоров в год;

■ A 3 - открытие ателье мощностью 6 тыс. телевизоров в год;

■ A 4 - открытие ателье мощностью 8 тыс. телевизоров в год.

Вторым игроком выступает совокупность всех обстоятельств, в которых формируется поток заявок на ремонт телевизоров в условиях ателье, т.е. природа П . Природа может реализовать любое из четырех состояний:

П 1 - поток составит 2 тыс. телевизоров в год;

■ П г - поток составит 4 тыс. телевизоров в год;

П 3 - поток составит 6 тыс. телевизоров в год;

§ П 4 - поток составит 8 тыс. телевизоров в год.

Вычислим выигрыши a ik игрока А при любых сочетаниях обстоятельств (A i , П k ). Наиболее благоприятными будут ситуации, когда количество поступивших заявок совпадает с возможностями ателье.

Для комбинации (A 1 , П 1 ) прибыль составит а 11 =2*9 = 18 тыс. ден. ед., для комбинации (A 2 , П 2 ) имеем а 22 =4*9 = 36 тыс. ден. ед. и т.д.

Для случая (A 1 , П 2 ) в ателье можно отремонтировать 2 тыс. телевизоров, а заявок поступило 4 тыс. Потери при этом составят 2*5=10 тыс. ден. ед., а общая прибыль а п =2*9-2*5=8 тыс. ден. ед.

Для случая (A i , П k ) в ателье можно отремонтировать 4 тыс. телевизоров, а заявок поступило 2 тыс. Потери при этом составят 2*6 = 12 тыс. ден. ед., а общая прибыль а 21 =18-12 = 6 тыс. ден. ед. Аналогично находятся другие элементы платежной матрицы. Результаты расчетов представлены в табл. 4.13.

Из табл. 4.13 следует, что нижняя чистая цена игры

а верхняя чистая цена игры

Так как α ≠ β, то игра не содержит седловой точки. Доминирующих стратегий у статистика нет.____________

Критерий Байеса. Пусть известны вероятности q k состояния природы П к. В табл. 4.13 эти вероятности обозначены как . По формуле (4.23) находим значения средних выигрышей . Эти значения приведены в седьмом столбце табл. 4.13. В качестве оптимальной по критерию Байеса принимается чистая стратегия А 3 (открыть ателье на 6 тыс. ремонтов в год), при которой средний выигрыш статистика .

Таблица 4.13

П 1 (2) П 2 (4) П 3 (6) П 4 (8) α i 0,8α i δ i 0,2δ i h i
A 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
A 2 (4) 23,5 4,8 7,2
A 3 (6) -6 -6 29,5 -4,8 10,8
A 4 (8) -18 -18 25,5 -14,4 14,4
β i
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Здесь использованы следующие обозначения:

Критерий Лапласа. По этому критерию вероятности принимаются равными и рассчитывают по формуле

В качестве оптимальной по критерию Лапласа также принимается чистая стратегия А 3 , при которой средний выигрыш статистика

Критерий Сэвиджа. Для анализа игры по этому методу построим матрицу рисков. Для расчетов используются формулы (4.21), (4.22). Результаты расчетов представлены в табл. 4.14.

Как следует из табл. 4.14, минимальный из всех максимальных рисков равен . Этот риск соответствует чистой стратегии А 3 (открыть ателье на 6 тыс. ремонтов в год).

Таблица 4.14

П 1 П 2 П 3 П 4 max r ik
A 1
A 2
A 3
A 4

Критерий Вальда. Из табл. 4.13 видно, что нижняя чистая цена игры . Эта цена соответствует чистой стратегии А г (открыть ателье на 4 тыс. ремонтов в год).

Критерий Гурвица. Положим γ = 0,8. Рассчитываем по формуле δ i = max a ik (см. столбец 10 табл. 4.13). Затем, используя данные столбцов 6 и 10 табл. 4.13, проводим расчет по формуле .

Результат представлен в столбце 12 табл. 4.13. Значение и соответствует стратегии A 2 (открыть ателье на 4 тыс. ремонтов в год).