Главная База знаний "Allbest" Экономико-математическое моделирование Информационные технологии теории игр

Информационные технологии теории игр

Теория игр в контексте теории принятия решений. Игры без седловых точек. Использование линейной оптимизации при решении матричных игр. Критерии, используемые для принятия решений в играх с природой. Решение парных матричных игр с нулевой суммой.

Рубрика	Экономико-математическое моделирование
Вид	контрольная работа
Язык	русский
Дата добавления	14.02.2011
Размер файла	437,2 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ТЕМА

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ТЕОРИИ ИГР

Теория игр в контексте теории принятия решений

Рассмотренные до сих пор задачи формулировались и решались, в основном, в предположении наличия полной информации. Их можно отнести к совокупности задач принятия решений в условиях определенности. В реальных экономических условиях, однако, часто приходится действовать при ограниченности, неточности исходной информации о самом объекте и внешней среде, в которой он функционирует.

При принятии управленческих решений, влияющих на функционирование и развитие экономического объекта, необходимо учитывать важнейшую характеристику внешней среды - неопределенность.

Под неопределенностью следует понимать отсутствие, неполноту, недостаточность информации об объекте, процессе, явлении или неуверенность в достоверности информации. В экономической сфере имеется множество источников возникновения неопределенности для систем самого различного уровня сложности и масштабов.

Неопределенность обуславливает появление ситуаций, не имеющих однозначного исхода (решения). Среди тех из них, с которыми в процессе производства сталкиваются предприятия, особое место занимают ситуации риска.

Ситуации риска сопутствуют три условия:

· наличие неопределенности;

· необходимость выбора альтернативы;

· возможность оценить вероятность осуществления выбираемых альтернатив.

Таким образом, ситуация риска характеризуется возможностью количественного и качественного определения степени вероятности того или иного варианта развития событий.

Экономический риск предстает в виде совокупности вероятных экономических, политических, нравственных и других последствий (как благоприятных, так и неблагоприятных), которые могут наступить при реализации выбранных решений.

Существуют различные виды неопределенности, в частности:

· количественная, обусловленная значительным числом объектов или элементов в ситуации;

· информационная, вызванная недостатком информации или ее неточностью по техническим, социальным и другим причинам;

· стоимостная из-за слишком дорогой или недоступной платы за определенность;

· профессиональная как следствие недостаточного профессионализма ЛПР (не учитывается, например, требуемое количество влияющих факторов);

· ограничительная (вызванная ограничениями в ситуации принятия решений, например ограничения по времени и др.);

· внешней среды, связанная с поведением среды или реакцией конкурента на процесс принятия решения.

Природа риска в рыночной экономике обусловлена следующими факторами:

· ограниченной сферой государственного регулирования хозяйственной деятельности;

· усилением роли случайных факторов во взаимодействии предприятия с внешней средой;

· частной (и ее видами) собственностью предпринимателя, ее владением, пользованием, распоряжением;

· конкурентной борьбой товаропроизводителей и других хозяйствующих субъектов;

· всеобъемлющим характером риска, распространяющимся на сферы общественной жизни, как производственную, так и непроизводственную. Он имеет место на этапах производства, продажи, закупки и др.

Рыночные отношения порождают различные виды рисковых ситуаций, более того, в работе предприятий риск становится необходимым и обязательным компонентом.

Для иллюстрации различия между ситуациями, когда приходится принимать решения в условиях риска или в условиях неопределенности, рассмотрим задачу оптимального выбора ассортимента выпускаемой продукции. В условиях риска доход от реализации единицы продукции не является фиксированной величиной. Это - случайная величина, точное численное значение которой неизвестно, но описывается с помощью известной функции распределения .

В условиях неопределенности функция распределения неизвестна. Вообще говоря, неопределенность не означает полного отсутствия информации о задаче. Например, может принимать некоторое число определенных значений, но вероятности этих значений неизвестны.

Таким образом, с точки зрения полноты исходных данных определенность и неопределенность представляют два крайних случая, а риск определяет промежуточную ситуацию.

Уровень имеющейся информации о проблеме определяет, каким образом может быть формализована и решена задача принятия решения.

При решении задач в условиях неопределенности внешней среды наиболее часто возникают две ситуации. При первой сама система препятствует принятию решений (задачи “природной неопределенности” - например, задача производства сельскохозяйственной продукции на некоторой территории, когда неизвестны погодные условия предстоящего сезона). В этой ситуации природа может рассматриваться как доброжелательный противник, в том смысле, что она не преследует целей, противоположных целям человека.

Во второй ситуации возможно наличие конкуренции, когда два или более участника находятся в конфликте, и каждый стремится, как можно больше, выиграть у конкурента (конкурентов). В этом случае лицу, принимающему решения, противостоит мыслящий противник. Для ситуаций этого типа (называемых конфликтными) характерно, что эффективность решений, принимаемой каждой из сторон, существенно зависит от действий другой стороны. При этом ни одна из сторон не может полностью контролировать положение. Например, при определении объема выпуска продукции на одном предприятии нельзя не учитывать размеров выпуска аналогичной продукции на других предприятиях. В реальных условиях часто также возникают ситуации, в которых антагонизм отсутствует, но необходимо учитывать противоположные тенденции. Например, для нормального функционирования производства, с одной стороны, необходимо наличие запасов разнообразных ресурсов, но с другой, их хранение вызывает появление дополнительных расходов.

Раздел математики, изучающий конфликтные ситуации на основе их математических моделей, называется теорией игр. Можно также сказать, что теория игр - математическая теория конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу действий каждого из участников в ходе конфликтной ситуации, т.е. таких действий, которые обеспечивали бы ему наилучший результат.

Игровые схемы можно применять во многих экономических ситуациях. Выигрышем могут при этом выступать величина прибыли, себестоимость, эффективность использования дефицитных ресурсов, производственных фондов, и т.д.

Существенным обстоятельством является то, что методы и рекомендации теории игр разработаны применительно к таким конфликтным ситуациям, которые обладают свойством многократной повторяемости. Если конфликтная ситуация реализуется однократно или ограниченное число раз, то рекомендации теории игр становятся малоэффективными.

Анализ реальной конфликтной ситуации требует ее существенного (иногда радикального) упрощения - учета лишь наиболее существенных для конфликта факторов. В связи с этим, можно рассматривать игру как упрощенную математическую модель конфликтной ситуации, характеризующуюся наличием определенных правил. Эти правила устанавливают:

· выбор образа действия игроков на каждом этапе игры;

· информацию, которой обладает каждый игрок при осуществлении таких выборов;

· плату для каждого игрока после завершения любого этапа игры.

Стратегией игры называется совокупность правил, определяющих поведение игрока на протяжении всей игры. Стратегии каждого игрока определяют результаты или платежи в игре; при этом каждый игрок имеет некоторое множество (конечное или бесконечное) возможных стратегий.

К числу определяющих характеристик игр можно отнести следующие:

· имеется конфликтующих сторон (игроков), принимающих решения, интересы которых не совпадают;

· сформулированы правила выбора допустимых стратегий, известные игрокам;

· определен набор возможных конечных состояний игры (например, выигрыш, проигрыш, ничья);

· всем участникам игры (игрокам) заранее известны платежи, соответствующие каждому возможному конечному состоянию.

Конфликтные ситуации, встречающиеся в практике, порождают различные виды игр. Классификация игр возможна по разным признакам.

А) По количеству игроков. В игре может принимать участие любое конечное число игроков. Если игроков всего двое, или игроки объединяются в две группы, преследующие противоположные цели, то имеет место парная игра. В зависимости от количества стратегий в игре они делятся на конечные и бесконечные.

Б) В зависимости от взаимоотношений участников различают бескоалиционные (участники не имеют права заключать соглашения) и коалиционные игры (иногда используются синонимы - некооперативные и кооперативные игры соответственно).

В) По характеру выигрышей игры делятся на игры с нулевой суммой и ненулевой суммой. В играх с нулевой суммой общий капитал игроков не меняется, а лишь перераспределяется в ходе игры, в связи с чем сумма выигрышей равна нулю (при этом проигрыш рассматривается как отрицательный выигрыш). В играх с ненулевой суммой сумма выигрышей отлична от нуля.

Г) По виду функции выигрыша игры делятся на матричные, биматричные и др. В матричных играх (при двух участниках) выигрыши первого игрока задаются матрицей, в биматричных - выигрыши каждого игрока задаются своей матрицей.

Д) По количеству ходов игры делятся на одноходовые (выигрыш распределяется после одного хода каждого игрока) и многоходовые (выигрыш распределяется после нескольких ходов).

Стратегия игрока называется оптимальной, если она обеспечивает данному игроку при многократном повторении игры максимально возможный средний выигрыш или минимально возможный средний проигрыш, независимо от поведения противника.

В дальнейшем мы ограничимся рассмотрением парных матричных игр с нулевой суммой. Задание стратегий двух игроков в парной игре такого типа полностью определяет ее исход, т.е. выигрыш одного или проигрыш другого. Как уже отмечалось, результаты конечной парной игры с нулевой суммой можно задавать матрицей, строки и столбцы которой соответствуют различным стратегиям 1-го и 2-го игроков соответственно, а ее элементы - выигрышам одной стороны (равные проигрышам другой). Эта матрица называется платежной матрицей или матрицей игры.

Матричные игры с нулевой суммой

Рассмотрим парную игру с нулевой суммой. Пусть игрок I имеет стратегий (1, 2,…,m), а игрок II - стратегий 1, 2,…, n). Такая игра называется матричной игрой размерности .

Предположим, игрок I выбрал одну из своих возможных стратегий (), а игрок II, не зная результата выбора игрока I, - стратегию ( ). Выигрыши игрока I и игрока II в результате выбора стратегий удовлетворяют соотношению ; таким образом, если ввести обозначение , то .

Элементы для каждой пары стратегий считаются известными и записываются в платежную матрицу (табл. 4.1), строки которой соответствуют стратегиям игрока I, а столбцы - стратегиям игрока II. Каждый положительный элемент матрицы определяет величину выигрыша игрока I и, соответственно, проигрыша игрока II при применении ими соответствующих стратегий. Естественно, целью игрока I является максимизация своего выигрыша, тогда как игрока II - минимизация своего проигрыша.

Таблица 4.1Платежная матрица парной игры с нулевой суммой

II

I

1

2

…

n

1

…

2

…

…

…

…

…

…

m

…

Решение парных матричных игр с нулевой суммой. Принцип минимакса

Используя платежную матрицу парной игры с нулевой суммой (табл. 4.1), определим наилучшую стратегию игрока I среди стратегий i ( i = ) и наилучшую стратегию игрока II среди стратегий j (j=).

В теории игр предполагается, что противники, участвующие в игре, одинаково разумны, и каждый из них делает все возможное для того достижения своей цели.

Проанализируем стратегии игрока I. Игрок I, выбирая стратегию , должен рассчитывать, что игрок II ответит на нее той из своих стратегий , для которой выигрыш игрока I будет минимальным. Найдем минимальное число в каждой строке матрицы и, обозначив его , запишем в добавочный столбец платежной матрицы (см. табл. 4.2):

. (4.1)

Зная числа (свои выигрыши при применении i-х стратегий и разумном ответе игрока II), игрок I должен выбрать такую стратегию, для которой максимально. Обозначив это максимальное значение как

(т.е. и используя (4.1), получим

(4.2)

Таблица 4.2

II

I

1

2

. . .

n

1

. . .

2

. . .

. . .

. . .

. . .

. . .

. . .

. . .

m

. . .

. . .

Величина представляет собой гарантированный выигрыш, который может обеспечить себе игрок I; она называется нижней ценой игры (максимином). Стратегия, обеспечивающая получение нижней цены игры , называется максиминной стратегией. Если игрок I будет придерживаться своей максиминной (перестраховочной) стратегии, то ему гарантирован выигрыш, не меньший при любом поведении игрока II.

В свою очередь, второй игрок стремится уменьшить свой проигрыш или, что то же самое, выигрыш игрока I обратить в минимум. В связи с этим, для выбора своей наилучшей стратегии он должен найти максимальное значение выигрыша игрока I в каждом из столбцов и среди этих значений выбрать наименьшее. Обозначим через максимальный элемент в каждом столбце и запишем эти элементы в дополнительной строке табл. 4.2. Наименьшее значение среди обозначим через ; эта величина представляет собой верхнюю цену игры (минимакс), которая определяется по формуле

. (4.3)

Стратегия игрока II, обеспечивающая «выигрыш» , является его минимаксной стратегией. Выбор минимаксной стратегии игроком II гарантирует ему проигрыш не больше .

В теории игр доказывается, что для нижней и верхней цены игры всегда справедливо неравенство

Игры, для которых нижняя цена равна верхней, т.е. , называются играми с седловой точкой.

Общее значение нижней и верхней цены игры в играх с седловой точкой называется чистой ценой игры , а стратегии , позволяющие достичь этого значения, - оптимальными чистыми стратегиями; элемент = является одновременно минимальным в i-й строке и максимальным в j-м столбце. Оптимальные стратегии определяют в игре положение равновесия, поскольку каждому из игроков невыгодно отходить от своей оптимальной стратегии. Чистую цену игры в игре с седловой точкой игрок I не может увеличить, а игрок II _ уменьшить. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Игры без седловых точек

Итак, если матрица игры содержит седловую точку, то ее решение находится по принципу минимакса. Рассмотрим методику решения игры, в платежной матрице которой отсутствует седловая точка. Применение минимаксных стратегий каждым из игроков обеспечивает первому выигрыш не меньше , а второму проигрыш не больше. Учитывая, что <, естественно для игрока I желание увеличить выигрыш, а для игрока II - уменьшить проигрыш. Поиск такого решения приводит к применению сложной стратегии, состоящей в случайном применении двух и более чистых стратегий с определенными вероятностями. Такая сложная стратегия в теории игр называется смешанной. Смешанные стратегии игроков I и II будем обозначать, соответственно,

и

где , _ вероятности применения соответствующих чистых стратегий. Очевидно, должны выполняться условия нормировки для вероятностей

Одна из основных теорем теории игр утверждает, что любая конечная игра двух лиц с нулевой суммой имеет, по крайней мере, одно решение, возможно, в смешанных стратегиях. Из этой теоремы следует, что каждая конечная игра имеет цену. Обозначим ее так же, как чистую цену игры, через . Цена игры - средний выигрыш, приходящийся на одну партию, - всегда удовлетворяет условию , т.е. лежит между нижней () и верхней () ценами игры. Следовательно, каждый игрок при многократном повторении игры, придерживаясь смешанных стратегий, получает более выгодный для себя результат. Оптимальное решение игры в смешанных стратегиях, так же как и решение в чистых стратегиях, характеризуется тем, что каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии, если его противник применяет оптимальную смешанную стратегию, так как это ему невыгодно.

Стратегии игроков, входящие в их оптимальные смешанные стратегии, называются активными.

Использование линейной оптимизации при решении
матричных игр

Пусть игра не имеет оптимального решения в чистых стратегиях, т.е. седловая точка отсутствует .

Будем считать, что все элементы платежной матрицы неотрицательны (если это не так, то можно ко всем элементам матрицы добавить некоторое число L, переводящее платежи в область неотрицательных значений - очевидно, при этом цена игры увеличится на L, а решение задачи не изменится). Таким образом, предполагаем, что >0.

Будем искать решение игры в смешанных стратегиях

;

Применение игроком I оптимальной смешанной стратегии гарантирует ему, независимо от поведения игрока II, выигрыш, не меньший цены игры .

Пусть игрок II применяет свою активную чистую j-ю стратегию, а игрок I - свою оптимальную стратегию . Тогда средний выигрыш игрока I будет равен

Учитывая, что не может быть меньше , запишем условия:

Разделив левую и правую части каждого из неравенств (4.4) на цену игры >0, получим

(4.5)

При использовании обозначений

(4.6)

неравенства (4.5) примут вид

где, очевидно, все , так как .

Из равенства

и в силу определения (4.6) следует, что переменные () удовлетворяют условию

Учитывая, что игрок I стремится максимизировать , получаем линейную функцию

(4.8)

Таким образом, задача решения игры свелась к следующей задаче линейной оптимизации: найти неотрицательные значения переменных

минимизирующие линейную функцию (4.8) и удовлетворяющие ограничениям (4.7).

Из решения задачи линейной оптимизации легко найти цену игры и оптимальную стратегию игрока I:

В свою очередь, оптимальная стратегия игрока II

может быть найдена из выражения

где - неотрицательные переменные задачи линейной оптимизации

которая является двойственной по отношению к задаче, представленной условиями (4.7) и (4.8).

В этой системе неравенств переменные

Таким образом, оптимальные стратегии

и

игры с платежной матрицей () могут быть найдены путем решения симметричной пары двойственных задач линейной оптимизации.

Исходная задача Двойственная задача

Цена игры и вероятности применения стратегий игроками I и II равны

Решение матричных игр в смешанных стратегиях с помощью Excel

Как уже отмечалось, любая парная игра с нулевой суммой может быть сведена к решению задачи линейной оптимизации. Используя значение функции и неизвестных взаимно двойственных задач линейной оптимизации, легко найти цену игры и вероятности применения стратегий каждым из игроков.

Пример 1

В качестве примера применения информационных технологий Excel найдем решение парной игры с платежной матрицей

II

I

1

2

3

4

1

24

20

18

21

2

19

22

24

20

3

14

16

20

25

Решение

Для данной задачи (седловая точка отсутствует). Запишем пару двойственных задач линейной оптимизации для решения игры.

Решим исходную и двойственную задачи с помощью Excel.

Внесем данные на рабочий лист в соответствии с Рис. 4.1.

матричный игра решение линейный

Рис. 4.1. Данные для решения исходной задачи примера 1

В ячейки E3:E6 введем формулы для расчета функций - ограничений, ячейки B9:D9 отведем для переменных , ячейку B15 - для расчетного значения цены игры , диапазон ячеек F12:H12 - для расчетных значений вероятностей применения стратегий игроком I, и, наконец, ячейку F9 - для расчета целевой функции. Введем все необходимые формулы в соответствующие ячейки. Установим все необходимые ограничения исходной задачи перед запуском Поиска решения. С помощью Поиска решения получим следующий ответ

Таким образом, оптимальная смешанная стратегия игрока I:

Решим двойственную задачу. Во избежание возможных ошибок расположим данные для ее решения на отдельном рабочем листе Excel (Рис. 4.2.).

Рис. 4.2 Данные для решения двойственной задачи примера 1

Ввод данных и формул производится аналогично предыдущему случаю. Поиск решения дает ответ:

U?

0,0026

Q1=U1*?

0,0541

ЦФ

U?

0,0195

Q2=U2*?

0,4054

0,048177

U?

0,0000

Q3=U3*?

0,0000

?

U?

0,0260

Q4=U4*?

0,5405

20,75676

Таким образом, оптимальная смешанная стратегия игрока II есть

.

Игры с природой

В рассматриваемых ранее стратегических играх принимают участие противоборствующие стороны. Однако имеется обширный класс задач, в которых неопределенность, сопровождающая любое действие, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Природа (игрок II) рассматривается при этом как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. Часто задачи такого рода называют задачами теории статистических решений.

Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть первому игроку (ЛПР) необходимо выполнить операцию в недостаточно известной обстановке, относительно состояний которой можно сделать п предположений. Эти предположения П1, П2,..., Пn рассматриваются как стратегии природы. Первый игрок может использовать возможных стратегий

Выигрыши игрока I при каждой паре стратегий и предполагаются известными и задаются платежной матрицей

Цель первого игрока (ЛПР) - определение такой стратегии (чистой или смешанной), которая обеспечила бы ему наибольший выигрыш.

При рассмотрении задачи игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

Максимальный выигрыш в j-м столбце обозначается через

, ().

Риск игрока при применении им стратегии в условиях равен

, ().

Матрица рисков

часто позволяет лучше охарактеризовать неопределенную ситуацию, чем матрица выигрышей.

Критерии, используемые для принятия решений в играх с природой

Критерии, основанные на известных вероятностях стратегий природы

Иногда неопределенность ситуации удается в некоторой степени ослабить с помощью нахождения вероятностей состояний на базе данных статистических наблюдений.

Пусть вероятности состояний природы известны

Если - среднее значение (математическое ожидание) выигрыша, которое игрок I стремится максимизировать, то:

В качестве оптимальной стратегии выбирается та из стратегий , которая соответствует максимальному среднему значению выигрыша:

. (4.9)

Оптимальную стратегию при известных вероятностях состояний природы можно найти, используя показатель риска. Для этого необходимо определить среднее значение риска:

В качестве оптимальной стратегии в данном случае выбирается та, которая обеспечивает минимальное среднее значение риска

.

Легко показать, что применение критериев среднего выигрыша и среднего риска для одних и тех же исходных данных приводит к одному и тому же результату, т.е. оптимальная стратегия, полученная при применении критерия оптимизации среднего выигрыша, совпадает с оптимальной стратегией, полученной по критерию минимизации среднего риска.

Чрезвычайно существенно то обстоятельство, что в случае известных вероятностей состояний природы , игроку I нет смысла пользоваться смешанными стратегиями.

Предыдущее рассмотрение относилось к случаю, когда вероятности состояний природы известны. Если объективные оценки вероятностей состояний получить невозможно, то они могут быть оценены субъективно на основе:

· принципа недостаточного основания Лапласа

который применяется тогда, когда ни одно состояние природы нельзя предпочесть другому;

· убывающей арифметической прогрессии - в том случае, если можно расположить состояния природы в порядке убывания их правдоподобности (вероятности свершения):

,

где:

· использования оценки группы экспертов (например, в случае, когда необходимо оценить вероятности различных погодных условий, можно использовать данные метеорологических наблюдений за длительный период времени).

Рассмотрим использование информационных технологий поиска оптимальных стратегий в играх с природой для случая известных вероятностей ее состояний.

Пример 2

Имеется три участка земли, отличающихся по степени влажности. Возможные стратегии сельскохозяйственного предприятия

состоят в том, что оно может высаживать некоторую культуру на участках 1, 2 или 3. Урожайность на любом из трех участков, естественно, зависит от количества осадков, выпавших в период вегетации. Обозначим возможные варианты погодных условий (стратегии природы) через П1, П2 и П3, где П1 - соответствует выпадению осадков ниже нормы, П2 - нормальному количеству осадков, и П3 - количеству осадков ниже нормы.

Выигрыш сельскохозяйственного предприятия естественно ассоциировать с урожайностью культуры с 1 гектара. Платежная матрица, т.е. совокупность значений урожайности для каждой стратегии предприятия и природы, приведена ниже.

Платежная матрица примера 2

П1

П2

П3

A1

220

200

110

A2

200

230

150

A3

130

240

260

Пусть на основе обработки многолетних статистических данных о погодных условиях в данном регионе получены следующие значения вероятностей засушливого, нормального по количеству осадков и дождливого сезонов

Требуется выбрать стратегию, обеспечивающую максимальный средний выигрыш (максимальный средний урожай).

Решение

Введем данные на рабочий лист в соответствии с Рис. 4.3.

Рис. 4.3. Данные для решения примера 2.

В ячейку E3 введем формулу для определения среднего выигрыша

=СУММПРОИЗВ(B3:D3;$B$13:$D$13)

и скопируем ее в ячейки E4, E5. В ячейку E6 введем формулу для определения максимального среднего выигрыша =МАКС(E3:E5); наконец, в ячейку E7 введем логическую функцию, с помощью которой будет автоматически определяться оптимальная стратегия поведения предприятия:

=ЕСЛИ(И(E3>E4;E3>E5);A3;ЕСЛИ(И(E4>E3;E4>E5);A4;A5))

В результате получим следующее решение задачи

Стратегия сельскохозяйственного предприятия

П₁

П₂

П₃

Средний выигрыш (средняя урожайность)

A₁

220

200

110

175,3

A₂

200

230

150

196,1

A₃

130

240

260

219,1

Максимальный средний выигрыш

219,1

Оптимальная стратегия

A3

В условиях полной неопределенности, в отличие от только что рассмотренного случая, используется ряд критериев, не требующих знания вероятностей состояний природы. Наиболее широко используемыми являются при этом критерии Вальда, Сэвиджа и Гурвица.

Критерий Вальда

Данный критерий базируется на принципе наибольшей осторожности и использует выбор наилучшей из наихудших стратегий (в связи с чем его относят к группе критериев крайнего пессимизма).

Если в исходной матрице (по условию задачи) результат представляет собой потери ЛПР, то при выборе оптимальной стратегии используется минимаксный критерий. В этом случае для определения оптимальной стратегии необходимо в каждой строке матрицы результатов найти наибольший элемент, а затем выбирается действие (строка), которому будет соответствовать наименьший элемент из этих наибольших элементов.

Наоборот, если в исходной матрице по условию задачи результат представляет выигрыш, то при выборе оптимальной стратегии используется максиминный критерий. Иначе говоря, в качестве оптимальной рекомендуется выбирать ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш,

Следует отметить, что критерий Вальда иногда приводит к нелогичным выводам вследствие своей чрезмерной “пессимистичности”, в связи с чем, часто при решении аналогичных задач используется близкий по смыслу критерий Сэвиджа.

Критерий Сэвиджа (минимаксного риска)

Данный критерий использует матрицу рисков. При использовании критерия Сэвиджа рекомендуется выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение:

(4.10)

Иначе говоря, данный критерий рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).

Критерий Гурвица

Критерий Гурвица устанавливает баланс между случаями крайнего пессимизма и крайнего оптимизма путем введения некоторых весовых коэффициентов и , где При этом предполагается, что природа может находиться в самом невыгодном для ЛПР состоянии с вероятностью и в самом выгодном - с вероятностью .

Этот критерий называют еще принципом пессимизма - оптимизма. Он может быть выражен в виде соотношения:

(4.11)

Очевидно, что при критерий Гурвица превращается в пессимистический критерий Вальда, а при - в критерий крайнего оптимизма. Значение выбирается в зависимости от склонности ЛПР к пессимизму или оптимизму, а также на основании опыта, здравого смысла и т.д.

Следует отметить, что выбор критерия принятия решений в условиях неопределенности является наиболее сложным и ответственным этапом в процессе принятия решения. При этом не существует каких-либо общих советов или рекомендаций. Выбор критерия должен производиться ЛПР, с учетом конкретной специфики решаемой задачи и в соответствии с его целями, на основе прошлого опыта и интуиции.

В частности, в случае, когда даже минимальный риск недопустим, следует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое предприятие столько средств, чтобы впоследствии не сожалеть о слишком малой величине вложений, то выбирают критерий Сэвиджа.

Оценка необходимости эксперимента в условиях неопределенности

Для любой экономической задачи, решаемой с помощью теории статистических игр (игр с природой), может быть определено абсолютно минимальное значение выигрыша, который ЛПР получит в наихудшей для себя ситуации. Эта величина может быть равна, например, сумме затрат на производство продукции при нулевой выручке от ее реализации, максимально возможным потерям, возникшим вследствие принятого решения и т.д. В процессе принятия решения для определения наиболее выгодной стратегии ЛПР необходима информация о вероятностях состояния природы (окружающей среды). В частности, повышение уровня информированности может быть достигнуто при обращении ЛПР к услугам консультационной службы, способной составить хорошо обоснованный прогноз развития ситуации. Можно рассматривать данное действие как своего рода “эксперимент”, проведение которого, несомненно, требует затраты определенных средств.

С экономической точки зрения эксперимент целесообразно проводить в том случае, если затраты на его проведение не превышают выигрыша, который можно получить при более точном знании стратегии природы. Рассмотрим решение проблемы, основанное на известных вероятностях состояний природы, которое гарантирует при многократном повторении игры в сходных условиях получение максимального в среднем выигрыша.

Пусть известны матрица выигрышей

игры с природой и вероятности различных состояний природы . Известны также затраты на проведение эксперимента, которые составляют руб.

Если эксперимент не проводится, то средний выигрыш игрока I определяется выражением

Пусть эксперимент проведен, и выяснено действительное состояние природы. Если этим состоянием оказалось , то выигрыш первого игрока

если , то выигрыш

и т.д.

Наконец, при действительном состоянии природы выигрыш игрока I

Если истинное состояние природы неизвестно, то гипотетический средний выигрыш игрока I находится из выражения

Таким образом, условие целесообразности проведения эксперимента можно записать в виде

Если данное условие не выполняется, то эксперимент проводить нецелесообразно и в качестве оптимальной стратегии следует выбирать ту, для которой средний риск минимален.

Пример 3

Матрица выигрышей игры с природой приведена ниже. Вероятности состояний природы

известны и равны соответственно

Затраты на проведение эксперимента для выяснения условий, в которых будет осуществляться операция, составляют 0,8 млрд. руб. Необходимо определить целесообразность проведения эксперимента в предположении, что он позволяет точно определить состояние природы , при котором будет осуществляться операция.

Матрица выигрышей для примера 3.

II

I

А1

4

1

2

5

А2

3

2

0

4

А3

0

3

2

5

Решение

Введем данные на рабочий лист в соответствии с Рис. 4.4

Рис. 4.4 Данные для решения примера 3

Введем необходимые формулы для расчета введенных выше параметров . В ячейку F2 введем формулу

=СУММПРОИЗВ(B2:E2;$B$8:$E$8)

и скопируем ее в ячейки F3, F4. В ячейку F5 введем формулу для расчета максимального из чисел в столбце F: =МАКС(F2:F4), а в ячейки B5:E5 - формулы для определения максимальных значений чисел в соответствующих столбцах.

В ячейку E11 введем формулу для расчета параметра (=СУММПРОИЗВ(B5:E5;B8:E8)), а в ячейку F11 формулу, осуществляющую связь с ячейкой F5 (=F5). В ячейке G11 рассчитаем разность

В ячейку E14 (под надписью Рекомендация), введем формулу

=ЕСЛИ(G11>A11;A15;A16)

для того, чтобы автоматизировать процесс получения рекомендации о целесообразности эксперимента.

В результате получим ответ

Стратегия

П₁

П₂

П₃

П₄

Выигрыш

A₁

4

1

2

5

3,55

A₂

3

2

0

4

2,65

A₃

0

3

2

5

2,85

4

3

2

5

3,55

q₁

q₂

q₃

q₄

0,25

0,15

0,2

0,4

Затраты на проведение эксперимента (С)

разность

0,8

3,85

3,55

0,3

Рекомендация

Эксперимент производить нецелесообразно

Так как затраты на проведение эксперимента превосходят величину выигрыша, то в данном случае эксперимент проводить нецелесообразно.

Пример 4

Торговое предприятие планирует продажу сезонных товаров с учетом возможных вариантов поведения покупательского спроса

()

Предприятием разработано три хозяйственных стратегии продажи товаров

().

Требуется найти оптимальное поведение торгового предприятия, пользуясь критериями Вальда, Гурвица (при ) и Сэвиджа, если товарооборот, зависящий от стратегий предприятия и покупательского спроса представлен в виде следующей платежной матрицы.

Платежная матрица примера 4

А1

280

140

210

245

А2

420

560

140

280

А3

245

315

350

490

Решение

Введем данные на рабочий лист в соответствии с Рис. 4.5 (а,б).

Рассмотрим вначале поиск оптимальных стратегий по критериям Вальда и Гурвица.

Критерий Вальда. Введем в ячейку F5 формулу для нахождения минимального значения строки 5 (=МИН(B5:E5)) и скопируем данную функцию в ячейки F6, F7. В ячейку F8 введем формулу для нахождения максимального из значений ячеек F5:F7 (=МАКС(F5:F7)). В ячейку F9 введем логическую функцию, позволяющую автоматизировать процесс поиска оптимальной стратегии по методу Вальда:

=ЕСЛИ(И(F5>F6;F5>F7);A5;ЕСЛИ(И(F6>F5;F6>F7);A6;A7))

Критерий Гурвица. Введем в ячейку F15 формулу для нахождения произведения минимального из значений строки 15 на параметр (=МИН(B15:E15)*$A$22) и скопируем ее в ячейки F16, F17. В ячейку G15 введем формулу для расчета произведения максимального из значений ячеек строки 15 на (=МАКС(B15:E15)*$B$22) и скопируем эту формулу в ячейки G16:G17.

Рис. 4.5 (а). Данные для решения примера 3
(критерии Вальда и Гурвица)

В ячейке H15 разместим формулу для суммы значений, находящихся в ячейках F15, G15 и скопируем ее в ячейки H16:H17. В ячейку H18 введем формулу для нахождения наибольшего из значений в ячейках H15:H17 (=МАКС(H15:H17)). В ячейку H19 введем логическую функцию

=ЕСЛИ(И(H15>H16;H15>H17);A15;ЕСЛИ(И(H16>H15;H16>H17);A16;A17))

Критерий Сэвиджа. Введем данные в соответствии с Рис. 3.5(б).

Вначале рассчитаем и разместим в ячейках B38:E40 матрицу рисков. В ячейку B32 введем формулу =МАКС(B29:B31) и скопируем ее в ячейки C32:E32. Введем в ячейку B38 формулу =B$32-B29 и скопируем эту формулу в диапазон ячеек B38:E40. В ячейку F38 введем формулу =МАКС(B38:E38) и скопируем ее в ячейки F39:F40.

Рис. 4.5(б). Данные для решения примера 3 (критерий Сэвиджа)

В ячейку 41 введем формулу для расчета минимального риска =МИН(F38:F40), а в ячейку F42 - логическую функцию, имеющую следующий вид:

=ЕСЛИ(И(F38<F39;F38<F40);A38;ЕСЛИ(И(F39<F38;F39<F40);A39;A40)

Очевидно, данная логическая функция позволяет автоматизировать процесс выбора оптимальной стратегии при применении рассматриваемого критерия.

Результат поиска оптимальных стратегий по всем трем критериям приводится на следующей странице.

Характерной особенностью игровых методов теории принятия решений является относительная простота нахождения оптимальных стратегий выбора. Применительно к информационным технологиям на базе Excel это выражается в отсутствии необходимости использования пакета Поиск решения.

Критерий Вальда

Стратегии

Покупательский спрос

П1

П2

П3

П4

A1

280

140

210

245

140

A2

420

560

140

280

140

A3

245

315

350

490

245

Выигрыш

245

Оптимальная стратегия

A3

Критерий Гурвица

Стратегии

Покупательский спрос

П1

П2

П3

П4

A1

280

140

210

245

56

168

224

A2

420

560

140

280

56

336

392

A3

245

315

350

490

98

294

392

Выигрыш

392

Оптимальная стратегия

A3

?=

???=

0,4

0,6

Критерий Сэвиджа

Стратегии

Покупательский спрос

П1

П2

П3

П4

A1

280

140

210

245

A2

420

560

140

280

A3

245

315

350

490

?_j

420

560

350

490

Стратегии

Покупательский спрос

П1

П2

П3

П4

A1

140

420

140

245

420

A2

0

0

210

210

210

A3

175

245

0

0

245

Риск предприятия r =

210

Оптимальная стратегия

A2

Размещено на Allbest.ru

контрольная работа "Информационные технологии теории игр" скачать

Подобные документы

Методы решения матричных игр
Основы теории матричных игр. Причины неопределенности результата. Смешанные стратегии в матричных играх. Свойства решений. Определение смешанных стратегий с использованием геометрической интерпретации. Нахождение неотрицательных решений неравенств.

контрольная работа [132,8 K], добавлен 13.04.2014

Методы решения матричных и статистических игр
Элементы теории матричных игр. Способы решения матричных игр. Различия в подходах критериев оптимальности при определении оптимальной стратегии в условиях статистической неопределенности. Нахождение седловой точки игры. Графическое решение матричной игры.

контрольная работа [366,9 K], добавлен 12.05.2014

Теория игр
Основные положения теории игр. Терминология и классификация игр. Решение матричных игр в чистых и в смешанных стратегиях. Сведение матричной игры к задаче линейного программирования. Применение теории игр в задачах экономико-математического моделирования.

курсовая работа [184,5 K], добавлен 12.12.2013

Проверка гипотез, связанных с коэффициентами регрессии
Понятие нулевой и альтернативной гипотез. Обычная процедура принятия решений. Область принятия гипотезы. Гипотетическое распределение, область принятия и распределения в действительности. Области и вероятность совершения ошибки при принятии решения.

презентация [61,3 K], добавлен 20.01.2015

Измерительные шкалы в математическом моделировании. Теория принятия решений
Понятие измерительной шкалы и их виды в математическом моделировании: шкала наименований (полинальная), порядковая, интервальная и шкала отношений. Статистические меры, допустимые для разных типов шкал. Основные положения теории принятия решений.

контрольная работа [21,7 K], добавлен 16.02.2011

Оптимизационные модели принятия решений
Использование информационных технологий при решении задач нелинейной оптимизации. Определение оптимального ассортимента продукции. Линейные модели оптимизации в управлении. Использование мощностей оборудования. Размещение проектов на предприятиях.

контрольная работа [560,8 K], добавлен 14.02.2011

Принятие решений в условиях неопределенности
Теория статистических решений как поиск оптимального недетерминированного поведения в условиях неопределенности. Критерии принятия решений Лапласа, минимаксный, Сэвиджа, Гурвица и различия между ними. Математические средства описания неопределенностей.

контрольная работа [66,0 K], добавлен 25.03.2009

Принятие решений в условиях неполной информации
Статистические модели принятия решений. Описание моделей с известным распределением вероятностей состояния среды. Рассмотрение простейшей схемы динамического процесса принятия решений. Проведение расчета вероятности произведенной модификации предприятия.

контрольная работа [383,0 K], добавлен 07.11.2011

Задачи принятия решений в условиях неполной определённости
Решение задач при помощи пакета прикладных программ MatLab. Загрузка в MatLab матриц A и P. Нахождение оптимальной стратегии для заданных матриц с использованием критериев принятия решений в условиях неопределённости Вальда, Гурвица, Лапласа, Сэвиджа.

лабораторная работа [80,2 K], добавлен 18.03.2015

Критерии принятия оптимальных решений
Принятие решений в условиях неопределенности. Критерий Лапласа и принцип недостаточного основания. Критерий крайнего пессимизма. Требования критерия Гурвица. Нахождение минимального риска по Сэвиджу. Выбор оптимальной стратегии при принятии решения.

контрольная работа [34,3 K], добавлен 01.02.2012

Другие документы, подобные "Информационные технологии теории игр"

главная

рубрики

по алфавиту

вернуться в начало страницы

вернуться к началу текста

вернуться к подобным работам

Рубрики

По алфавиту

Закачать файл

Заказать работу

весь список подобных работ

скачать работу можно здесь

сколько стоит заказать работу?

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.

II I	1	2	. . .	n
1			. . .
2			. . .
. . .	. . .	. . .	. . .	. . .	. . .
m			. . .
			. . .

U?	0,0026	Q1=U1*?	0,0541	ЦФ
U?	0,0195	Q2=U2*?	0,4054	0,048177
U?	0,0000	Q3=U3*?	0,0000	?
U?	0,0260	Q4=U4*?	0,5405	20,75676

Стратегия сельскохозяйственного предприятия	П₁	П₂	П₃	Средний выигрыш (средняя урожайность)
A₁	220	200	110	175,3
A₂	200	230	150	196,1
A₃	130	240	260	219,1
	Максимальный средний выигрыш	219,1
	Оптимальная стратегия	A3

Стратегия	П₁	П₂	П₃	П₄	Выигрыш
A₁	4	1	2	5	3,55
A₂	3	2	0	4	2,65
A₃	0	3	2	5	2,85
	4	3	2	5	3,55
	q₁	q₂	q₃	q₄
	0,25	0,15	0,2	0,4
Затраты на проведение эксперимента (С)						разность
0,8				3,85	3,55	0,3
				Рекомендация
				Эксперимент производить нецелесообразно

Критерий Вальда
Стратегии	Покупательский спрос
	П1	П2	П3	П4
A1	280	140	210	245	140
A2	420	560	140	280	140
A3	245	315	350	490	245
		Выигрыш	245
		Оптимальная стратегия	A3

Критерий Гурвица
Стратегии	Покупательский спрос
	П1	П2	П3	П4
A1	280	140	210	245	56	168	224
A2	420	560	140	280	56	336	392
A3	245	315	350	490	98	294	392
						Выигрыш	392
					Оптимальная стратегия	A3
?=	???=
0,4	0,6

Критерий Сэвиджа

Стратегии	Покупательский спрос
	П1	П2	П3	П4
A1	280	140	210	245
A2	420	560	140	280
A3	245	315	350	490
?_j	420	560	350	490

Стратегии	Покупательский спрос
	П1	П2	П3	П4
A1	140	420	140	245	420
A2	0	0	210	210	210
A3	175	245	0	0	245
		Риск предприятия r =	210
		Оптимальная стратегия	A2

Информационные технологии теории игр

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

ТЕМА

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ТЕОРИИ ИГР

Матричные игры с нулевой суммой

Рассмотрим парную игру с нулевой суммой. Пусть игрок I имеет стратегий (1, 2,…,m), а игрок II - стратегий 1, 2,…, n). Такая игра называется матричной игрой размерности .

Таблица 4.1Платежная матрица парной игры с нулевой суммой

Решение парных матричных игр с нулевой суммой. Принцип минимакса

В теории игр предполагается, что противники, участвующие в игре, одинаково разумны, и каждый из них делает все возможное для того достижения своей цели.

. (4.1)

(т.е. и используя (4.1), получим

(4.2)

Таблица 4.2

II

. (4.3)

Стратегия игрока II, обеспечивающая «выигрыш» , является его минимаксной стратегией. Выбор минимаксной стратегии игроком II гарантирует ему проигрыш не больше .

В теории игр доказывается, что для нижней и верхней цены игры всегда справедливо неравенство

Игры без седловых точек

и

где , _ вероятности применения соответствующих чистых стратегий. Очевидно, должны выполняться условия нормировки для вероятностей

Стратегии игроков, входящие в их оптимальные смешанные стратегии, называются активными.

Использование линейной оптимизации при решении матричных игр

Пусть игра не имеет оптимального решения в чистых стратегиях, т.е. седловая точка отсутствует .

Будем искать решение игры в смешанных стратегиях

;

Применение игроком I оптимальной смешанной стратегии гарантирует ему, независимо от поведения игрока II, выигрыш, не меньший цены игры .

Пусть игрок II применяет свою активную чистую j-ю стратегию, а игрок I - свою оптимальную стратегию . Тогда средний выигрыш игрока I будет равен

Учитывая, что не может быть меньше , запишем условия:

Разделив левую и правую части каждого из неравенств (4.4) на цену игры >0, получим

(4.5)

При использовании обозначений

(4.6)

неравенства (4.5) примут вид

Решение матричных игр в смешанных стратегиях с помощью Excel

Игры с природой

Выигрыши игрока I при каждой паре стратегий и предполагаются известными и задаются платежной матрицей

Цель первого игрока (ЛПР) - определение такой стратегии (чистой или смешанной), которая обеспечила бы ему наибольший выигрыш.

Максимальный выигрыш в j-м столбце обозначается через

, ().

Риск игрока при применении им стратегии в условиях равен

, ().

Матрица рисков

часто позволяет лучше охарактеризовать неопределенную ситуацию, чем матрица выигрышей.

Критерии, используемые для принятия решений в играх с природой

Критерии, основанные на известных вероятностях стратегий природы

Иногда неопределенность ситуации удается в некоторой степени ослабить с помощью нахождения вероятностей состояний на базе данных статистических наблюдений.

Пусть вероятности состояний природы известны

Критерий Вальда

Критерий Сэвиджа (минимаксного риска)

(4.10)

Критерий Гурвица

Этот критерий называют еще принципом пессимизма - оптимизма. Он может быть выражен в виде соотношения:

(4.11)

Оценка необходимости эксперимента в условиях неопределенности

Пусть известны матрица выигрышей

игры с природой и вероятности различных состояний природы . Известны также затраты на проведение эксперимента, которые составляют руб.

Если эксперимент не проводится, то средний выигрыш игрока I определяется выражением

Пусть эксперимент проведен, и выяснено действительное состояние природы. Если этим состоянием оказалось , то выигрыш первого игрока

если , то выигрыш

и т.д.

Наконец, при действительном состоянии природы выигрыш игрока I

Если истинное состояние природы неизвестно, то гипотетический средний выигрыш игрока I находится из выражения

Таким образом, условие целесообразности проведения эксперимента можно записать в виде

Пример 3

Матрица выигрышей игры с природой приведена ниже. Вероятности состояний природы

известны и равны соответственно

Матрица выигрышей для примера 3.

II

Решение

Введем данные на рабочий лист в соответствии с Рис. 4.4

Подобные документы

Использование линейной оптимизации при решении
матричных игр