Матричные антагонистические игры с нулевой суммой в чистых стратегиях
Принятие решений как особый вид человеческой деятельности. Рациональное представление матрицы игры. Примеры матричных игр в чистой и смешанной стратегиях. Исследование операций: взаимосвязь задач линейного программирования с теоретико-игровой моделью.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 05.05.2010 |
Размер файла | 326,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Теорема о принципе максимина.
Для с (где - множества чистых стратегий игроков, (х, у) - ситуация игры - функции полезности игроков, заданные на множестве ситуаций игры аналитически ) общего вида
.
Доказательство.
Для
Для игры, заданной матрицей выигрышей можно записать следующее равенство .
Скажем ещё несколько слов о матричных играх. Для матричных игр доказано, что любая из них имеет решение, и оно может быть легко найдено путем сведения игры к задаче линейного программирования.
Матричная игра игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков.
Первый игрок имеет m страте6гий i = 1,2,...m, второй имеет n стратегий j=1,2,...n. Каждой паре стратегий (i, j) поставлено в соответствии число a, выражающее выигрыш игрока 1 за счет игрока 2, если первый игрок примет свою i-ю стратегию, а 2-ю j-ю стратегию.
Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i=), 2- свою j-ю стратегию (j=) после чего игрок 1 получает выигрыш a за счет игрока 2 ( если a<0, то это значит, что игрок 1 платит второму сумму a). На этом игра заканчивается.
Каждая стратегия игрока i=; j= часто называется чистой стратегией.
Если рассмотреть матрицу
то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i- строки, а игроком 2 j-го столбца и получения игроком 1 (за счет игрока 2) выигрыша a.
Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие вкладывается следующий смысл: обеспечивается наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i (i=) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2
min a (i=)
j
т.е определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i=i, при которой этот минимальный выигрыш будет максимальным, т.е. находится
max min a = a = (1)
Определение: Число , определенное по формуле (1) называется чистой нижней ценой игры показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.
Игрок 2 при оптимальном своем поведении должен стремиться по возможности за счет своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается
max a
i
т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает свою j=j стратегию, при которой игрок 1 получит min выигрыш, т.е. находит
min max a=a= (2)
j i
Определение. Число , определяемое по формуле (2), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счет своих стратегий может себе гарантировать игрок 1.
Другими словами, применяя свои чистые стратегии, игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счет применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем .
Переходя к рациональному представлению матрицы игры, отметим, что стратегии двух игроков сводятся в таблицу, а непосредственно само представление упрощает поиск решения матричных игр.
ПРИМЕР 3: Провести SP-разбиение матрицы игры (Н)
X1 |
2 |
3 |
4 |
5 |
|
X2 |
1 |
4 |
0 |
5 |
|
X3 |
1 |
0 |
6 |
7 |
|
X4 |
1 |
2 |
3 |
4 |
|
Y1 |
Y2 |
Y3 |
Y4 |
2 |
3 |
4 |
5 |
2 |
||
1 |
4 |
0 |
5 |
0 |
||
1 |
0 |
6 |
7 |
0 |
||
1 |
2 |
3 |
4 |
1 |
||
2 |
4 |
6 |
7 |
Решение: вычисляем верхнюю и нижнюю цену игры
Исходная игра имеет SP (x1,y1) в чистых стратегиях. Существование SP в чистых стратегиях матричной игры с полной информацией позволяет провести SP-разбиение (Н) исходной игры:
.
Формирование SP- разбиения матричной игры с SP по существу и является рациональным представлением исходной матрицы (Н) игры. Значит, понятие рациональности представления матрицы игры преследует цель сформулировать методы рационального преобразования платёжной матрицы с целью вычисления цены игры v или упрощения построения подыгры-решения.
Далее рассмотрим такое понятие, как решение, при помощи фиктивного разыгрывания. Есть 2 игрока, которые без теории игр, хотят сделать игру несколько раз, причём каждый из них склонен к статистике и оценивает стратегию своего противника. При каждом разыгрывании противоборствующие стороны стремятся максимизировать свой ожидаемый выигрыш против наблюдаемого вероятностного распределения противника: если игрок 2 использует j-ю стратегию раз, то игрок 1 выберет i-ю стратегию, чтобы максимизировать . Аналогично, если игрок 1 использует i-ю стратегию раз, то игрок 2 выберет j-ю стратегию, чтобы минимизировать . Условно эмпирические распределения сходятся к оптимальным стратегиям. Точнее, пусть - число использований первым игроком i-ой стратегии в течение первых N розыгрышей. Пусть , то тогда является смешанной стратегией. Здесь справедливо утверждение о том, что предел любой сходящейся подпоследовательности является оптимальной стратегией, т.е. если и полученные стратегии игроков 1 и 2, то выполняется равенство . Такой метод полезен в случае игры с большим числом стратегий.
Опишем некоторые свойства решений матричных игр. Пусть G(X,Y,A) - игра двух лиц с нулевой суммой, в которой игрок 1 выбирает стратегию , а игрок 2 - , после чего игрок 1 получает выигрыш A=A(x,y) за счёт игрока 2.
Свойство 1: Если чистая стратегия одного из игроков содержится в спектре (спектр - множество чистых стратегий, вероятность которых положительна) некоторой его оптимальной стратегии, то выигрыш этого игрока в ситуации, образованной данной стратегией и любой оптимальной стратегией другого игрока, равен значению конечной антагонистической игры.
Свойство 2: Ни одна доминируемая чистая стратегия игрока не содержится в спектре его оптимальной стратегии.
Свойство 3: Если - конечная антагонистическая игра, а , подыгра игры G причём - чистая стратегия игрока 1 в игре G, доминируемая над некоторой стратегией , спектр которой не содержит . Тогда всякое решение игры является решением игры G.
Свойство 4: Тройка является решением игры <=>, когда является решением игры , где а - любое вещественное число, к>0
ГЛАВА 2. Игры с нулевой суммой в чистых стратегиях
2.1 Вычисление оптимальных стратегий на примере решения задач
Используя теорему о минимаксе, можно утверждать, что каждая антагонистическая игра имеет оптимальные стратегии.
Теорема: пусть А - матричная игра и строки данной матрицы являются доминирующими. Тогда игрок 1 имеет такую оптимальную стратегию х, что ; кроме того, любая оптимальная стратегия для игры, получающаяся в результате удаления доминирующих строк, будет также оптимальной для первоначальной игры.
Пример 1. Игра доминирования
Рассмотрим игру с матрицей . Здесь второй столбец доминирует 4 и игрок 2 соответственно не будет использовать 4 стратегию. Поэтому можно рассмотреть матрицу следующего вида . В этой матрице третья строка доминирует первую. При удалении получается матрица . А в этой матрице третий столбец доминируется вторым. Следовательно, исходная матрица сводится к следующей матрице .
Пример 2. Игра на уклонение.
Предполагается, что игроки выбирают целые числа i и j между 1 и n, а игрок 1 выигрывает величину , т.е. расстояние между i и j. Пусть первый игрок придерживается стратегии , тогда для всех (( - значение игры).
· Пусть нечётно, тогда игрок 2 имеет чистую стратегию для всех
· Предположим, что чётно, тогда игрок 2 имеет такую стратегию где , , , , , для всех . Теперь используя теорему можно убедиться, что значение игры . Игрок 1 имеет оптимальную стратегию , а оптимальная стратегия игрока 2 равна , если и если
Приведём теорему, по которой решалась эта игра. Теорема: для того, чтобы ситуация была равновесной в игре , а число - значение игры , необходимо и достаточно выполнение следующего неравенства. Для всех и : ).
Ситуация называется ситуацией равновесия в чистых стратегиях, если для любых выполнено двойное неравенство (*). Если каждый из игроков стремится достичь ситуации равновесия, то принцип, которому они следуют, называют принципом равновесия. Для игры, заданной матрицей равенство (т.е. верхнее значение игры равно нижнему значению) записывается в виде , а неравенство (*) - в виде , где чистые максиминная и минимаксная стратегии соответственно игроков I и I I.
Пример 3. Игра «Дуэль».
Два дуэлянта (игроки А и В) начинают сходиться в момент времени t=0. Встреча произойдёт в момент времени t=1. У каждого есть возможность выстрелить в любой момент времени. Если одному из них удастся выстрелить раньше соперника, то он становится победителем. Если же оба выстрелят одновременно, то дуэль закончится вничью. Если игрок А произведёт выстрел в момент времени x () то его выстрел будет успешным с вероятностью р(x). Подобным образом будет вероятным выстрел игрока В в момент времени y () c вероятностью q(y). При условии игрок А выиграет с вероятностью р(x), а проиграет с вероятностью (1- р(x)) q(y). Тем самым его средний выигрыш при будет равен . С другой стороны, если x> y, то его средний выигрыш будет равен . При x= y средний выигрыш . Таким образом, функция H(x,y) игрока А имеет вид
и антагонистическая игра задана. В частности, если игроки стреляют без промаха,
,
2.2 Примеры матричных игр в чистой и смешанной стратегиях Уменьшение порядка платёжной матрицы
Порядок платёжной матрицы (количество строк и столбцов) может быть уменьшен за счёт исключения доминируемых и дублирующих стратегий.
Стратегия K* называется доминируемой стратегией K**, если при любом варианте поведения противодействующего игрока выполняется соотношение
< ,,
где и - значения выигрышей при выборе игроком, соответственно, стратегий K* и K**.
В случае, если выполняется соотношение
= ,
стратегия K* называется дублирующей по отношению к стратегии K**.
Например, в матрице
B1 |
B2 |
B3 |
B4 |
B5 |
B6 |
||
A1 |
1 |
2 |
3 |
4 |
4 |
7 |
|
A2 |
7 |
6 |
5 |
4 |
4 |
8 |
|
A3 |
1 |
8 |
2 |
3 |
3 |
6 |
|
A4 |
8 |
1 |
3 |
2 |
2 |
5 |
Платёжная матрица с доминируемыми и дублирующими стратегиями. Стратегия A1 является доминируемой по отношению к стратегии A2, стратегия B6 является доминируемой по отношению к стратегиям B3, B4 и B5, а стратегия B5 является дублирующей по отношению к стратегии B4. Данные стратегии не будут выбраны игроками, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей.
Множество недоминируемых стратегий, полученных после уменьшения размерности платёжной матрицы, называется ещё множеством Парето (по имени итальянского экономиста Вильфредо Парето, занимавшегося исследованиями в данной области)
Пример решения матричной игры в чистых стратегиях
Рассмотрим пример решения матричной игры в чистых стратегиях, в условиях реальной экономики, в ситуации борьбы двух предприятий за рынок продукции региона.
Задача
Два предприятия производят продукцию и поставляют её на рынок региона. Они являются единственными поставщиками продукции в регион, поэтому полностью определяют рынок данной продукции в регионе.
Каждое из предприятий имеет возможность производить продукцию с применением одной из трёх различных технологий. В зависимости от качества продукции, произведённой по каждой технологии, предприятия могут установить цену единицы продукции на уровне 10, 6 и 2 денежных единиц соответственно. При этом предприятия имеют различные затраты на производство единицы продукции.
Затраты на единицу продукции, произведенной на предприятиях региона (д.е.).
Технология |
Цена реализации единицы продукции, д.е. |
Полная себестоимость единицы продукции, д.е. |
||
Предприятие 1 |
Предприятие 2 |
|||
I |
10 |
5 |
8 |
|
II |
6 |
3 |
4 |
|
III |
2 |
1.5 |
1 |
В результате маркетингового исследования рынка продукции региона была определена функция спроса на продукцию:
Y = 6 - 0.5X,
где Y - количество продукции, которое приобретёт население региона (тыс. ед.), а X - средняя цена продукции предприятий, д.е.
Данные о спросе на продукцию в зависимости от цен реализации приведены в таблице.
Спрос на продукцию в регионе, тыс. ед.
Цена реализации 1 ед. продукции, д.е. |
Средняя цена реализации 1 ед. продукции, д.е. |
Спрос на продукцию, тыс. ед. |
||
Предприятие 1 |
Предприятие 2 |
|||
10 |
10 |
10 |
1 |
|
10 |
6 |
8 |
2 |
|
10 |
2 |
6 |
3 |
|
6 |
10 |
8 |
2 |
|
6 |
6 |
6 |
3 |
|
6 |
2 |
4 |
4 |
|
2 |
10 |
6 |
3 |
|
2 |
6 |
4 |
4 |
|
2 |
2 |
2 |
5 |
Значения долей продукции предприятия 1, приобретенной населением, зависят от соотношения цен на продукцию предприятия 1 и предприятия 2. В результате маркетингового исследования эта зависимость установлена и значения вычислены.
Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию (табл. 1.1)
Цена реализации 1 ед. продукции, д.е. |
Доля продукции предприятия 1, купленной населением |
||
Предприятие 1 |
Предприятие 2 |
||
10 |
10 |
0,31 |
|
10 |
6 |
0,33 |
|
10 |
2 |
0,18 |
|
6 |
10 |
0,7 |
|
6 |
6 |
0,3 |
|
6 |
2 |
0,2 |
|
2 |
10 |
0,92 |
|
2 |
6 |
0,85 |
|
2 |
2 |
0,72 |
По условию задачи на рынке региона действует только 2 предприятия. Поэтому долю продукции второго предприятия, приобретённой населением, в зависимости от соотношения цен на продукцию можно определить как единица минус доля первого предприятия.
Стратегиями предприятий в данной задаче являются их решения относительно технологий производства продукции. Эти решения определяют себестоимость и цену реализации единицы продукции. В задаче необходимо определить:
1. Существует ли в данной задаче ситуация равновесия при выборе технологий производства продукции обоими предприятиями?
2. Существуют ли технологии, которые предприятия заведомо не будут выбирать вследствие невыгодности?
3. Сколько продукции будет реализовано в ситуации равновесия? Какое предприятие окажется в выигрышном положении?
Решение задачи
1. Определим экономический смысл коэффициентов выигрышей в платёжной матрице задачи. Каждое предприятие стремится к максимизации прибыли от производства продукции. Но кроме того, в данном случае предприятия ведут борьбу за рынок продукции в регионе. При этом выигрыш одного предприятия означает проигрыш другого. Такая задача может быть сведена к матричной игре с нулевой суммой. При этом коэффициентами выигрышей будут значения разницы прибыли предприятия 1 и предприятия 2 от производства продукции. В случае, если эта разница положительна, выигрывает предприятие 1, а в случае, если она отрицательна - предприятие2.
2. Рассчитаем коэффициенты выигрышей платёжной матрицы. Для этого необходимо определить значения прибыли предприятия 1 и предприятия 2 от производства продукции. Прибыль предприятия в данной задаче зависит:
- от цены и себестоимости продукции;
- от количества продукции, приобретаемой населением региона;
- от доли продукции, приобретённой населением у предприятия.
Таким образом, значения разницы прибыли предприятий, соответствующие коэффициентам платёжной матрицы, необходимо определить по формуле (1):
D = p(SR1-SC1) - (1-p) (SR2-SC2) (1),
где D - значение разницы прибыли от производства продукции предприятия 1 и предприятия 2;
p - доля продукции предприятия 1, приобретаемой населением региона;
S - количество продукции, приобретаемой населением региона;
R1 и R2 - цены реализации единицы продукции предприятиями 1 и 2;
C1 и C2 - полная себестоимость единицы продукции, произведённой на предприятиях 1 и 2.
Вычислим один из коэффициентов платёжной матрицы.
Пусть, например, предприятие 1 принимает решение о производстве продукции в соответствии с технологией III, а предприятие 2 - в соответствии с технологией II. Тогда цена реализации единицы. продукции для предприятия 1 составит 2 д.е. при себестоимости единицы. продукции 1,5 д.е. Для предприятия 2 цена реализации единицы. продукции составит 6 д.е. при себестоимости 4 д.е. (табл. 1.1).
Количество продукции, которое население региона приобретёт при средней цене 4 д.е., равно 4 тыс. ед. (таблица 1.2). Доля продукции, которую население приобретёт у предприятия 1, составит 0,85, а у предприятия 2 - 0,15 (табл. 1.3). Вычислим коэффициент платёжной матрицы a32 по формуле (1): a32 = 0,85(42-41,5) - 0,15(46-44) = 0,5 тыс. ед.
где i=3 - номер технологии первого предприятия, а j=2 - номер технологии второго предприятия.
Аналогично вычислим все коэффициенты платёжной матрицы. В платёжной матрице стратегии A1 - A3 - представляют собой решения о технологиях производства продукции предприятием 1, стратегии B1 - B3 - решения о технологиях производства продукции предприятием 2, коэффициенты выигрышей - разницу прибыли предприятия 1 и предприятия 2. Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».
B1 |
B2 |
B3 |
Minj |
||
A1 |
0,17 |
0,62 |
0,24 |
0.17 |
|
A2 |
3 |
-1,5 |
-0,8 |
-1.5 |
|
A3 |
0,9 |
0,5 |
0,4 |
0.4 |
|
Maxi |
3 |
0.62 |
0.4 |
В данной матрице нет ни доминируемых, ни дублирующих стратегий. Это значит, что для обоих предприятий нет заведомо невыгодных технологий производства продукции. Определим минимальные элементы строк матрицы. Для предприятия 1 каждый из этих элементов имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии. Минимальные элементы матрицы по строкам имеют значения: 0,17, -1,5, 0,4.
Определим максимальные элементы столбцов матрицы. Для предприятия 2 каждый из этих элементов также имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии. Максимальные элементы матрицы по столбцам имеют значения: 3, 0,62, 0,4.
Нижняя цена игры в матрице равна 0,4. Верхняя цена игры также равна 0,4. Таким образом, нижняя и верхняя цена игры в матрице совпадают. Это значит, что имеется технология производства продукции, которая является оптимальной для обоих предприятий в условиях данной задачи. Эта технология III, которая соответствует стратегиям A3 предприятия 1 и B3 предприятия 2. Стратегии A3 и B3 - чистые оптимальные стратегии в данной задаче.
Значение разницы прибыли предприятия 1 и предприятия 2 при выборе чистой оптимальной стратегии положительно. Это означает, что предприятие 1 выиграет в данной игре. Выигрыш предприятия 1 составит 0,4 тыс. д.е. При этом на рынке будет реализовано 5 тыс. ед. продукции (реализация равна спросу на продукцию, таблица 1.2).. Оба предприятия установят цену за единицу продукции в 2 д.е. При этом для первого предприятия полная себестоимость единицы продукции составит 1,5 д.е., а для второго - 1 д.е (таблица 1.1). Предприятие 1 окажется в выигрыше лишь за счёт высокой доли продукции, которую приобретёт у него население.
Смешанные стратегии в матричных играх
Понятие о матричных играх со смешанным расширением
Исследование в матричных играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры. Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.
Определение. Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей. Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.
Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.
Доказано, что для всех игр со смешанным расширением существует оптимальная смешанная стратегия, значение выигрыша при выборе которой находится в интервале между нижней и верхней ценой игры:
Vн V Vв.
При этом условии величина V называется ценой игры.
Кроме того, доказано, что, если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры V, независимо от того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий. Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии.
Решение матричных игр со смешанным расширением методами линейного программирования
Решение матричной игры со смешанным расширением - это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.
Для матричной игры, платёжная матрица которой показана на рис. 1.1, Vн Vв, определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2,…, pm) и для игрока 2 (q1, q2,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.
Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:
Для первого игрока:
Для второго игрока:
Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V - через yj.
Для игрока 1 получим следующую систему неравенств, из которой найдём значение 1/v:
Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение 1/V должно стремиться к минимуму.
Целевая функция задачи будет иметь следующий вид:
min Z = min 1/V = min (x1 + x2 + … + xm)
Для игрока 2 получим следующую систему неравенств, из которой найдём значение 1/v:
Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.
Целевая функция задачи будет иметь следующий вид:
Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина
V* = V + K
Для решения задач линейного программирования используется симплекс-метод. [1, 5].
В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных xi и yj.
Величина V* определяется по формуле: V* = 1/z
Значения вероятностей выбора стратегий определяются: для игрока 1: Pi = xiV*: для игрока 2: qi = yiV*.
Для определения цены игры V из величины V* необходимо вычесть число K.
Пример решения матричной игры со смешанным расширением
Рассмотрим пример решения матричной игры со смешанным расширением. Платёжную матрицу игры составим на основе исходных данных, заменив лишь значения долей продукции предприятия 1, приобретаемой населением в зависимости от соотношений цен (табл. 2.1).
Таблица 2.1 - Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию
Цена реализации 1 ед. продукции, д.е. |
Доля продукции предприятия 1, купленной населением |
||
Предп. 1 |
Предп. 2 |
||
10 |
10 |
0,31 |
|
10 |
6 |
0,33 |
|
10 |
2 |
0,18 |
|
6 |
10 |
0,7 |
|
6 |
6 |
0,3 |
|
6 |
2 |
0,2 |
|
2 |
10 |
0,9 |
|
2 |
6 |
0,85 |
|
2 |
2 |
0,69 |
Применив к исходным данным задачи формулу (1) определения разницы прибыли от производства продукции, получим следующую платёжную матрицу
Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона»
B1 |
B2 |
B3 |
minj |
||
A1 |
0,17 |
0,62 |
0,24 |
0.17 |
|
A2 |
3 |
-1,5 |
-0,8 |
-1.5 |
|
A3 |
0,75 |
0,5 |
0,175 |
0,175 |
|
maxi |
3 |
0.62 |
0.24 |
В данной матрице нет доминируемых или дублирующих стратегий. Нижняя цена игры равна 0,175, а верхняя цена игры равна 0,24. Нижняя цена игры не равна верхней. Поэтому решения в чистых стратегиях не существует и для каждого из игроков необходимо найти оптимальную смешанную стратегию.
Решение задачи
1. В данной матрице имеются отрицательные коэффициенты. Для соблюдения условия неотрицательности в задачах линейного программирования прибавим к каждому коэффициенту матрицы модуль минимального отрицательного коэффициента. В данной задаче к каждому коэффициенту матрицы необходимо прибавить число 1,5 - значение модуля наименьшего отрицательного элемента матрицы. Получим платёжную матрицу, преобразованную для выполнения условия неотрицательности
Платёжная матрица, преобразованная для выполнения условия неотрицательности
B1 |
B2 |
B3 |
||
A1 |
1,67 |
2,12 |
1,74 |
|
A2 |
4,5 |
0 |
0,7 |
|
A3 |
2,25 |
2 |
1,675 |
2. Опишем задачу линейного программирования для каждого игрока в виде системы линейных неравенств:
Для игрока 1:
1,67x1 + 4,5x2 + 2,25x3 1
2,12x1 + 0x2 + 2x3 1
1,74x1 + 0,7x2 + 1,675x3 1
x1 0; x2 0; x3 0
min Z = x1 + x2 + x3
Для игрока 2:
1,67y1 + 2,12y2 + 1,74y3 1
4,5y1 + 0y2 + 0,7y3 1
2,25y1 + 2y2 + 1,675y3 1
y1 0; y2 0; y3 0
max Z = y1 + y2 + y3
3. Решим обе задачи с использованием симплекс-метода, применяя программный комплекс "Линейная оптимизация".
В результате решения задачи получим следующие значения целевой функции и переменных:
Z = 0,5771
V* = 1/0,5771 = 1,7328
x1 = 0,5144; x2 = 0; x3 = 0,0626
y1 = 0,0582; y3 = 0,5189
4. Для определения значений вероятностей выбора стратегий игроков 1 и 2 умножим значения переменных на V*. P1 = x1V* = 0,8914, p2 =0, p3 = x3V* = 0,1083: q1 = y1V* = 0,1008, q2 = 0, q3 = y3V* = 0,8991.
5. Определим значение цены игры. Для этого из величины V* вычтем 1,5 (значение модуля наименьшего отрицательного элемента).
V = 1,7328 - 1,5 = 0,2328
Таким образом, в данной игре выиграет предприятие 1 (значение V > 0). Для достижения своей оптимальной стратегии (получения максимального математического ожидания гарантированного выигрыша) предприятие 1 должно выбирать технологию 1 с вероятностью 0,8914, а технологию 3 - с вероятностью 0,1083. Предприятие 2, соответственно, должно выбирать технологию 1 с вероятностью 0,1008, а технологию 3 - с вероятностью 0,8991. Значение математического ожидания выигрыша предприятия 1 составит 0,2328 тыс. д.е.
2.3 Исследование операций
Скажем несколько слов об основных методологических принципах Исследования операций:
· Системный подход. Его суть состоит в систематическом поиске существенных взаимодействий при оценке деятельности или стратегии любой части организации
· Комплексный научный коллектив. Необходимость привлечения к решению практических задач разных специалистов связана с требованием всестороннего подхода к проблеме
· Научный метод. Так как эксперимент в узком смысле этого слова невозможен, нужно заменить реальную действительность её научной моделью. Поэтому решение задач исследования операций при научном подходе сводится на практике к решению уравнений или систем уравнений при условии выполнения различных заданных критериев.
Назовём теперь основные этапы исследования операций:
· Содержательная постановка задачи
· Построение математической модели
· Решение задачи на модели
· Проверка адекватности модели
· Построение конкурирующего алгоритма
· Реализация решения
Несмотря на различное содержание задач, их физическую суть, математические постановки этих задач имеют много общего. В каждой из них требуется максимизировать или минимизировать некоторую линейную функцию нескольких переменных, ограничения, положенные на совокупность этих переменных являются либо линейными уравнениями, либо линейными неравенствами. Поэтому далее рассмотрим только математическую постановку задачи линейного программирования. К настоящему времени в литературе выделяют следующую классификацию ЗЛП (общая задача линейного программирования; каноническая целевая функция задачи линейного программирования; основная задача линейного программирования; основная задача линейного программирования с ограничениями - неравенствами) и их решений (допустимое решение; допустимое базисное решение; оптимальное решение).
Общая задача линейного программирования заключается в отыскании вектора (х1, х2,..., хn) максимизирующего (минимизирующего) критерий оптимальности (функцию цели задачи)
при ограничениях линейного типа в виде равенств:
в виде неравенств:
и ограничениях на переменные состояния:
Эта задача при наличии двух (или трех) переменных имеет наглядное геометрическое представление.
Пусть целевая функция имеет вид . Если на плоскости переменных и принимает некоторое постоянное значение то определяемое последним соотношением множество точек плоскости (,) является линией равного значения уровня (линией уровня) целевой функции. Причем, при = = 0 эта линия «сжимается» в точку (рис. 1), при имеем и линия равного уровня является прямой линией, проходящей через точки и
Рис. 1 - Геометрическое представление целевой функции
Операцией - называется всякое мероприятие (или система действий), объединенное единым замыслом, и направленное к достижению какой-то определённой цели. Операция всегда есть управляемое мероприятие, т.е. наблюдается зависимость, каким способом выбрать параметры, характеризующие её организацию. Всякий определённый выбор параметров называется решением. Оптимальными называются решения по тем или другим признакам предпочтительные перед другими.
В исследовании операций используется научный метод для изучения и объяснения явлений, связанных с функциональными системами, так как в рамках данной дисциплины изучается определенный круг явлений реальной действительности. Такие системы нередко включают людей и механизмы, которые действуют в условиях реального мира, причем слову «механизм» мы придаем достаточно общее значение, охватывающее все случаи - от механических устройств, обычно определяемых их названиями, до сложных социальных структур, функционирующих в соответствии с установленными правилами.
Научная дисциплина, называемая исследованием операций, наблюдает реальные явления, связанные с функциональными системами, разрабатывает теории (которые многие исследователи называют моделями), предназначенные для объяснения данных явлений, использует эти теории для описания того, что произойдет при изменении условий, и проверяет предсказания новыми наблюдениями.
Таким образом, исследование операций - наука, так как эта дисциплина использует научный метод для получения соответствующих знаний и отличается от других наук предметом исследований. Она изучает явления, связанные с функциональными системами, в том аспекте, который почти не рассматривается другими науками.
Учитывая этапы реализации научного метода, для любой научной дисциплины можно ожидать систематических публикаций четырех категорий, в которых соответственно приводятся результаты, получаемые при наблюдении явлений, и специальные способы проведения таких наблюдений. Даются построения математических моделей; описывается применение этих моделей для составления прогноза на основе полученных результатов; проводится проверка прогнозов путем сравнения с результатами новых наблюдений.
Во всяком случае, на протяжении всей истории развития методов исследования операций научные работники следовали рекомендациям Блеккета согласно которым, исследование операций, как и любая другая наука, не базируется на использовании точных копий аналитических методов какой-либо другой науки, а требует разработки своего собственного математического аппарата - методов исследований операций, ориентированного на специфику, присущую этой области и задачам исследования. Этот аппарат не должен оставаться неизменным; наоборот, он должен меняться в соответствии с характером исследуемых задач.
Довольно часто отправным моментом построения моделей служило сходство с моделями, используемыми другими науками. Таким образом, новые теоретические направления были развиты в основном в послевоенное время. Основы теории ведения боевых действий заложены Ланчестером в 1916г., и, хотя во время войны математические аспекты этой теории исследовались достаточно интенсивно, непосредственного применения при разработке операций военного времени она не нашла; действительно, вплоть до 1954г. Эта теория не была достаточно проверена.
Зарождение исследования операций как научной дисциплины было обусловлено неотложным требованием решения важных практических проблем. Поэтому в процессе становления исследования операции научные работники, которые занимались соответствующими исследованиями, не только заложили фундамент некоторого нового научного направления, но и использовали полученные знания для практического решения проблем. В течение второго и третьего десятилетий существования группы по исследованию операций значительно выросли и стали достаточно отличаться друг от друга по направлениям. Однако тесная связь между исследовательскими и практическими аспектами разработок оставалась характерной особенностью данной дисциплины: термин «исследование операций» как раз и подчеркивает их неразрывность. Итак, исследование операций включает как научное исследование систем, так и соответствующие виды технической деятельности, направленной на практическую реализацию результатов таких исследований.
Однако эти прикладные аспекты исследования операций предполагают не только простое применение знаний, полученных в результате использования теории, но требуют и наличие творческого начала (ориентации работы в желаемых направлениях), а также профессионального умения и навыков практического проектирования (направленных на выполнение требуемых задач или решение важных проблем). Кроме того, важно обеспечить внедрение результатов работ.
В исследовании операций немаловажную роль играют задачи, которые непосредственно вносят вклад в рациональное использование имеющихся в наличии ресурсов. Для примера рассмотрим подробное решение одной из задач.
Пример задачи о производстве красок Задача фирмы Reddy Mikks Небольшая фабрика фирмы Reddy Mikks изготовляет два вида красок: для внутренних (I) и наружных (E) работ. Продукция обоих видов поступает в оптовую продажу. Для производства красок используются два исходных продукта-А и В. Максимально возможные суточные запасы этих продуктов составляют 6 и 8 т соответственно. Расходы А и В на 1 т соответствующих красок и максимально возможный запас приведены в таблице.
Изучение рынка сбыта показало, что суточный спрос на краску I никогда не превышает спроса на краску Е более чем на 1 т. Кроме этого установлено, что спрос на краску I никогда не превышает 2 т в сутки. Оптовые цены одной тонны красок равны: 3 тыс. долл. для краски Е 2 тыс. долл. для краски I.
Какое количество краски каждого вида должна производить фабрика, чтобы доход от реализации продукции был максимальным?
Построение математической модели
Процесс построения математической модели для решения поставленной задачи можно начать с ответов на три следующие вопроса:
1. Для определения, каких величин должна быть построена модель?
2. Какие ограничения должны быть наложены на переменные, чтобы выполнялись условия, для моделируемой системы?
3. В чем состоит цель, для достижения которой из всех допустимых значений переменных нужно выбрать те, которые будут соответствовать оптимальному (наилучшему) решению задачи?
Отвечая на поставленные вопросы, сформулируем суть проблемы. Фирме требуется определить объемы производства (в тоннах) каждой из красок, который максимизирует доход (в тысячах долларов) от реализации продукции, с учетом ограничений на спрос и расход исходных продуктов.
Введем переменные: так как нужно определить объемы производства каждого вида краски, то переменными в модели являются
· xE - суточный объем производства краски Е (в тоннах)
· xI - суточный объем производства краски I (в тоннах).
Так как стоимость 1 т краски Е равна 3 тыс. долл., суточный доход от ее продажи составит 3 xE тыс. долл. Аналогично доход от реализации xI тонн краски I составит 2 xI тыс. долл. в сутки. При допущении независимости объемов сбыта каждой из красок можно дать следующую математическую формулировку целевой функции: определить (допустимые) значения xЕ и xI, максимизирующие величину общего дохода Ограничения: При решении рассматриваемой задачи должны быть учтены ограничения на расход исходных продуктов и спрос на изготовляемые краски. Ограничение на расход исходных продуктов можно записать следующим образом:
Это приводит к следующим двум ограничениям: (для А) (для В) Ограничения на величину спроса красок имеют вид
Эти ограничения имеют вид: (соотношение величин спроса на краску I и краску Е), (максимальная величина спроса на краску I). Переменные xI и xE не могут принимать отрицательных значений: (объем производства краски I), (объем производства краски Е). Итак, математическую модель можно записать следующим образом. Определить суточные объемы производства (xI и xE ) краски I и краски Е (в тоннах), при которых достигается (целевая функция) при ограничениях:
Что определяет линейный характер построенной модели? С формальных позиций данная модель является линейной потому, что все входящие в нее функции (ограничения и целевая функция) линейны. Линейность предполагает наличие двух свойств - пропорциональности и аддитивности.
1 Пропорциональность означает, что вклад каждой переменной хЕ и хI в целевую функцию прямо пропорционален этим переменным.
2 Аддитивность заключается в том, что целевая функция представляет собой сумму вкладов от различных переменных. Однако если фирма производит два конкурирующих вида продукции, увеличение сбыта одного из которых отрицательно сказывается на объеме реализации другого, то такая модель не обладает свойством аддитивности.
Задача о пищевом рационе.
Пусть имеется 4 вида продуктов: . Стоимость единицы каждого продукта . Согласно этим условиям, требуется составить пищевой рацион, в котором должны содержаться белки, в количестве не менее единиц, углеводов - не менее единиц, жиров - не менее единиц.
Составим таблицу.
продукт |
элементы |
продукт |
элементы |
|||||
Белки |
углеводы |
Жиры |
Белки |
углеводы |
Жиры |
|||
() - какие то определённые числа. Первый индекс указывает номер продукта, второй - номер элемента (белки, жиры углеводы). Требуется составить пищевой рацион таким образом, чтобы условия по белкам, жирам и углеводам были выполнены. Математическая модель будет выглядеть следующим образом: - количества продукции входящих в рацион. Показатель эффективности L - стоимость рациона (эту величину требуется минимизировать). Запишем линейную зависимость . Учитывая, что в одной единице продукта содержится единиц белка, в единицах - единиц белка, в единицах продукта содержится единиц белка и т.д. получим три неравенства: эти линейные неравенства представляют собой ограничения, накладываемые на элементы решения . Таким образом задача сводится к следующей: найти такие неотрицательные значения переменных , чтобы они удовлетворяли ограничениям - неравенствам и одновременно обращали в минимум линейную функцию этих переменных:
2.4 Математический аппарат теории игр и его применение к решению прикладных задач
Транспортная задача. Подобная задача возникает в своем простейшем варианте, когда речь идет о рациональной перевозке некоторого однородного продукта от производителей к потребителю. Поэтому здесь естественно возникает задача о наиболее рациональном прикреплении транспорта, правильном направлении перевозок груза, при котором полностью удовлетворяются потребности при минимальных затратах на транспортировку. Итак, задача формулируется следующим образом.
Имеется m пунктов производства с объемами производства в единицу времени аi, i= и n пунктов потребления bi, i= , естественно, что потребление не должно превышать возможностей производства ai bi, затраты на перевозку единицы продукции из i-го пункта производства в j-й пункт потребления составляют Сij, а количество перевезенного продукта xij.
Требуется составить такой план перевозок, при котором суммарные затраты на них были бы минимальны min Cij xij при условиях, что в каждый пункт потребления завозится требуемое количество продукта xij bj, j = , из каждого пункта производства вывозится не более произведенного количества продукта xij ai, = и перевозимый объем продукта не может быть отрицательным xij 0, i = , j = .
Рассмотрим далее транспортную задачу в частной постановке.
На двух станциях отправления и сосредоточено соответственно и единиц некоторого однородного груза. Этот груз следует доставить в три пункта назначения , , , причём в каждый из них должно быть завезено соответственно , , единиц этого груза. Стоимость перевозки единицы груза из пункта в пункт (равную ), считаем заданной. Все данные полезно представить в виде таблицы 2.2.
Таблица 2.2
Пункты назначения Пункты отправления |
Пункты назначения |
Запасы груза |
|||
Потребность в грузе |
Естественно считать, что общий запас грузов на станциях отправления равен суммарной потребности в этом грузе всех станций назначения. Следовательно
(1)
Требуется составить такой план перевозок, при котором их общая стоимость была бы наименьшей.
Обозначим через количество единиц груза, предназначенного к отправке из пункта в пункт . Тогда количество груза, который планируется к доставке в пункт из пунктов и составит
.
Но так как потребность в грузе в пункте равна , то должно выполняться равенство .
Аналогичные рассуждения приводят к равенствам
, .
С другой стороны, общее количество груза, отправленного со станции , выражается суммой , которая, очевидно, обязана совпадать с запасом груза , сосредоточенным на этой станции, т.е.
.
Подобно этому .
Полученные соотношения легче запомнить, если все величины свести в таблицу 2 (матрицу перевозок). Тогда легко проверить, что сумма всех , расположенных в -ой строке, равна запасу в пункте назначения . Сумма же всех из столбца равна потребности пункта назначения .
Таблица 2.3
Пункты назначения Пункты отправления |
Пункты назначения |
Запасы груза |
|||
Потребности |
Из условий задачи с очевидностью вытекает, что общая стоимость всех перевозок
Таким образом, математическая формулировка транспортной задачи (по критерию стоимости перевозок) такова.
Задана система
(2)
пяти линейных алгебраических уравнений с шестью переменными и линейная целевая функция
(3)
Требуется среди всех неотрицательных решений системы (2) выбрать такое, при котором целевая функция минимизируется (достигает наименьшего значения).
Необходимо отметить, что при решении транспортной задачи следует учитывать важное соотношение
(4)
вытекающего из самого условия задачи.
Впрочем, возможны и иные постановки транспортной задачи, когда условие (1а) не выполнено.
Задача о выборе производственной программы. Эта задача была одной из первых практических задач линейного программирования, решенная в 1939 году известным русским математиком Л.В.Канторовичем.
На m предприятиях нужно произвести n продуктов в заданном ассортименте l1, l2,..., ln. Если xij, i = , j = - рабочее время i-го предприятия, отводимое под j-й продукт, аij - производительность i-го предприятия в единицу времени по выпуску j-го продукта, то задача о выборе производственной программы для случая, когда продукция дефицитна, производственные мощности ограничены и должны использоваться максимально полно, ставится следующим образом.
Требуется составить программу работы предприятий - указать время хij, отведенное на производство каждого вида продукции на данном предприятии таким образом, чтобы получить максимальный суммарный объем продукции в заданном ассортименте в единицу времени, т.е. необходимо найти xij из условий, что время не может быть отрицательным xij > 0, сумма всех временных долей не превосходит полного времени работы предприятия xij 1, количество ассортиментных наборов продуктов максимально.
Подобные документы
Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.
контрольная работа [855,7 K], добавлен 01.06.2014Теория игр - математическая теория конфликтных ситуаций. Разработка математической модели игры двух лиц с нулевой суммой, ее реализация в виде программных кодов. Метод решения задачи. Входные и выходные данные. Программа, руководство пользователя.
курсовая работа [318,4 K], добавлен 17.08.2013Составление платежной матрицы, поиск нижней и верхней чисты цены игры, максиминной и минимаксной стратегии игроков. Упрощение платежной матрицы. Решение матричной игры с помощью сведения к задаче линейного программирования и надстройки "Поиск решения".
контрольная работа [1010,3 K], добавлен 10.11.2014Общее понятие вектора и векторного пространства, их свойства и дополнительные структуры. Графический метод в решении задачи линейного программирования, его особенности и область применения. Примеры решения экономических задач графическим способом.
курсовая работа [1,2 M], добавлен 14.11.2010Проектирование математической модели. Описание игры в крестики-нолики. Модель логической игры на основе булевой алгебры. Цифровые электронные устройства и разработка их математической модели. Игровой пульт, игровой контроллер, строка игрового поля.
курсовая работа [128,6 K], добавлен 28.06.2011Понятие равных матриц, их суммы и произведения. Нахождение элемента матрицы, свойства ее произведения. Расположение вне главной диагонали элементов квадратной матрицы. Понятие обратной матрицы, матричные уравнения. Теорема о базисном миноре, ранг матрицы.
реферат [105,3 K], добавлен 21.08.2009Теория игр – раздел математики, предметом которого является изучение математических моделей принятия оптимальных решений в условиях конфликта. Итеративный метод Брауна-Робинсона. Монотонный итеративный алгоритм решения матричных игр.
дипломная работа [81,0 K], добавлен 08.08.2007Изучение общих сведений о матричных и антагонистических играх. Понятие позиционной игры, дерева, информационного множества. Рассмотрение принципа максимина и принципа равновесия. Оптимальность по Парето. Позиционная неантагонистическая игра, ее свойства.
курсовая работа [1,4 M], добавлен 17.10.2014Знакомство с особенностями построения математических моделей задач линейного программирования. Характеристика проблем составления математической модели двойственной задачи, обзор дополнительных переменных. Рассмотрение основанных функций новых переменных.
задача [656,1 K], добавлен 01.06.2016Проектирование методов математического моделирования и оптимизации проектных решений. Использование кусочной интерполяции при решении задач строительства автомобильных дорог. Методы линейного программирования. Решение специальных транспортных задач.
методичка [690,6 K], добавлен 26.01.2015