Разработка программного обеспечения, реализующего математический аппарат теории игр

Теория игр: основные понятия, модели, принципы; элементарные приемы решения игр в "чистых" и "смешанных" стратегиях. Разработка алгоритма программного обеспечения, реализующего математический аппарат теории игр. Выбор инструмента программирования Delphi.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык немецкий
Дата добавления 27.03.2011
Размер файла 255,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Министерство обороны Российской Федерации

Военная академия войск радиационной, химической и биологической защиты и инженерных войск имени Маршала Советского Союза

С.К. Тимошенко

Дипломная работа

Разработка программного обеспечения, реализующего математический аппарат теории игр

Кострома 2010

Оглавление

Введение

Глава 1. Анализ математического аппарата и метода, используемых при решении задач теории игр

1.1 Основные понятия и элементарные приемы решения игр

1.2 Решение игр в «чистых» и «смешанных» стратегиях

1.3 Графическое решение игр

Глава 2. Разработка алгоритма программного обеспечения, реализующего математический аппарат теории игр

2.1 Основные понятия алгоритмизации

2.2 Разработка алгоритма

Глава 3. Разработка программного обеспечения, реализующего математический аппарат теории игр

3.1 Выбор инструмента программирования Delphi

3.2 Разработка программного обеспечения

Заключение

Список использованных источников

Приложение А

Перечень принятых сокращений

ПО - программное обеспечение

ГОСТ - государственный стандарт

ЭВМ - электронно-вычислительная машина

ТИ - теория игр

СП - среда программирования

Введение

Развитие любой теории представляет собой противоречивое единство специализации, дифференциации знания и тенденции к его интеграции. На данном этапе развития теории игр первая сторона превалирует над второй. Это обнаруживается, в частности, в литературе по разработке методологических вопросов теории, где больше исследований, в которых обсуждаются отдельные специальные аспекты игровой теории, и нет работ, рассматривающих теорию игр как единую, целостную теорию. В этих условиях появляется потребность в интеграции материала, необходимость сведения разностороннего содержания теории игр воедино для того, чтобы вычленить ее характеристики и основные положения, раскрывающие ее сущность. Эти проблемы подводят к главной и насущной задаче- создать единый мощный формализованный математический аппарат и поднять теорию игр на подлинно теоретический уровень. Однако достигнуть уровня теоретической зрелости теория игр сможет лишь тогда, когда будет осуществлен глубокий философский анализ предмета, основных идей, понятий, методов и результатов теории игр, когда по-настоящему будет осмыслена роль материалистической диалектики в теории игр как всеобщего и универсального метода познания действительности. Отдельные аспекты философских проблем рассматриваются в работах Н. Воробьева и Г. Клауса, где предпринимаются попытки их общего решения с рекомендациями на более углубленное рассмотрение этих вопросов.

В качестве основных направлений в разработке философских проблем теории игр, как Н. Воробьев, так и Г. Клаус берут проблемы всестороннего анализа адекватного отражения теоретико-игровыми моделями моделируемых ими явлений, а также диалектического противоречия, считая, что любая игра содержит в себе диалектическое противоречие конфликтных сторон. Объектом специального исследования стали принципы изучения конфликтов в теории игр в работах Г. Смоляна, который пытается подойти к анализу конфликта с несколько иных позиций, отличных от методологических позиций Воробьева и Клауса. Это связано, прежде всего, с потребностью исследования духовной деятельности людей, интеллектуальных, этических и психологических сторон этой деятельности, приобретающих в конфликтной ситуации резко очерченные формы. Подходя с психологических позиций к рефлексивному пониманию конфликта, Смолян приходит в своих работах к изображению конфликта как интеллектуального взаимодействия сторон, что является новой и важной стороной в системном представлении конфликта.

Весьма многообещающими для дальнейшего философского осмысления теории игр, представляются работы Х. Либшера. Он убедительно доказывает необходимость принципиальной философской основы при рассмотрении математической теории игр. Либшер считает, что пора приступать к созданию основ математической ТИ на базе марксистско-ленинской философии, что на сегодняшний день уже «создана возможность предварительной работы для преследующей математической разработки, и идейные посылки, лежащие в основе теории игр, позволяют также без всякой математики проникнуть в суть соответствующих конфликтных ситуаций и создать возможность принятия обоснованных решений». Одним из главнейших объектов теории игр является игра, одним из фундаментальнейших теоретико-игровых понятий, соответственно, понятие игры. Либшер указывает, что философский анализ построения теоретико-игровой модели должен включать в себя детальное исследование образования этого понятия. Это явится первым шагом в целостном теоретическом осмыслении предмета теории игр. Теория игр является результатом математизации целого ряда отраслей науки. В процессе становления конкретного понятия игры происходит формализация конфликта, благодаря которой изменяется понятийное содержание теории игр. Это изменение происходит как процесс конкретизации, «обогащения» основного понятия игры и требует анализа и модификации всей понятийной системы теории игр. Приоритет содержательного над формальным не сводится только к тому, что содержательные идеи и представления об игре предшествуют формальному исследованию конфликта. Формальное предполагает содержательное также в качестве средства построения и исследования своих собственных дедуктивных возможностей. Тут уже содержательное выступает своеобразным эталоном, от степени соответствия которому зависят в значительной мере достоинства формализованной теории игр. Теория игр на сегодняшний день представляет собой сеть различных классов теоретико-игровых моделей и принципов.

Глава 1. Анализ математического аппарата и метода, используемых при решении задач теории игр

1.1 Основные понятия и элементарные приемы решения игр

Теория игр - это математическая теория конфликтных ситуаций, т.е. таких ситуаций, в которых сталкиваются интересы двух или более сторон, преследующих различные цели. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу- в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учетом представлений о других участниках, их ресурсах и их возможных поступках. Чаще всего методы теории игр находят применение в экономике, чуть реже в других общественных науках - социологии, политологии, психологии, этике и других. Начиная 1970-х годов ее взяли на вооружение биологи для исследования поведения животных и теории эволюции. Очень важное значение она имеет для искусственного интеллекта и кибернетики, особенно с проявлением интереса к интеллектуальным агентам. Теория игр берет свое начало из неоклассической экономики. Впервые математические аспекты и приложения теории были изложены в классической книге 1944 года Джона Фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение». Эта область математики нашла некоторое отражение в общественной культуре. Из определения теории игр видно, что она рассматривает задачи, типичные для военного дела.

Игры представляют собой строго определенные математические объекты. Игра образуется игроками, набором стратегий для каждого игрока и указания выигрышей, или платежей, игроков для каждой комбинации стратегий. Большинство кооперативных игр описываются характеристической функцией, в то время как для остальных видов чаще используют нормальную или экстенсивную форму.

Игра «Ультиматум» в экстенсивной форме

Игра в экстенсивной, или расширенной форме представляются в виде ориентированного дерева, где каждая вершина соответствует ситуации выбора игроком своей стратегии. Каждому игроку сопоставлен целый уровень вершин. Платежи записываются внизу дерева, под каждой листовой вершиной.

Игра «Ультиматум»- игра для двух игроков. Игрок 1 ходит первым и выбирает стратегию F или U. Игрок 2 анализирует свою позицию и решает - выбрать стратегию А или R. Скорее всего первый игрок выберет U, а второй- А( для каждого из них это оптимальные стратегии); тогда они получат соответственно 8 и 2 очка.

Экстенсивная форма очень наглядна, с ее помощью особенно удобно представлять игры с более чем двумя игроками и игры с последовательными ходами. Если же участники делают одновременные ходы, то соответствующие вершины либо соединяются пунктиром, либо обводятся сплошной линией.

Нормальная форма игры

В нормальной, или стратегической, форме игра описывается платежной матрицей. Каждая сторона (точнее, измерение) матрицы- это игрок. Строки определяют стратегии первого игрока, а столбцы - второго. На пересечении двух стратегий можно увидеть выигрыши, которые получат игроки.

Пример:

Игрок 2 стратегия 1

Игрок 2 стратегия 2

Игрок 1 стратегия 1

4,3

-1,-1

Игрок 1 стратегия 2

0,0

3,4

Нормальная форма для игры с 2 игроками, у каждого из которых по 2 стратегии.

В данном примере, если игрок 1 выбирает первую стратегию, а второй игрок - вторую стратегию, то на пересечении видим (-1,-1), это значит, что в результате хода оба игрока потеряли по одному очку. Игроки выбирали стратегии с максимальным для себя результатом, но проиграли, из-за незнания хода другого игрока. Обычно в нормальной форме представляются игры, в которых ходы делаются одновременно, или хотя бы полагается, что все игроки не знают о том, что делают другие участники.

Кооперативная игра (математика)

Игра называется кооперативной, или коалиционной, если игроки могут объединяться в группы. Беря на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя. Примером такой игры может являться карточная игра в дурака «двое на двое» или «трое на трое», либо разыгрывание «втемную» виста в преферансе. Развлекательные игры редко являются кооперативными, однако такие механизмы нередки в повседневной жизни. Часто предполагают, что кооперативные игры отличаются именно возможностью общения игроков друг с другом. В общем случае это неверно. Существуют игры, где коммуникация разрешена, но игроки преследуют личные цели, и наоборот. Из двух типов игр, некооперативные описывают ситуации в мельчайших деталях и выдают более точные результаты. Кооперативные рассматривают процесс игры в целом. Попытки объединить два подхода дали немалые результаты. Так называемая программа Нэша уже нашла решение некоторых кооперативных игр как ситуации равновесия некооперативных игр. В теории игр равновесием Нэша (названным в честь Джона Форбса Нэша, который предложил его) называется тип решений игры двух или более игроков, в котором ни один участник не может увеличить выигрыш, изменив свое решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша. Концепция равновесия Нэша (PH) впервые использована не Нэшем; Антуан Огюст Курно показал, как найти то, что мы называем равновесием Нэша, в игре Курно. Соответственно, некоторые авторы называют его равновесием Нэша-Курно. Однако Нэш первым показал в своей диссертации некооперативные игры (1950), что равновесия Нэша должны существовать для всех конечных игр с любым числом игроков. До Нэша это было доказано только для игр с 2 участниками с нулевой суммой Джоном фон Нейманом и Оскаром Моргенштерном (1947).

Формальное определение:

Допустим, (S,f)- игра n лиц в нормальной форме, где S- набор чистых стратегий, а f- набор выигрышей. Когда каждый игрок i{1,…,n} выбирает стратегию хiSв профиле стратегий х=(х1,…,хn), игрок i получает выигрыш fi(x). Выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком i, но и от чужих стратегий. Профиль стратегий х* является равновесием по Нэшу, если изменение своей стратегии не выгодно ни одному игроку, то есть для любого i fi(x*)?fi(xi,x*-i).

Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешить смешанные стратегии, тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.

Гибридные игры включают в себя элементы кооперативных и некооперативных игр. Например, игроки могут образовывать группы, но игра будет вестись в некооперативном стиле. Это значит, что каждый игрок будет преследовать интересы своей группы, вместе с тем стараясь достичь личной выгоды. В кооперативных играх с трансферабельной полезностью, то есть возможностью передачи средств от одного игрока к другому, невозможно применять понятие индивидуальных платежей. Вместо этого используют так называемую характеристическую функцию, определяющую выигрыш каждой коалиции игроков. При этом предполагается, что выигрыш пустой коалиции равен нулю. Основания такого подхода можно найти еще в книге Фон Неймана и Моргенштерна. Изучая нормальную форму для коалиционных игр, они рассудили, что если в игре с двумя сторонами образуется коалиция С, то против нее выступает коалиция N/С. Образуется как бы игра для двух игроков. Но так как вариантов возможных коалиций много (а именно 2N, где N-количество игроков), то выигрыш для С будет некоторой характеристической величиной, зависящей от состава коалиции. Формально игра в такой форме (также называемая TU- игрой) представляется парой (N, v), где N- множество всех игроков, а v:2N>R- это характеристическая функция. Подобная форма представления может быть применена для всех игр, в том числе без трансферабельной полезности. В настоящее время существуют способы перевести любую игру из нормальной формы в характеристическую, но преобразование в обратную сторону возможно не во всех случаях.

Решение кооперативных игр:

В соответствии с определением кооперативной игры, множество игроков N в совокупности обладает некоторым количеством определенного блага, которое надлежит разделить между участниками. Принципы этого деления и называются решениями кооперативной игры.

Решение может быть определенно как для конкретной игры, так и для класса игр. Естественно, что наибольшей важностью обладают как раз те принципы, которые применимы в широком спектре случаев (т.е. для обширного класса игр). Решение может быть как однозначным (в этом случае для каждой игры решением является единственное распределение выигрышей), так и многозначным (когда для каждой игры могут быть определены несколько распределений).

Симметричные и несимметричные игры

А

Б

А

1,2

0,0

Б

0,0

1,2

Несимметричная игра

Игра будет симметричной тогда, когда соответствующие стратегии у игроков будут равны, то есть иметь одинаковые платежи. Иначе говоря, если игроки могут поменяться местами и при этом их выигрыши за одни и те же ходы не изменятся. Многие изучаемые игры для двух игроков- симметричные. В частности, таковыми являются: «Дилемма заключенного», «Охота на оленя», «Ястребы и голуби». В качестве несимметричных игр можно привести «Ультиматум» или «Диктатор». Дилемма заключенного (реже употребляется название «дилемма бандита») - в теории игр некооперативная игра, в которой игроки стремятся получить выгоду, сотрудничая друг с другом или предавая. Как во всей теории игр, предполагается что игрок («заключенный») максимизирует свой собственный выигрыш, не заботясь о выгоде других. В дилемме заключенного предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие - предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали. В этом и заключается дилемма. В повторяющейся дилемме заключенного игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания.

Игры с нулевой суммой и с ненулевой суммой

А

Б

А

-1,1

3,-3

Б

0,0

-2,2

Игра с нулевой суммой

Игры с нулевой суммой - особая разновидность игр с постоянной суммой, то есть таких, где игроки не могут увеличить или уменьшить имеющиеся ресурсы, или фонд игры. В этом случае сумма всех выигрышей равна сумме всех проигрышей при любом ходе. Многие изучаемые математиками игры, в том числе уже упоминавшаяся «Дилемма заключенного», иного рода: в играх с ненулевой суммой выигрыш какого-то игрока не обязательно означает проигрыш другого, и наоборот. Исход такой игры может быть меньше или больше нуля. Такие игры могут быть преобразованы к нулевой сумме- это делается введением фиктивного игрока, который «присваивает себе» излишек или восполняет недостаток средств. Еще игрой с отличной от нуля суммой является торговля, где каждый участник извлекает выгоду. Сюда также относятся шашки, шахматы; в двух последних игрок может превратить свою рядовую фигуру в более сильную, получив преимущество. Во всех этих случаях сумма игры увеличивается. Широко известным примером, где она уменьшается, является война.

Параллельные и последовательные игры

В параллельных играх игроки ходят одновременно, или, по крайней мере, они не осведомлены о выборе других до тех пор, пока все не сделают свой ход. В последовательных, или динамических, играх участники могут делать ходы в заранее установленном либо случайном порядке, но при этом они получают некоторую информацию о предшествующих действиях других. Различия в представлении параллельных и последовательных игр рассматривались выше. Первые обычно представляют в нормальной форме, а вторые - в экстенсивной.

Игры с полной или неполной информацией

Важное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы, сделанные до текущего момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников. Большинство изучаемых в математике игр- с неполной информацией. Например: «Дилемма заключенного» заключается в неполноте информации. В то же время есть интересные примеры игр с полной информацией: «Ультиматум», шахматы, шашки и другие.

Платежная матрица игры

B

A

B1

B2

Bn

A1

a 11

a 12

a 1n

A2

a 21

a 22

a 2n

Am

a m1

a m2

a mn

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Рис. 1. Классификация задач теории игр

В исследовании операций приходится сталкиваться с одноходовыми и многоходовыми играми, причем число стратегий может быть как конечным, так и бесконечным.

Рассмотрим, прежде всего, так называемые матричные, или прямоугольные, игры, для которых может быть составлена платежная матрица.

Платежной матрицей называется матрица, показывающая платеж одной стороны другой при условии, что первая сторона выбрала стратегию Ai, а вторая Bi.Если сторона A имеет m стратегий, а сторона B-n стратегий, то такая игра называется mЧn.

Играми с нулевой суммой называются такие игры, в которых то, что проигрывает одна сторона, выигрывает другая. С такими играми, как правило, приходится иметь дело в исследовании операций.

Решить игру - значит найти оптимальные стратегии обеих сторон и определить цену игры: ожидаемый выигрыш стороны A или проигрыш стороны B.

Оптимальной стратегией называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш. Любое отклонение от оптимальной стратегии уменьшает выигрыш.

При рассмотрении платежной матрицы следует сразу же отбросить дублирующие и доминирующие стратегии.

Дублирующими называются такие стратегии, для которых платежи полностью совпадают друг с другом.

Доминирующими называются явно невыгодные стратегии, т.е. такие, у которых все платежи выше, чем у какой-нибудь другой стратегии.

Решение игры может быть найдено либо в чистых стратегиях, когда игрок должен следовать одной единственной стратегии, либо в смешанных, когда игрок должен с определенными частостями применять две чистые стратегии или более. Последние в этом случае называются активными.

Доказывая, что любая конечная игра имеет решение в области чистых или смешанных стратегий, причем число активных стратегий во втором случае не более m и n.

При выборе оптимальной стратегии за основу принимается предположение, что противник является разумным и делает все, чтобы помешать нам добиться своей цели, откуда следует основной принцип теории игр: выбирай своё поведение так, чтобы оно было рассчитано на наихудший для нас образ ответных действий противника.

Принцип выбора каждой стороной наиболее осторожной («перестраховочной») стратегии называется «принципом минимакса».

Нижняя цена игры б- это максимальный выигрыш, который можно гарантировать в игре против разумного противника, выбрав одну из своих стратегий.

Верхняя цена игры в- это минимальный проигрыш, на который может рассчитывать противник, выбрав для себя одну из своих стратегий в расчете на наихудшее для себя наше поведение.

Если б=в, то решение игры находится в области чистых стратегий, в противном случае в области смешанных.

Применение классической теории игр в военном деле не всегда оказывается эффективным. Более целесообразным может оказаться введение в теорию игр «функций полезности» или использование теории рефлексных игр.

Рассматриваются конечные парные и игры с нулевой суммой.

Игрок A располагает p чистыми стратегиями A1,…Ai,...,Ap, а игрок B- соответственно q чистыми стратегиями B1,…,Bk,...,Bq. Первый игрок может выбрать любую стратегию Ai, в ответ на которую второй игрок может выбрать любую стратегию Bk. Сочетание этих стратегий (Ai,Bk) приведет к некоторому числовому результату («платежу»), который обозначим через aik и будем называть его «выигрышем» игрока A. Игра с «нулевой суммой» означает, что при этом «выигрыш» игрока B составит- aik (числа aik могут быть и отрицательными, поэтому слово «выигрыш» взято в кавычки). Матрица П=¦aik¦ порядка pq называется платежной матрицей, или матрицей игры:

Bk

Аi

Стратегии игрока В

бi=aik

B1

Bk

Bq

Стратегии игрока А

А1

а11

aik

a1q

б1

*

*

*

*

*

Ai

ai1

aik

aiq

ai

*

*

*

*

*

Ap

ap1

apk

apq

бp

Bk=aik

в1

вk

вq

вб

Число ai=aik и bk=aik указывают минимально гарантированный выигрыш для игрока A применяющего стратегию Ai,и минимально гарантированный проигрыш игроком B при использовании им стратегии Bk.

Величина б=бi=(aik) называется нижней ценой игры, максиминным выигрышем A, или коротко максимином, а соответствующая ему стратегия (строка)- максиминной. Аналогично в =вk= (aik) называется верхней ценой игры, минимаксным проигрышем B, или минимаксом, а соответствующая стратегия игрока B- минимаксной. Всегда б?в.

Принцип, согласно которому игроки выбирают эти стратегии, называется принципом максимина (для A) или минимакса (для B). Если игрок A выбирает свою максиминную стратегию, то при любой стратегии, выбираемой игроком B, ему обеспечивается выигрыш не менее чем a. Аналогично для игрока B, при выборе им стратегии, при которой достигается в =вk обеспечивается проигрыш (или выигрыш игрока A) не более чем b.

Если a=b, то игра называется с седловой точкой, а общее значение a и b, которое будем обозначить через н- ценой игры. В этом случае оптимальным решение игры для обоих игроков является выбор максиминной (для A) и минимаксной (для B) стратегий. Любое отклонение для каждого игрока от этих стратегий не может оказаться выгодным.

Пример1. Игра заключается в том, что игрок A записывает числа 1 ( стратегия А1), или 2 (А2),или 3 (А3). Игрок В, в свою очередь, может записать числа 1 (В1), 2 (В2), 3 (В3), или 4 (В4).

Если оба числа окажутся равной четности, то А выигрывает сумму этих чисел. Составить платежную матрицу, определить верхнюю и нижнюю цену игры и минимаксные стратегии.

Решение. Согласно условию, платежная матрица игры имеет следующий вид:

Bk

Аi

B1

B2

B3

B4

бi

A1

2

-3

4

-5

-5

A2

-3

4

-5

6

-5

A3

4

-5

6

-7

-7

вk

4

4

6

6

4 -5

Нижняя цена игры: б=бi=-5;

Верхняя цена игры: в=вk=4

Следовательно, для игрока А максиминными стратегиями являются А1 или А2, при которых ему обеспечен «выигрыш» не менее -5(т.е. проигрыш не более 5).

Для игрока В соответственно минимаксными стратегиями являются В1 или В2, которые обеспечивают ему проигрыш не более 4.

Игра не имеет седловой точки (б<в).

Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. В этом случае применяют смешанные стратегии.

Смешанной стратегией игрока А называется применение им своих чистых стратегий А1,…,Аi,…,Аp c частостями х1,…,хi,…,хр (причем Ухi=1). Ее записывают в виде

А1,…,Аi,…,Ар

х1,…,хi,…,хр ,

или

=( х1,…,хi,…,хр).

Аналогично вектором

(y1,…,уk,…,yq) (Ууk=1)

Определяется смешанная стратегия игрока В, где уk есть частость использования стратегии Вk. Чистые стратегии являются частным случаем смешанной стратегии, задаваемой единичным вектором.

Функцией выигрыша, или платежной функцией f( , ) игры с матрицей П=¦ak¦ при применении игроком А смешанной стратегии , а игроком В- смешанной стратегии , называется средняя величина выигрыша игрока А (проигрыша игрока В),подсчитываемая по формуле:

а(б)=У У чшнлфшл= П ю

i k

Стратегии *и * называются оптимальными, если выполняются неравенства

f (, *)?f ( *, *)?f (*,),

т.е. если их применение обеспечивает игроку А средний выигрыш, не меньший, чем при применении им любой другой стратегии , и игроку В средний проигрыш, не больший, чем при применении им любой другой стратегии .

Совокупность оптимальных стратегий (*,*) называется оптимальным решением, или просто решением игры, а значение платежной функции при этом -ценой игры:

V=f (*,*).

Фундаментальная теорема Неймана утверждает, что каждая конечная матричная игра с нулевой суммой имеет решение в смешанных стратегиях.

Пример. Исследовать игры, заданные следующими матрицами:

8 6 4 7 7 2 -1 3 -2 8 4 3 7

1) 5 4 3 4 6 ; 2) 4 1 5 -1 ; 3) 7 6 8 9 .

4 3 2 3 4 3 -2 4 -3 8 2 4 6

7 2 6 5 9 3 -1 5 2 6 3 2 5

Решение. 1) 1-я строка доминирует над 2-й и 3-й, так как все ее элементы соответственно не меньше элементов 2-й и 3-й строк. Поэтому стратегии А2 и А3 заведомо менее выгодны, чем А1, и могут быть исключены. В результате получаем матрицу

8 6 4 7 7

7 2 6 5 9

В этой матрице 1, 4 и 5-й столбцы доминируют над 2-м. Поскольку столбцы характеризуют стратегии игрока В, стремящегося уменьшить выигрыш игрока А, то эти стратегии заведомо невыгодны. После их исключения получаем матрицу

6 4 ,в которой нет доминирующих стратегий.

2 6

Определив нижнюю и верхнюю цены игры, получим б1=min{6,4}=4, б2=min{2,6}=2, откуда б= max{4,2}=4. Аналогично, в1=max{6,2}=6, в2=max{4,6}=6, откуда в=min{6,6}=6.

Так как б?в, то игра не имеет седловой точки и ее решением будет смешанная стратегия.

2) Стратегия А2, доминирует над А1 и А3. Следовательно, исключив последние, получим матрицу

4 1 5 -1.

3-1 5 2

В этой матрице можно исключить В1и В3, доминирующие над В2.Окончательно получим 1 -1 .

-1 2

Перейдем к исследованию седловой точки, располагая числа бi и вk справа и снизу матрицы: 1 -1 -1

-1 2 -1

1 2

Получим б= -1 и в=1, следовательно, седловой точки нет.

3) Стратегия А4 заведомо невыгодна по сравнению с А1 и может быть исключена. В оставшейся матрице 8 4 3 7 можно исключить

7 6 8 9

8 2 4 6

доминирующие стратегии В1 и В4. После их исключения получаем матрицу

4 3

6 8 ,

2 4

в которой вновь оказались заведомо невыгодными стратегии А1 и А3. Их исключение дает матрицу (6 8). Теперь для игрока А осталась одна стратегия А2 (в первоначальной нумерации) и для игрока В, очевидно, выгодной является стратегия В2, обеспечивающая ему проигрыш 6, вместо 8 при В3. Окончательно получили решение игры в виде чистых стратегий А2 и В2 и цену игры н=6. Полученное решение в виде чистых стратегий говорит о том, что исходная матрица имела седловую точку а22=6,что можно было бы установить прямым исследованием:

8 4 3 7 3 3

7 6 8 9 6 6

8 2 4 6 2 2

6 3 2 5 2 2

8 6 8 9 6

Следовательно,б=max бi=6, в=min вk=6, и б=в=6=н.

Решение методами теории игр задачи о выборе оптимального сочетания различных видов боевой техники.

Пусть имеются две системы оружия A1 и A2 ( например, ЗРК), одна из которых эффективна против одного вида целей ( например, низколетящих), вторая более эффективна против других ( например, высоколетящих).

В результате расчетов эффективности при каждом варианте действий получается платежная матрица, элементами которой могут быть вероятности поражения данной цели данным комплексом.

АB

B1

B2

Min строк

A1

A2

a11

a21

a12

a22

a1

a2

Max столбцов

b1

b2

Выбрав минимум из каждой строки, находим нижнюю цену игры б=maxбi, а выбрав максимум из каждого столбца, находим верхнюю цену игры в=min вi.

Если они совпадают, то пересечение соответствующей строки и столбца дает оптимальные стратегии( это будет случай чистых стратегий). Цена игры в этом случае н=б=в. Если они не совпадают, то цена игры заключена между б и в и имеет место случай смешанных стратегий.

Для игры 22 имеется аналитическое решение. Частоты применения стороной A стратегий равны

Р1=.

Цена игры в этом случае

н=a 11P1+a 21P2,

Оптимальные частоты применения стороной B стратегий равны

q1=

Пример. Имеются две системы ЗРК. Одни (выбор их -стратегия A1), более эффективны против высоколетящих целей, другие ( выбор их - стратегия A2) против низколетящих. Противник может лететь на малых (стратегия B1) и больших (стратегия B2) высотах.

Расчеты эффективности для всех четырех возможных вариантов сочетаний стратегий позволили построить платежную матрицу, в которой показаны вероятности поражения самолетов.

A B

B1

B2

A1

0,4

0,2

A2

0,2

0,6

Требуется найти оптимальные стратегии сторон и цену игры.

Согласно написанным выше формулам получаем

P1=

P2=1- =

н =0,4+ 0,2= ;

q1=

Следовательно, целесообразно иметь комплексов A1 и комплексов A2 . Противнику целесообразно проводить налетов на малых высотах и на больших. При этом вероятность сбития целей . Однако это справедливо только тогда, когда стороны не знают о действиях противника.

В случае игры mn , где m>2 и n>2, решение оказывается более сложным (если верхняя и нижняя цены игры не совпадают).

Эти задачи в общем случае могут быть сведены к задаче линейного программирования и точно решены одним из большого числа существующих методов решения задач линейного программирования.

Задача теории игр может быть описана следующей системой уравнений:

a 11 x 1 + a 21 x 2 +…+ a m 1 x m > =1;

…………………………………….

a 1 n x 1 + a 2 n x 2 +…+a m n x m >1,

где xi = , xi = и требуется найти минимум линейной формы

M= x1 + x2 +…xn.

Существуют и приближенные методы задач теории игр, в частности итеративные методы Неймана, Брауна и другие. Таким образом, игра mЧn может быть решена, причем трудоемкость этого решения (машинное время) возрастает с увеличением mn.

Случай игр с несколькими ходами.

Выше рассматривался случай игры с одним ходом, однако в практике исследования операций приходится сталкиваться и со случаем игры, где число ходов больше одного.

Путем процесса, называемого нормализацией, такие игры сводятся к эквивалентным прямоугольным играм. Процедура нормализации состоит в построении дерева игры (рис.34), подсчете платежа для каждой ветви игры и составлении платежной матрицы.

Пусть у стороны A есть при первом ходе две стратегии (например, сосредоточение артиллерии на одном A/11 или на другом направлении A/12) и при втором ходе тоже две стратеги (например, подать бронебойные снаряды A/21 или осколочно-фугасные A/22). У стороны B при первом ходе две стратегии (например, послать танки на одно B/1 или на другое B/2 направление). Известен платеж для любого варианта ходов (например, ущерб, наносимый стороне B).

Рассмотрим теперь все возможные стратегии стороны A:

A1-выбирается A/11 или A/21 независимо от поведения стороны B;

A2-выбирается A/11, а второй ход по правилу: если B/1, то A/21; если B/2, то A/22;

A3-то же, но второй ход делается наоборот по сравнению с предыдущим порядком;

A4-выбирается A/11 и A/22 независимо от поведения стороны B;

A5-выбирается A/12 и A/22 независимо от поведения стороны B;

A6-выбирается A/12,а второй ход по правилу: если B/1,то A/21;если B/2,то A/22;

A7- то же, но второй ход делается наоборот по сравнению с предыдущем порядком;

A8-выбирается A/12 и A/22 независимо от поведения стороны B

У стороны B четыре возможные стратегии:

B1-выбрать B/1 независимо от поведения стороны A;

B2-если A/11,то B/1,а если A/12, то B/2;

B3- то же, но наоборот;

B4-выбрать B/2 независимо от поведения стороны A.

Теперь можно составить платежную матрицу, пользуясь рис.34 и обозначениями стратегий сторон.

B

A

B1

B2

B3

B4

A1

a 1

a 1

a 3

a 3

A2

a 1

a 1

a 4

a 4

A3

a 2

a 2

a 3

a 3

A4

a 2

a 2

a 4

a 4

A5

a 6

a 7

a 6

a 7

A6

a 6

a 8

a 6

a 8

A7

a 2

a 7

a 2

a 7

A8

a 6

a 8

a 6

a 8

Вместо матрицы 22, которая имела место при одноходовой игре, получена более громоздкая матрица 84. Игра может проводиться при наличии полной информации, при наличии информации о первом ходе и при отсутствии информации. Если информация полная, то возможны все стратегии сторон A и B, указанные выше. Если у стороны A информации перед вторым ходом нет, то стратегии A2, A3,A6 и A7 пропадают, так как в них сторона делает ход в зависимости от первого хода стороны B и имеет место игра 42. Если нет информации у стороны B, то у нее остаются только две стратегии B1 и B4 и имеет место игра 82. Наконец, при полном отсутствии информации имеет место игра 42.

Пример. Для ситуации, описанной выше, заданы математические ожидания потерь стороны B: a1=10; a2=2; a3=5; a4=9; a5=6; a6=4; a7=10; a8=2.

Определить цену игры н в случаях:

1) полной информации (обе стороны знают о каждом ходе друг друга);

2) у стороны A нет информации перед вторым ходом (она не знает, как поступила сторона B);

3) у стороны B нет информации перед первым ходом (она не знает, как поступила сторона A).

Не останавливаясь на вычислениях, приводим окончательные результаты: н1=7; н2=5,9; н3=9,2.

Итак, за счет скрытности действий сторона B уменьшает свой проигрыш с 7 до 5,9, т.е. на 16%, а сторона A увеличивает выигрыш с 7 до 9,2, т.е. на 30%.

Случай игр с бесконечным числом стратегий.

В бесконечной игре уже не удаётся составить платёжную матрицу. Она заменяется платежной функцией M (x,y), где x и y- параметры, характеризующие стратегии сторон. С этими играми мы сталкиваемся в тех случаях, когда речь идет о выборе не из конечного числа образцов, методов действий, а из каких-то непрерывных последовательностей (например, оптимальная дальность открытия огня, высота полета и т.д.). Стратегиями в общем случае являются функции распределения F(x) и G(y), а цена игры

v (F, G)=[ dG(y).

В ряде практически встречающихся случаев бесконечные игры могут быть сведены к конечным путем разбивки непрерывной величины (например, дальности открытия огня) на ряд дискретных, что снижает точность решения задачи и приводит к громоздкой платёжной матрице.

Точное решение бесконечных игр с отсутствием информации удается получить только в отдельных случаях. Определенный интерес в исследовании операций могут представить результаты теории бесконечных игр для разного вида дуэлей.

Общая схема дуэлей такова. Два противника сближаются начиная от определенного рубежа. Вероятность поражения до того, как достигнут рубеж, P1(0)=P2(0)=0. Далее эти функции возрастают в зависимости от пройденного противником расстояния соответственно на величины к и ?, которые меняются от 0 до 1 и составляют на конечном рубеже P1(1)=P2(1)=1. Противники могут сделать по одному выстрелу или более(mв и nв соответственно), могут иметь или не иметь информацию о том, произвел противник выстрел или нет. Цена игры принимается +1 при поражении противника и -1 при своем поражении.

Рассмотрим случай одного выстрела. Если противники имеют информацию о проведении выстрела, то игра имеет чистую стратегию, причем о0 определяется из соотношения

P10)+ P20)=1.

Оптимальным моментом выстрела для второго игрока (в случае его выживания) является з0=1.

Цена игры определяется из выражения

н =2P10)-1.

Пример 1. Определить оптимальные моменты проведения противниками выстрелов, если известно, провел противник выстрел или нет, а вероятность поражения возрастает линейно от пройденного расстояния, т.е.

P1=о; P2=з.

Пользуясь соотношением для вероятностей, получаем

о 00=1,

откуда о 0=0,5 т.е. целесообразно провести выстрел, пройдя половину расстояния до противника. Цена игры

н=20,5-1=0.

Пример 2. Решить ту же задачу, что и в примере 1, если P1=о,а P22,т.е. вероятность поражения выстрелом второй стороны возрастает пропорционально квадрату расстояния (с учетом того, что з?1, медленнее, чем у первой стороны).

Пользуясь соотношением для вероятностей, получаем

о 020=1,

откуда

о 0= - ±()2+1=0,62.

Второй корень отбрасывается, как не имеющий физического смысла (0?о0?1).

Цена игры н=20,62-1=0,24, т.е. первая сторона в 24% случаев выигрывает.

Если игроки не имеют информации о проведении выстрелов (выстрелы «бесшумны»), задача также имеет решение.

В частности, при P1(о)=P2(о)=о плотности оптимальных стратегий (здесь они смешанные) запишутся в следующем виде:

0 0?о?;

f(о)=

о-3 ?о?1.

н=0

Если один игрок имеет информацию о проведении выстрела противником, а другой нет и P1(о)=P2(о)=о, то оптимальная стратегия первого игрока характеризуется плотностью

F(о)= (о2+2о-1)-

А второго

F(з)= (з2+2з-1).

Цена игры н=0,11, т.е. отсутствие информации при прочих равных условиях приводит к проигрышу той стороны, которая не располагает информацией.

Теория игр дает формулы для определения оптимальных стратегий и в тех случаях, когда противники располагают несколькими выстрелами в различных условиях.

1.2 Решение игр в «чистых» и «смешанных» стратегиях

Мы знаем, что если нижняя цена игры a равна верхней b(максимин равен минимаксу) то игра имеет седловую точку и по крайней мере одно решение в чистых стратегиях. А если б?в? Можно доказать, что и в этом случае решение всегда есть, только оно лежит не в области чистых, а в области смешанных стратегий. Решение игры называется такая пара стратегий- в общем случае смешанных, систематическое применение которых обеспечивает каждой стороне максимально возможный для нее по условиям игры выигрыш, определяемый ценой игры. Если же одна из сторон отступает от своей оптимальной стратегии( в то время как другая продолжает придерживаться своей), то это ни в коем случае не может быть выгодно для отступающего; это либо оставит его выигрыш неизменным, либо уменьшит. Таким образом, каждая конечная игра имеет решение( возможно, в области смешанных стратегий). Это положение называется основной теоремой теории игр. Введем специальное обозначение для смешанных стратегий. Пусть K применяет свои стратегии K1,K2,K3 с частотами соответственно p1,p2,p3(p1+p2+p3=1). Эту смешанную стратегию будем обозначать:

K1

K2

Sk= K3

p1

p2

p3

Аналогично смешанную стратегию игрока C будем обозначать:

C1C2

C3

Sc= q1

q2

q3

где

q1+q2+q3=1

Очевидно, любая чистая стратегия- частный случай смешанной, в которой все частоты, кроме одной, равны 0,а одна-1.

Решение игры- пару оптимальных стратегий- будем обозначать Sk* и Sc*, а соответствующий ему выигрыш(цену игры) v.

Очевидно, что цена игры v не может быть меньше нижней и больше верхней цены: б?v?в. В первом примере решение игры должно быть:

K1K2 C1C2

Sk*= ; Sc*= ,

а цена игры v=0. Проверим это

Пусть мы («красные») держимся своей стратегии Sk*, т.е. ищем C в убежище 1 и 2 одинаково часто, чередуя эти стратегии случайным образом. Может ли C улучшить свое положение(повысить свой выигрыш),отступая любым образом от своей стратегии Sc*? Очевидно, нет. А если одностороннее отступление от стратегии Sk* произойдет(в то время как C будет держаться стратегии Sc*), то это невыгодно. Значит мы нашли решение игры и ее цену v=0.

Пользуясь чистыми максиминно-минимаксными стратегиями, в общем случае невозможно получить оптимальные решения игры, появилась идея использования смешанных стратегий. Каждый игрок вместо выбора одной из чистых стратегий может выбирать любую из них с заранее заданными вероятностями. Пусть x=(x1,x2,…,xm) и y=(y1,y2,…,yn)- наборы вероятностей, с которыми игроки A и B соответственно выбирают свои чистые стратегии. Тогда

1==1,

xi,,yj?0 для всех i и j. Если aij-(i,j)-й элемент матрицы игры, то платежная матрица будет иметь следующий вид:

B

y1 y2 … y n

x1 a11 a12 … a1n

x2 a21 a22 … a2n

A * * * *

xm am1 am2 ... amn

Подход к определению решения игры при смешанных стратегиях основывается на критерии минимакса. Единственная разница заключается в том, что игрок А выбирает xi так, чтобы максимизировать наименьший ожидаемый выигрыш по столбцам, тогда как игрок Выбирает yi с целью минимизировать наибольший ожидаемый проигрыш по строкам. Математически критерий минимакса при смешанных стратегиях может быть описан следующим образом. Игрок А выбирает стратегия xi(xi?0, xi=1), дающую

{min(ai1 xi, ai2 xi,…,ain xi)},

а игрок В выбирает стратегию

yj(yj?0,yj=1),

дающую

Хьфч(ф1о ноб ф2о ноб…бфьо но)Ъю

Эти величины определяются соответственно как ожидаемые максиминные и минимаксные платежи. Как и в случае чистых стратегий, выполняется соотношение: минимаксный ожидаемый проигрыш ? максиминный ожидаемый выигрыш. Когда хi и yj соответствуют оптимальным решениям, выполняется строгое равенство, и результирующее значение равно ожидаемому(оптимальному) значению игры. Если хi*и yj*-оптимальные решения для обоих игроков, каждому элементу платежной матрицы аij соответствует вероятность хi*yj*. Следовательно, оптимальное ожидаемое значение игры:

v*= aij xi* yj*.

1.3 Графическое решение игр

Этот метод применим только к играм, в которых хотя бы один игрок имеет только две стратегии. Рассмотрим игру вида 2n:

В

у1 у2 … уn

х1 а11 а12 … а1n

А

х2=1-х1 а21 а22 … а2n

Эта игра не имеет седловой точки. Поскольку игрок А имеет только две стратегии, то х2=1-х11?0,х2?0. Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В, представлены в таблице:

Таблица 1.3.1

Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В

Чистые стратегии игрока В

Ожидаемые выигрыши игрока А

1

1121121

2

1222122

*

*

*

n

1n-a2n)x1+a2n

Отсюда видно, что ожидаемый выигрыш игрока А линейно зависит от х1.

В соответствии с критерием минимакса для игр в смешанных стратегиях игрок А должен выбирать х1 так, чтобы максимизировать свой минимальный ожидаемый выигрыш. Эта задача может быть решена графически построением прямых линий, соответствующих линейным функциям от х1.

Пример. Рассмотрим игру вида 24.

В

1 2 3 4

1 2 2 3 -1

A 2 4 3 2 6

Эта игра не имеет седловой точки. Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям В представлены в таблице.

Таблица 1.3.2

Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В

Чистые стратегии игрока В

Ожидаемые выигрыши игрока А

1

-2х1+4

2

1+3

3

х1+2

4

-7х1+6

Изображены четыре прямые, являющиеся графиками этих функций от х1. Максимин достигается при х1*=. В этой точке пересекаются любые две из прямых 2,3 и 4. Следовательно, оптимальной стратегией игрока А является (х1*=, х2*=) и значение игры находится подстановкой х1 в уравнение любой из прямых, проходящих через максиминную точку.

-+3=

Это дает

v*= +2=

-7()+6=.

При определении оптимальных стратегий игрока В три прямые проходят через максиминную точку. Это означает, что оптимальная стратегия В представляет собой совокупность трех стратегий. Любые две прямые, имеющие противоположные наклоны, определяют одно возможное оптимальное решение. Таким образом, из трех комбинаций (2,3), (2,4) и (3,4) комбинация (2,4) должна быть исключена как неоптимальная.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.