Методы решения биматричных игр

Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.

Рубрика Математика
Вид реферат
Язык русский
Дата добавления 13.02.2011
Размер файла 84,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МЕТОДЫ РЕШЕНИЯ БИМАТРИЧНЫХ ИГР

1. Основные определения теории биматричных игр

Рассмотрим конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

игрок А - может выбрать любую из стратегий А1, ... , Ат,

игрок В - любую из стратегий В1, …, Вn

При этом всякий раз их совместный выбор оценивается вполне определенно:

если игрок А выбрал i-ю стратегию , а игрок В - kстратегию , то в итоге выигрыш игрока А будет равен некоторому числу , а выигрыш игрока В некоторому, вообще говоря, другому числу .

Иными словами, всякий раз каждый из игроков получает свой приз.

Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы (первая из них описывает выигрыши игрока А, а вторая - выигрыши игрока В).

Обычно эти таблицы записывают в виде матриц

Здесь А - платежная матрица игрока А, а В - платежная матрица игрока В.

При выборе игроком А i-й стратегии, а игроком В - k-й стратегии их выигрыши находятся в матрицах выплат на пересечении i-х строк и k-x столбцов: в матрице А это элемент , а в матрице В - элемент .

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна - матрица выплат игроку А, другая - матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре - биматричная.

Замечание. Рассматриваемые матричные игры, можно рассматривать и как биматричные, где матрица выплат игроку В противоположна матрице выплат А:

В общем случае биматричная игра - это игра с ненулевой суммой.

Класс биматр. игр значительно шире класса матричных (разнообразие новых моделируемых конфликтных ситуаций весьма заметно), а, значит, неизбежно увеличиваются и трудности, встающие на пути их успешного разрешения.

Пример. «Студент -- Преподаватель».

Рассмотрим следующую ситуацию. Студент (игрок А ) готовится к зачету, который принимает Преподаватель (игрок В). Можно считать, что у Студента две стратегии - подготовиться к сдаче зачета (+) и не подготовиться (-). У Преподавателя также две стратегии - поставить зачет [+] и не поставить зачета [-].

В основу значений функций выигрыша игроков положим следующие соображения:

Количественно это можно выразить, например, так

2. Смешанные стратегии в биматричных играх

В приведенных примерах описаны ситуации, в которых интересы игроков не совпадают. Встает вопрос о том, какие рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась. Иными словами, что мы будем понимать под решением биматричной игры?

Попробуем ответить на это вопрос так:

вследствие того, что интересы игроков не совпадают, нам нужно построить такое (компромиссное) решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.

Не пытаясь сразу выражать эту мысль совсем точно, скажем - попробуем найти некую равновесную ситуацию, явное отклонение от которой одного из игроков уменьшало бы его выигрыш.

Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникающее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, существует не всегда - конечно, если ограничиваться только чистыми стратегиями игроков А и В, т.е. стратегиями .

Однако при расширении матричной игры путем перехода к смешанным стратегиям, т. е. к такому поведению игроков, при котором они чередуют (чистые) стратегии с определенными частотами:

игрок А - стратегии A1,..., Ат с частотами р1,..., рт, где

а игрок В - стратегии В1,...., Вn, с частотами q1,..., qn, где

выяснилось, что в смешанных стратегиях равновесная ситуация всегда существует. Иными словами, любая матричная игра в смешанных стратегиях разрешима.

Поэтому, рассматривая здесь биматричные игры, разумно попробовать сразу же перейти к смешанным стратегиям игроков (этим мы предполагаем, что каждая игра может быть многократно повторена в неизменных обстоятельствах).

В матричном случае смешивание стратегий приводило к расширению возможности выплат в том смысле, что расчет строился из вычисления средних выигрышей игроков А и В, которые определялись по элементам платежной матрицы А и вероятностям и :

,

При смешанных стратегиях в биматричных играх также возникают средние выигрыши игроков А и В, определяемые по правилам, в которых уже нет никакой дискриминации игрока В:

,

3. 2x2 биматричные игры. Ситуация равновесия

Мы предполагаем уделить основное внимание случаю, когда у каждого из игроков имеется ровно две стратегии, т. е. случаю т = п = 2. Поэтому нам кажется уместным выписать приведенные выше формулы именно для такого случая.

В 2 2 биматричной игре платежные матрицы игроков имеют следующий вид

, ,

вероятности

биматричная игра решение

а средние выигрыши вычисляются по формулам

где

,

Сформулируем основное определение.

Определение. Будем считать, что пара чисел

, ,

определяет равновесную ситуацию, если для любых р и q, подчиненных условиям одновременно выполнены следующие неравенства

(1)

Пояснение. Выписанные неравенства (1) означают следующее: ситуация, определяемая смешанной стратегией (р*, q*), является равновесной, если отклонение от нее одного из игроков при условии, что другой сохраняет свой выбор, приводит к тому, что выигрыш отклонившегося игрока может только уменьшиться. Тем самым, получается, что если равновесная ситуация существует, то отклонение от нее невыгодно самому игроку.

Теорема 1 (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Итак, равновесная ситуация существует. Но как ее найти?

Если некоторая пара чисел (р*, q*) претендует на то, чтобы определять ситуацию равновесия, то для того, чтобы убедиться в обоснованности этих претензий, или, наоборот, доказать их необоснованность, необходимо проверить справедливость неравенств (1) для любого р в пределах от 0 до 1 и для любого q в пределах от 0 до 1. В общем случае число таких проверок бесконечно. И, следовательно, действенный способ определения равновесной ситуации нужно искать где-то в ином месте.

Теорема 2. Выполнение неравенств

(1)

равносильно выполнению неравенств

(2)

Иными словами, для того, чтобы убедиться в обоснованности претензий пары (р*, q*) на то, чтобы определять равновесную ситуацию, нужно проверить справедливость неравенства

только для двух чистых стратегий игрока А (р = 0 и р = 1) и неравенства

только для двух чистых стратегий игрока В (q = 0 и q= 1).

Четыре неравенства (2) позволяют провести поиск точки равновесия вполне конструктивно.

Запишем средние выигрыши игроков А и В в более удобной форме.

Имеем

Обратимся к первой из полученных формул.

Полагая в ней сначала р = 1, а потом р = 0, получаем,

Рассмотрим разности

Полагая

получим для них следующие выражения

В случае, если пара (р, q) определяет точку равновесия, эти разности неотрицательны

Поэтому окончательно получаем

Из формул для функции нв ( р, q) при q = 1 и q = 0 соответственно имеем

Разности

и

с учетом обозначений

.

приводятся к виду

совершенно так же, как соответствующие разности для функции НА.

Если пара , q) определяет точку равновесия, то эти разности неотрицательны

Поэтому

Вывод

Для того, чтобы в биматричной игре

, ,

пара (р, q) определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств

, ,

, ,

где

.

Размещено на Allbest.ru


Подобные документы

  • Игры, повторяемые многократно, их отличительные свойства и этапы. Смешанные стратегии, условия и возможности их использования на практике. Аналитический метод решения игры типа 2 x 2. Основные теоремы для прямоугольных игр. Алгебраические решения.

    презентация [893,5 K], добавлен 23.10.2013

  • Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.

    контрольная работа [855,7 K], добавлен 01.06.2014

  • Составление платежной матрицы, поиск нижней и верхней чисты цены игры, максиминной и минимаксной стратегии игроков. Упрощение платежной матрицы. Решение матричной игры с помощью сведения к задаче линейного программирования и надстройки "Поиск решения".

    контрольная работа [1010,3 K], добавлен 10.11.2014

  • Изучение общих сведений о матричных и антагонистических играх. Понятие позиционной игры, дерева, информационного множества. Рассмотрение принципа максимина и принципа равновесия. Оптимальность по Парето. Позиционная неантагонистическая игра, ее свойства.

    курсовая работа [1,4 M], добавлен 17.10.2014

  • Теория игр - математическая теория конфликтных ситуаций. Разработка математической модели игры двух лиц с нулевой суммой, ее реализация в виде программных кодов. Метод решения задачи. Входные и выходные данные. Программа, руководство пользователя.

    курсовая работа [318,4 K], добавлен 17.08.2013

  • Основные понятия и определения кубических уравнений, способы их решения. Формула Кардано и тригонометрическая формула Виета, сущность метода перебора. Применение формулы сокращенного умножения разности кубов. Определение корня квадратного трехчлена.

    курсовая работа [478,4 K], добавлен 21.10.2013

  • Сущность понятия "комбинаторика". Историческая справка из истории развития науки. Правило суммы и произведения, размещения и перестановки. Общий вид формулы для вычисления числа сочетаний с повторениями. Пример решения задач по теории вероятностей.

    контрольная работа [293,2 K], добавлен 30.01.2014

  • Проектирование математической модели. Описание игры в крестики-нолики. Модель логической игры на основе булевой алгебры. Цифровые электронные устройства и разработка их математической модели. Игровой пульт, игровой контроллер, строка игрового поля.

    курсовая работа [128,6 K], добавлен 28.06.2011

  • Векторы на плоскости и в пространстве. Обыкновенное дифференциальное уравнение. Необходимые формулы для решения задач о касательной. Метод наименьших квадратов. Необходимые определения и формулы для вычисления интегралов. Производные элементарных функций.

    курс лекций [119,3 K], добавлен 21.04.2009

  • Принятие решения по многим критериям (многокритериальная оптимизация). Эффект несравнимости исходов. Отношение доминирования по Парето при сравнении векторных оценок. Нижние границы критериев. Учет неопределенных пассивных условий, выбор стратегии.

    курсовая работа [71,6 K], добавлен 17.12.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.