Теория игр нэша. Равновесие по Нэшу. Теория игр для экономистов (Джон Нэш). Существует единственный выигрышный ход

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться отверсии , проверенной 9 мая 2012; проверки требуют2 правки .

Перейти к: навигация ,поиск

Джон Форбс Нэш, ноябрь 2006

Равновесие Нэша (англ. Nash equilibrium ) названо в честьДжона Форбса Нэша - так втеории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша .

Концепция равновесия Нэша (РН) впервые использована не Нэшем; Антуан Огюст Курно показал, как найти то, что мы называем равновесием Нэша, в игре Курно. Соответственно, некоторые авторы называют егоравновесием Нэша-Курно . Однако Нэш первым показал в своей диссертации понекооперативным играм в 1950-м году, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. До Нэша это было доказано только для игр с 2 участниками снулевой суммой Джоном фон Нейманом иОскаром Моргенштерном (1947).

Формальное определение

Допустим, -игра n лиц в нормальной форме, где- набор чистых стратегий, а- набор выигрышей. Когда каждый игроквыбирает стратегиюв профиле стратегий, игрокполучает выигрыш. Заметьте, что выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком, но и от чужих стратегий. Профиль стратегийявляется равновесием по Нэшу, если изменение своей стратегии снане выгодно ни одному игроку, то есть для любого

Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешитьсмешанные стратегии , тогда в каждой игреn игроков будет хотя бы одно равновесие Нэша.

Литература

    Васин А. А., Морозов В. В. Теория игр и модели математической экономики - М.: МГУ, 2005, 272 с.

    Воробьев Н. Н. Теория игр для экономистов-кибернетиков - М.: Наука, 1985

    Мазалов В. В. Математическая теория игр и приложения - Изд-во Лань, 2010, 446 с.

    Петросян Л. А. , Зенкевич Н. А., Шевкопляс Е. В. Теория игр - СПб: БХВ-Петербург, 2012, 432 с.

Эффективность по Парето

Материал из Википедии - свободной энциклопедии

Перейти к: навигация ,поиск

Оптимальность по Парето - такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других элементов.

Таким образом, по словам самого Парето : «Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением». Значит, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством парето-оптимальных альтернатив».

Ситуация, когда достигнута эффективность по Парето - это ситуация, когда все выгоды от обмена исчерпаны.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. На основе этого понятия строятся Первая и Вторая фундаментальные теоремы благосостояния . Одним из приложений Парето-оптимальности является т. н. Парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, то есть экономическом объединении двух и более государств. Интересно, что Парето-распределение до и после международной экономической интеграции было адекватно математически описано (Далимов Р. Т., 2008). Анализ показал, что добавленная стоимость секторов и доходы трудовых ресурсов движутся противонаправленно в соответствии с хорошо известным уравнением теплопроводности аналогично газу или жидкости в пространстве, что дает возможность применить методику анализа, используемую в физике, в отношении экономических задач по миграции экономических параметров.

Оптимум по Парето гласит, что благосостояниеобщества достигает максимума, а распределение ресурсов становится оптимальным, если любое изменение этого распределения ухудшает благосостояние хотя бы одногосубъекта экономической системы.

Парето-оптимальное состояние рынка - ситуация, когда нельзя улучшить положение любого участника экономического процесса, одновременно не снижая благосостояния как минимум одного из остальных.

Согласно критерию Парето (критерию роста общественного благосостояния), движение в сторону оптимума возможно лишь при таком распределении ресурсов, которое увеличивает благосостояние по крайней мере одного человека, не нанося ущерба никому другому.

Проявляет себя в реальности, дабы показать, что это понятие является не просто абстрактным термином, а обобщением реально существующей закономерности. Однако, несмотря на наглядность примера, на основании только его одного может показаться, что мы наткнулись на какой-то вырожденный случай. Поэтому имеет смысл рассмотреть и более общее описание данного правила.

Многие читатели, возможно, знакомы с равновесием Нэша по одному весьма распространённому его частному случаю - так называемой «дилемме заключённого». Его суть примерно в следующем.

В тюрьме находятся два заключённых, которых взяли с поличным по отдельности, но ещё подозревают в более тяжких преступлениях. Если участие докажут, то срок заключённых возрастёт до десяти лет. Сейчас же они отсиживают по году каждый. Следствие предлагает каждому из них пойти на сделку и дать показания против второго. В этом случае первому срок скостят до полугода, а второй сядет на десять. Однако заключённые понимают, что если они оговорят друг друга, то вряд ли их обоих пощадят - скорее добавят каждому ещё лет по пять.

Расклад можно отобразить при помощи следующей таблицы.

Легко видеть, что «зелёные» варианты (1, 2) и (2, 1) являются симметричными, в двух же других положение заключённых будет идентичным. Поэтому можно рассмотреть логику ситуации с точки зрения только одного из заключённых - для второго она будет такой же.

Заключённый, разумеется, хочет наименьшего срока для себя. Но если он будет хранить молчание, то, возможно, его коллега даст против него показания, чем повысит ему срок до десяти лет. Если бы не обещанное снижение срока, то можно было бы тешить себя мыслью «а зачем мне это?», но соблазн снизить срок слишком вели́к. Кроме того, второй заключённый, как понимает первый, будет подозревать его, первого, в том, что он даст показания против второго и повысит тем самым ему срок.

«Обидно будет оказаться крайним и загреметь на десять лет», - думает первый. Но «и второй наверняка думает так же, и так же подозревает меня, - понимает он, - а потому шансов, что коллега меня не заложит, очень мало. Выходит, надо давать показания: если второй каким-то чудом промолчит, то будет полгода, проговорится - пять. Ну хоть не десять, которые я неизбежно получу из-за разоткровенничавшегося со следствием моего подельника!».

«Оранжевый» вариант (1, 1) является удобоваримым для обоих и в каком-то смысле это оптимум в данной ситуации. Однако у каждого есть ещё лучший вариант - соответствующий «зелёный» (1, 2) или (2, 1). В результате чего на деле будет реализован «красный» вариант (2, 2).

Можно сказать, что для каждого из заключённых он не так плох: всего пять лет против десяти в «зелёном» варианте в пользу подельника. Однако представим, что в «красном» варианте обоим дадут по десять. Логика в данном случае чуть-чуть поменяется: «если я его сдам, то хотя бы есть шанс отвертеться от десяти лет, а если промолчу - шансов нет, он меня наверняка заложит по тем же соображениям». Однако тут система подталкивает заключённых выбрать наихудший вариант из возможных. Действуя, что характерно, строго ради своей выгоды.

Рассмотрим теперь ещё одну ситуацию. Есть две фирмы - А и Б. Каждая из них может воспользоваться стратегией - Икс или Игрек. Однако на результаты оказывает влияние не только стратегия, выбранная самой фирмой, но и стратегия второй фирмы тоже. Выигрыш или проигрыш каждой из фирм мы представим в виде следующей таблицы.

Я специально для повышения накала страстей подобрал числа так, чтобы убыточное для обеих фирм состояние лишь незначительно отличалось бы от «соседних» с ним: тем удивительнее, что будет реализовано именно оно. Фирмы, действуя строго в своих интересах, с большой вероятностью захотят получить тысячу рублей вместо ста и тем самым не получат ничего, а наоборот, даже утратят. Переход же одной из фирм на стратегию Икс ещё сильнее ухудшит её положение - другая фирма будет обогащаться, а вторая терять ещё больше, хотя и незначительно больше.

Запишем вышеприведённые матрицы в более общем виде, абстрагировавшись от «фирм», «заключённых», «сроков» и «рублей». Положим, что у нас просто есть два игрока А и Б, играющие в некоторую игру, где на каждом ходе можно совершить один из двух ходов - Икс или Игрек. Выигрышем являются просто некие «баллы», наибольшее число которых каждый игрок и стремится набрать.

А делает ход Икс А делает ход Игрек
Б делает ход Икс А: a 0
Б: b 0
А: a 1 > a 0
Б: b 1 < b 3
Б делает ход Игрек А: a 2 < a 3
Б: b 2 > b 0
А: b 3
Б: a 3

Правила игры, представленные данной матрицей, будут «подталкивать» игроков к реализации «красного» варианта (2, 2), даже если выигрыши игроков в этом случае существенно меньше, чем во всех остальных вариантах. Правда, в зависимости от соотношения выигрышей (которые могут быть в том числе отрицательными - то есть проигрышами), обозначенных буквами «a» и «b» с индексами, частота реализации каждого из вариантов будет разной.

В частности, на выбор может влиять среднее арифметическое выигрышей при выборе каждой из стратегий, а также предположительная вероятность, с которой игрок сделает тот или иной ход (которая, кстати, может быть аппроксимирована частотой ходов, сделанных в предыдущих раундах). Так, в простейшем случае игрок А для оценки хода Икс складывает a 0 и a 2 и делит результат на два, полагая выбор хода со стороны Б равновероятным. То же самое он проделывает для хода Игрек - складывает a 1 с a 3 , после чего делит результат на два - и сравнивает результаты. В более сложном случае игрок считает сумму a 0 *p x + a 2 *p y , где p x и p y - вероятности ходов Икс и Игрек, сделанных игроком Б. Результат сравнивается с a 1 *p x + a 3 *p y .

Можно было бы, конечно, снова поделить результат на два, но поскольку деление на два имеет место быть для обоих вариантов хода, для сравнения величин эта операция необязательна, как, впрочем, и в случае «равновероятных ходов».

Также игрок может ориентироваться на сами величины. Например, если один из ходов означает вероятный проигрыш - особенно крупный, такой, какой игрок не может себе позволить, - игрок, не исключено, будет выбирать другой ход, даже если предположительный выигрыш при другом ходе в среднем ниже, но зато в обоих случаях положительный.

Наконец, надо помнить, что люди часто, скажем так, «помнят о другом игроке». Если второй игрок - конкурент или даже враг, то, возможно, будет иметь место тенденция выбирать такой ход, который навредит другому игроку, даже если первый игрок из-за этого выиграет мало, и даже, не исключено, проиграет. Если второй игрок - друг, то чаще будет выбираться ход, позволяющий чуть-чуть выиграть и ему тоже - в том случае, если «игра» - это не заранее заявленное соревнование, а какой-то процесс из реальной жизни. Возможности мести и поблажек, разумеется, зависят от соотношений в матрице - при некоторых из них скорее забудут, что соперник - твой друг, чем начнут ему слегка подыгрывать.

Иными словами, рассматриваемый нами принцип отображает именно что тенденцию, а не детерминированность. Чем сильнее соотношения значений выигрышей и проигрышей подобны фигурировавшим в «дилемме заключённого», тем чаще и быстрее система будет подводить игроков к «наихудшему» варианту и тем «более наихудшим» будет этот вариант.

Есть как бы «невидимая рука рынка», которая как бы невидимо подталкивает игроков… ну, вы знаете. Точнее, нет, может быть, и не знаете. В классическом варианте «рука рынка» как бы подталкивает куда всем надо, а тут она толкает совсем не туда. Не во всеобщее благо, а в перманентный кризис, которого при иных раскладах можно было бы избежать, что нам иллюстрирует и «дилемма заключённого», и гипотетический пример с конкуренцией фирм, и реальный пример с неизбежным завышением сроков разработки софта, о котором речь шла в предыдущей статье.

Рынок толкает игроков к равновесию Нэша, которое сколь угодно далеко может отстоять от их общего и личного блага.

В данном случае мы рассматривали только двух игроков и игру с двумя ходами, однако возможно и более широкое обобщение, которое как раз и является формулировкой равновесия Нэша:

Если в некоторой игре с произвольными количеством игроков и матрицей выигрышей существует такое состояние, что при выборе не соответствующего ему хода любым из игроков в отдельности его личный выигрыш уменьшится, то это состояние окажется «равновесным» для данной игры.

Кроме того, в ряде случаев ходы игроков будут иметь тенденцию стремиться к этому состоянию, даже если в этой игре есть другие состояния, в рамках которых выигрыш игроков в целом и/или по отдельности выше.

Приводить примеры такого общего случая способом, подобным ранее использованному, ощутимо тяжелее, поскольку добавление каждого игрока будет добавлять ещё одно измерение к матрице выигрышей. Однако об этом - позже.

Определение 2.10. Пусть задана игра G в нормальной форме (N,Sj , Исход s = (s, s 2 > > %)е5 называется равновесием

Нэша (NE - Nash Equilibrium) игры G, если Vi е 1.....N, Уу, е 5,

Иначе говоря, каждый из игроков максимизирует свою функцию полезности

на множестве своих стратегий.

В точке равновесия Нэша стратегия х,- - одна из лучших для игрока i стратегий в ответ на х_ ; =(х 1 ,х 2 ,--.,^_ 1 ,х 1+1 ,...,х лг) - стратегии остальных игроков. Игрок i рассматривает стратегии из х_ ; как заданную вполне определенную совокупность стратегий «внешнего мира», на которую он не может активно воздействовать. Он может активно выбирать лишь свою стратегию в, которая будет наилучшим выбором, если остальные игроки выберут s_j. При этом игрок i полагает, что аналогично выбирают свои стратегии и все остальные игроки.

В точке равновесия Нэша игроку i невыгодно в одиночку отклоняться от стратегии s it если остальные игроки придерживаются стратегий 5 1 ,s 2 ,...s,-_ 1 ,s i+1 ...s N . Действия «в одиночку» могут только уменьшить выигрыш игрока i. Поиск точки равновесия Нэша, таким образом, сводится к решению системы из N задач максимизации функций полезности по соответствующим переменным

Пусть G - (N, 5,-, Uj , i - 1,..N) - конечная игра в нормальной форме.

Назовем X,- множеством смешанных стратегий игрока i, а множество X = X,-Х 2 -...-X jV - множеством профилей всех смешанных стратегий. Обозначим аеХ - элементы этого множества.

Назовем игру G = (N; X; и) смешанным расширением игры G. Тогда равновесие в смешанных стратегиях в игре G - это равновесие Нэша в ее смешанном расширении.

Пример 2.17. Задана биматричная игра

Какие выигрыши будут у игроков при выборе ими стратегий т = 0 + 0,и п = 0,25с + 0,75d ?

Решение

Запишем рядом с чистыми стратегиями вероятности их выбора:

Поскольку выбор стратегий осуществляется игроками независимо, вероятность профиля (а; с) равна 0,4-0,25 = 0,1. Аналогично рассчитываются вероятности выигрышей игроков при остальных наборах чистых стратегий. Для удобства выигрыши игроков представим в виде вектор-столбца:

Ответ: щ - 2; и 2 = 0,25.

Наряду с равновесием Нэша введем еще одно важное понятие - доминирования по Парето.

Пусть задана игра в нормальной форме G = (N,Si, u it i = l,...,N). Рассмотрим два профиля стратегий x = (x,x 2 ,...,x jY)e5 и i/ = (i/ v i/ 2 ,...,yy)&S.

Определение 2.11. Профиль стратегий х доминирует по Парето профиль стратегий у, если

Последняя система неравенств означает, что для всех игроков профиль х не хуже, чем профиль у, но при этом хотя бы для одного из игроков профиль х лучше, чем у.

Определение 2.12. Профиль стратегий х называется оптимальным по Парето (Парето-оптимальным), если он недоминируем но Парето.

Если исход оптимален но Парето, то он характеризуется следующим свойством: невозможно улучшить положение ни одного из игроков без ухудшения положения хотя бы одного из других игроков.

Пример 2.18. Найти точки равновесия Нэша, точки равновесия в строго доминирующих стратегиях и Парето-оптимальные точки в матричной игре двух игроков с заданными платежными матрицами:

Решение

Очевидно, ни одна из стратегий не является строго доминируемой. Поэтому равновесия в строго доминирующих стратегиях нет.

Для определения равновесий Нэша подчеркнем наибольшие выигрыши каждого из игроков при фиксированных ходах противника:

Исходы с двойными подчеркиваниями будут равновесиями Нэша: (a; d) (b; с); (b;d ).

Для определения Парето-оптимальных исходов удобно изобразить все точки биматричной игры в критериальной плоскости (рис. 2.21 - по осям откладываем выигрыши игроков).


Рис. 2.21

Парето-оптимальными являются точки, в направлении штриховки от которых (к «северо-востоку») нет других точек. Таковыми являются исходы (а ; d) (а; с); (Ь; с). Введем для краткости обозначения для Парето- оптимальных точек - Р и для равновесных по Нэшу - N. Получим

Выясним, существуют ли в этой игре равновесные по Нэшу профили смешанных стратегий.

Пусть стратегии а и b играются с вероятностями р и 1 - р соответственно, а стратегии с и d - с вероятностями q и 1 - q.

Максимизируем функцию щ(р, q) = 3q - 2pq по переменной р е при постоянном значении q

К аналогичному результату приводит рассмотрение рационального поведения второго игрока, оптимизирующего u 2 (p,q ) по переменной q при постоянном значении р

Изобразим полученный результат (рис. 2.22) в координатах (q, р ):

Рис. 2.22

Как видим, оба графика совпали.

Равновесия Нэша:

Пример 2.19. Найти точки равновесия Нэша (в смешанных стратегиях) и Парето-оптимальные точки в матричной игре двух игроков с заданными платежными матрицами:

Решение

Очевидно, доминирующих стратегий в игре нет. Точек равновесия Нэша в чистых стратегиях также нет. Парето-оптимальные профили: (а ; d) и {b d).

Рассмотрим смешанные стратегии игроков.

Пусть стратегии а и b играются с вероятностями р и 1 - р соответственно, а стратегии cud - с вероятностями q и 1 - q. Запишем матрицу ожидаемых выигрышей первого и второго игроков:

Очевидно, первый игрок решает задачу

Решением задачи является

Эти три случая представлены на рис. 2.23.

Рис. 2.23

Аналогично второй игрок решает задачу Решением задачи является

Эти три случая представлены на рис. 2.24.

Рис. 2.24

Совмещая рисунки, получим рис. 2.25.

Рис. 2.25

Точка N (р = 0,75; q = 0,6), очевидно, является точкой равновесия Нэша в смешанных стратегиях, поскольку она получена в результате решения задач максимизации функции u x (p,q ) пори u 2 (p,q) по q.

Ответ: равновесие Нэша:

Как соотносятся между собой решения игр в чистых стратегиях, полученные методом итерационного исключения строго доминируемых стратегий (если они существуют) и равновесий Нэша? Ответ на этот вопрос дают следующие две теоремы.

Теорема 2.3. Если существует процедура итерационного исключения строго доминируемых стратегий в игре G - (S ;, щ;i - 1,...,N), которая приводит к единственному исходу s = (s i ,s 2 ,...,s N), то этот исход является единственным равновесием Нэша.

Доказательство теоремы достаточно очевидно, поскольку процедура итерационного исключения строго доминируемых стратегий в конечной игре не может исключить равновесия Нэша. И в силу единственности получаемого исхода он будет единственным равновесием Нэша.

Замечание. Если в теореме 2.3 исключить слово «строго», то она перестает быть справедливой. Например, в игре

исходы (а; с) и (Ь; с) являются точками равновесия Нэша, хотя стратегия b доминируема.

Теорема 2.4. Если исход явля

ется равновесием Нэша, то он не может быть исключен в процедуре итерационного исключения строго доминируемых стратегий.

Доказательство теоремы следует из определения строгой доминируемости стратегии.

Пример 2.20. Рассмотрим матричную игру:

Точка равновесия Нэша - (а,х). Однако стратегия а первого игрока доминируема (не строго) стратегией с, а стратегия х второго игрока доминируема стратегией у. Тем самым мы показали, что условие строгой доминируемое™ в теореме существенно.

Пример 2.21. Рассмотрим игру двух игроков, называемую «битва полов» (или «семейный спор»). Саша и Маша пытаются решить, как им проводить выходной день, - пойти на футбол или на балет. Конечно, Саше больше хочется пойти на футбол, Маша же получает большее удовольствие от балета. Но совсем никакого удовольствия они не получат, если будут развлекаться порознь (бывает же такое!). Саша и Маша выбирают место развлечения одновременно и независимо друг от друга, не сговариваясь. Матрица выигрышей имеет следующий вид :

В данной игре исход (Футбол; футбол) является точкой равновесия Нэша. Это значит, что если игроки договорились о выборе каждым из них первой стратегии, то ни одному из них невыгодно будет отклоняться от нее, если другой ее придерживается. Аналогично и исход (Балет; балет) будет точкой равновесия Нэша. Рассмотрим теперь возможность выбора игроками смешанных стратегий. Пусть первый игрок (Саша) выбирает первую и вторую чистые стратегии с вероятностями соответственно р и 1 - р. Второй игрок (Маша) выбирает первую и вторую чистые стратегии с вероятностями соответственно q и 1 -q. Получаем матрицу

Выигрыш Саши равен

Стратегия Саши определяется выбором вероятности р. Функция выигрыша Саши и с (р, q) р ,

если , и, следовательно, приСаша выберет максимальное значение вероятности, т.е.р = 1.

Аналогично если, то функция u c (p,q) - убывающая по переменной/;, и, следовательно, при Саша, максимизируя свой выигрыш, выберет минимальное значение вероятности, т.е. р = 0.

При функция и с (р> q) не зависит от р и Сашу удовлетворяет любое значение р е . Таким образом, имеем

Все сказанное наглядно представляется диаграммой (рис. 2.26).

Рис. 2.26

Выигрыш Маши равен

Стратегия Маши определяется выбором вероятности q. Функция выигрыша Маши u M (p,q) является монотонно возрастающей по переменной q,

если , и, следовательно, приМаша выберет максимальное значение вероятности, т.е.q = 1.

Аналогично если , то функция u M (p,q) - убывающая по переменной q, и, следовательно, приМаша выберет минимальное значение

вероятности, т.е.

При функция и и (р, q) не зависит от q и Машу удовлетворяет

любое значение

Все сказанное наглядно представляется диаграммой (рис. 2.27). Совмещение диаграмм на рис. 2.26 и 2.27 дает три точки пересечения наилучших выборов игроков на всевозможные действия другого игрока (рис. 2.28).

Имеем три точки равновесия Нэша. Первые

две из них соответствуют выбору чистых стратегий (Балет; балет) и (Футбол; футбол). Третья точка представляет собой точку равновесия Нэша в смешанных стратегиях.

Заметим, что значения платежных функций обоих игроков в точке В соседней точке, например , значения платежных функций игроков равны Однако

эта точка не будет точкой равновесия, поскольку если Маша будет придерживаться стратегии , то Саше будет более выгодна стратегия р = 1,

поскольку

Рис. 2.27

Пример 2.22. Рассмотрим пример биматричной игры, в которой существует бесконечно много равновесий 11эша:

Выигрыш первого игрока равен

р получим

Графически этот выбор изображается следующим образом (рис. 2.29).

Рис. 2.29

q вторым игроком. Но первый игрок не знает, каков выбор второго игрока. Он лишь знает, что второй игрок будет также максимизировать свою функцию выигрыша по переменной q.

Выигрыш второго игрока равен

Из условия максимизации функции выигрыша по переменной q получим

Графически этот выбор изображается следующим образом (рис. 2.30).

Рис. 230

Совместим графики на рис. 2.29 и 2.30 (рис. 2.31).

Рис. 2.31

Графики совпадают на отрезке АВ и в начале координат. Все эти точки и будут равновесиями Нэша в смешанных стратегиях. Точка p = q = 0 означает выбор профиля чистых стратегий (b;d ). Поэтому получим: NE:{(b;d), (pa + (l-p)b ; с), ре }.

Следующая теорема дает ответ на вопрос о существовании равновесия Нэша в довольно широком классе игр.

Теорема 2.5 (Нэш, 1950). Для любой конечной игры (т.е. множество игроков и множества их чистых стратегий конечны) в нормальной форме G = (N,S jt Uj,i = 1,..., N) всегда существует по крайней мере одна точка равновесия Нэша, возможно, в смешанных стратегиях.

Чистые стратегии могут быть строго доминируемы смешанными стратегиями, даже если в чистых стратегиях не существует доминируемых стратегий. Покажем это на следующем примере.

Пример 2.23. Дана биматричная игра:

Найти все равновесия Нэша в смешанных стратегиях.

Решение

В данной биматричной игре невозможно, рассматривая только чистые стратегии игроков, исключить строго доминируемые стратегии. Попробуем найти смешанную стратегию, которая доминирует чистую стратегию.

Сначала рассмотрим возможность исключения строго доминируемых строк. Выпишем для удобства матрицу выигрышей первого игрока (он выбирает строки):

Очевидно, никакая смешанная стратегия ра + (1- р)Ь не сможет доминировать чистую стратегию с, поскольку неравенство /?-0 + (1-/?)-2>14 невыполнимо ни при каких значениях р е . Значит, стратегия с не может быть строго доминируема даже с применением смешанных стратегий.

Как было доказано выше, величина f(p) = p-A + (l-p) B при /?е, {А и В - действительные числа) может принимать все значения между числами А и В. Действительно, поскольку /(/?) - линейная функция, то множеством ее значений является отрезок E(f) = .

Аналогично стратегия а не может быть доминируема смешанной стратегией pb + (l-р)с, поскольку (при выборе вторым игроком стратегии е) потребуется выполнение неравенства 4/?+ 4(1-/?) >6.

Предполагая, что смешанная стратегия pa + (1 - р)с может строго доминировать чистую стратегию Ь, также получим невыполнимое неравенство 2/?+ 4(1-/?) >8.

Следовательно, в данной игре не существует строго доминируемых стратегий первого игрока.

Рассмотрим стратегии второго игрока. Выпишем матрицу его выигрышей:

Очевидно, стратегии ей/ недоминируемы. Поскольку 2 е , 1 е , то можем предположить, что существует смешанная стратегия qe + (l-q)f, строго доминирующая чистую стратегию d. Проверим наше предположение. Для этого требуется выполнение системы неравенств:

Необязательно было решать систему неравенств. Достаточно догадаться, что эта система имеет какое-нибудь решение. Например, в данной задаче

видно, что смешанная стратегия строго доминирует стратегию d.

Важно понимать, что не только второй игрок исключает стратегию d, но и первый игрок, поставив себя на место второго и выполнив за него все указанные операции, может прийти к вывод}" об исключении стратегии d.

Вычеркнув первый столбец, получим матрицу

Нетрудно увидеть, что в этой матрице смешанная стратегия первого

игрока строго доминирует стратегию с (это стало очевидным только

после исключения стратегии d). Игра сократилась до биматричной игры размерности 2x2:

Теперь е>/. Получим

И наконец, а >- Ь.

Равновесие Нэша: (а; е). Этот исход будет единственным равновесием Нэша в исходной игре, поскольку процедура исключения строго доминируемых стратегий не может исключить равновесный по Нэшу профиль стратегий.

Пример 2.24. Последовательным исключением строго доминируемых чистых стратегий привести биматричную игру к игре размерности 2x2 (смешанная стратегия может доминировать чистую). Найти все равновесия Нэша в смешанных стратегиях.

5) Пусть первый игрок играет смешанную стратегию рА + ( 1 - р)С, а второй - qE + (-q)F.

Выигрыш первого игрока равен

Из условия максимизации функции выигрыша по переменной р получим

Графически этот выбор изображается следующим образом (рис. 2.32).

Рис. 2.32

Это наилучшее для первого игрока действие, зависящее от выбора вероятности q вторым игроком.

Выигрыш второго игрока равен

Из условия максимизации функции выигрыша по переменной q получим Графически этот выбор изображается следующим образом (рис. 2.33).

Рис. 2.33

Совместим графики на рис. 2.32 и 2.33 (рис. 2.34).

Рис. 2.34

Графики совпадают в трех точках. Эти точки и будут определять равновесия Нэша:

Пример 2.25. Найти все равновесия Нэша в смешанных стратегиях в биматричной игре

Решение

Способ 1. Нетрудно видеть, что в данной игре не существует строго доминируемых стратегий. Введем смешанные стратегии игроков:

Выигрыш первого игрока максимизируем по переменной р:

Выигрыш второго игрока максимизируем по переменным q и г.

Рассмотрим различные значения р (рис. 2.35).

Рис. 235

Случай 1. Пусть р 0,5. Тогда из (2) и (3) получим р - 0. Итак, (р = ();q = 0;г = 1) - равновесие Нэша. Это исход (b, d).

Случай 2. Пусть р = 0,5. Тогда из (2) получим q = 0, а из (1) 5г= 3, или г = 0,6. Следовательно, (р = 0,5; q = 0; г = 0,6) - равновесие Нэша. Это исход (0,5а + 0,56, 0,6d + 0,4е).

Случай 3. Пусть р е (0,5; 1). Тогда из (2) и (3) получим q = 0; г= 0. Но тогда из (1) имеем р = 1, что противоречит исходному условию.

Случай 4. Пусть р = 1. Тогда из (3) получим г = 0, а из (1) q 3, что выполняется при всех допустимых q. Итак, (р = 1; е;г = 0) - равновесия Нэша. Это исходы (a, qc + (-q)e), qe[ 0; 1].

Ответ: (6, d) (0,5а + 0,56, 0,6с/ + 0,4с); (a,qc + (-q)e), ^е.

Покажем еще один способ нахождения равновесий Нэша в таких играх.

Способ 2 (решения примера 2.25). Рассмотрим выигрыши второго игрока при условии выбора первым игроком смешанной стратегии ра + (-р)Ь. Выигрыш второго игрока при выборе им чистой стратегии с равен U - 3 р при выборе чистой стратегии d - = р + 3(- р)] при выборе чистой стратегии е - U? 2 =Зр + (-р).

Построим графики функций выигрыша второго игрока (рис. 2.36).


Рис. 2.36

Случай 1. Пусть р d. Но наилучшим ответом первого игрока на стратегию второго d является чистая стратегия b (2 > 0), т.е. р- 0, что удовлетворяет исходному условию р 0,5. Следовательно, (b , d) - равновесие Нэша.

Случай 2. Пусть р е (0,5; 1). Тогда второй игрок выбирает чистую стратегию е. Но наилучшим ответом первого игрока на стратегию второго е является чистая стратегия а (4 > 1), т.е. р = 1, что не удовлетворяет исходному условию. В данном промежутке нет равновесий Нэша.

Случай 3. Пусть р = 0.5. Тогда вторым игроком не будет играться стратегия с, г.е. q - 0. Рассмотрим игру

Математическое ожидание выигрыша первого игрока равно

Значение р = 0,5 может быть наилучшим ответом на смешанную стратегию второго игрока только при г = 0,6. Тогда исход (0,5а + 0,56, 0,6d + + 0,4с) - равновесие Нэша.

К тому же результату мы придем и из других рассуждений. А именно, для первого игрока значение р = 0,5 возможно только в случае его безразличия к выбору стратегии а или Ь. Э го значит:

Случай 4. Пусть р= 1. Тогда вторым игроком не будет играться стратегия d, т.е. г = 0. Матрица принимает вид

Тогда (a, qc + (1 - q)e) - равновесие Нэша при любых

Пример 2.26. Найти все равновесия Нэша в смешанных стратегиях в биматричной игре

Решение

Рассмотрим выигрыши второго игрока при использовании им чистых стратегий в ответ на смешанную стратегию первого игрока:

Построим графики этих функций (рис. 2.37).


Рис. 2.37

В точке А пересекаются прямые d не. Найдем точку пересечения:

В точке В пересекаются прямые сие. Найдем точку пересечения:

Ломаная линия MABN - наилучший ответ второго игрока при различных значениях р. Рассмотрим несколько случаев.

Случай 1:

чистая стратегия d. d й, что соответствует значению b, d).

Случай 2: . Тогда наилучшим ответом второго игрока является

чистая стратегия е. Но наилучшим ответом первого игрока на чистую стратегию е второго игрока является чистая стратегия а , что соответствует значению . В этом промежутке нет равновесий Нэша.

Случай 3: . Тогда наилучшим ответом второго игрока является

чистая стратегия с. Но наилучшим ответом первого игрока на чистую стратегию с второго игрока является чистая стратегия а , что соответствует значению . В этом промежутке получили единственное равновесие Нэша (а } с).

Случай 4: (точка Л). В этой точке заведомо не играется стратегия с. Матрица игры принимает вид

Рассмотрим математическое ожидание выигрыша первого игрока:

При равновесном по Нэшу исходе первый игрок максимизирует по р свою функцию полезности:

Очевидно, если является оптимальным для первого игрока, то

. Это значение можно получить из условия равенства значений функции выигрыша первого игрока при выборе им а и /;. Иными словами, первому игроку безразлично, выберет он а или b :

Следовательно, профиль стратегий является равно

весием Нэша.

Случай 5: (точка В). В этой точке заведомо не играется стратегия d. Матрица игры принимает вид

Поскольку а >- b , то р = 1 , что противоречит исходному условию Следовательно, не существует равновесия Нэша, при котором второй игрок выбирает

Этот метод решения можно применять для нахождения равновесий Нэша в любых биматричных играх размерности 2 хп или п х 2, и, следовательно, он более универсален, чем метод, примененный в способе 1 решения предыдущего примера.

  • Здесь и далее в аналогичных примерах стратегии Саши (Футбол, Балет) обозначенысловом, начинающимся с заглавной буквы, стратегии Маши - со строчной.

February 10th, 2015

Давайте быстро поделим 100$. Вы и я решаем, сколько из сотни мы требуем и одновременно озвучиваем суммы. Если наша общая сумма меньше ста, каждый получает то, что хотел. Если общее количество больше ста, тот, кто попросил наименьшее количество, получает желаемую сумму, а более жадный человек получает то, что осталось. Если мы просим одинаковую сумму, каждый получает 50 $. Сколько вы попросите? Как вы разделите деньги?

Существует единственный выигрышный ход.

Для начала по научному:

Равновесие Нэша (англ. Nash equilibrium ) названо в честь Джона Форбса Нэша - так в теории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша.

Концепция равновесия Нэша (РН) впервые использована не Нэшем; Антуан Огюст Курно показал, как найти то, что мы называем равновесием Нэша, в игре Курно. Соответственно, некоторые авторы называют его равновесием Нэша-Курно . Однако Нэш первым показал в своей диссертации по некооперативным играм в 1950-м году, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. До Нэша это было доказано только для игр с 2 участниками с нулевой суммой Джоном фон Нейманом и Оскаром Моргенштерном (1947).

А теперь решение задачки, которая была представлена в начале поста:

Требование 51 $ даст вам максимальную сумму независимо от того, что выберет ваш противник. Если он попросит больше, вы получите 51 $. Если он попросит 50 $ или 51 $, вы получите 50 $. И если он попросит меньше 50 $, вы получите 51 $. В любом случае нет никакого другого варианта, который принесет вам больше денег, чем этот. Равновесие Нэша - ситуация, в которой мы оба выбираем 51 $.

А теперь немного об этом человеке:

Джон Нэш родился 13 июня 1928 г. в Блюфилде, штат Вирджиния, в строгой протестантской семье. Отец работал инженером в компании Appalachian Electric Power, мама до замужества успела 10 лет проработать школьной учительницей. В школе учился средне, а математику вообще не любил - в школе ее преподавали скучно. Когда Нэшу было 14, к нему в руки попала книга Эрика Т. Белла «Великие математики». «Прочитав эту книгу, я сумел сам, без посторонней помощи, доказать малую теорему Ферма» - пишет Нэш в своей автобиографии. Так его математический гений заявил о себе.

Учёба

Затем последовала учёба в Политехническом институте Карнеги (ныне частный Университет Карнеги-Меллона), где Нэш пробовал изучать химию, прослушал курс международной экономики и потом окончательно утвердился в решении заняться математикой. В 1948 году, окончив институт с двумя дипломами - бакалавра и магистра, - он поступил в Принстонский университет. Институтский преподаватель Нэша Ричард Даффин снабдил его одним из самых лаконичных рекомендательных писем. В нем была единственная строчка: «Этот человек - гений!»

Работы

В Принстоне Джон Нэш услышал о теории игр, в ту пору только представленной Джоном фон Нейманом и Оскаром Моргенштейном. Теория игр поразила его воображение, да так, что в 20 лет Джон Нэш сумел создать основы научного метода, сыгравшего огромную роль в развитии мировой экономики. В 1949 году 21-летний ученый написал диссертацию о теории игр. Сорок пять лет спустя он получил за эту работу Нобелевскую премию по экономике. Вклад Нэша описали так: зафундаментальный анализ равновесия в теории некооперативных игр.

Нейман и Моргенштейн занимались так называемыми играми с нулевой суммой, в которых победа одной стороны неизбежно означает поражение другой. В 1950 - 1953 гг. Нэш опубликовал четыре без преувеличения революционные работы, в которых представил глубокий анализ «игр с ненулевой суммой» - особого класса игр, в которых все участники или выигрывают, или терпят поражение. Примером такой игры могут стать переговоры об увеличении зарплаты между профсоюзом и руководством компании. Эта ситуация может завершиться либо длительной забастовкой, в которой пострадают обе стороны, либо достижением взаимовыгодного соглашения. Нэш сумел разглядеть новое лицо конкуренции, смоделировав ситуацию, впоследствии получившую название «равновесие по Нэшу» или «некооперативное равновесие», при которой обе стороны используют идеальную стратегию, что и приводит к созданию устойчивого равновесия. Игрокам выгодно сохранять это равновесие, так как любое изменение только ухудшит их положение.

В 1951 году Джон Нэш стал работать в Массачусетском Технологическом институте (MIT) в Кэмбридже. Коллеги его особенно не любили, т. к. он был очень эгоистичен, однако относились к нему терпеливо, ведь его математические способности были блестящими. Там у Джона завязались близкие отношения с Элеанор Стиэр, которая вскоре уже ждала от него ребёнка. Так Нэш стал отцом, однако он отказался дать свое имя ребенку для записи в свидетельство о рождении, а также отказался оказывать какую-либо финансовую поддержку. В 1950-х гг. Нэш был знаменит. Он сотрудничал с корпорацией RAND, занимающейся аналитическими и стратегическими разработками, в которой работали ведущие американские ученые. Там, опять-таки благодаря своим исследованиям в области теории игр, Нэш стал одним из ведущих специалистов в области ведения «холодной войны». Кроме этого, работая в MIT Нэш написал ряд статей по вещественной алгебраической геометрии и теории римановых многообразий, высоко оценённые современниками.

Болезнь

Вскоре Джон Нэш встретил Алисию Лард и в 1957 г. они поженились. В июле 1958 г. журнал Fortune назвал Нэшавосходящей звездой Америки в «новой математике». Вскоре жена Нэша забеременела, но это совпало с болезнью Нэша - онзаболел шизофренией. В это время Джону было 30 лет, а Алисии - всего 26. В начале Алисия пыталась скрыть все происходящее от друзей и коллег, желая спасти карьеру Нэша. Однако спустя несколько месяцев безумного поведения, Алисия насильно поместила мужа в частную психиатрическую клинику в пригороде Бостона, McLean Hospital, где ему поставили диагноз «параноидальная шизофрения». После выписки он внезапно решил уехать в Европу. Алисия оставила новорожденного сына своей матери и последовала за мужем. Она вернула своего мужа в Америку. По возвращении они обосновались в Принстоне, где Алисия нашла работу. Но болезнь Нэша прогрессировала: он постоянно чего-то боялся, говорил о себе в третьем лице, писал бессмысленные почтовые карточки, звонил бывшим коллегам. Они терпеливо выслушивали его бесконечные рассуждения о нумерологии и состоянии политических дел в мире.

Ухудшение состояния мужа все сильнее угнетало Алисию. В 1959 г. он лишился работы. В январе 1961 года полностью подавленная Алисия, мать Джона и его сестра Марта приняли трудное решение: поместить Джона в Trenton State Hospital в Нью Джерси, где Джон прошел курс инсулиновой терапии - жесткое и рискованное лечение, 5 дней в неделю в течении полутора месяцев. После выписки коллеги Нэша из Принстона решили ему помочь, предложив ему работу в качестве исследователя, однако Джон опять отправился в Европу, но на этот раз один. Домой он отправлял только загадочные письма. В 1962 году, после 3 лет смятения, Алисия развелась с Джоном. При помощи матери она вырастила сына сама. Позднее оказалось, что у него тоже шизофрения.

Несмотря на развод с Алисией коллеги-математики продолжали помогать Нэшу - они дали ему работу в Университете и устроили встречу с психиатром, которой выписал анти-психотические лекарства. Состояние Нэша улучшилось, и он стал проводить время с Элеонорой и своим первым сыном Джоном Дэвидом. «Это было очень обнадёживающее время, - вспоминает сестра Джона Марта. - Это был достаточно долгий период. Но затем все стало меняться». Джон перестал принимать лекарства, опасаясь, что они могут оказать подавляющие влияние на мыслительную активность и симптомы шизофрении опять проявились.

В 1970 г. Алисия Нэш, будучи уверенной, что она совершила ошибку, предав мужа, приняла его вновь, и теперь уже как пансионера, это возможно и спасло его от состояния бездомности. В последующие годы Нэш продолжал ходить в Принстон, записывая на досках странные формулы. Студенты Принстона прозвали его «Фантом». Затем в 1980 гг. Нэшу стало заметно лучше - симптомы отступили и он стал более вовлеченным в окружающую жизнь. Болезнь, к удивлению врачей, стала отступать. Точнее, Нэш стал учиться не обращать на нее внимания и вновь занялся математикой. «Сейчас я мыслю вполне здраво, как всякий ученый, - пишет Нэш в своей автобиографии. - Не скажу, что это вызывает у меня радость, какую испытывает всякий выздоравливающий от физического недуга. Здравое мышление ограничивает представления человека о его связи с космосом».

Признание

В 1994, в возрасте 66 лет, Джон Нэш получил Нобелевскую Премию за свою работу по теории игр. Однако он был лишен возможности прочитать традиционную Нобелевскую лекцию в Стокгольмском университете, так как организаторы опасались за его состояние. Вместо этого был организован семинар (с его участием), на котором обсуждался его вклад в теорию игр. После этого Нэш был приглашен прочитать лекцию в университете Уппсалы, раз уж ему не предоставилось такой возможности в Стокгольме. По словам приглашавшего его профессора Математического института университета Уппсалы Кристера Кисельмана, лекция была посвящена космологии.

В 2001 году, через 38 лет после развода, Джон и Алисия вновь поженились. Нэш вернулся в свой офис в Принстоне, где продолжает познавать математику и познавать этот мир - мир, в котором вначале он был так успешен; мир, который заставил его пройти через очень сложное заболевание; и всё-таки этот мир принял его вновь.

«Игры разума»

В 1998 году американская журналистка (и профессор экономики Колумбийского университета Сильвия Назар) написала биографию Нэша под названием «A Beautiful Mind: The Life of Mathematical Genius and Nobel Laureate John Nash» (Прекрасный ум: Жизнь гения математики и нобелевского лауреата Джона Нэша). Книга мгновенно стала бестселлером.

В 2001 году под руководством Рона Ховарда по мотивам книги был снят фильм «A Beautiful Mind», в русском прокате «Игры разума». Фильм получил четыре «Оскара» (за лучшие адаптированный сценарий, режиссуру, актрису второго плана и, наконец, лучший фильм), награду «Золотой глобус» и был отмечен несколькими призами Bafta (британская премия за кинематографические достижения).

Как видим, фильм практически правда. Конечно, с некоторыми «литературными» искажениями.

  • На роль режиссёра фильма был предложен Роберт Редфорд, но его не устроило расписание съёмок.
  • На роль Джона Нэша пробовался Том Круз, а на роль Алисии - Сальма Хайек. Любопытно, что она родилась в том же городке Эль Сальвадор, что и её несостоявшаяся героиня.
  • Когда Нэш впервые видит Паркера, он обращается к нему как к «большому брату» (намёк на роман Оруэлла «1984»). Ещё одна отсылка к Оруэллу происходит позднее, когда мы видим номер на двери кабинета Нэша - 101.
  • В роли рукописи, которую молодой Джон Нэш показывает своему куратору, профессору Хелинджеру, выступает подлинная копия статьи, напечатанной в журнале Econometrica под заголовком «Задача совершения сделки».
  • Сценарист фильма Акива Голдсман имел немалый опыт общения с душевнобольными людьми: в свою бытность врачом он лично разрабатывал методики восстановления душевного здоровья детей и взрослых.
  • Куратором фильма по математической части стал профессор Барнардского колледжа Дэйв Байер - именно его рукойРасселл Кроу «выводит» на доске мудрёные формулы.
  • «Мудрёные формулы» при внимательном рассмотрении представляют собой просто бессмысленный набор греческих букв, стрелок и математических знаков.
  • В отличие от своего экранного двойника, отличавшегося редкой преданностью своей «половинке», реальный Джон Нэш в своей жизни несколько раз был женат, а в двадцать с небольшим лет усыновил внебрачного ребенка.
  • В части фильма, относящейся к периоду вручения Нобелевской Премии (1994 г.), Нэш говорит о том, что якобы принимает антипсихотики нового типа, однако в действительности Джон Нэш отказался от них еще в 1970 году, и его ремиссия не была связана с приемом нейролептиков.

Где же сегодня применяются открытия Нэша?


Пережив бум в семидесятых-восьмидесятых, теория игр заняла прочные позиции в некоторых отраслях социального знания. Эксперименты, в которых команда Нэша в свое время фиксировала особенности поведения игроков, в начале пятидесятых были расценены как провал. Сегодня они легли в основание «экспериментальной экономики». «Равновесие Нэша» активно используется в анализе олигополий: поведении небольшого количества конкурентов в отдельном секторе рынка.

Кроме того, на Западе теория игр активно используется при выдаче лицензий на вещание или связь: выдающий орган математически высчитывает наиболее оптимальный вариант распределения частот.

Точно так же успешный аукционист сам определяет, какую информацию о лотах можно предоставлять конкретным покупателям, чтобы получить оптимальный доход. С теорией игр успешно работают в юриспруденции, социальной психологии, спорте и политике. Для последней характерным примером существования «равновесия Нэша» является институционализация понятия «оппозиция».

Однако теория игр нашла свое применение не только в социальных науках. Современная эволюционная теория была бы невозможна без представления о «равновесии Нэша», которое математически объясняет, почему волки никогда не съедают всех зайцев (потому что иначе они через поколение умрут от голода) и почему животные с дефектами делают свой вклад в генофонд своего вида (потому что в таком случае вид может приобрести новые полезные характеристики).

Сейчас от Нэша не ждут грандиозных открытий. Кажется, это уже неважно, поскольку он успел сделать две самые важные вещи в жизни: стал признанным гением в молодости и победил неизлечимую болезнь в старости.

И еще немного научных теорий: вот вам например , а вот . Вспомним еще про , и . А ведь есть еще и Оригинал статьи находится на сайте ИнфоГлаз.рф Ссылка на статью, с которой сделана эта копия -

В играх с ненулевой суммой в выигрыше или проигрыше могут оказаться все участники игры. Биматричная игра – это конечная игра двух игроков с ненулевой суммой. В этом случае для каждой игровой ситуации A i B j каждый из игроков имеет свой выигрыш a ij для первого игрока и b ij – для второго игрока. К биматричной игре сводится, например, поведение производителей на рынках несовершенной конкуренции. С помощью онлайн-калькулятора можно найти решение биматричной игры , а также ситуации оптимальные по Парето и ситуации устойчивые по Нэшу .

Рассмотрим конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

  • игрок А – может выбрать любую из стратегий А 1 ,…,А m ,
  • игрок В – любую из стратегий В 1 ,…,В n .

При этом их совместный выбор оценивается вполне определённо: если игрок А выбрал i-ю стратегию А i , а игрок В – k -ю стратегию В k , то в итоге выигрыш игрока А будет равен некоторому числу a ik , а выигрыш игрока В некоторому, вообще говоря, другому числу b ik .
Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы.

Первая из таблиц описывает выигрыш игрока А, а вторая – выигрыш игрока В. Обычно эти таблицы записывают в виде матрицы.
Здесь А – платёжная матрица игрока А, В – платёжная матрица игрока В.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны) получаются две платёжные матрицы: одна – матрица выплат игроку А, другая – матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная .

Равновесие Нэша – равновесие, когда каждый участник игры выбирает стратегию, которая является для него оптимальной при условии, что остальные участники игры придерживаются определенной стратегии.
Равновесие Нэша не всегда является наиболее оптимальным для участников. В этом случае говорят, что равновесие не является Парето-оптимальным .
Чистая стратегия – определенная реакция игрока на возможные варианты поведения других игроков.
Смешанная стратегия – вероятностная (не определенная точно) реакция игрока на поведение других игроков.

Пример №1 . Борьба за рынки сбыта.
Фирма а намерена сбыть партию товара на одном из двух рынков, контролируемых более крупной фирмой b . С этой целью она проводит подготовительную работу, связанную с определенными затратами. Если фирма b разгадает, на каком из рынков фирма а будет продавать свой товар, она примет контрмеры и воспрепятствует "захвату" рынка (этот вариант означает поражение фирмы а); если нет, то фирма а одерживает победу. Предположим, что для фирмы а проникновение на первый рынок более выгодно, чем проникновение на второй, но и борьба на первом рынке требует от нее больших средств. Например, победа фирмы а на первом рынке приносит ей вдвое большую прибыль, чем победа на втором, но зато поражение на первом рынке полностью ее разоряет.
Составим математическую модель этого конфликта, считая фирму а игроком 1 и фирму b игроком 2. Стратегии игрока 1: А 1 – проникновение на рынок 1, А 2 – проникновение на рынок 2; стратегии игрока 2: В 1 – контрмеры на рынке 1, В 2 – контрмеры на рынке 2. Пусть для фирмы а ее победа на 1-м рынке оценивается в 2 единицы, а победа на 2-м рынке – в 1 единицу; поражение фирмы а на 1-м рынке оценивается в -10, а на 2-м в -1. Для фирмы b ее победа составляет соответственно 5 и 1 единицу, а поражение -2 и -1. Получаем в итоге биматричную игру Г с матрицами выигрышей
.
По теореме эта игра может иметь либо чистые, либо вполне смешанные ситуации равновесия. Ситуаций равновесия в чистых стратегиях здесь нет. Убедимся теперь, что данная игра имеет вполне смешанную ситуацию равновесия. Находим , .
Итак, рассматриваемая игра имеет единственную ситуацию равновесия , где , . Она может быть реализована при многократном повторении игры (то есть при многократном воспроизведении описанной ситуации) следующим образом: фирма а должна использовать чистые стратегии 1 и 2 с частотами 2/9 и 7/9, а фирма b – чистые стратегии 1 и 2 с частотами 3/14 и 11/14. Любая из фирм, отклонившись от указанной смешанной стратегии, уменьшает свой ожидаемый выигрыш.

Пример №2 . Найти ситуации оптимальные по Парето и ситуации устойчивые по Нэшу для биматричной игры.

Пример №3 . Имеются 2 фирмы: первая может произвести одно из двух изделий А 1 и А 2 , вторая – одно из двух изделий B 1 , B 2 . Если первая фирма произведет продукцию A i (i = 1, 2), а вторая - B j (j = 1, 2), то прибыль этих фирм (зависящая от того, являются ли эти изделия взаимодополняющими или конкурирующими), определяется таблицей №1:

В 1 В 2
А 1 (5, 6) (3, 2)
А 2 (2, 1) (5, 3)
Считая, что фирмы заключают между собой соглашение, определить справедливое распределение прибыли, используя арбитражное решение Нэша.
Статьи по теме: