Пятая информационная ситуация критерий вальда. Критерии вальда, сэвиджа, гурвица и лапласа. Критерий минимаксного риска Сэвиджа

При использовании максиминного критерия Вальда в качестве оптимальной выбирается стратегия, которая максимизирует минимальный результат для каждой альтернативы:

Значение критерия Вальда для рассматриваемого примера v op , = 4. Этому значению соответствует стратегия Х 4 .

Для критерия минимаксного риска Сэвиджа оптимальной является стратегия, при которой величина риска Гу в наихудших условиях минимальна, т.е. равна

а риск определяется как Гу =(шахау)-ау. Значение критерия Сэвиджа

для рассматриваемого примера равно единице. Ему соответствует стратегия Х 2 .

Критерий оптимизма - пессимизма Гурвица предполагает, что при выборе решения не следует руководствоваться ни крайним пессимизмом, ни крайним оптимизмом. Согласно этому критерию стратегия выбирается из условия

Значение коэффициента пессимизма к выбирается между нулем и единицей. При к = 1 критерий Гурвица превращается в критерий Вальда, при к > 0 - в критерий крайнего оптимизма.

В случае использования критерия безразличия Лапласа предполагается, что (неизвестные) вероятности возможных состояний окружающей среды (природы) одинаковы. Этот критерий выявляет альтернативу с максимальным средним результатом:

Пример 13.15. Молодой специалист (ЛПР) приглашен на стажировку в одну из европейских стран на пять лет. По итогам испытательного срока длительностью один год он может быть приглашен на постоянную работу. Ему необходимо распорядиться двухкомнатной квартирой, которую он имеет.

Возможные состояния конъюнктуры рынка S/.

  • 1) останется в Европе и курс доллара увеличится на 10% за год;
  • 2) останется в Европе и курс доллара уменьшится на 10% за год;
  • 3) вернется в Россию и курс доллара увеличится на 10% за год;
  • 4) вернется в Россию и курс доллара уменьшится на 10% за год.

Варианты решений для ЛПР Я):

  • 1) продать квартиру перед отъездом за 7 200 тыс. руб. (240 тыс. дол.);
  • 2) сдать квартиру в аренду за 30 тыс. руб./мес.;
  • 3) сдать одну комнату в аренду за 12 тыс. руб., а вторую продать за 2 400 тыс. руб.;
  • 4) продать квартиру через год, когда решение о переезде будет принято.

Очевидно, что если придется возвращаться и квартира будет сохранена, то этот вариант предпочтительнее. К такому варианту добавим некий бонус:

  • 1) если квартира продана сразу, то вычитаем сумму минимальной стоимости квартиры - 220 тыс. дол.;
  • 2) если квартира сохранена, то такую же сумму прибавляем;
  • 3) если продана только одна комната, то бонус равен стоимости одной комнаты - 80 тыс. дол.

Пусть курс доллара на данный момент равен 30 руб. Составим матрицу выигрышей в долларах США (табл. 13.9).

Вычислим платежную матрицу игры (табл. 13.10) и матрицу рисков (табл. 13.11)

Найдем решения, используя все рассмотренные критерии. Применяя максиминный критерий Вальда, получим

Этому критерию соответствует стратегия Ху Критерий минимаксного риска Сэвиджа дает

Таблица 13.9

30000 12 , -0000

30000 12 , -0000

12 000 12+2 400 000

12 000 12+ 2400 000

12 000 1 2+ 2 400 000

12 000 12+2 400 000

7200000 , омо

344 . ГЛАВА 13. ЭЛЕМЕНТЫ ТЕОРИИ ИГР

Таблица 13.10

г опт = шах {0,0,59111,0} = 59111,

что соответствует выбору стратегии X 3 .

Применяя критерий Гурвица при к = 0,6 (что соответствует среднестатистическим предпочтениям), получим


Этому критерию также соответствует стратегия X 3 . По критерию Лапласа

Это решение соответствует стратегии Х 4 .

Таким образом, по трем критериям оптимальной стратегией является X з.

В заключении отметим, что каждый критерий имеет свои положительные и отрицательные стороны. Анализ матрицы игры при помощи разных критериев позволяет исследовать задачу с разных точек зрения, особенно это полезно, если соответствующая матрица имеет большую размерность. Это в любом случае более конструктивный подход, чем попытки сравнения множества вариантов. Если полученные решения совпадут, как в примере, то решение однозначно. Если нет, то нужно провести дополнительный анализ с учетом всех характеристик рассматриваемых критериев.

Критерий Вальда

Критерий Вальда является самым "осторожным". Согласно ему, оптимальной альтернативой будет та, которая обеспечивает наилучший исход среди всех возможных альтернатив при самом плохом стечении обстоятельств.

Если исходы отражают подлежащие минимизации показатели (убытки, расходы, потери и т.д.), то критерий Вальда ориентируется на "минимакс" (минимум среди максимальных значений потерь всех альтернатив).

Если в качестве исходов альтернатив фигурируют показатели прибыли, дохода и других показателей, которые надо максимизировать (по принципу "чем больше, тем лучше"), то ищется "максимин" выигрыша (максимум среди минимальных выигрышей). Здесь и далее для всех критериев в тексте мы будем рассматривать именно такой случай, когда исход показывает некий выигрыш.

По критерию Вальда оценкой i-й альтернативы является ее наименьший выигрыш:

W i = min(x ij), j = 1..M

Оптимальной признается альтернатива с максимальным наихудшим выигрышем:

Х* = Х k , W k = max(W i), i = 1..N

Пример применения критерия Вальда

Есть два проекта Х 1 и Х 2 , которые при трех возможных сценариях развития региона (j=1..3) обеспечивают разную прибыль. Значения прибыли приведены в таблице 2. Необходимо выбрать проект для реализации.

Табл.2. Исходные данные.

Среди возможных проектов нет доминирующих ни абсолютно, ни по состояниям. Поэтому решение придется принимать по критериям.

Если выбор оптимального проекта осуществляется по критерию Вальда, то ЛПР должен выполнить следующие действия:

1. Найти минимальные исходы для каждой альтернативы. Это и будут значения критерия Вальда:

W 1 = min(x 1j), j = 1..3 => W 1 = min(45, 25, 50) = 25

W 2 = min(x 2j), j = 1..3 => W 2 = min(20, 60, 25) = 20

2. Сравнить значения критерия Вальда и найти наибольшую величину. Альтернатива с максимальным значением критерия будет считаться оптимальной:

25 > 20 => W 1 > W 2 => X* = X 1

Если бы решение принималось только по критерию Вальда, ЛПР выбрал для реализации проект Х 1 , поскольку прибыль, которую обеспечит данный проект при самом плохом развитии ситуации, выше.

Выбрав оптимальную альтернативу по критерию Вальда, ЛПР гарантирует себе, что при самом плохом стечении обстоятельств он не получит меньше, чем значение критерия. Поэтому данный показатель еще называют критерием гарантированного результата .

Основной проблемой критерия Вальда является его излишняя пессимистичность, и, как следствие, не всегда логичный результат. Так, например, при выборе по данному критерию между альтернативами А{100; 500} и В{90; 1000} следует остановиться на варианте А. Однако в жизни логичнее было бы выбрать В, так как в худшем случае В лишь немного хуже А, тогда как при хорошем стечении обстоятельств В обеспечивает гораздо больший выигрыш.


2. Критерий "максимакса"

Диаметральной противоположностью критерия Вальда является так называемый критерий "максимакса". Если Вальд отражал взгляд предельного пессимиста, то "максимакс" соответствует отношению крайнего оптимизма. Все внимание уделяется только наилучшим исходам, поэтому оценкой i-й альтернативы по данному критерию является ее наибольший выигрыш М i:

М i = mах(x ij), j = 1..M

Оптимальной считается альтернатива с максимальным наибольшим выигрышем:

Х* = Х k , М k = max(М i), i = 1..N

Пример применения критерия "максимакса"

В условиях примера из п. 1 (табл.2) действия ЛПР, использующего критерий "максимакса" для принятия решения, будут следующие:

1. Найти максимальные исходы для каждой альтернативы:

М 1 = max(x 1j), j = 1..3 =>М 1 = max(45, 25, 50) = 50

М 2 = max(x 2j), j = 1..3 =>М 2 = max(20, 60, 25) = 60

2. Сравнить найденные значения и определить альтернативу с максимальной величиной критерия:

50 < 60 => М 1 < М 2 => X* = X 2

По критерию "максимакса" оптимальным является проект Х 2 ., который может обеспечить наибольшую прибыль при наилучшем стечении обстоятельств.

Критерий "максимакса" не учитывает никакие иные исходы, кроме самых лучших. Поэтому его применение, во-первых, может быть весьма опасным, и, во-вторых, также как и критерий Вальда он может приводить к нелогичным решениям. Например, среди альтернатив А{-100; 0; 500} и В{200; 300; 400} с позиции "максимакса" лучшей является А, однако она несет в себе и опасность убытков (-100), и вообще все исходы, кроме лучшего намного уступают В. Поэтому практическое применение критерия "максимакса" весьма

Критерий Лапласа

Критерий Лапласа основан на принципе недостаточного обоснования . Поскольку в рамках информационного подхода в ситуации неопределенности вероятности состояний неизвестны, то нет оснований утверждать, что они различны. Поэтому можно допустить, что они одинаковы.

По критерию Лапласа в качестве оценки альтернативы используется средний выигрыш:

Оптимальной является альтернатива с максимальным средним выигрышем:

Х* = Х k , L k = max(L i), i = 1..N

Критерий Сэвиджа один из критериев принятия решений в условиях неопределённости. Условиями неопределённости считается ситуация, когда последствия принимаемых решений неизвестны, и можно лишь приблизительно их оценить. Для принятия решения… … Википедия

Критерий согласия Колмогорова - или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

Вальда критерий - , другое написание критерий Уолда см. Максимин … Экономико-математический словарь

Критерий согласия Пирсона - Критерий Пирсона, или критерий χ² (Хи квадрат) наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… … Википедия

Критерий Краскела - Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия

Критерий Кохрена - Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия

Критерий Лиллиефорса - статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… … Википедия

Критерий Уилкоксона - Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Добавить иллюстрации. Т Крит … Википедия

Последовательный статистический критерий - Последовательный статистический критерий последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе. Пусть наблюдению в статистическом эксперименте доступна случайная величина с… … Википедия

Тест Вальда - (англ. Wald test) статистический тест, используемый для проверки ограничений на параметры статистических моделей, оцененных на основе выборочных данных. Является одним из трех базовых тестов проверки ограничений наряду с тестом… … Википедия

Книги

  • Теория вероятностей и математическая статистика в задачах: Более 360 задач и упражнений , Борзых Д.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к… Купить за 443 руб
  • Теория вероятностей и математическая статистика в задачах. Более 360 задач и упражнений , Борзых Д.А.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к…

Многие из нас не любят попадать в ситуацию, когда информации о внешних факторах очень мало, или она напрочь отсутствует, и при этом нужно срочно сделать важный выбор. Скорее всего, именно поэтому большинство людей предпочитает избегать на работе ответственности и довольствуется скромным, но вместе с тем относительно спокойным служебным положением. Если бы они знали о теории игр и о том, какую пользу могут сослужить критерии Вальда, Сэвиджа, Гурвица, карьера наиболее сообразительных из них наверняка бы стремительно пошла вверх.

Рассчитывай на худшее

Именно так можно охарактеризовать первый из перечисленных принципов. Критерий Вальда нередко называют еще критерием крайнего пессимизма или правилом минимального зла. В условиях и шаткого, неустойчивого положения вполне логичным представляется перестраховочная позиция, которая рассчитана на самый худший случай. Максиминный критерий Вальда ориентирует на максимизацию выигрыша при наиболее неблагоприятных обстоятельствах. Примером его использования может служить максимальное увеличение минимального дохода, максимизация минимальных объемов наличности и т. п. Такая стратегия оправдывает себя в тех случаях, когда человек, принимающий решения, не столько заинтересован в большой удаче, сколько хочет застраховать себя от внезапных потерь. Другими словами, критерий Вальда сводит риск к минимуму и позволяет принимать наиболее безопасные решения. Подобный подход дает возможность получить гарантированный минимум, хотя фактический итог может оказаться не таким уж и плохим.

Критерий Вальда: пример использования

Предположим, некое предприятие собирается выпускать новые виды товаров. При этом следует сделать выбор между одним из четырех вариантов В 1 , В 2 , В 3 , В 4 , каждый из которых предполагает определенный тип выпуска либо их сочетание. От принятия решения в конечном счете будет зависеть, какую предприятие получит прибыль. Как конкретно сложится рыночная конъюнктура в будущем, неизвестно, однако аналитики прогнозируют три основных сценария развития событий: С 1 , С 2 , С 3 . Полученные данные позволяют составить таблицу возможных вариантов выигрыша, которые соответствуют каждой паре возможного решения и вероятной обстановки.

Виды продукции

Сценарии рыночной конъюнктуры

Наихудший результат

Используя критерий Вальда, следует выбрать такую, которая будет для рассматриваемого предприятия наиболее оптимальной. В нашем случае показатель эффективности

Е = мах {25;22;15;20} = 25.

Его мы получили, выбрав по каждому из вариантов минимальный результат и вычленив среди них тот, который принесет наибольший доход. Это означает, что решение В 1 будет для фирмы, согласно данному критерию, самым оптимальным. Даже при самой неблагоприятной обстановке будет получен результат 25 (С 1), в то же время не исключено, что он достигнет 45 (С 3).

Отметим еще раз, что критерий Вальда ориентирует человека на максимально осторожную линию поведения. При других обстоятельствах вполне возможно руководствоваться иными соображениями. К примеру, вариант В 3 мог бы принести выигрыш в 90 при гарантированном результате в 15. Однако этот случай выходит за рамки темы данной статьи, и потому рассматривать его мы пока не будем.

Наиболее просто решается задача о выборе решения в условиях неопределенности, когда нам хотя и неизвестны условия выполнения операции (состояние природы) но известны их вероятности:

В этом случае в качестве показателя эффективности, который мы стремимся обратить в максимум, естественно взять среднее значение, или математическое ожидание выигрыша, с учетом вероятностей всех возможных условий.

Обозначим это среднее значение для стратегии игрока через

или, короче,

Очевидно, есть не что иное, как взвешенное среднее выигрышей строки, взятых с кесами . В качестве оптимальной стратегии естественно выбрать ту из стратегий для которой величина обращается в максимум.

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Пример 1. Планируется операция в заранее неизвестных метеорологических условиях; варианты этих условий: Согласно материалам метеосводок за много лет частоты (вероятности) этих вариантов равны соответственно:

Возможные варианты организации операции в различных метеоусловиях приносят различную выгоду. Значения «дохода» для каждого решения в разные условиях приведены в табл. 13.1

Таблица 13.1

В последней строке даны вероятности условий. Средние выигрыши приведены в последнем столбце. Из него видно, что оптимальной стратегией игрока является его стратегия дающая средний выигрыш (отмечен звездочкой).

При выборе оптимальной стратегии в неизвестных условиях с известными вероятностями можно пользоваться не только средним выигрышем

но и средним риском

который, разумеется, нужно обратить не в максимум, а в минимум.

Покажем, что стратегия, максимизирующая средний выигрыш совпадает со стратегией, минимизирующей средний риск Вычислим оба эти показателя и сложим их:

(13.2)

Эта сумма (среднее взвешенное значение максимумов столбцов) для данной матрицы есть величина постоянная; Обозначим ее С:

откуда средний риск равен

Очевидно, эта величина обращается в минимум тогда же, когда а, - в максимум, следовательно, стратегия, выбранная из условий минимального среднего риска, совпадает со стратегией, выбранной из условий максимального среднего выигрыша.

Заметим, что в случае, когда известны вероятности состояний природы при решении игры с природой всегда можно обойтись одними чистыми стратегиями, не применяя смешанных. Действительно, если мы будем применять какую-то смешанную стратегию

т. е. стратегию с вероятностью стратегию с вероятностью и т. д., то наш средний выигрыш, осредненный и по условиям (состояниям природы) и по нашим стратегиям, будет:

Это - взвешенное среднее выигрышей соответствующих нашим чистым стратегиям.

Но ясно, что любое среднее не может превосходить максимальной из осредняемых величин:

Поэтому применение смешанной стратегии с любыми вероятностями не может быть выгоднее для игрока, чем применение чистой стратегии .

Вероятности условий (состояний природы) могут быть определены из статистических данных, связанных с многократным выполнением подобных операций или просто с проведением наблюдений над состояниями природы. Например, если железной дороге за данный промежуток времени предстоит выполнить не вполне известный объем перевозок, то данные о распределении условий могут быть взяты из опыта прошлых лет. Если, как в предыдущем примере, успех операции зависит от метеоусловий, данные о них могут быть взяты из статистики метеосводок.

Однако часто встречаются случаи, когда, приступая к выполнению операции, мы не имеем представления о вероятностях состояний природы; все наши сведения сводятся к перечню вариантов состояний, а оценить их вероятности мы не можем. Так, например, вряд ли нам удастся разумно оценить вероятность того, что в течение ближайших k лет будет предложено и реализовано важное техническое изобретение.

Разумеется, в подобных случаях вероятности условий (состояний природы) могут быть оценены субъективно: некоторые из них представляются нам более, а другие - менее правдоподобными. Для того чтобы наши субъективные представления о большей или меньшей «правдоподобности» той или другой гипотезы превратить в численные оценки, могут применяться различные технические приемы. Так, если мы не можем предпочесть ни одной гипотезы, если они все для нас равноправны, то естественно назначить их вероятности равными друг другу:

Это - так называемый «принцип недостаточного основания» Лапласа. Другой часто встречающийся случай - когда мы имеем представление о том, какие условия более вероятны, а какие - менее, т. е. можем расположить имеющиеся гипотезы в порядке убывания их правдоподобности: всего правдоподобнее первая гипотеза (ПО, затем вторая ) менее всего правдоподобна гипотеза (). Однако, насколько одна из них вероятнее другой - мы не знаем. В этом случае можно, например, назначить вероятности гипотез пропорциональными членам убывающей арифметической прогрессии:

или, учитывая, что

Иногда удается, исходя из опыта и здравого смысла, оценить и более тонкие различия между степенями правдоподобия гипотез.

Подобные методы субъективной оценки «вероятности-правдоподобности» разных гипотез о состоянии природы могут иногда помочь при выборе решения. Однако нельзя забывать, что «оптимальное решени выбранное на основе субъективных вероятностей, неизбежно окажется тоже субъективным. Степень субъективности решения можно уменьшить, если вместо вероятностей назначенных произвольно одним лицом, ввести средние из таких вероятностей, назначенных, независимо друг от друга, группой квалифицированных лиц («экспертов»). Метод опроса экспертов вообще широко применяется в современной науке, когда речь идет об оценке неопределенной ситуации (например, в футурологии). Опыт применения подобных методов учит, что зачастую оценки экспертов (принятые независимо одним от другого) оказываются далеко не столь разноречивыми, как это можно было предположить заранее, и вывести из них некоторые предпосылки для принятия разумного решения вполне возможно.

Выше мы осветили вопрос о выборе решения на основе объективно вычисленных или субъективно назначенных вероятностей состояний природы. Этот подход в теории решений - не единственный. Кроме него существуют еще несколько «критериев» или подходов к выбору оптимального решения в условиях неопределенности. Остановимся на некоторых из них.

1. Максиминный критерий Вальда

Согласно этому критерию в качестве оптимальной выбирается та стратегия игрока А, при которой минимальный выигрыш максимален, т. е. стратегия, гарантирующая при любых условиях выигрыш, не меньший, чем максимин:

(13.4)

Если руководствоваться этим критерием, надо всегда ориентироваться на худшие условия и выбирать ту стратегию, Для которой в худших условиях выигрыш максимален. Пользуясь таким критерием в играх с природой, мы как бы ставим взамен этой безличной и незаинтересованной инстанции активного и злонамеренного противника. Очевидно, такой подход может быть продиктован только крайним пессимизмом в оценке обстановки - «всегда надо рассчитывать на худшее!» - но как один из возможных подходов заслуживает рассмотрения.

2. Критерий минимаксного риска Сэвиджа

Сущность этого критерия в том, чтобы любыми путями избежать большого риска при принятии решения.

Критерий Сэвиджа, так же как и критерий Вальда - это критерий крайнего пессимизма, но только пессимизм здесь понимается по-другому: худшим объявляется не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях (максимальный риск).

3. Критерий пессимизма-оптимизма Гурвица

Этот критерий рекомендует в условиях неопределенности при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее!) ни крайним, легкомысленным оптимизмом (все обойдется наилучшим образом!) Критерий Гурвица имеет вид:

где - коэффициент, выбираемый между нулем и единицей.

Проанализируем структуру выражения (13.6). При критерий Гурвица превращается в пессимистический критерий Вальда, а при - в критерий «крайнего оптимизма», рекомендующий выбирать ту стратегию, для которой в наилучших условиях выигрыш максимален. При получается нечто среднее между крайним пессимизмом и крайним оптимизмом (коэффициент и выражает как бы «меру пессимизма» исследователя). Этот коэффициент выбирается из субъективных соображений - чем опаснее ситуация, чем больше мы хотим в ней «подстраховаться», тем ближе к единице выбирается и.

При желании можно построить критерий, аналогичный критерию оптимизма-пессимизма Гурвица исходя не из выигрыша, а из риска, как в критерии Сэвиджа, но мы на этом не будем останавливаться.

Несмотря на то, что выбор критерия, как и выбор параметра в критерии Гурвица, являются субъективным, все же может оказаться полезным просмотреть ситуацию с точки зрения этих критериев. Если рекомендации, вытекающие из различных критериев, совпадают - тем лучше, можно смело выбирать рекомендуемое ими решение. Если же, как это часто бывает, рекомендации противоречат друг другу - всегда имеет смысл задуматься над этим и принять окончательное решение с учетом его сильных и слабых сторон. Анализ матрицы игры с природой под углом зрения разных критериев часто дает лучшее представление о ситуации, о достоинствах и недостатках каждого решения, чем непосредственное рассмотрение матрицы, особенно, когда ее размеры велики.

Пример 2. Рассматривается игра с природой 4X3 с четырьмя стратегиями игрока: и тремя вариантами условий (состояний природы): Матрица выигрышей дана в табл. 13.2.

Таблица 13.2

Найти оптимальное решение (стратегию), пользуясь критериями Вальда, Сэвиджа и критерием Гурвица при

Решение. 1. Критерий Вальда.

В каждой строке матрицы берем наименьший выигрыш (табл. 13.3).

Из величин максимальная (отмечена звездочкой) равна 0,25, следовательно, по критерию Вальда оптимальной является стратегия

2. Критерий Сэвиджа.

Строим матрицу рисков и помещаем в правом добавочном столбце максимальный риск в каждой строке (табл. 13.4).

Минимальным из значений является 0,60 (отмечено звездочкой); следовательно, по критерию Сэвиджа, оптимальной является любая из стратегий

Таблица 13.3

3. Критерий Гурвица

Записываем в правых трех столбцах матрицы (табл. 13 5) «пессимистическую» оценку выигрыша «оптимистическую» а); и их среднее взвешенное по формуле (13.6):

для которой достигается

(минимум берется по всем Найти этот минимакс (или максимин в критерии Вальда) можно обычными методами линейного программирования. Могут быть случаи, когда применение смешанных стратегий при пользовании критериями Вальда, Сэвиджа, Гурвица даст преимущество по сравнению с тем решением, где применяются одни чистые стратегии, однако мы будем рассматривать эти критерии только для чистых стратегий.

Одна из причин этого - в том, что мы хотим избежать сложных вычислений, когда их результат может быть сведен на нет недостатком сведений о ситуации (незнание вероятностей условий). Другая, более важная причина - в том, что основное содержание теории статистических решений (мы коснемся его в следующем параграфе) - это планирование получения и использования дополнительной информации о состоянии природы, которую можно добыть путем эксперимента. Исследования показывают, что в типичных случаях, когда речь идет о получении сколько-нибудь значительного количества дополнительной информации, критерии, не пользующиеся вероятностями состояний (Вальда и др.), становятся практически равносильными критерию, основанному на вероятностях состояний. Но мы знаем, что при пользовании таким критерием применение смешанных стратегий не имеет смысла; стало быть, если мы можем получить сколько-нибудь много дополнительной информации, применение смешанных стратегий теряет смысл (каким бы из критериев выбора решения мы ни пользовались). Если же мы не можем, производя эксперименты, добывать новую информацию, то различные критерии могут давать противоречащие друг другу рекомендации, как мы видели в примере 3.

Статьи по теме: