Тема:
Многошаговые Игры
Год сдачи в учебное заведение: 2009 г.
Город в котором сдавалась учебный материал Волгоград.
Стоимость данной работы без скидки: 300 руб. (подробнее о скидках вам раскажет менеджер по работе с клиентами)
Количество страниц: 18 стр.
Вид работы: Реферат.
Содержание:
Заданная тема реферата: Многошаговые Игры
ВВЕДЕНИЕ 3
ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР 6
ВЫБОР КРИТЕРИЯ ПРИНЯТИЯ РЕШЕНИЯ 14
ЗАКЛЮЧЕНИЕ 17
СПИСОК ЛИТЕРАТУРЫ: 18
Выдержка из работы
Введение:
Стратегией игрока называется совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся ситуации. Обычно в процессе игры при каждом личном ходе игрок делает выбор в зависимости от конкретной ситуации. Однако в принципе возможно, что все решения приняты игроком заранее (в ответ на любую сложившуюся ситуацию). Это означает, что игрок выбрал определённую стратегию, которая может быть задана в виде списка правил или программы. (Так можно осуществить игру с помощью ЭВМ). Игра называется конечной, если у каждого игрока имеется конечное число стратегий, и бесконечной – в противном случае.
Для того чтобы решить игру, или найти решение игры, следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получать максимальный выигрыш, когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии. Такие стратегии называются оптимальными. Оптимальные стратегии должны также удовлетворять условию устойчивости, т. е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.
Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а средний выигрыш (проигрыш) во всех партиях.
Целью теории игр является определение оптимальной стратегии для каждого игрока. При выборе оптимальной стратегии естественно предполагать, что оба игрока ведут себя разумно с точки зрения своих интересов. Важнейшее ограничение теории игр – естественность выигрыша как показателя эффективности, в то время как в большинстве реальных экономических задач имеется более одного показателя эффективности. Кроме того, в экономике, как правило, возникают задачи, в которых интересы партнёров не обязательно антагонистические. Развитие аппарата теории игр для решения задач со многими участниками, имеющими непротиворечивые интересы, выходят за рамки настоящего пособия.
Основная часть:
Очевидно, что если игрок 1 отступит от оптимальной политики, а игрок 2 будет действовать оптимально, то выигрыш игрока 1 будет меньше цены игры, и если игрок 2 отступит от оптимальной политики при сохранении оптимального поведения игроком 1, то его проигрыш превысит цену игры:
Рассуждения игрока 1: мне хотелось бы максимизировать цену игры, т.е. мой гарантированный выигрыш, и я должен подобрать систему значений Pi так, чтобы при любом выборе противника мой ожидаемый выигрыш был больше цены игры.
Рассуждения игрока 2: мне хочется уменьшить мой гарантированный проигрыш, т.е. цену игры, и мне надо подобрать значения Qj так, чтобы при любом выборе противника мой проигрыш был меньше цены игры.
Отсюда возникают две задачи:
Легко показать, что эти задачи образуют пару двойственных задач линейного программирования.
Т.о. решение матричной игры сводится к решению пары двойственных линейных программ.
Обратим внимание на то, что при увеличении элементов матрицы R на любую константу С цена игры увеличится на С и это изменение не окажет влияния на искомые вероятности выборов. Таким образом, можно добиться, например, положительности элементов матрицы и, следовательно, цены игры. Поэтому можно допустить, что цена игры V положительна.
В предположении V > 0 проведем замену переменных
Хi = Pi / V, Yj = Qj / V.
Отсюда видно, что
Соответственно, поставленные задачи можно преобразовать к задачам с меньшим числом переменных:
Например, для игры с матрицей возникают задачи:
максимизировать минимизировать
Y1 + Y2 + Y3 X1 + X2 + X3
при при
Y1 + 2 Y2 + 3 Y3 Ј 1 X1 + 4 X2 + 2 X3 і 1
4 Y1 + Y3 Ј 1 2 X1 + 3 X3 і 1
2 Y1 + 3 Y2 Ј 1 3 X1 + X2 і 1
Y1, Y2, Y3 і 0 X1, X2, X3 і 0
Решение этих задач симплексным методом дает оптимальные значения
X = {11/37, 4/37, 5/37}, Y = {8/37, 7/37, 5/37}
и экстремумы целевых функций, равные 20/37.
Отсюда V = 37/20, P = {11/20, 4/20, 5/20}, Q = {8/20, 7/20, 5/20}.
13.3. Итеративный метод решения матричных игр
Как мы показали выше, игры могут решаться методами линейного программирования. Здесь мы рассмотрим итеративный метод Брауна-Робинсон, обычно используемый при решении игр большой размерности.
Используется многократная реализация игры на основе знания предыстории с последовательным совершенствованием стратегий.
Для примера возьмем задачу, которую мы только что решили.
Пусть игрок 1 сделал выбор 1 с ожидаемыми выигрышами 1, 2, 3. Противник, стремясь минимизировать свой проигрыш, прибегнет к выбору 1 с ожиданием проигрыша 1, 4, 2. Игрок 1 в стремлении максимизировать свой выигрыш прибегнет к выбору 2, что даст ему надежду на суммарный выигрыш (1+4, 2+0, 3+1). Но тогда его противник найдет среди этих значений меньшее и прибегнет к выбору 2 с ожидаемым суммарным проигрышем (1+2, 4+0, 2+3) и т.д.
Купить / скачать реферат (Получить по e-mail ознакомительную версию реферата.)
|
|