next up previous
Next: Bibliography Up: KLEIMENO Previous: 4 Формализация различных типов

5. Построение динамики для повторяющейся биматричной 2$ \times $2 игры


В этом разделе рассмотрим повторяющуюся 2$ \times $2 игру (см., например, [8]-[11]) и, в частности, повторяющуюся ''дилемму заключенного'' (см., например, [12]-[13]). Для построения динамики мы используем принцип неуменьшения выигрышей игроков, различные типы поведения игроков и введенную в [7] специальную процедуру сужения множества решений, основанную на нэшевских равновесиях во вспомогательных биматричных играх.

Сначала рассмотрим биматричную 2$ \times $2 игру $ (A,B)$ с матрицами выигрыша 1-го и 2-го игроков соответственно

$\displaystyle A=\left( \begin{array}[c]{cc} a_{11} & a_{12}\\ a_{21} & a_{22} \...
...eft( \begin{array}[c]{cc} b_{11} & b_{12}\\ b_{21} & b_{22} \end{array} \right)$ (5.1)

Предполагаем, что каждый игрок представляет большую группу идентичных агентов или популяцию. Тогда смешанные стратегии могут быть реализованы физически. В самом деле, если пара $ (p,\,1-p),\;0\leq p\leq1$ есть смешанная стратегия 1-го игрока, а пара $ (q,\,1-q),\;0\leq q\leq1$ - смешанная стратегия 2-го игрока, то $ p$ и $ q$ могут быть интерпретированы как доли всех тех агентов в первой и во второй группах соответственно, кто играет первую чистую стратегию.

Выигрыши 1-го и 2-го игроков определяются как

\begin{displaymath}\begin{array}[c]{c} f_{1}(p,q)=cpq-c_{1}p-c_{2}q+a_{22}\\ [1ex] f_{2}(p,q)=dpq-d_{1}p-d_{2}q+b_{22}, \end{array}\end{displaymath} (5.2)

где

\begin{displaymath}\begin{array}{cccccccc} c\ \!=\! &\!\!\! a_{11}-a_{12}-a_{21}...
...2}-b_{12}, & d_{2}\!\!\!\!&=&\!\!\!\!b_{22}-b_{21}. \end{array}\end{displaymath} (5.3)

Пара $ (p,q)$ в единичном квадрате

$\displaystyle E=\{(p,q):0\leq
p\leq1,\;0\leq q\leq1 \}$

характеризует состояние игры.

Пусть теперь эта биматричная игра повторяется $ N$ раз, где $ N$ - бесконечное или большое число, неизвестное наперед. Пусть $ (p_{0},q_{0})\in E$ - начальное состояние. Предположим, что на шаге $ k+1\;(k=0,1,...,N-1)$ игрокам разрешается перейти из текущего состояния $ (p_{k},q_{k})\in E$ в любое состояние $ (p_{k+1},q_{k+1})\in M_{\alpha}(p_{k}
,q_{k})$, где

$\displaystyle M_{\alpha}(p_{k},q_{k})=\{(p,q)\in E:\left\vert p-p_{k}\right\vert
\leq
\alpha,\;\left\vert q-q_{k}\right\vert \leq\alpha\}.
$

Здесь $ \alpha$ - положительное, достаточно малое число. Малость $ \alpha$ означает, что внутренняя структура групп взаимодействующих агентов эволюционирует достаточно медленно.

Будем реализовывать подход $ (p_{k},q_{k})\Longrightarrow(p_{k+1},q_{k+1})$ следуя принципу неуменьшения выигрышей игроков. Существует много вариантов такого перехода. Здесь мы применяем подход, основанный на использовании нэшевских равновесий в вспомогательных биматричных играх (см. [7,14,16]).

Пусть $ (p_{k},q_{k})$ - текущее состояние в повторяющейся биматричной игре. Сформулируем следующие задачи.

Задача 5.1   Найти $ (p^{1},q^{1})$, максимизирующий функцию $ f_{1}
(p,q)\,$ % latex2html id marker 3922
$ (\ref{f_5_2})$ на множестве $ M_{\alpha}(p_{k},q_{k})$ при условии

$\displaystyle f_{2}(p,q)\geq f_{2}(p_{k},q_{k})$ (5.4)

Задача 5.2   Найти $ (p^{2},q^{2})$, максимизирующий функцию $ f_{2}(p,q)$ % latex2html id marker 3939
$ (\ref{f_5_2})$ на множестве $ M_{\alpha}(p_{k},q_{k})$ при условии

$\displaystyle f_{1}(p,q)\geq f_{1}(p_{k},q_{k})$ (5.5)

Теперь сконструируем вспомогательную биматричную игру $ (A^{\ast},B^{\ast})$ с матрицами

\begin{displaymath}A^{\ast}=\left(
\begin{array}[c]{cc}
f_{1}(p^{1},q^{1}) & f_{...
...ex]
f_{2}(p^{2},q^{1}) & f_{2}(p^{2},q^{2})
\end{array}\right) \end{displaymath}

В этой игре $ i$-тая стратегия 1-го игрока есть ``выбрать $ p^{i}$'', а $ j$-тая стратегия 2-го игрока есть ``выбрать $ q^{j}$'' $ (i=1,2;\,j=1,2)$. Чтобы достичь $ (p_{k+1},$$ q_{k+1})$, игроки находят нэшевские равновесия. Легко показывается, что эта биматричная игра имеет по крайней мере одно нэшевское равновесие в классе чистых стратегий. Возможны два случая.

1. Игра имеет единственное нэшевское равновесие $ (p^{N},\,q^{N})$. Тогда мы принимаем $ (p_{k+1},\,q_{k+1})=(p^{N},\,q^{N})$.

2. Игра имеет два нэшевских равновесия $ (p^{N1},\,q^{N1})$ и $ (p^{N2}
,\,q^{N2})$. Тогда в качестве $ (p_{k+1},\,q_{k+1})$ берем либо $ (p^{N1},\,q^{N1})$ либо $ (p^{N2}
,\,q^{N2})$ с равной частотой.

Итак, динамика повторяющейся биматричной 2$ \times $2 игры определена полностью.

Теперь переходим к повторяющейся ''дилемме заключенного''. В этой игре матрица выигрышей игроков суть

\begin{displaymath}
A=\left(
\begin{array}[c]{cc}
a_{11} & a_{12}\\
a_{21} & a...
...[c]{cc}
a_{11} & a_{21}\\
a_{12} & a_{22}
\end{array}\right), \end{displaymath}

где справедливы неравенства

$\displaystyle a_{21}>a_{11}>a_{22}>a_{12}$   и$\displaystyle \quad 2a_{11}>a_{21}+a_{12}$ (5.6)

Каждый игрок имеет две стратегии: $ C$ (кооперироваться) и $ D$ (отклониться). Из (5.6) следует, что пара $ (D,D)$ доставляет единственное нэшевское равновесие. На этой паре каждый игрок получает $ a_{22}$. В то же время оба игрока получают $ a_{11}>a_{22}$ на паре $ (C,C)$, которая не является нэшевским равновесием.

Естественно рассмотреть задачу: как следует выбрать типы поведений игроков, чтобы привести начальное состояние $ (p_0,q_0)\in E$ в состояние кооперации $ (p=1,\;q=1)$, используя описанную выше динамику.

Задача 5.3   Для фиксированного $ \alpha >0$ найти начальное состояние $ (p_0,q_0)\in E$, для которого описанная выше динамика приводит в состояние кооперации за конечное число шагов, используя только нормальный тип поведения для обоих игроков.

Множество начальных состояний $ (p_0,q_0)\in E$, решающих задачу 5.3, обозначим через $ E_1$.

Теорема 5.1   Множество $ E_{1}$ описывается следующими формулами$ :$

$\displaystyle E_{1}=\{(p,q)\in E:cpq-c_{1}p-c_{2}q+a_{22}\leq a_{11},\;
cpq-c_{2}p-c_{1}q+a_{22}\geq a_{11}\},$

если $ c<0$ или $ c=0$ или $ c>0,$ $ c_{1}+c_{2}\leq0,$ и

$\displaystyle E_{1}=\{(p,q)\in E:cpq-c_{1}p-c_{2}q+a_{22}\leq a_{11},\;
cpq-c_{2}p-c_{1}q+a_{22}\geq a_{11},$

$\displaystyle c\left( p+q\right)
>c_{{}}+c_{2}\},$

если $ c>0,$ $ c_{1}+c_{2}>0,$ где $ c,\;c_{1}$ и $ c_{2}$ определены в % latex2html id marker 4048
$ (\ref{f_5_3})$.

Множество $ E_1$ изображено на рис. 2-5 для разных случаев.

Задача 5.4   Для фиксированного $ \alpha >0$ найти начальное состояние $ (p_0,q_0)\in E\backslash E_1$, для которого описанная выше динамика приводит на границу $ E_1$ за конечное число шагов, используя только нормальный тип поведения для одного игрока и альтруистический тип поведения - для другого.

Обозначим через $ E_2$ ($ E_3$) множество начальных состояний, решающих задачу 5.4, используя нормальный тип поведения для 1-го игрока (2-го игрока) и альтруистический тип поведения для 2-го игрока (1-го игрока).

Теорема 5.2   Множества $ E_{2}$ и $ E_{3}$ описываются формулами

$\displaystyle E_{2}=\{(p,q)\in E\backslash E_1:cpq-c_{1}p-c_{2}q+a_{22}>
a_{11}\}, $

$\displaystyle E_{3}=\{(p,q)\in E\backslash
E_1:cpq-c_{2}p-c_{1}q+a_{22} < a_{11}\}. $

Множества $ E_2$ и $ E_3$ изображены на рис. 2-5.

Заметим, что только для случая $ c>0$, $ c_1 +c_2>0$ имеем $ E\neq
E_1\cup E_2 \cup E_3$. Обозначим $ E_4 =E\backslash \left(E_1\cup
E_2 \cup E_3\right)$ (см. рис. 5).

Задача 5.5   Для фиксированного $ \alpha >0$ и для начального состояния $ (p_0,\;q_0)\in E_4$ найти типы поведений для $ 1$-го игрока и $ 2$-го игрока такие, что описанная выше динамика приводит на границу $ E_1$ за минимальное число шагов.

Теорема 5.3   Типы поведений $ 1$-го и $ 2$-го игроков, решающие
задачу $ 5.5$, следующие: либо агрессивный тип поведения для обоих игроков, либо парадоксальный тип поведения для обоих игроков.

\includegraphics{c:/marinov/tom6rus/final2/kleimenov/f1f2.eps}

Рис. 2. Рис. 3.



\includegraphics{c:/marinov/tom6rus/final2/kleimenov/f3f4.eps}

Рис. 4. Рис. 5.

Поступила 16.07.2000


next up previous
Next: Bibliography Up: KLEIMENO Previous: 4 Формализация различных типов
2003-08-19