鞍点のない問題：混合戦略問題

の２人がじゃんけんをします。
負けたら10円を相手に払い,勝ったら相手から10円貰うというルールで, じゃんけんを繰り返します。
無論,「アイコ」の場合は,支払うお金,貰うお金とも0円です。

(賭博は法律で禁止されているから考えたくないという方は,これは,仮想の国でのお話しと思って頂くか,お金の替わりにゲーム用のメダルを考えてください。
「じゃんけんぽん,アイコでしょ…」というかけ言葉, 関東近辺でよく使われていますが,他の地域はどんなかけ言葉は？）

前節と同様に,との出す手によって,貰えるお金,支払うお金がどうなるか, の立場で以下のように＜利得表2＞に表しておきます。

＜利得表2＞

0 -10 10

10 0 -10

-10 10 0

$\begin{eqnarray*} &&Gu：グー\\ &&Choki：チョキ\\ &&Pa：パー \end{eqnarray*}$

「-10」はに10円払う事を表します。

の立場に立ってみます。先ず,このゲームの利得表には、前節で説明した鞍点がありません。双方が選択の余地のない「平衡状態」にする戦略はないわけです。出す手をランダムしてゲームを繰り返す方法以外ありません。このような問題を混合戦略問題といいます。
じゃんけんを繰り返すわけですが,どのような「戦略」があるでしょうか？

グーを出し続ける？でも,はそれを直ぐ見破って, パーを出し続けてくるでしょう。続ければ続けるほどは大損です。
同様にパーを出し続けるのも駄目,チョキを出し続けるのも駄目です。
結局,例えば,サイコロを用意して,出た目によって出す手を決めるランダムな手の繰り返す方法でしょう。
(1か6ならグー,2か5ならパー,3か4ならチョキなど)

問題は,どんな割合で（確率で）グー,チョキ,パーを出すべきかです。
相手のはの出す手を監視しながらと対戦しますので,が選択したグー,チョキ,パーの確率を直ぐに見破り, それでも,自分にとって有利な手を選択してくると考えるべきです。
との立場を替えても全く同じです。

ゲームの理論を創始し,この種の問題に解を与えたのが,ノイマン（現在の計算機の原理開発者としても有名）です。

前節の鞍点のある問題と異なり,一工夫が必要です。それは,ゲームの利得の替わりに期待値を使います。以下、その説明をします。

が選択する戦略（グー,チョキ,パーを出す確率）をとし, で表しておきます。

このゲームの場合、「戦略」は幾つかある「手」をランダムに選んで繰り返す確率の組み合わせになるわけです。

同様にが選択する戦略をで表しておきます。

: がグーを出し,もグーを出す確率はでこのときは損得なし(0円の儲け),
: がグーを出し,がチョキを出す確率はでこのとき,は10円の儲け,
: がグーを出し,がパーを出す確率はでこのとき, は10円の損失(-10の儲け),

という計算を全て行いますと

$\begin{displaymath}P=(p_1,p_2,p_3),Q=(q_1,q_2,q_3)\end{displaymath}$

での

の儲けの期待値

は

$\begin{eqnarray*} &&E(P,Q)=0・p_1・q_1+10・p_1・q_2+(-10)・p_1・q_3\\ &&+(‐10)... ...2+10・p_2・q_3 \\ &&+10・p_3・q_1+(‐10)・p_3・q_2+0・p_3・q_3 \end{eqnarray*}$

です。

$\begin{displaymath}P=(p_1,p_2,p_3),Q=(q_1,q_2,q_3)\end{displaymath}$

はそれぞれ,グー,チョキ,パーを出す確率を表していますから, これらについての制約は

$\begin{eqnarray*} &&1 \ge p_1 \ge 0,1 \ge p_2 \ge 0,1 \ge p_3 \ge 0, p_1+p_2+p_3... ...&&1 \ge q_1 \ge 0,1 \ge q_2 \ge 0,1 \ge q_3 \ge 0, q_1+q_2+q_3=1 \end{eqnarray*}$

です。

簡単のための採り得る集合を

$\begin{eqnarray*} &&P_O= \{ (p_1,p_2,p_3)\vert 1 \ge p_1 \ge 0,1 \ge p_2 \ge 0,1... ...1 \ge q_1 \ge 0,1 \ge q_2 \ge 0,1 \ge q_3 \ge 0, q_1+q_2+q_3=1\} \end{eqnarray*}$

で表しておきます。前節のと異なり,それぞれ,確率を要素にもつベクトルの集合になっています。

がの中から選択されるとはこれに対抗してが最小になるように（自分の損失が最小になるように）を中で選択するはずです。
すなわち

$\begin{displaymath}\min \{ E(P,Q) \vert Q \in Q_O\}\end{displaymath}$

が実現されるとなるような

を

の中で探します。
この最小値を

$\begin{displaymath}\min_Q E(P,Q)\end{displaymath}$

で表しておきます。

はこれを見越して,自分の利益が最大になるようにするため,

$\begin{displaymath}\max \{ \min_Q E(P,Q) \vert P \in P_O\}\end{displaymath}$

が実現されるとなるようなをの中から探すことになります。この最大値を

$\begin{displaymath}\max_P \min_Q E(P,Q) \end{displaymath}$

で表しておきます。

まっく逆のQの立場からは, がの中から選択されるとはこれに対抗してが最大になるようにを中で選択するはずです。
すなわち

$\begin{displaymath}\max \{ E(P,Q) \vert P \in P_O\}\end{displaymath}$

が実現されるとなるような

を

の中から探します。この最小値を

$\begin{displaymath}\min_P E(P,Q)\end{displaymath}$

で表しておきます。

はこれを見越して,自分の損失を最小にするため,

$\begin{displaymath}\min \{ \max_P E(P,Q) \vert Q \in Q_O\}\end{displaymath}$

が実現されるとなるような

を

の中で探すことになります。この最大値を

$\begin{displaymath}\min_Q \max_P E(P,Q)\end{displaymath}$

で表しておきます。

以上出てきた,２つの値には一般には

$\begin{displaymath}\max_P \min_Q E(P,Q) \le \min_Q \max_P E(P,Q) \end{displaymath}$

という関係が成り立っています。
証明は前節のの場合と全く同じなので省略します。

ノイマンは上のような問題では,の中に

$\begin{displaymath}P^*=(p_1^*,p_2^*,p_3^*), Q^*=(q_1^*,q_2^*,q_3^*)\end{displaymath}$

があって

$\begin{eqnarray*} &&\max_P \min_Q E(P,Q) = \min_Q \max_P E(P,Q)=E(P^*,Q^*)\\ &&\max_P E(P,Q^*)=E(P^*,Q^*)= \min_Q E(P^*,Q) \end{eqnarray*}$

となることを証明しました。
その証明についての話しは後の章ということにして, このとを具体的求めることにします。

問題を解きやすくするため,最初に出てきた＜利得表＞ (損失と利益の表)の要素に全て10を加えておきます。

＜利得表2＞

10 0 20

20 10 0

0 20 10

$\begin{eqnarray*} &&Gu：グー\\ &&Choki：チョキ\\ &&Pa：パー \end{eqnarray*}$

これでは,一方的なのゲームじゃないかと思われるかもしれませんが,

$\begin{displaymath}P^*=(p_1^*,p_2^*,p_3^*), Q^*=(q_1^*,q_2^*,q_3^*)\end{displaymath}$

を計算するためだけにします。このような,利得表の平行移動やっても解は同じです。

も,も,も未知な量ですがは判っているものとして

$\begin{displaymath}\max_P E(P,Q^*)=E(P^*,Q^*)=\min_Q E(P^*,Q)\end{displaymath}$

に注目します。

$\begin{eqnarray*} &&E(P,Q)=q_1 \{ 10p_1+0p_2+20p_3\} \\ &&+q_2 \{ 20p_1+10p_2+0p_3\} +q_3 \{ 0p_1+20p_2+10p_3\} \end{eqnarray*}$

で,

$\begin{displaymath}1 \ge q_1 \ge 0,1 \ge q_2 \ge 0,1 \ge q_3 \ge 0, q_1+q_2+q_3=1\end{displaymath}$

ですので

$\begin{eqnarray*} && E(P^*,Q^*) \le 10p_1+0p_2+20p_3~ (1)\\ && E(P^*,Q^*) \le 20p_1+10p_2+0p_3~ (2)\\ && E(P^*,Q^*) \le 0p_1+20p_2+10p_3~ (3) \end{eqnarray*}$