next up previous
: 鞍点のない問題:混合戦略問題 : ゲーム : ゲーム

鞍点

 話題をゲームの話しに替えます。小生の知り合いに教育熱心な父親と、遊び盛りの息子がいます。
この父親、ご多分に洩れず仕事の疲れがたまり、日曜は昼寝することが多いのですが、子煩悩で息子の勉強も気になります。
息子にしてみれば、日曜日に頼みもしないのに、父親に小言を言われながら―父親にしてみれば指導なのですが―勉強させられるなんて最悪です。
「ウザッタイ」が父親が起きていても、「ノラリ、クラリ、」話題をはぐらかして、 なんとか家でゲームでもした方がましです。

大人しく昼寝してくれて、こっそり抜け出すことができれば友人の家にでもゲームでもしに行くのですが、それができなくても、溜まった宿題を一人で片付けるほうがまだましです。

父親は「昼寝をする。しない。」息子は「勉強する。遊ぶ。」でそれぞれ「戦略」に選択肢があるわけです。そこで、二人に「戦略」の選択によってかわる利害得失を下のように単純化して表にしてみます。

<利得表1>
  勉強する 遊ぶ
昼寝しない -50 50
昼寝する 0 100

この表の値は、息子の側に立ったものです。ウザッタイ父親が昼寝しないで、指導を受けながら、勉強する最悪な場合は得点-50点
何とか、はぐらかしながら、遊ぶ場合は あまり楽しめませんが50点、父親が昼寝して、一人で勉強して、溜まっている宿題 を片付けるのは0点、こっそり抜け出して遊ぶ場合は100点ということです。

父親にしてみれば:

\begin{eqnarray*}
 &&「昼寝する」を選択したら、自分の失点(息子の得点)は、最大...
...「昼寝しない」を選択したら、自分の失点(息子の得点)は、最大50点
\end{eqnarray*}



この二つの最大失点のうち、最小のものは50点です。

息子にしてみれば:

\begin{eqnarray*}
&&「勉強する」を選択したら、自分の得点は、最小-50点\\
&&「遊ぶ」を選択したら、  自分の得点は、最小50点
\end{eqnarray*}



この二つの最小得点のうち、最大ものは50点です。

この例では 「最大失点のうち、最小のもの」=「最小得点のうち、最大もの」 が成立っています。

結局、父親が昼寝をしなければ、父親にとっては、最悪でも息子は、50点 息子にしてみれば、「遊ぶ」を選択したら最悪でも自分の得点は50点 ということになります。このような状況を「このゲームには鞍点がある」といいます。
さて、この話を一般化しておきましょう。 二人の競技者$P,Q$が取り得「戦略」の集合を$P_0,Q_0$とします。そして, この二人がそれぞれ「戦略」の集合$P_0,Q_0$の中から戦略$P,Q$を選択したときの 得点を$G(P,Q)$で表しておきます。

上の例では、$P=息子,Q=父親$で, $P_0=\{ 勉強する,遊ぶ \} $ $Q_0=\{ 昼寝する,昼寝しない \} $です。$G(P,Q)$は上の利得表1で与えられます。

$P$$P_O$の中から選択されると$Q$はこれに対抗して $G(P,Q)$が最小になるように (自分の損失が最小になるように) $Q$$Q_O$中で選択するはずです。
すなわち

\begin{displaymath}\min \{ G(P,Q) \vert Q \in Q_O\}\end{displaymath}

が実現されるとなるような$Q$$Q_O$の中で探します。
この最小値を

\begin{displaymath}\min_Q G(P,Q)\end{displaymath}

で表しておきます。
$P$はこれを見越して,自分の利益が最大になるようにするため,

\begin{displaymath}\max \{ \min_Q G(P,Q) \vert P \in P_O\}\end{displaymath}

が実現されるとなるような$P$$P_O$の中から探すことになります。 この最大値を

\begin{displaymath}\max_P \min_Q G(P,Q) \end{displaymath}

で表しておきます。

まっく逆の$Q$の立場からは, $Q$$Q_0$の中から選択されると$P$はこれに対抗して $G(P,Q)$が最大になるように $P$$P_O$中で選択するはずです。
すなわち

\begin{displaymath}\max \{ G(P,Q) \vert P \in P_O\}\end{displaymath}

が実現されるとなるような$P$$P_O$の中から探します。この最小値を

\begin{displaymath}\min_P G(P,Q)\end{displaymath}

で表しておきます。 $Q$はこれを見越して,自分の損失を最小にするため,

\begin{displaymath}\min \{ \max_P G(P,Q) \vert Q \in Q_O\}\end{displaymath}

が実現されるとなるような$Q$$Q_0$の中で探すことになります。この最大値を

\begin{displaymath}\min_Q \max_P E(P,Q)\end{displaymath}

で表しておきます。

以上出てきた,2つの値には一般には


\begin{displaymath}\max_P \min_Q G(P,Q) \le \min_Q \max_P G(P,Q) \end{displaymath}

という関係が成り立っています。
[証明]
$Q$$Q_O$の中で動かして,

\begin{displaymath}\min_Q G(P,Q) \le G(P,Q)\end{displaymath}

が任意の$P$(両辺),$Q$(右辺)について成立
次に上の不等式の右辺について$P$$P_0$中で動かして,

\begin{displaymath}\min_Q G(P,Q) \le \max_P G(P,Q)\end{displaymath}

が任意の$P$(左辺),$Q$ (右辺)について成立
さらに上の不等式の左辺について$P$$P_0$の中で動かして,

\begin{displaymath}\max_P \min_Q G(P,Q) \le \max_P G(P,Q)\end{displaymath}

が任意の$Q$(右辺)について成立
最後に右辺の$Q$$Q_0$の中で動かして

\begin{displaymath}\max_P \min_Q G(P,Q) \le \min_Q \max_P G(P,Q) \end{displaymath}

[証明終]

特に「鞍点」が存在する場合,戦略 $P^* \in P_0,Q^* \in Q_0$が存在して

\begin{displaymath}\max_P \min_Q G(P,Q) =G(P^*,Q^*)= \min_Q \max_P G(P,Q)\end{displaymath}

となります。 この場合,競技者$P,Q$はそれぞれ戦略 $P^* \in P_0,Q^* \in Q_0$以外の戦略を選択すると損をすることになり,この意味で平衡状態になります。














(図2.1 鞍点)


next up previous
: 鞍点のない問題:混合戦略問題 : ゲーム : ゲーム
Yasunari SHIDAMA