大人しく昼寝してくれて、こっそり抜け出すことができれば友人の家にでもゲームでもしに行くのですが、それができなくても、溜まった宿題を一人で片付けるほうがまだましです。
父親は「昼寝をする。しない。」息子は「勉強する。遊ぶ。」でそれぞれ「戦略」に選択肢があるわけです。そこで、二人に「戦略」の選択によってかわる利害得失を下のように単純化して表にしてみます。
<利得表1>
勉強する | 遊ぶ | |
昼寝しない | -50 | 50 |
昼寝する | 0 | 100 |
この表の値は、息子の側に立ったものです。ウザッタイ父親が昼寝しないで、指導を受けながら、勉強する最悪な場合は得点-50点
何とか、はぐらかしながら、遊ぶ場合は
あまり楽しめませんが50点、父親が昼寝して、一人で勉強して、溜まっている宿題
を片付けるのは0点、こっそり抜け出して遊ぶ場合は100点ということです。
父親にしてみれば:
息子にしてみれば:
この例では
「最大失点のうち、最小のもの」=「最小得点のうち、最大もの」
が成立っています。
結局、父親が昼寝をしなければ、父親にとっては、最悪でも息子は、50点
息子にしてみれば、「遊ぶ」を選択したら最悪でも自分の得点は50点
ということになります。このような状況を「このゲームには鞍点がある」といいます。
さて、この話を一般化しておきましょう。
二人の競技者が取り得「戦略」の集合をとします。そして,
この二人がそれぞれ「戦略」の集合の中から戦略を選択したときの
得点をで表しておきます。
上の例では、で,
です。は上の利得表1で与えられます。
がの中から選択されるとはこれに対抗して
が最小になるように
(自分の損失が最小になるように)
を中で選択するはずです。
すなわち
が実現されるとなるようなをの中から探すことになります。
この最大値を
まっく逆のの立場からは,
がの中から選択されるとはこれに対抗して
が最大になるように
を中で選択するはずです。
すなわち
以上出てきた,2つの値には一般には
という関係が成り立っています。
[証明]
をの中で動かして,
特に「鞍点」が存在する場合,戦略
が存在して
(図2.1 鞍点)