ゲーム理論のナッシュ均衡と最適戦略
用語の整理。 定義上、ナッシュ均衡は全プレイヤーがbest responseを取った状態のことであるが、これを「わかりやすく」説明しようと試みた結果、逆にわかりにくかったり、正確ではない言い方になっていることが多かったので、自分の言葉でまとめなおした。 ・ナッシュ均衡 すべてのプレイヤーが最適戦略(best response)である戦略をとっている状態 a ∗ = (a ∗ 1 , · · · , a ∗ n ) ∈ A is a Nash Equilibrium if a ∗ i ∈ Bi(a ∗ −i ) for every i ∈ N. ・Best Response ほかのプレイヤーの戦略を固定値としたまま、自分の戦略だけを動かして、最大値を取れる戦略。数式で書くと以下の定義。 ai ∈ Ai is a best response to a−i ∈ A−i if ui(ai , a−i) ≥ ui(a*i , a−i) for all a*i ∈ Ai ポイントはbest response(最適戦略)であろうか。bestあるいは最適という言葉に引きづられて、あたかもナッシュ均衡を目指す戦略がもっとも報酬が高い戦略であるという風に説明されていることもおおいように思える。 しかし、囚人のジレンマなどでも有名なようにナッシュ均衡は必ずしも、全プレイヤーに最高の結果をもたらす戦略ではない。あくまでも、自力でがんばれる範囲(=ほかのプレイヤーの戦略値を固定値としたまま) でもっとも報酬が高い(=その環境において最適な)戦略を全プレイヤーがとった状態だ。自分だけでは戦略を変更しても、メリットはないため均衡に陥る。 均衡の定義自体はわかりやすいが、定義したことのメリットがわかりづらいため、いろいろな説明が生まれて、その結果混乱の元になっているのだろうか。 参考文献 http://www.econ.ucla.edu/iobara/Nash201B.pdf