2021年1月12日火曜日

自粛しないがゲーム理論の最適戦略

 現在担当している講義ではさまざまな最適化法を取り上げ、線形計画法、非線形最適化法を解説している。おまけとして、ゲームの理論の最適戦略にも触れている。メイナード・スミスの「進化的に安定な戦略」は下記のようなタカ・ハトゲームで説明できる。

・集団にたくさん個体がいる。エサは常に2匹で分け合うがそのときにハト戦略とタカ戦略をとる。

・両者がハト戦略の時の利得は双方2(A)

・こっちがタカ、相手がハトのときはこっちの利得が4、むこうは0(B)

・両者がタカの時は双方1(C,喧嘩するのでコストがかかる)

この時、100%タカ戦略が「進化的に安定な戦略」である(ナッシュ均衡でもある)。仮にハト戦略100%の個体のみからなる集団にタカは侵入できるが(B>A)、逆はできないからである。

つぎにお互いの戦略がタカの時の利得を―1に変えると、タカ戦略は進化的に安定な戦略にならない。

・お互いがハト戦略の時の利得は双方2(A)

・こっちがタカ、相手がハトのときはこっちの利得が4、むこうは0(B)

・お互いの戦略がタカの時は双方-1(C,喧嘩するのでコストがかかる)

この場合は、相手の戦略によってこちらの最善手が異なるので(相手がタカの時はハト、相手がハトの時はタカ)、確率的にタカとハトを選ぶ混合戦略Qをとる。タカを選ぶ確率をqとすると、q=2/3の時に、

混合戦略Qのみをとる集団にハト100%の個体が侵入した時の利得は2/3

混合戦略Qのみをとる集団にタカ100%の個体が侵入した時の利得は2/3

混合戦略Qのみをとる集団に混合戦略Qの個体が侵入した時の利得は2/3

となり、混合戦略Qはハトにもタカにも負けない「進化的に安定な戦略」となる(計算は自分でやってみてね。このとき、混合戦略Qのみをとる集団には、どんな混合戦略をとる集団が侵入しても利得は2/3になるという性質がある)。


このタカ・ハトゲームが重要になるのは、コロナ状況下の外出・自粛の選択戦略を考えるときである。

・両者が自粛戦略の時の利得は互いに2(A)

・こっちが外出、相手が自粛のときはこっちの利得が4、むこうは0(B)

・両者が戦略が外出の時はお互い-1(C,感染が拡大するのでコストがかかる)

このとき、進化的に安定な戦略は、上記と同様「混合戦略Q:2/3の確率で外出する」である。現状をうまく説明できているような気がする。

「進化的に安定な戦略」である混合戦略Qで、外出を選ぶ確率qを下げるには、上記の利得を人為的に変える必要がある。これもいろいろ利得表を変えて計算するとわかるが、たとえば外出を選ぶ確率qを1/3に半減したい場合、

・市中感染のリスクが高くなると人は行動を変えるだろうと考えるが、それには、両者が外出したときの利得が-4にならないといけない。つまりかなり市中感染のリスクが高くならないと人は行動を変えない。

・休業補償をすれば自粛するだろうと考えるが、両者が自粛した時の利得を3.5にしないといけない。つまり休業補償はかなり手厚くしないと効かない。

ということが推測される。さらに一般化すると

・両者が戦略が外出のお互いの利得をk(k<0)とすると q = 2/(2-k)

・両者が戦略が自粛のお互いの利得をk(k<4)とすると q = (4-k)/(5-k)

という関係があり、kとqが非線形なので大きくkを変えないとqに効かないこともわかる。つまりこれらの手段は効率が悪い。

もう一つ手があり、

・こっちが外出、相手が自粛のときのこっちの利得を4-k, むこうの利得をkとすると、q=(2-k)/3となる。k=1の時にq=1/3となる。

つまり、外出する人のメリットを減らし、その分自粛する人のメリットが増える。という仕掛けがあると、行動を変えられると予想される。外出した人から料金を徴収し、自粛した人には利益がある。という仕組みを考えるとよいのではないか。また、式が線形なので、kの変化量に比例してqも変化する、やったらやっただけ効く可能性がある。

例えば、大都市圏の交通が鉄道に大きく依存していることに鑑みて、一般利用者の鉄道料金を一気に3倍とか5倍に値上げする。電車に乗って出勤しないとマズイ仕事をしている人は電子定期券ユーザーであると思われるので、定期券の電車賃の値上げはしない。がその代わりに、平日1日電車に乗らないと定期代の1-2%がご褒美のおやつ台としてSuicaポイント(ただし2週間で失効)ですぐもらえる。とか。片道500円の距離の通勤定期は月20000円くらいなので、一日200-400円をもらって、地元ですぐ使ってくれたらいいだろう。鉄道各社のインフラを使えばすぐ可能な気がする。

ただ、限界も見え見えである。

・通院に電車が必要。のようなケースのフォローが大変そう。

・自転車や車で通ってポイントをちょろまかす悪用が横行しそう。

・そのせいで道が自動車でむっちゃ渋滞しそう。

などとあまり現実的ではないか。ただ、なにかいいアイデアが必要とされているのは間違いないだろう。