Chaos, Solitons & Fractalsで集団行動と進化ゲームが特集された.
http://www.sciencedirect.com/science/journal/09600779/56
そもそもなぜChaos, Solitons & Fractalsという雑誌であまり関係なさそうな進化ゲームが取り上げられたのかはわからない.またCollective behaviorとEvolutionary gamesの寄せ集めのようになっていて統一感がない.Collective Behavior in Evolutionary Gamesにして進化ゲームだけ集めたらよかったのにと個人的には思う(それだと特集号は組めないのかな).
だが,それらを差し置いても進化ゲームの方に面白いものがあったので,いくつか取り上げ簡単にまとめておく.
Introduction
Collective behavior and evolutionary games – An introduction
Matjaž Perc, Paolo Grigolini
1-3は基礎的な内容だが,空間構造上の進化ゲームの研究のやり方について簡潔にまとまっている.
4のFuture researchでこれからの進化ゲームについて述べてある.まず最初は相互依存ネットワーク上での進化ゲーム.既にいくつかの研究が出ているが,基本的に相互依存ネットワークは協力を進化させる(ただし,相互依存度が高すぎると良くない).次に二部ネットワーク上での進化ゲーム.これはまだあまりよく知らないが,普通の二部グラフのようなものではなく,ネットワークの中にグループ構造があるような階層的なネットワークのようだ.最後に社会学や神経生理学と進化ゲームとの接続について.
Reviews
Lévy flights in human behavior and cognition
Andrea Baronchelli, Filippo Radicchi
これは進化ゲームじゃなくて集団行動に関係がある方だけど面白そうだったので.
人間の行動と認知におけるレヴィ飛行について.
レヴィ飛行とはランダムウォークの一種だが,飛行距離がべき分布に従う.簡単に言うと,大体ランダムにちょこちょこ動き回っているが,たまに大きくジャンプする.いろいろな生物でこのパターンの移動が見られる.
人間の移動もこれに従うことがしられているが,最近の研究で人間の知的な探索もこのパターンに従うことがわかった.
Research Papers
Cooperation in harsh environments and the emergence of spatial patterns
Paul E. Smaldino
空間囚人のジレンマに厳しい(エージェントはゲームをするたびに自身のエネルギーからkのコストを引かれる)環境を入れる.
この環境と密度の変化が面白いパターンを生んだ.コストkが低い時は樹木状のパターン,高い時は網状のパターン.高いほうが協力が強い.
創発したパターンは生物輸送ネットワークに似ていた.
The evolution of fairness in the coevolutionary ultimatum games
Kohei Miyaji, Zhen Wang, Jun Tanimoto, Aya Hagishima, Satoshi Kokubo
最後通牒ゲームで戦略(いくらあげるか,受け取る最低レベル)とネットワーク構造が共進化する.
ネットワーク改変のルールは5通り用意した.公平性の進化はこのルールにかなり依存した.また決定論的なルールの時は現実とは乖離した結果が見られ,確率的なルールの時は現実の結果に近いものが得られた.
Does coveting the performance of neighbors of thy neighbor enhance spatial reciprocity?
Zhen Wang, Bin Wu, Ya-peng Li, Hang-xian Gao, Ming-chu Li
空間囚人のジレンマで戦略の更新方法のやり方を変える.
通常は近傍からランダムに選んだ個体jの利得と自分の利得を比べ,相手jのほうが高いほど真似するが,αというパラメータでjか全ての近傍の平均利得のどちらを重視するか制御し,自分の利得との差が大きいほどjの戦略を真似する.
平均利得を重視するほど協力が進化した.これは協力のクラスターの平均利得が高いからである.
でもなぜ平均利得を重視してjの戦略の真似をするのかがちょっと変な感じ.
Quantifying the impact of noise on macroscopic organization of cooperation in spatial games
Faqi Du, Feng Fu
空間ゲームで戦略更新にフェルミ関数を使うが,その場合のノイズを制御するパラメータKの効果が,特に協力のクラスタのでき方に対して,囚人のジレンマとスノードリフトでは大きく異なることがわかった.
Searching with cooperators
Karyn Benson, Manuel Cebrian
進化計算に協力のアルゴリズムを入れ込む.
The effects of nonlinear imitation probability on the evolution of cooperation
Qionglin Dai, Haihong Li, Hongyan Cheng, Mei Zhang, Junzhong Yang
戦略更新のフェルミ関数の式をαというパラメータで非線形にする.
様々なネットワーク構造,平均次数で調査して,それぞれ協力が最も進化する最適なαがあることがわかった.
Can remembering history from predecessor promote cooperation in the next generation?
Zhi-Gang Chen, Tao Wang, De-Gui Xiao, Yin Xu
良い戦略(戦略には記憶あり)をそのまま引き継ぐのが協力を進化させるのか?
戦略をそのまま引き継ぐ場合と特定の割合で協力を混ぜる.
協力を高い割合で混ぜると協力が進化した…という当たり前の結果のような気がするのだが,そのまま戦略を引き継ぐより,ちょっとは忘れて相手に好意的に振る舞うのが良いということが言いたいのだろうか.
An evolving Stag-Hunt game with elimination and reproduction on regular lattices
Lei Wang, Chengyi Xia, Li Wang, Ying Zhang
規則ネットワーク上のスタグハントゲームだが,各エージェントは裏切った相手を確率的に切ることができる.孤立した裏切り者はシステムから排除される.
従来のスタグハントゲームより協力が保たれるとのことだが,これも当たり前のような気がする.
Onset of limit cycles in population games with attractiveness driven strategy choice
Elżbieta Kukla, Tadeusz Płatkowski
戦略に魅力度という別のファクターを入れるとどうなるかという問題.得点の良し悪しだけでなく,戦略には魅力度がついていて,それらに依存して頻度が増減する.
繰り返し囚人のジレンマでAll-C,All-D,TFTの3戦略でAll-Cだけの魅力度を高くしていくと,リミットサイクルが存在する(基本的にAll-Cの魅力度がましてその頻度が高くなっていくので,それを搾取するAll-Dの周りで周期的な軌道が出現する).さらに高くすると全体がAll-Cになる(当たり前だが).
じゃんけんゲームでも同様にグーの魅力度を高くしていくと,同じようにリミットサイクルが出現し,さらに高くすると全員グーだけとるようになる.
Combination of continuous and binary strategies enhances network reciprocity in a spatial prisoner’s dilemma game
Noriyuki Kishimoto, Satoshi Kokubo, Jun Tanimoto
連続的2値戦略(どういう風に訳したらよいかわからないけど)を考案.
これは,連続戦略(協力と裏切りの2値ではなくその間を連続的にとる)と混合戦略(協力するか裏切るかを確率的に出す)の間をとったもの.パラメータdで制御.d=0なら連続戦略,d=1なら混合戦略.したがって,dがその間なら確率的に連続的な戦略をとる.
これを格子空間とスケールフリーネットワークで次数を変えて比較する.
連続的2値戦略が最も協力を進化.
実際の人間は,状況に応じてこういう戦略をとってるだろうから,これが協力を進化させるのは面白い.
The different cooperative behaviors on a kind of scale-free networks with identical degree sequence
Yonghui Wu, Xing Li, Zhongzhi Zhang, Zhihai Rong
スケールフリーネットワークでは協力が強力に進化することが知られている.協力者のハブは強いから.
スケールフリーネットワークで同じ次数分布を持つがつながり方が違う(ハブ同士が繋がりやすいか,ハブと次数の低いノードが繋がりやすいか)ネットワークを生成し(パラメータqで制御),その上で囚人のジレンマと公共財ゲームをやって協力の進化具合を調べる.
単にべき則という性質だけが協力を促進させるのではなく,つながり方によって進化具合が異なることがわかった.ハブ同士がつながりやすいと裏切りへの誘惑が小さい時は協力がかなり促進されるが,大きい時は裏切りが促進される(裏切りのハブに取って代わられるので).ハブと次数が小さいノードがつながりやすいとハブ同士のお互いの影響が小さくなり,初期の戦略が保たれる.そのため,あまり協力は進化しないが,裏切りへの誘惑が大きくなっても協力が絶滅せずに残る.
Learning ability driven by majority selection enhances spatial reciprocity in prisoner’s dilemma game
Yi-Ling Wang
2次元囚人のジレンマで個体は近傍からランダムに選んだ戦略を真似するかどうか利得の差に基づいて決めるだけでなく,その選んだ個体が自分を含む近傍がとっている戦略と同じかどうか(majority selection)にも依存する.同じ場合は,通常のフェルミ関数に基づく戦略更新が行われるが,違う場合はμ<1だけ真似する確率が弱められる.μのことを学習と呼んでいる.
μが0.01から0.1くらいの値で協力はピークになるようだ.学習というよりは新奇戦略に対する鋭敏性のようなものに感じる.μが低いということは鈍感な方が良いわけで,これが協力のクラスターの維持に役立っていると考えられる.
裏切りへの誘惑bの値が1.2くらいまでしか協力が保たれていないので,そんなに強力なメカニズムではないかな.
Effects of limited interactions between individuals on cooperation in spatial evolutionary prisoner’s dilemma game
Xu-Sheng Liu, Jian-Yue Guan, Zhi-Xi Wu
空間囚人のジレンマでタイプAとBがいて,同じタイプとしかゲーム出来ないという設定.タイプAの割合をp,Bの割合を1-pとする.
ただ裏切りへの誘惑uの値が上と同じくそれほど高くない.
なんかタグありの進化ゲームに似ている気がするが,それには触れられていない.
Evolutionary games with facilitators: When does selection favor cooperation?
Mauro Mobilia
一定の数のcooperation facilitators(協力の促進者:協力とやるときに協力として働くが裏切りとやる時はなんの影響も与えない)がいる時の協力が進化する条件についていろいろな進化ゲームで固定確率を求めて明らかにしている.
協力者の相対的適応度が上がるので,協力は進化しやすい.
Masuda, Sci. Rep. 2, 646 (2012)のzealots(熱狂者)と似ているがzealotsの場合は,協力に対しても裏切りに対しても常に協力として振る舞うので,facilitatorの方が条件が緩い.
Effects of group sensitivity on cooperation in N-person snowdrift game with dynamic grouping
Yong-Dong Shi, Li-Xin Zhong, Wen-Juan Xu
自分の利得がグループの平均利得よりも小さい場合,グループの鋭敏さのパラメータεによって,グループのサイズを±1変更することができる.
εが中間の時,グループサイズが小さくなり,協力も進化する.おそらく協力者が満たされなくなって,グループサイズを自分が満足できる小さいグループへと進化させることが効いているのだと思う.
基本的にmultilevel selectionのモデルだと思うのだが,触れられていない.
Proportional cost for punishment enhances spatial reciprocity in evolutionary games
Jiang-Sheng Luo, Ming Zhao
協力の進化における罰の役割を調べている.
裏切り者全員が罰されるのは現実的ではないということで,罰する割合と罰の強さを変えれるようにしているが,結果としては罰する割合が高くて罰の強さが強いと協力が進化するという自然な結果.
Effects of neighborhood type and size in spatial public goods game on diluted lattice
Hong-yang Li, Jian Xiao, Yu-meng Li, Zhen Wang
公共財ゲームで,ゲームをする近傍と真似をする近傍が異なり,それらのサイズも変わるモデル.
An intermediate number of neighbors promotes the emergence of generous tit-for-tat players on homogeneous networks
Hui Gao, Liming Pan, Zhihai Rong
戦略を確率分布で表し(例えば,AllCが(1,1),AllDが(0,0),TFTが(1,0)),利得は近傍の個体の戦略と自分の戦略の確率分布と利得行列によって決まる.
レギュラーネットワークとランダムネットワークで戦略を進化させたところ,近傍数が中間の値の時,GTFT(寛容なしっぺ返し)が創発したとのこと.面白い.
The evolution of cooperation in mixed games
Lucas Wardil, Jafferson K.L. da Silva
利得行列のTとSを変化させて,4つのゲーム(ハーモニー,スノードリフト,スタグハント,囚人のジレンマ)を表し,その中から2つのゲームを確率wと1-wで,エージェントはプレーする.
混合集団とサイクルで調べた.
混合集団の場合の結果は,2つのゲームの平均になる.例えば,スノードリフトとスタグハントの場合は,囚人のジレンマの結果と同じ.
サイクルの場合は,ゲームをどう混ぜるかに依存して,選択の強さが協力を促進するか抑制するかを決める.
Cooperation in spatial prisoner’s dilemma game with delayed decisions
Qiuhui Pan, Shu Shi, Yu Zhang, Mingfeng He
セルオートマトンの空間囚人のジレンマに時間遅れを入れたモデル.
プレーヤはm世代前の自分と近傍の利得を覚えていて,それを基に自分の現在の戦略を決める.
mが大きいほど協力が進化.協力者のクラスターのサイズが増加するのが効くとのこと.
Effect of assessment error and private information on stern-judging in indirect reciprocity
Satoshi Uchida, Tatsuya Sasaki
間接互恵のモデルでStern-judging(良い人を助け,悪い人を助けることを断る人に良い評判,逆に良い人を助けることを拒み,悪い人を助ける人に悪い評判)戦略が強いことが知られているが,これにエラー(uの確率で逆の評判を与える)とprivate information(ゲームが全ての個体によって観察されるのではなく,qの割合の個体のみによって観察される)を入れるとStern-judgingが崩壊するとのこと.
ある個体に対するStern-judging戦略の評判が逆だとそれを修復する要素がないのが効いている,だからエラーに弱い.
Reputation-based mutual selection rule promotes cooperation in spatial threshold public goods games
Xiaofeng Wang, Xiaojie Chen, Jia Gao, Long Wang
空間公共財ゲームに,ゲームをする人数がある一定値Tを下回るとそのグループではゲームが行われないという効果を入れたモデル.
ゲームに参加するかどうかは中心のプレーヤとその周りのプレーヤの評判の差が許容レベルhを下回っている時にのみ行われる.なので,評判の良いグループでのみゲームが行われやすい.
hが中間でTが小さい時に協力が進化.
Cooperation in changing environments: Irreversibility in the transition to cooperation in complex networks
Carlos Gracia-Lázaro, Luis M. Floría, Jesús Gómez-Gardeñes, Yamir Moreno
ちょっとモデルが良く分かっていないところがあるが,戦略を進化させる途中で,裏切りへの誘惑bの値を増やしたり減らしたりすることが,2種類のネットワーク(ランダムとスケールフリー)で協力の進化にどのような影響を与えるかを調べたもの.