PCM
JSTさきがけ研究「表現型の進化モデルと系統種間比較から適応進化を明らかにする計算行動生態学」 の最終報告書です(その後の出版状況に応じて、一部、加筆・修正しました)。
研究のねらい
“Evolution is messy” (Losos 2011 Am Nat)
現在、地球上には多様な生物が存在している。この生物多様性は、生命が誕生して以来、長い進化の過程を経て育まれてきたものである。進化のプロセスには種の誕生や絶滅、変動する環境への適応、中立的な進化が含まれる。これら諸現象の生起確率・速度は一定ではなく、不均一な性質を持つと考えられる。
動物の行動や表現型形質の適応的意義を考察する際、生物進化の歴史である系統関係を考慮することが必要不可欠である。その理由として、進化の歴史を最近まで共有してきた近縁な二種は、形質が類似することが多く、統計的に独立であるとみなせないためである。Felsenstein (1985, Am Nat)に始まる系統種間比較 (phylogenetic comparative methods) と呼ばれるアプローチでは、現世種にみられる形質の種間比較から、進化のプロセス(進化速度、進化モード、祖先形質)を推定することが可能である(沓掛 2012 行動生態学)。現在までに、系統種間比較を用いた研究は数多く行われ、適応進化に関する多くの知見をもたらしてきた。しかし、従来の系統種間比較には、単純な進化モデルしか検証することしかできないという欠点が存在した。多くの系統種間比較法において、表現型の進化モデルとして用いられるものがブラウン運動Brownian motionである。この進化モードは中立進化に相当し、適応進化の検出を主目的とする研究において有用なモデルと見なせるかどうかについては議論があった。ブラウン運動に基づくモデルを拡張し、異なる進化速度を持つ複数のブラウン運動による進化、進化速度の加速・減速を伴うブラウン運動などを想定した手法も開発されてきたが、これらも先述の議論に答えを与えるものではない。そのため、系統樹上で複数の進化モードが混在する進化モデルのもと、各パラメーターの推定、さらには複数の進化モデルの統計的に比較する手法は限定されてきた。さらに、多くの手法では形質の種内変異が考慮されていなかった。 この現状は、遺伝子型を対象にした系統関連の分析手法が大きく発展している状態とは対照的である。とくに、遺伝子型の研究で頻用されている計算機的手法やベイズ統計学は、表現型を対象にした系統種間比較では十分に導入されていない。 これらの問題点をふまえ、本研究では新しい系統種間比較の理論・分析手法を開発した(図1)。開発した分析手法を進化・行動生態学の実証的研究に適用し、従来の研究では実現できなかった適応進化プロセスの推定を行った。
研究成果
(1)概要
系統樹上で表現型をシミュレーションによって節の形質値を進化させ、実証データとの比較によって尤度を算出する新しい系統種間比較のアルゴリズムを開発した。進化シミュレーションでは、研究者が検証したい進化モード、進化速度、生態学的イベントを設定する事ができるため、既存のブラウン運動に基づく進化モデル、または安定化淘汰に基づく進化モデルのみならず、枝やクレード特異的に働く方向性淘汰や、枝の途中段階における進化プロセスの変化なども考慮する事ができる。パラメーター推定には、近似ベイズ計算(approximate Bayesian computation, ABC)を用いることによって、計算時間が短縮されるのみならず、系統樹や枝長の不確実性を考慮する事ができ、また、事後分布によりモデル選択を行うことも可能であるという利点がある。開発された手法は、既存の系統種間比較を広くカバーするのみならず、研究者が検証したいと考える進化モデルを扱う事ができるという点で、柔軟性が高い、最も包括的な手法であるといえる。このアルゴリズムを用いて、実証場面において未解明の現象について研究を行っている。現在までに分析が完了している例として、テナガザルにおける体サイズの大型化、デバネズミ科における社会進化が挙げられる。それぞれの例は、枝長に不確実性がある系統における枝特異的にかかる方向性淘汰の検出、種内変異と下限があるデータの分布という、従来の系統種間比較法では分析する事が困難であった事例を扱っており、本アルゴリズムの有用性を示している。
(2)詳細
表現型の進化シミュレーションに基づく尤度の計算とパラメーター推定のアルゴリズム 表現型の進化シミュレーションによる、従来の手法とは異なる新しい系統種間比較のアルゴリズムを作成した。この手法では、集団遺伝学の概念を取り入れ、既知の系統樹の上で、研究者が仮説として持つ進化モデルに基づいて表現型を進化させる。その結果、末端節(tip)や内部節(internal node)の形質値が生み出される。この値と、対応する実際の形質値を比較し、あるパラメーターセットのもとで、実際の形質値が得られる確率(尤度)を求めることが可能である。種内変異の情報は、末端節のデータを平均値とするデータ分布(例:量的形質の場合は正規分布など)中での、実証データの値が得られる確率を算出する事によって、重み付けを行う。パラメーター推定は、最尤法と近似ベイズ計算(approximate Bayesian computation, ABC)によって行うことが可能である。 この手法の特徴は以下の通りである。まず、多数のパラメーターセット、様々な進化モデル(進化モード、進化速度)と、その不均一な生起、その他の仮定を柔軟に設定する事ができる。進化モードとしては、中立進化に相当するブラウン運動、安定化淘汰に相当するオルンステイン・ウーレンベックOrnstein-Uhlenbeck過程、その他、方向性淘汰や分断淘汰など、研究者が検証したい進化モードを柔軟に設定する事ができる。また、尤度とパラメーター数から、尤度比検定や情報量基準によって進化モデルを比較することが可能である。この手法は、既存の系統種間比較を広くカバーする、柔軟性の高い包括的な手法であるといえる。当アルゴリズムは、今後、統計ソフトRでのライブラリーとしての公開を予定している。 図2:本アルゴリズムの概略図 実証研究への応用 当アルゴリズムを用いて、従来の研究ではできなかった、系統樹内での不均一な進化の検出を行っている。以下はそのうち、分析を完了している二例である。
・ 近縁種間にみられる表現型の変異のなかには、特定の種の形質が、他種と大きく異なる(ようにみえる)事例が存在する。このような現象はevolutionary singularityと呼ばれ、中立進化のみでは説明できず、系統樹の一部において何らかの淘汰圧がかかっている可能性を示唆している。しかし、従来の系統種間比較では、この可能性を定量的に検証する事が難しかった。加えて、従来の手法では、系統樹に存在する不確実性をパラメーター推定において考慮することができなかった。本研究では、evolutionary singularityの存在を検証できることを示す一例として、テナガザル科におけるシアマンSymphalangus syndactylusの体の大型化を分析した。テナガザル科は17種で構成され、そのうちの一種であるシアマンは体サイズが他種と比較してやや大きく、特別な種であると言われてきた。しかし、その定量的な検証は行われず、シアマンが他種と行動的に異なるという結果は得られていない。遺伝子情報に基づくテナガザル科の系統関係は、推定結果には不確実性が高いものの、近年、報告され始めている。このような背景のもと、シアマンの大型化を検証するのに適した時期に来ている。本研究では、枝長に不確実性が存在する系統樹を用いて、シアマンに至る枝で体サイズが大きくなる方向性淘汰に関するパラメーター(k)を導入し、その他の枝では中立進化を想定したブラウン運動による進化モデルを構築した。パラメーター k = 1のときには、系統中の他と同様のブラウン運動と同様に形質の増加と現象が等確率で起きる。k > 1のときには、形質の増加を伴う突然変異が中立進化と比較してk倍多く起き、形質の増加が起きる。ABCを用いたパラメーター推定の結果、kの事後分布は1より大きく、また祖先型はシアマンよりも他種と近いものであった(図3)。このことから、テナガザル科においてシアマンにおいて体サイズの増加が特異的に起きたという仮説が初めて支持された。
・ 約20種からなるデバネズミ科は社会進化を研究するうえで興味深い分類群である。この科には、単独性、社会性、真社会性と異なる社会形態が混在し、しかも真社会性が系統樹内に二回独立に進化している(図3)。群れ(コロニー)サイズは、社会システムに対応した大きな種間変異がみられるが、同時に種内変異も大きい(例:ハダカデバネズミHeterocephalus glaberは最小2から約275のコロニーを作る)。 デバネズミ科の社会進化に関しては、祖先形質が単独性であるか、社会性であるかによってその解釈が大きく異なる。最祖先種が単独性である場合、ハダカデバネズミにみられる真社会性が急速に進化したということになり、最祖先種が社会性である場合、単独性が派生形質として進化したということとなる。現在までに、不均一な進化を想定した上での祖先形質や他のパラメーターの推定は行われてこなかった。 本研究では、開発したアルゴリズムを用いて、平均群れサイズが1以下とならない仮定のもと、種内変異の情報を取り入れた進化シミュレーションを行った。社会性の種に対してはブラウン運動による中立淘汰、二種の真社会性の種に対してはコロニーサイズが上昇する方向性淘汰を設定した。なお、真社会性を示す二種での方向性淘汰では、ハダカデバネズミとダマラランドデバネズミの二種に異なる淘汰圧を想定した。その結果、ハダカデバネズミに至る枝では群れサイズの上昇という方向性淘汰が検出されたが、ダマラランドデバネズミCyptomys damarensisに至る枝では、他の枝と同様の中立的な進化で説明する事が可能であった。このように、ともに真社会性に分類されている二種であっても、群れサイズにかかる進化プロセスが質的に異なることが判明し、この分類群における複雑な社会進化の過程を推測する事ができた。
この研究は、Haba & Kutsukake (2019, Evol Ecol)に掲載されました。こちらもご覧ください。
以上のように、個別の事例やデータ特性に対応して、柔軟な表現型シミュレーションを行うことが本アルゴリズムでは可能である。さらに、パラメーターの事後分布を用いたモデル選択によって、進化モデルを比較することも可能である。これらの点から、従来の系統種間比較ではできなかった、適応進化に関する新しい理解を行う事が可能な土壌を作ることができたといえる。
今後の展開
表現型や形質を対象にした系統種間比較は、遺伝子型を対象にした研究と比較して、手法、概念ともに大きく遅れている。とくに、計算機の飛躍的な発展に相まって開発された分析手法と比較して、表現型を対象にした研究では発展余地がある。博物学の時代以来、収集されてきた形質データのデータベース化は近年加速し、さまざまな分類群を対象にした高精度の系統関係が報告されている。これらの大量データが扱うことが可能となる時代において、生物学における比較研究、計算機を用いたデータ分析は、その必要性をますます強めるであろう。本研究によって生み出されたアルゴリズムは、進化生物学的に妥当性の高い進化モデルの検証を可能にするものであり、今後の系統種間比較研究において中心的な役割を果たす事が期待される。また、当初は想定していなかったが、生物進化における適応・制約・中立が果たす役割、標準化された進化速度の提案など、本研究は進化生物学的における大きなテーマに対して寄与できる事が分かった。今後はこれらの研究を進めていく予定である。
自己評価
本研究プロジェクトを提案した最初の動機が、実証研究において系統種間比較を用いた際の違和感であった。それは、系統樹内で不均一な進化モードや進化速度、種内変異や分岐年代の不確かさ、化石種と現世種の同時分析など、進化生物学的に本当に重要な仮説や問題点を分析に織り込めないという手法の限界に対するもどかしさであった。本研究の中心部分のアルゴリズムは、これらの問題点をすべて解消するものであり、当初想定していた主要な目標は達成したといえる。今後、多くの実証研究例と、発展した手法を多く報告する事によって、手法を普及させていく必要がある
Ornstein-Uhlenbeck (OU) process
Martins 1994; Hansen 1997
Butler and King 2004: ML framework
Beaulieu et al 2012 Evolution, multiple OUs
Landis et al 2012 SysBiol --
形質の進化にLevy walkを想定したPCMモデル
Multiple Brownian Motion
McPeek 1995 a single branch based on PIC
O’Meara et al. (2006)
Thomas et al. (2006, 2009)
Revell 2012 SysBiol -- 複数のBMを系統樹に当てはめるとき、離散形質によってBMの速度が違うと仮定した場合、離散形質の進化速度によって、進化速度の推定値が異なるという問題
Adams 2012 SystBiol -- 複数の形質間でBMの進化速度を比較する手法
計算機系
Eastman et al (2011) Evolution Reversible-jump MCMC on multiple BMs
Revell et al (2011) Evolution MCMC on multiple BMs
Slater et al (2012) Evolution ABC-MCMC on multiple BMs
Revell et al. 2012 Evolution
ABC = Approximate Bayesian Computation
BM with accelerating or decelerating rates
Blomberg et al. 2003
Harmon et al. 2010
BM with punctuated evolution
Bokma 2008
化石、祖先系の情報を入れる
Oakely and Cunningham 2000
Polly 2001
Finarelli and Flynn 2006
Alberts et al. 2009
Slater et al.
Intra-specific variation
Ives et al. 2007
Felsenstein 2008
Hadfield and Nakagawa 2010
種分化
Brock et al. (2011) SB 60: 410-419 Pybus & Harvey (2000)のγ推定の際のmissing dataがランダムでない場合
化石系