研究

  • 研究分野など

    • 研究分野: 量的遺伝学 (quantitative genetics), 育種学 (breeding)

    • 専門: GWAS, GS, 混合モデル (mixed-effects model)

    • 関連分野: 統計学, 機械学習(強化学習を含む)

    • 言語: R (, C++, Python)

  • 背景: ゲノムワイド関連解析 (GWAS), ゲノミック予測・選抜 (GP・GS) とは?

  • ゲノムワイド関連解析 (GWAS; Genome-Wide Association Studies)とは, 遺伝資源 (genetic resources) などから遺伝子型 (genotype) と対応する表現型 (phenotype) を多く収集し, 統計学的検定(マーカーと原因変異との間の連鎖不平衡 (LD; Linkage Disequilibrium) を利用)により, 注目する形質 (trait) の候補遺伝子を選定する手法です(右図).


  • シークエンスコストの低下に伴い, さまざまな作物種に関するゲノム情報が得られていく中で, GWASは農業上重要な形質の関連遺伝子の同定に役立ってきており, ゲノム編集 (genome editing) などと組み合わせることで, 育種の高速化に貢献することも期待されています.

  • 一方で, ゲノミック予測 (GP; Genomic Prediction) とは, ゲノムワイドに配置されたマーカー遺伝子型 (marker genotype) 情報から, 注目する形質の表現型のうち遺伝的に支配される部分(遺伝子型値; genotypic values)を予測する手法です(右図).


  • GPによる予測値 (GEBV: Genomic Estimated Breeding Value) を用いて選抜を行う育種法はゲノミック選抜 (GS; Genomic Selection) と呼ばれ, 時期や場所を問わずに個体単位での選抜が行えるため, 育種の効率化・高速化に寄与するものとして期待されてます.

  • テーマ1: GWASに最適な集団の選択に関するイネの全ゲノム配列を用いたシミュレーション研究

  • GWASの欠点の一つとして, 遺伝的多様性の高い(=分集団構造 (population structure) が強い, 遺伝的背景の異質性が高い)集団で, 本来そうでない場所を原因変異として検出してしまう現象(=偽陽性 (false positive) )が生じてしまうことが挙げられます(=分集団構造による偽陽性, 左図の例). 一方, 解析に使える系統数(=標本サイズ)が限られると, 統計的に原因変異の検出力が低下してしまい, これらはトレードオフの関係にあると言えます(下図).

  • テーマ1では, こうしたトレードオフの効果を評価するため, 遺伝的多様性の低い集団が本来の解析対象である場合に, 遺伝的多様性の高い集団を解析集団に加えるべきか、という視点に基づきシミュレーション研究を行いました.


  • QTN (Quantitative Trait Nucleotide) の集団内における遺伝的分化 (固定指数, FST) の度合いと, 解析集団においてQTNに多型があるかどうかで, シミュレーション結果を場合分けして評価したところ, 遺伝的多様性の低い元の解析集団においてQTNに多型がある場合には、標本として利用できる遺伝子型を解析集団に追加して標本サイズを増やすことで, 検出力が向上しました. このとき, 元の解析集団に遺伝的に近い集団を加えることが望ましいことも明らかになりました. また, FST期待ヘテロ接合頻度Heという2つの値に注目すると, FSTが高い, またはHeが低いSNPは, 混合集団を用いたGWASによる検出が難しいことがわかりました. これらの結果は, 異なる遺伝的背景からなる混合集団を用いることで, GWASの検出力が向上する可能性を示唆するものだと考えられます.

  • 関連業績

  • テーマ2: ハプロタイプベースでGWASを行う新規手法の開発

  • ゲノム上には, 個体間の違いを生む場所(アリル, allele)が多く存在しますが, 複数のアリルの組合せをハプロタイプ (haplotype)といいます.


  • ハプロタイプのように, 複数アリルで構成される複雑な遺伝機構をもつ遺伝子は、従来のGWAS手法により検出することが困難でした(右図).


  • テーマ2では, 複数のSNP (Single Nucleotide Polymorphism, 一塩基多型) を同時に検定するSNP-set解析とよばれる手法に注目し, 各ハプロタイプブロックを一つのSNP-setとみなして新規のSNP-set解析を適用することで, 事前のハプロタイプ情報なしに, 従来手法では検出が困難な遺伝子の検出に成功しました. 提案手法の有用性は, シミュレーション研究により, 従来のSNPベースのGWAS手法, 従来のSNP-set手法, 従来のハプロタイプベースの手法の3つと比較することで示されました. 提案手法は他の既存手法と比較して, 特に (1) 偽陽性を抑えること, (2) 原因変異そのものをLDに頼らずに検出できること, (3) 隣り合うQTLの効果が相反 (repulsion) である場合(隣り合う原因変異の間で, その効果が逆向きの状況)などの複雑な条件下でも原因変異を検出できること, の3点において優れていることが明らかになりました.


  • 研究内容紹介動画: 以前、生物測定学研究室で各自の研究内容を紹介する動画を作る、という企画の時に作成したものです。(2020/05/13 公開)

  • テーマ3: 成長早期の表現型計測を用いたゲノミック予測のコストと精度に関する最適化