Q. マルチオミクスのモデルでゲノムデータの取り扱いが分かりません。同じ品種を違う環境や条件(たとえば灌水・乾燥)で栽培したデータの場合、遺伝子型は環境や条件によって不変なので、同じデータを複数回説明変数として入れることになり、違和感があります。遺伝子型の特徴量名を環境によって変え、遺伝子型のブロック行列を対角成分にして入れた場合は、ゲノムの因子負荷量が全て0になり上手くいきませんでした。 (雪さん)
A. おっしゃる通り、同じ品種を異なる環境や条件で栽培する場合、遺伝子型自体は環境によって不変なので、例えば同じ遺伝子型に対して異なる条件・環境に関する複数の結果が得られることになります。このようなデータを解析する手法はいくつかありますが、もっともシンプルには計画行列をうまく使ってあげると良いでしょう。つまり、異なる環境間で各遺伝子型の効果が共通であると仮定するならば、全ての条件・環境に関する表現型がどの遺伝子型の表現型なのかという対応を表す計画行列を用意(スカラー形式で考えるならダミー変数を用意)してやって、これを各遺伝子型の効果と掛け合わせる形でモデルを組めば良いでしょう。おそらくこの遺伝子型の効果とは別に、オミクスによる効果の項なども入ってくるかと思いますので、マルチカーネルモデルになることが想像されますね。これが最もシンプルなモデルですが、場合によっては遺伝子型とオミクスの間の交互作用項などを導入しても良いかもしれませんし、次元が多いようであれば、因子解析などを利用するのも一つの手ですね。いずれにせよ、このように、同じ効果が複数の表現型に影響しているようなモデル化を行いたい場合には、計画行列やダミー変数を導入することが有効であると言えるでしょう。(回答者:理研AIP・濱崎)