本ワークショップでは、育種に関するデータ解析における「落とし穴」を扱う。本発表では、本ワークショップを開催するに至った経緯を説明するとともに、機械学習モデルを育種に適用する際の注意点について、具体的な事例を交えながら紹介する。
RNA-seqは発現変動遺伝子(DEG)の解析に不可欠な手法となったが、リード前処理・マッピング・カウントデータ取得・正規化と手順は多岐にわたる。本ワークショップでは特にカウントデータの正規化手法についての「落とし穴(注意点)」を取り上げたい。
ゲノム解析では目的に応じた配列データの取得が不可欠であり、リファレンスゲノムの選定は多型検出や遺伝的評価結果に影響を及ぼす。本講演ではその重要性と注意すべき点を紹介する。
興味ある対象の2D画像や3D点群、ポリゴン、ボリュームデータを取得するハードルは下がった。しかし、多少のノウハウは必要かもしれない。また、そこから意味ある情報を取り出すことにはギャップもある。この周辺にしばしば現れる落とし穴を紹介したい。
演者らは複数の果樹種を対象に、ゲノム育種の可能性を評価している。解析に用いる集団やモデルの選定方法を含め、これらの研究を通じて演者が直面した「落とし穴」と、そこから得られた学びについて紹介する。
遺伝分散や遺伝相関といった遺伝的パラメータは、量的遺伝学及び育種学に頻出する概念であるが、その理解は案外と難しい。近年はさらに、ゲノミック予測によりその解釈に新たな難しさが生じていることを紹介する。
パネルディスカッションでは、事前アンケートで募集した質問や事例について、講演者および会場から意見を募った。
なお、各分野への精通度など事前アンケートの回答結果は以下の通りでした。ご回答いただいた皆様、本当にありがとうございました。