Ex. 多重比較の問題について、適切な対処法が適用されていない例が散見されます。そもそも問題と認識していない方も多くいらっしゃるように思います。かく言う私もきちんと理解できているかと言えば自信がありません。
A. 確かに、多重比較における有名な補正方法は以下のようにいくつかありますが、いつどんな補正方法を適用すればいいかはなかなか難しいです。
・Tukeyの方法(HSD検定、正規性・等分散性の仮定)
・Steel-Dwassの方法(正規性も仮定しない、ノンパラメトリック検定における補正)
・Bonferroni補正(簡便、保守的)
・Benjamini-Hochberg(GWASなどでよく用いられる)
一般にはその分野でよく用いられている補正方法を用いるのが望ましいと思いますが、その補正の意味についてはしっかりと把握しておく必要がありそうです。また、そもそも検定による有意かどうかの判断は、有意水準という人間が恣意的に決めた基準により左右されてしまうため、そこまで重要でないという考えもあります。例えばGWASを行った際に多重比較の補正による閾値を超えるかはさほど重要でなく、それよりもp値自身の順番の方が重要と言えるかもしれません。したがって、もちろん論文化を行う際に検定が必要とされる場合もありますが、そこまでとらわれすぎずに解析を行ってみても良いかもですね。(回答者:龍谷大学・小野木さん@ワークショップ、理研AIP・濱崎)
Ex. 何でもかんでも正規化するべしという風潮があるが、本当に正規化するべきなのか少しモヤモヤしている。(みかんさん)
A. おっしゃる通り、正規化・標準化の問題はデータ解析をする上で常につきまといます。正規化は、0~1の範囲に収めたりなど、データを一定の規則に基づいて変形することを言います。一方、 標準化は正規化の一種で、平均0、標準偏差1になるようにデータを変形することを言います。標準化は、例えば異なるスケールのデータを主成分分析や多変量解析で統合して扱いたいときに行う場合が多いです。また、標準化の他にも、正規分布に近い形にデータを変換するために、log変換やBox-Cox変換をかけることなどもよくあります。このような変換をかけることで、後の解析(例えばGWASやゲノミック予測)の結果が変わったりすることもよくあります。ですので、もちろんその分野でよく用いられたりする正規化手法を適用すること自体はいいのですが、各正規化手法を適用する意味やその必要をしっかりと検討した上で、正規化を行うべきかの判断を下すことが重要であると言えるでしょう。(回答者:東京農業大学・石森さん@ワークショップ、理研AIP・濱崎)