ここでは「有効種数の計算」の部分で作成した有効種数についてのベクトル(esn0, esn1, esn2)とサンプルに関するメタデータを結合して一つのデータフレームを作成します。まず、サンプリングの月日と月のデータをメタデータ用のベクトルとして用意します。
#add sample information (metadata)
date_sampling <- c("2018Sep25", "2018Sep25", "2018Oct04","2018Oct04","2018Oct04","2018Oct25","2018Oct25")
month_sampling <- c("Sep", "Sep", "Oct","Oct","Oct","Oct","Oct")
有効種数の結果を格納したベクトルと結合させます。
species_biwa_data3 <- cbind.data.frame(date_sampling,esn0)
species_biwa_data3 <- cbind.data.frame(species_biwa_data3,esn1)
species_biwa_data3 <- cbind.data.frame(month_sampling,species_biwa_data3)
自分でやるときは、サンプルデータには2019年5月の各班のものをすべて結合し、2次の有効種数まで計算して以上の処理を完成させましょう。とりあえず上のサンプルではspecies_biwa_data3は以下のような表になっているはずです。
まずはすべてのサンプルデータのばらつきを明示的にみるために散布図を描いてみましょう。ここでは例として0次の有効種数(種数)esn0に注目します。ほかの有効種数については以下のサンプルコードを参考に自分でコードを書いて実行してみましょう。
#scatter plot
plot.default(species_biwa_data3$date_sampling, species_biwa_data3$esn0)
図は以下のようになるはずです。グラフの横軸はspecies_biwa_data3$date_sampling
が要因(factor)として数値化されて並んでいますが、この実習はきれいなグラフを書くことを目的としていないのでとりあえずこれで良しとします。きれいなグラフが書きたかったらggplot2というキーワードでググればいろいろ情報はでてきます。
もうすこしだけきれいな図は箱ひげ図(box plot)として以下のコマンドで書けます。ただし分布の情報がかなり失われてしまうため、最近はあまり使用が奨励されていません。代わりにviolin plotというのがあるのでこのサイトの解説を参考にするとよいかもしれません。箱ひげ図を描く時のポイントは、plot関数の中にY~Xの形でモデル式(model equation, formula)を書き込む必要があります。Yは描画したい値、Xは箱ひげ図で分類したい要因をデータフレームの列名で指定する必要があります。dataオプションで、データ元のデータフレームを指定します。
#box plot
plot(esn0~date_sampling,data=species_biwa_data3)
グラフは以下の左図のような感じです。横軸がちゃんと文字になっていますが、data_samplingの中の情報はアルファベット順に要因1,2,3とラベリングされるため、カレンダーの正しい順になっていませんが、ここではこれでよしとします。
箱ひげ図を描く要因を月(month_sampling)に変えると、以下のようなコマンドで、右図のようなグラフが描写できます。ちょっとだけオプションを追加して見栄えを変えました。レポートを書く際は最低限これらのx軸とy軸のラベルを指定するオプション(xlab="hogehoge", ylab="hogehoge")
を追加して作図してください。
plot(esn0~month_sampling,data=species_biwa_data3, xlab="month", ylab="species richness")
いろいろやってみる
さて、以上、有効種数というパラメータについてのグラフ化(見える化)を解説しましたが、自分たちで観測したデータも含めて、いろいろ計算してみましょう。たとえば、珪藻の相対個体数に月間で差はあるのかとか、特定の種に注目してその相対個体数に月間で差はあるのかなど、グループ内で議論しながら面白そうなパターンをグラフ化によって見つけてください。
図の保存の仕方
方法1:Plots > Export > Save as Image: これでファイルとして保存できます。
方法2:Plots > Export > Copy Plot to Clipboard > Copy Plot: これでクリップボードに画像が一時保存(コピー)されるのでワードを開いて貼り付けることができます。
方法3:Plots > Zoom > 右クリック:これでファイルで保存したり、クリップボードにコピーしたりできます。
この実習プログラムでは範囲外とするため、解説なしに以下のコードだけ参考のために載せておきますが、仮説検定は卒論では必須のプロセスです。他グループではもっと詳しくすると思うのであとで復習しておきましょう。キーワードは一般線形モデル(general linear model)と分散分析(Analysis of Variance, ANOVA)です。または、以下の解説サイトがお勧めです。
橋本洸哉さんのRで統計解析
#test
summary(lm(esn0~date_sampling,data=species_biwa_data3))
anova(lm(esn0~date_sampling,data=species_biwa_data3))
summary(lm(esn0~month_sampling,data=species_biwa_data3))
anova(lm(esn0~month_sampling,data=species_biwa_data3))