代表値と四分位数・箱ひげ図
Rでの代表値の求め方、箱ひげ図の描き方です。
いま、xにデータが入っているとします。
平均値は mean(x) 中央値は median(x) で求められます。
最瀕値は table(x) で値ごとの度数をカウントして求めることができます。
次に、5数要約と箱ひげ図です。
これらは、データを比較するのに用いますので、いま、2種類のデータが、CSVファイルとして用意されているとしましょう。
これを読み込んで、それぞれのデータの5数要約と箱ひげ図を作ります。
まず、作業ディレクトリを変更(指定)します。データがデスクトップにあるとしましょう。
ファイルメニューの「ディレクトリの変更」を選び、作業ディレクトリを「デスクトップ」にしてOKボタンを押します。
2つのデータは、次のような形式でcsvファイルになっているとします。
A,B
31, 61
49,49
47,58
54,57
36,61
45,54
(以下同様)
これを read.table
関数で読み込んだ後、2つに分けます。
x<-read.table("sample3.csv",sep=",",header=TRUE)
A<-x[[1]]
B<-x[[2]]
ここで、「header=TRUE」は、最初の行にヘッダ(データ名など)が
入っていることを示す。 A<-x[[1]] 、 B<-x[[2]] で列ごとに
データがAとBに入る。
(2) 5数要約を求める。
fivenum(A) で5数要約ができます。Bについても同様です。
左から、最小値、第1四分位数、中央値、第3四分位数、最大値となっています。
5数要約はsummary関数でも求められます。summary関数では平均値も算出されます。
箱ひげ図は、boxplot(A,B)で描かれます。
Cinderellaで箱ヒゲ図
Cinderellaで箱ヒゲ図を書くには、その都度簡単に作る、というわけにはいかないので、ある程度汎用的なものを作っておきます。
そのソフトは下からダウンロードできます。
< 戻る >