代表値と四分位数・箱ひげ図

Rでの代表値の求め方、箱ひげ図の描き方です。

いま、xにデータが入っているとします。

平均値は mean(x) 中央値は median(x) で求められます。

最瀕値は table(x) で値ごとの度数をカウントして求めることができます。

次に、5数要約と箱ひげ図です。

これらは、データを比較するのに用いますので、いま、2種類のデータが、CSVファイルとして用意されているとしましょう。

これを読み込んで、それぞれのデータの5数要約と箱ひげ図を作ります。

まず、作業ディレクトリを変更(指定)します。データがデスクトップにあるとしましょう。

ファイルメニューの「ディレクトリの変更」を選び、作業ディレクトリを「デスクトップ」にしてOKボタンを押します。

2つのデータは、次のような形式でcsvファイルになっているとします。

A,B

31, 61

49,49

 47,58

 54,57

 36,61

 45,54 

(以下同様)

これを read.table

関数で読み込んだ後、2つに分けます。

        x<-read.table("sample3.csv",sep=",",header=TRUE)

          A<-x[[1]]

          B<-x[[2]]

  ここで、「header=TRUE」は、最初の行にヘッダ(データ名など)が

入っていることを示す。 A<-x[[1]] 、 B<-x[[2]] で列ごとに

データがAとBに入る。

(2) 5数要約を求める。

fivenum(A) で5数要約ができます。Bについても同様です。

   

左から、最小値、第1四分位数、中央値、第3四分位数、最大値となっています。

5数要約はsummary関数でも求められます。summary関数では平均値も算出されます。

箱ひげ図は、boxplot(A,B)で描かれます。

Cinderellaで箱ヒゲ図

Cinderellaで箱ヒゲ図を書くには、その都度簡単に作る、というわけにはいかないので、ある程度汎用的なものを作っておきます。

そのソフトは下からダウンロードできます。

< 戻る >