Rを使ったデータ処理 - Rで分散分析

Rを使ったデータ処理

Rで分散分析

ANOVA君の関数（anovakun）をDLする

ソースファイルの読み込み（Rファイルの実行）

ソースファイルとは

ソースファイル（anovakun_xxx.txt）を読み込む

anovakunのデータを用意する

データの例

anovakunを実行する

1要因3水準分散分析実行例（youtube）

anovakunのオプション

球面性の仮定の崩れへの対処

ANOVA君

Rで分散分析をするには，aov関数を使用する方法もあるが，ANOVA君が非常に楽で使い勝手が良い
以下に簡単に使い方をまとめる。が，本家サイトに全部載っているのでそっちを見たほうがいいと思うよ

ANOVA君の関数（anovakun）をDLする

https://riseki.cloudfree.jp/?ANOVA%E5%90%9B
上記URLの「ANOVA君のファイル」から，「anovakun_xxx.txt」というリンクをクリックし，PCの適当な場所に保存する。
- 拡張子を確認するためには，登録済み拡張子がエクスプローラー上で見えるようになっていなければならない。わかなければ自分でググること

ソースファイルの読み込み（Rファイルの実行）

ソースファイルとは

誰かが用意してくれた関数のこと，ソースファイルが集まったものをパッケージと呼ぶ
自分でも作れる

ソースファイル（anovakun_xxx.txt）を読み込む

ソースファイルの読み込みは，コンソールからだけでなく，GUIの操作によっても可能
- GUI「ファイル」→「Rコードのソースを読み込み」
- source("ファイル名"): ソースの読み込み

# source()は，あらかじめ用意された関数を読み込む関数

# ファイルパスは個人ごとに異なるので，適宜修正する

source("C:/Users/*******/******/anovakun_xxx.txt")

xxxはバージョンの数字。ファイル名に従って入力する
Mac／Linuxの場合は，source関数のオプションとして「encoding = 'CP932'」を指定して実行する

anovakunのデータを用意する

解析用データは，縦（行）に参加者間要因，横（列）に参加者内要因を並べる
被験者間要因が1つある場合
- 1列目に要因と水準を示すラベルを記載する（a1,a1,…a2,a2,...など。文字列でなくても，数値でも構わない）
被験者間要因がn個ある場合
- 最初のn列に水準を示すラベルを記載する（1列目にa1,a1,…a2,a2,...，2列目にb1...,b2...,b1...,b2...）
解析用データは，データフレームで用意する
- 動かないときは，as.data.frame()をすればいける気がする
- たとえばcsvを読み込む場合には，read.csv() を使う。
  - data <- read.csv("data.csv")

データの例

テキストエディタ（メモ帳など）で開いた場合，以下のように見えるはずです。
エクセルで開いた場合には，各セルに数値が入っており，カンマ（，）は見えません。
- 挙動を確認したい場合には，以下のデータ部分をコピーしてから，data <- read.table("clipboard") としてデータを読み込んでみよう
被験者内1要因3水準データの例（下記データにおける参加者の数は6名分）

1.2, 2.3, 3.22.5, 2.2, 3.51.5, 2.3, 4.22.2, 2.3, 3.11.2, 1.1, 1.62.8, 3.2, 3.3

被験者内2要因データの例（被験者内2水準 x 被験者内3水準=6列）（下記データにおける参加者の数は6名分）

1.2, 2.3, 3.2, 4.2, 3.1, 3.22.5, 2.2, 3.5, 3.9, 3.0, 3.01.5, 2.3, 4.2, 4.2, 3.1, 3.32.2, 2.3, 3.1, 4.1, 3.5, 3.21.2, 1.1, 1.6, 4.2, 3.1, 3.52.8, 3.2, 3.3, 4.6, 3.3, 3.7

被験者間1要因3水準データの例（下記データにおける参加者の数は3名×3群＝9名分）

a1, 1.2 a1, 2.5a1, 1.5a2, 1.2a2, 2.8a2, 2.3a3, 2.3a3, 3.2a3, 3.2

被験者間2要因データの例（被験者間2水準 x 被験者間2水準）（下記データにおける参加者の数は4名×2群＝8名分）

a1, b1, 1.2 a1, b1, 2.5a1, b2, 1.5a1, b2, 1.2a2, b1, 2.8a2, b1, 2.3a2, b2, 2.3a2, b2, 3.2

混合2要因データの例（被験者間2水準 x 被験者内3水準）（下記データにおける参加者の数は3名×2群＝6名分）

a1, 1.2, 2.3, 3.2a1, 2.5, 2.2, 3.5a1, 1.5, 2.3, 4.2a2, 2.2, 2.3, 3.1a2, 1.2, 1.1, 1.6a2, 2.8, 3.2, 3.3

anovakunを実行する

要因・水準の数は例です。自身の実験計画に沿った数値を入力すること
"As"などの部分が要因計画を指定する部分
- 要因名はA，B，C…と便宜的についている（一つ目の要因＝A，二つ目の要因＝B，…）
- sより左にある要因が被験者間要因，sより右にある要が被験者内要因
要因の後にある数値は，各要因の水準数
- 要因が一つなら一つ，要因が二つならば二つ，…指定する必要がある

# 被験者間1要因3水準ANOVA

anovakun(data, "As",3)

# 被験者内1要因3水準ANOVA

anovakun(data, "sA",3)

# 被験者間2要因ANOVA (2 x 2)

anovakun(data, "ABs",2,2)

# 被験者内2要因ANOVA (2 x 3)

anovakun(data, "sAB",2, 3)

# 混合2要因ANOVA (3,5)

anovakun(data, "AsB",3,5)

# 3要因以下も同様に実行可能です

1要因3水準分散分析実行例（youtube）

https://youtu.be/DEai9uZfxx0
- RStudioじゃなくてふつうのRで実行しているので少しインターフェースが違います

anovakunのオプション

多重比較

デフォルトはBonferroniの改訂版であるShafferの方法
- 基本はこれを使っていればいい
- anovakunではBonferroniの方法は実装していない（が，bonferroniは自分で簡単に計算可能）

# Holm の方法：Bonferroniの改訂版のひとつ

# holm = T

anovakun(data, "sA",3, holm = T)

効果量

効果量はどれを使えば正解，というものはない。先行研究（デザイン同じであることが望ましい）で使用されているものと同じものを使った方が比較が簡単なので，そういう基準で選べばいいと思います。
上記のholmの方法のように記述する。カンマで区切っていけば，複数の効果量を出力することも可能
- anovakun(data, "sA",3, holm = T, eta = T, peta = T)

# イータ二乗

eta = T

# 偏イータ二乗

peta = T

# 一般化イータ二乗

geta = T

# オメガ二乗

omega = T

# 偏オメガ二乗

pomega = T

# 一般化オメガ二乗

gomega = T

球面性の仮定の崩れへの対処

デフォルトだと球面性の仮定に対する検定はおこなってくれるが，対処（自由度調整）はしてくれないので，手動で指定する必要がある。
- ただし，サンプル数がある程度大きくないとチェック不可能
- K(K−1)/2＜N のときに使用可能 (Oberfield and Franke, 2013)。 K は水準数
これに関しても，どれを使えばいいか，に関して正解はない。使用する際には，本家サイトの説明，統計の教科書，論文等をしっかりと読むこと。

# すべての被験者内効果についてGreenhouse-Geisserのεによる調整を適用

gg = T

# すべての被験者内効果について，Chi-Mullerのεによる調整を適用

cm=T

# 球面性検定の結果が有意であった被験者内効果について，Greenhouse-Geisserのεによる調整を適用

auto=T

統計検定の詳しいこと（初歩的なこと）については心理学統計入門（板口・森，2017）を参照ください（Amazonリンク）

Page updated

Google Sites

Report abuse