Lecture 1: R初心者のためのマイクロアレイ解析ことはじめ(大林武)
発表スライド(PDF)は,こちら.
Rのインストールは行いません.予めご準備ください.できればライブラリのインストールも(下記のコマンドをR上で実行).
(0) 環境の構築
(0) 環境の構築
- ライブラリのインストール
source("http://bioconductor.org/biocLite.R")
biocLite("GEOquery")
- パーミッションエラーが出た場合の対処
- windowsで管理者アカウントでインストールした場合
- (右クリックから)管理者権限で実行
- 書き込み許可がある場所を指定する場合
- (Windowsの例)
R_LIBS="C:/Program Files/R/myRlib"
- (Macの例) ~/.Renviron
R_LIBS="$HOME/lib/R:/usr/local/lib/R-contrib"
- (Windowsの例)
- windowsで管理者アカウントでインストールした場合
(1) Rことはじめ
(1) Rことはじめ
- 関数電卓
- 変数とは
- ベクトル四則演算
- ベクトルから統計量を計算
- ベクトル要素の操作
- 行列
- データフレーム
data(iris)
head(iris)
plot(iris[,c(3,4)])
points(iris[iris$Species == "setosa", c(3,4)], col=2, pch=16)
points(iris[iris$Species == "versicolor", c(3,4)], col=3, pch=16)
points(iris[iris$Species == "virginica", c(3,4)], col=4, pch=16)
(2) 遺伝子発現データの入手
(2) 遺伝子発現データの入手
- NCBI GEOを使って,興味ある実験のIDを探す.
- Repository browser で絞り込む
(3) マイクロアレイデータの解析
(3) マイクロアレイデータの解析
- GDSデータの読み込み(GEOqueryを利用)
library("GEOquery")
gds <- getGEO("GDS2861")
- データの構造(S4クラス)
- gds
- header
- dataTable
- columns
- table
- 確認
gds @ header
gds @ dataTable @ columns
head(gds @ dataTable @ table)
- gds
- 発現データのデータ型の変換
d <- gds @ dataTable @ table
str(d)
# 文字(character)を数字(numeric)に変換
for (i in 3:8) d[i] <- as.numeric (d[[i]])
str(d)
- プロット
boxplot (d[3:8])
plot (d[,c(3,6)])
- 3倍以上発現変動した遺伝子
mean_wt <- apply (d[,3:5], 1, mean)
mean_ox <- apply (d[,6:8], 1, mean)
plot (mean_wt, mean_ox)
abline (log2(3), 1)
abline (-log2(3), 1)
subset (d, mean_treat - mean_cont > log2(3))