Lecture 1: R初心者のためのマイクロアレイ解析ことはじめ(大林武)

発表スライド(PDF)は,こちら

Rのインストールは行いません.予めご準備ください.できればライブラリのインストールも(下記のコマンドをR上で実行).

- http://cran.ism.ac.jp/

(0) 環境の構築

  • ライブラリのインストール
        • source("http://bioconductor.org/biocLite.R")
        • biocLite("GEOquery")
  • パーミッションエラーが出た場合の対処
    • windowsで管理者アカウントでインストールした場合
      • (右クリックから)管理者権限で実行
    • 書き込み許可がある場所を指定する場合
      • (Windowsの例)
          • R_LIBS="C:/Program Files/R/myRlib"
      • (Macの例) ~/.Renviron
            • R_LIBS="$HOME/lib/R:/usr/local/lib/R-contrib"

(1) Rことはじめ

  • 関数電卓
  • 変数とは
  • ベクトル四則演算
  • ベクトルから統計量を計算
  • ベクトル要素の操作
  • 行列
  • データフレーム
        • data(iris)
        • head(iris)
          • plot(iris[,c(3,4)])
          • points(iris[iris$Species == "setosa", c(3,4)], col=2, pch=16)
          • points(iris[iris$Species == "versicolor", c(3,4)], col=3, pch=16)
        • points(iris[iris$Species == "virginica", c(3,4)], col=4, pch=16)

(2) 遺伝子発現データの入手

  • NCBI GEOを使って,興味ある実験のIDを探す.
    • Repository browser で絞り込む

(3) マイクロアレイデータの解析

    • GDSデータの読み込み(GEOqueryを利用)
        • library("GEOquery")
        • gds <- getGEO("GDS2861")
  • データの構造(S4クラス)
    • gds
      • header
      • dataTable
        • columns
        • table
    • 確認
        • gds @ header
        • gds @ dataTable @ columns
        • head(gds @ dataTable @ table)
  • 発現データのデータ型の変換
        • d <- gds @ dataTable @ table
        • str(d)
        • # 文字(character)を数字(numeric)に変換
        • for (i in 3:8) d[i] <- as.numeric (d[[i]])
        • str(d)
    • プロット
        • boxplot (d[3:8])
        • plot (d[,c(3,6)])
    • 3倍以上発現変動した遺伝子
        • mean_wt <- apply (d[,3:5], 1, mean)
        • mean_ox <- apply (d[,6:8], 1, mean)
        • plot (mean_wt, mean_ox)
        • abline (log2(3), 1)
          • abline (-log2(3), 1)
          • subset (d, mean_treat - mean_cont > log2(3))