Differential gene expression analyses

featureCounts to edgeR

featureCounts (subread library)

  • http://bioinf.wehi.edu.au/featureCounts/
  • Example code
    • -T スレッド数
    • -s 1 ストランド特異的なマッピングを行う
    • -O アノテーション間のオーバーラップを許す
    • -M マルチマップリードを入れるとき
    • -a gtfファイルがデフォルトでSAFフォーマットの場合にはオプションで指定
featureCounts -T 5 -s 1 -O -a refSeq.gtf -o output input.bam
  • 下記のスクリプトでは対応するリードをsamtoolsで抽出する
  • 生リードを見たければこれのプリントモードで出力したコマンドを打つと出せます
  • https://github.com/carushi/NGS/blob/master/script/readcountsamtools.py

edgeR

  • Example code
source("https://bioconductor.org/biocLite.R") biocLite("edgeR") head(mat) > Symbol sample1 sample2 sample3 ... 1            1       1       2 ... 2           10      11       2 ...  group <- factor(1, 1, 2, ...) #レプリケイトは同じ数字 y <- calcNormFactors(y) design <- model.matrix(~group) y <- estimateDisp(y,design)