エンリッチメント解析
gene ID 変換
Bioconductorのorg.Hs.eg.db。参考
BiocManager::install("org.Hs.eg.db")
Entrez Gene IDを基本(リストname)として別のIDを検索しやすくしているが、逆の構築もできる。
KEGGはKEGGRESTライブラリを使う。
BiocManager::install("KEGGREST")
Microarray (Affymetrix Human Genome U133 Plus 2.0(GPL570))のプローブID。
BiocManager::install("hgu133plus2.db")
Gene ontologyのデータ
BiocManager::install("GO.db")
データがやや古い。
本家のGAFデータ(format guide)、go-basic.oboから作成できなくもない。
Pathway analysisでは、KEGG, Reactome, Wikipathway(https://github.com/wikipathways/rwikipathways)がよく使われる。
ヒトの転写因子とそのターゲット遺伝子の推定データ
ENCODE(based on CHIP-seq), ITFP(prediction), Marbach2016(CAGE in FAMTOM5), Neph2012(DNaseI footprinting and TF recognition sequences), TRED(prediction), TRRUST(manual curate)の6種類のデータベースのデータがRで利用できる。
https://github.com/slowkow/tftargets
devtools::install_github("slowkow/tftargets")
ただし、Marbach2016のデータはsynoviocyteだけのデータなので、ほかの細胞の関係を調べるためには、ここからダウンロードして、データ整形する。