エンリッチメント解析

gene ID 変換

Bioconductorのorg.Hs.eg.db参考

BiocManager::install("org.Hs.eg.db")

Entrez Gene IDを基本(リストname)として別のIDを検索しやすくしているが、逆の構築もできる。

KEGGはKEGGRESTライブラリを使う。

BiocManager::install("KEGGREST")

Microarray (Affymetrix Human Genome U133 Plus 2.0(GPL570))のプローブID。

BiocManager::install("hgu133plus2.db")

Gene ontologyのデータ

BioconductorのGO.db参考

BiocManager::install("GO.db")

データがやや古い。

本家のGAFデータformat guide)、go-basic.oboから作成できなくもない。

Pathway analysisでは、KEGG, Reactome, Wikipathway(https://github.com/wikipathways/rwikipathways)がよく使われる。

ヒトの転写因子とそのターゲット遺伝子の推定データ

ENCODE(based on CHIP-seq), ITFP(prediction), Marbach2016(CAGE in FAMTOM5), Neph2012(DNaseI footprinting and TF recognition sequences), TRED(prediction), TRRUST(manual curate)の6種類のデータベースのデータがRで利用できる。

https://github.com/slowkow/tftargets

devtools::install_github("slowkow/tftargets")

ただし、Marbach2016のデータはsynoviocyteだけのデータなので、ほかの細胞の関係を調べるためには、ここからダウンロードして、データ整形する。