Network analyses using R

- ①ASV(OTU)多様性が高い ②真の相関ネットワークは疎である
- 対数変換したASV間の分散を用いて真のASV分散を概算
- サンプル毎のリード数を、サブサンプリングにより正規化（希薄化）
- SparCC（Friedman and Alm 2015）でCompositional data（組成データ）の相関係数を計算

ref. : SCNIC解説（日本語）

Compositional dataの解説（日本語）: (Ohta and Arai 2006)

Example

library(SpiecEasi); ligrary(igraph); library(doParallel)

% res.se <- spiec.easi(as.matrix(t(DAT)), # spiec.easi

method="mb", # using "mb"

icov.select.params=list(ncores=9))

% ig.mb <- adj2igraph(GetRefit(res.se)) # adjust "res" to igraph

% plot(ig.mb, # Plot by igraph

vertex.color=tmp$membership,

vertex.size=5,

verte.label=NA,

edge.width=0.4)

SpiecEasi package

：Sparese InverseE Covariance estimation for Ecological Association and Statistical Inference [共分散(corvariance)に基づく] *SparCCを含む

- Kurtz et al. 2015；Kurtz et al 2019
- 参考HP: tokumeinow
- Spiec-Easi（GitHub: SpiecEasi）:

以下を含むpileline

data transformationを含む（input=normalizeしない）
sparse inverse covariance estimation
model selection

λ決定の検討が必要

SpiecEasiでは、①最適λを決定し、②そのモデルをサンプルにfittingする（getRefit()）
parameters: lambda.min.ratio, nlambda ...R package huge()のヘルプ

R package huge()のヘルプ:lambda:

- - [method="mb", "glasso" or "tiger"] 降順で整数を当てはめる。とりあえず、"lambda=NULL"として、nlambdaとlambda.min.ratioに基づいて、lambda値を計算（推定）する。
  - "mb", "glasso" or "tiger"時は特に、降順数列を指定する（少数の候補数値はよくない）

lambda.min.ratio:

- - method="mb", "glasso" or "tiger"において、lambdaの最小値を与える値

nlambdaで指定した個数の、『 log MAX ~ log lambda.min.ratio*MAX』の区間の数値をlambdaとして使用する。（0〜lambda.min.ratioを試行する）"mb", "glasso" or "tiger" ... 0.1（default)"ct" = 0.05 (default) nlambda:

"regularization/thresholding parameters"の数

"mb", "glasso" or "tiger" ... 10（default)"ct" = 30 (default)
Optimum lambda①: （GitHub-#190）

- lambda.min.ratioが"too low"の場合、全ネットワークは連結している
- [res.spieceasi]$select$stars$summaryがthresh値（閾値=defaultで0.05）を境界とする値を探す。直線的に増加する

spiec.easiのパラメータ例）

- - lambda.min.ratio=0.01
  - nlambda=100
  - pulsar.params=list(thresh=0.05, rep.num=20,seed=888,ncores=9)

Optimum lambda②: （GitHub-#85）

- SpiecEasiは、高次元（多OTUs）& 少数サンプルは向かないので、OTU数を減らしてmodelのパラメータを減らす必要がある。
- rep.run...少なすぎると正確なパラメータ決定ができない
λ：小=複雑 ↔︎ 大=単純

method:

pulsar package@R ref. Kurtz's web

Terms:

隣接行列：有限グラフを表す正方行列（0以外の要素で表す）
precision matrix=inverse covariance matrix：精度行列
mb (meinshausen-buhlmann's neighborhoood selection)：neighborhood selection (Meinshausen and Bühlmann 2010)
sparse inverse covariance estimation (Banerjee et al 2008; Yuan and Lin 2007)
glasso (Graphical Lasso [GLASSO], Friedman et al 2008) lasso=輪投げ
Quadratic approximation for sparse Inverse estimation (QUIC: Hsieh et al 2014)

グラフのモデル選択方法：regularization parameter="ℷ (lambda)": model complexityをcalibrationするので重要

Information criteria (IC) ... AIC, Bayesian IC (BIC)（Yuan and Lin 2007; Foygel and Drton 2010）

☞ 低次元（少数OTUs）に向くが、高次元には向かない(Liu et al. 2010)

Stability Approach to Regularization Selection (StARS) (Liu et al. 2010: 高次元で良い再現性)

☞ Networkの希薄化. 実証的. random subsamplingによる. stabilityに関するβを固定するので、正規化よりはstabilityに依存する調整となる☞ StARSの短所: ①計算コスト： N個のsubsample setでneighborhooodやinverse covariance selectionを実行（Nは指定可能）②βの最適化：edge stabilityは未知のgraph形態の影響を強く受けるので、不変的なβの値はない⬅︎ 改善：Müller et al 2016① N=2（Bounded StARS: 正規化の上限と下限の2点）に指定（一定以上に複雑なグラフの計算を省く）② "edge stability"をsubgraph (graphlet) stabilityへ一般化し、新たな変数としたgraphlet correlation distance (gcd: Yaveroglu et al 2014). edge安定性とgraphletの安定性により優れた計算となる

他の方法もあるが、regularization parameterを決定する必要がある(Liu et al. 2010)。
- Sparse PArtal Correlation Estimation (space)(Peng et al 2009: 高次元-少数サンプル向け)
- neighborhood selection with the Lasso（Meinshausen and Bühlmann 2006）
- Gausian copula (or "nonparanormal") for high deimensional (Liu et al 2009)

model selection R package: pulsar（Parallelized Utilities for Lambda Selection Along a Regularization path）

高速化オプション：parallelizations, gcd, natural connectivity
モデル学習オプション：Glasso, neighborhood selection, QUIC, clime... etc...

3. rMAGMA package

: Microbial Association Graphical Model Analysis for Rref. GitHub; Cougoul et al 2019 MAGMA 微生物HTSデータのような、noisyな構造のcountデータを扱う：

an excess of 0 count
overdispersion of sequencing data
compositionality
possible covariate inclusion

eg.

Prost et al 2021 ... 0-inflated dataがNGSデータ多く、Gaussian Graphical Models (GGMs)にそぐわないので新しいモデルを作った
Yousefl et al 2023 ... 使用例

Installation @R% library(devtools) @R% install_gitlab("arcgl/rmagma") @R% library(rMAGMA) Usage: res.magma <- magma(t(DAT)) plot(res.magma, V.color.factor=TAX, edge.width=0.01)

4. BDgraph: Bayesian structural learning with parametric marginals for count data

ref. Vinicotti et al 2022, GitHub [cran/DBgraph]

5. NMDA: 時系列などのdynamics検出

ref. Yousefi et al 2023

ネットワークの解析

ネットワークのコミュニティ（村田 2009）

モジュール ... ネットワークの中で特に密につながった点の集まり。同一モジュールの生物は頻繁に同居していると推測される（Toju 2017）
- 微生物間の相互作用
- 生態学的地位（ニッチ）の類似性

*直接的な相互作用のみを検出する場合は、潜在変数モデル（環境要因から環境選好性を推定）を検討する（Warton et al. 2015)

*Hubに注目（Toju et al. 2017, プレスリリース有り）

*生態学的地位の共有の効果を除外したネットワーク分析として時系列サンプリングがある

- - sparse S-map法（Suzuki et al. 2017）
  - convergent cross mapping法（Sugihara et al 2012）
- キーストーン種の絞り込み ... メタ群集中のnetwork centrality（中心性）によりOTUを評価する

モジュラリティ(Q)

："分割されたコミュニティ内の辺の数とコミュニティ外の辺の数の比較から、高密度のグループを抽出できているかを示す指標"（「ネットワーク分析」）

- Qが大きい=コミュニティ内のリンクが期待されるより大きい（Mori 2018-講義資料）

☞ d <- modularity(DAT)

コミュニティ

：内部同士の結合が多く、外との結合が比較的少ないネットワークの部分集合（クラスター）

- globalな定義：媒介中心性の高いリンクから順に切断し、生じる独立部分をコミュニティとする（Newman-Girvan法）

cf. localな定義=頂点の類似度に基づく定義(村田2009)

- OverlappigとNon-overlappingがある
  - Overlapping=2つのコミュニティに共通のnode

使い方：

- - - 遺伝子networkでは機能的に類似したものが同一のグループとなる
    - 複雑なnetworkを俯瞰することができる

コミュニティ抽出法 ref. Takemoto's Web: bob3's blog (igraph)

*速さ基準: fastgreedy.community < Girvan-Newman < 固有ベクトル < spinglass.communiy *精度基準: spinglass.communiy > 固有ベクトル > fastgreedy. community > Girvan-Newman

【OUTPUT】

$member から所属するcommunityを特定する
グラフをcommunity毎に色分けしてnetworkを示す

Non-Overlapping法：nodeが単一のcommunityのみに所属

モジュラリティ最大化法（Greedy algorithms）

各nodeをコミュニティとし、任意のnodeペアをコミュニティとしてモジュラリティの増減を調べる
増減が最大となるnodeペアをコミュニティとして全てのnodeが1つのコミュニティになるまで繰り返す
全ステップの中でQが最大であるステップでコミュニティを分割する

周辺媒介性（Edgebetweenness）（Girvan & Newman 2002）

: 媒介性が高いedgeを削除して分割

☞ d <- cluster_edge_betweenness(DAT)(ref. Workshop Web)

☞ d <- edge.betweenness.community(DAT)

ランダムウォーク（Walktrap）（Pons & Latapy 2006）

☞ d <- walktrap.community(DAT, modularity=T)

ランダムウォークに基づくクラスタリング・同じコミュニティに属するノードが集まりやすい性質を利用

- - Good points: 小中規模向け・結果が安定
  - Weak points: Louvainより遅い・ランダムウォークの長さパラメータに依存する
貪欲アルゴリズム（Clauset et al 2004）

:Q値が高くなるようにnodeをまとめる

☞ d <- cluster_fast_greedy(DAT)(ref. Workshop Web)

☞ d <- fastgreedy.community(DAT)

固有ベクトル（Newman 2006）

:グラフラプラシアンによりQ値が最大となるような分割を探す☞ d <- leading.eigenvector.community(DAT, options=list(maxiter=1000000,ncv=5)))

多段階最適アルゴリズム法（Louvain）（Blondel et al. 2008）

☞ cluster_louvain(DAT) (ref. Workshop Web)

☞ multilevel.community(DAT)

モジュラリティに基づく

- - Good points: 高速・モジュラリティが高くなる傾向
  - Weak points: ランダム性（初期状態依存）・階層構造の復元が弱い・モジュラリティが高くなる傾向
スピングラス（Spinglass）（Reichardt & Bornholdt 2006）

:焼きなまし法☞ spinglass.community(DAT) *unconnected graphは不可

spinglassモデル（物理学）に基づく・統計力学のエネルギーモデルでコミュニティ決定・計算コスト的に小規模向け

Good points: 複雑な構造向け・パラメータ微調整可能
Weak points: 計算コスト大・連結グラフのみ

Overlapping法：nodeが複数のcommunityに属することを許す

ref. MSato's web [Link to Takemoto's]

- - - library(linkcomm) # igraphではなく、linkcomm packageを使う

①☞ getLinkCommunities(DAT*)

*DAT=as_edgelist(matrix or data frame or NETWORK)ref. TJO's Web

as_edgelistは、「"weight"なしのedge list」
get.edgelist as_edgelist or get.data.frame (in igraph pkg)を使う # get.edgelistは、igraph 2.0.0で終了

ref. StackOverflow

- cbind(as_edgelist(NETWORK), round(E(NETWORK)$weight, 3))
- get.data.frame(NETWORK)

gl.lc <- getLinkCommunities(as_edgelist(DAT))plot(gl.lc, type="graph") # ネットワークplot(gl.lc, type="members") # 複数コミュニティに属するノード

②☞ getOCG.clusters(DAT)

*DAT=as_edgelist(matrix or data frame)ref. MSato's web....

モジュラリティ(Q)

- Qが大きい=コミュニティ内のリンクが期待されるより大きい（Mori 2018-講義資料）
- モジュラリティ(Q)抽出法 ref. Takemoto's Web; TJO's Web; yokkun's
  - 最適分割時のQ 値とコミュニティの数（Takemoto's Web）

☞ Q = max(d$modularity)☞ #Q <- max(d$membership)

- - 分割時毎のQ値のplot（TJO's Web） ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ Q値の決定

RES <- NULL #Q値の保存num_try <- 100 #試行回数 for (i in 1:num_try){memb <- cut_at(d,i) #d=コミュニティ検出結果 RES[i] <- modularity(DAT,memb)}plot(RES, type="b"); which(RES==max(RES))

- - 分割時毎のQ値のplot（yokkun's）

#-Q値が最大となる分割/community検出（ランダムウォーク法） res.com <– walktrap.community(DAT,modularity=T)memb <- community.to.membership(DAT, res.com$merges, steps=which.max(res.com$modularity)-1)#- コミュニティ毎に色を設定V(DAT)$color <- rainbow(length(memb$csize))[memb$membership+1]#- ネットワーク描画plot(DAT,layout=layout.fruchterman.reingold, edge.arrow.size=0.5)

中心性

: どのnodeが重要かを測る尺度（複数の考え方がある）

Ref.: reruru's web・Workshop Web・Takemoto's Web・SAS Japan・Qiita

- - 次数中心性（0~Vertice#）：高い次数（辺の数）を持つnodeが重要

:そのnodeの次数（他と繋がるnode）

☞ degree(DAT)/(vcount(DAT)-1)

0~1の値にnormalize次数分布 ☞ plot(degree.distribution(DAT))

- - 媒介中心性（0~）：全nodeから他の全nodeへの最短距離を考える時、最も多く通過するnodeが重要（ref. Qiita）

:そのnodeを通る測地線の数に基づく（他を仲介するnode）: 自身(n1)が、n1と異なるnodes（nxとny）の最短距離となる割合（ref. SAS Japan）➡︎ 「他のASVと共に増減するASV」

☞ betweenness(DAT)

- - 近接中心性：他の全てのnodeへの平均距離が最短なnodeが重要（最短距離の和の逆数）

:各nodeの平均測地適距離の逆数☞ closeness(DAT) *unconnected graphは不可

- - 固有ベクトル中心性（0~1）：重要な（次数が高い）nodeに繋がっているnodeが重要（ref. Qiita）

：次数中心性の拡張版

☞ evcent(DAT)$vector

☞ center_eigen(DAT, directed=T, normalized=T)$vector [SYN]

ハブ・Authority
モチーフ

ネットワークの解析

ネットワークのコミュニティ（村田 2009）

モジュール ... ネットワークの中で特に密につながった点の集まり。同一モジュールの生物は頻繁に同居していると推測される（Toju 2017）
- 微生物間の相互作用
- 生態学的地位（ニッチ）の類似性

*直接的な相互作用のみを検出する場合は、潜在変数モデル（環境要因から環境選好性を推定）を検討する（Warton et al. 2015)

*Hubに注目（Toju et al. 2017, プレスリリース有り）

*生態学的地位の共有の効果を除外したネットワーク分析として時系列サンプリングがある

- - sparse S-map法（Suzuki et al. 2017）
  - convergent cross mapping法（Sugihara et al 2012）
- キーストーン種の絞り込み ... メタ群集中のnetwork centrality（中心性）によりOTUを評価する

モジュラリティ(Q)

- Qが大きい=コミュニティ内のリンクが期待されるより大きい（Mori 2018-講義資料）

☞ d <- modularity(DAT)

コミュニティ

：内部同士の結合が多く、外との結合が比較的少ないネットワークの部分集合（クラスター）

- globalな定義：媒介中心性の高いリンクから順に切断し、生じる独立部分をコミュニティとする（Newman-Girvan法）

cf. localな定義=頂点の類似度に基づく定義(村田2009)

- OverlappigとNon-overlappingがある
  - Overlapping=2つのコミュニティに共通のnode

使い方：

- - - 遺伝子networkでは機能的に類似したものが同一のグループとなる
    - 複雑なnetworkを俯瞰することができる

コミュニティ抽出法 ref. Takemoto's Web: bob3's blog (igraph)

*速さ基準: fastgreedy.community < Girvan-Newman < 固有ベクトル < spinglass.communiy *精度基準: spinglass.communiy > 固有ベクトル > fastgreedy. community > Girvan-Newman

【OUTPUT】

$member から所属するcommunityを特定する
グラフをcommunity毎に色分けしてnetworkを示す

Non-Overlapping法：nodeが単一のcommunityのみに所属

モジュラリティ最大化法（Greedy algorithms）

各nodeをコミュニティとし、任意のnodeペアをコミュニティとしてモジュラリティの増減を調べる
増減が最大となるnodeペアをコミュニティとして全てのnodeが1つのコミュニティになるまで繰り返す
全ステップの中でQが最大であるステップでコミュニティを分割する

周辺媒介性（Edgebetweenness）（Girvan & Newman 2002）

: 媒介性が高いedgeを削除して分割

☞ d <- cluster_edge_betweenness(DAT)(ref. Workshop Web)

☞ d <- edge.betweenness.community(DAT)

ランダムウォーク（Walktrap）（Pons & Latapy 2006）

☞ d <- walktrap.community(DAT, modularity=T)

ランダムウォークに基づくクラスタリング・同じコミュニティに属するノードが集まりやすい性質を利用

Good points: 小中規模向け・結果が安定
Weak points: Louvainより遅い・ランダムウォークの長さパラメータに依存する
貪欲アルゴリズム（Clauset et al 2004）

:Q値が高くなるようにnodeをまとめる

☞ d <- cluster_fast_greedy(DAT)(ref. Workshop Web)

☞ d <- fastgreedy.community(DAT)

固有ベクトル（Newman 2006）

:グラフラプラシアンによりQ値が最大となるような分割を探す☞ d <- leading.eigenvector.community(DAT, options=list(maxiter=1000000,ncv=5)))

多段階最適アルゴリズム法（Louvain）（Blondel et al. 2008）

☞ cluster_louvain(DAT) (ref. Workshop Web)

☞ multilevel.community(DAT)

スピングラス（Spinglass）（Reichardt & Bornholdt 2006）

:焼きなまし法☞ spinglass.community(DAT) *unconnected graphは不可

=====

Louvain ... モジュラリティに基づく

Good points: 高速・モジュラリティが高くなる傾向
Weak points: ランダム性（初期状態依存）・階層構造の復元が弱い・モジュラリティが高くなる傾向

Spinglass ... spinglassモデル（物理学）に基づく・統計力学のエネルギーモデルでコミュニティ決定・計算コスト的に小規模向け

Good points: 複雑な構造向け・パラメータ微調整可能
Weak points: 計算コスト大・連結グラフのみ

Walktrap ... ランダムウォークに基づくクラスタリング・同じコミュニティに属するノードが集まりやすい性質を利用

Good points: 小中規模向け・結果が安定
Weak points: Louvainより遅い・ランダムウォークの長さパラメータに依存する

=====

Overlapping法：nodeが複数のcommunityに属することを許す

ref. MSato's web [Link to Takemoto's]

- - - library(linkcomm) # igraphではなく、linkcomm packageを使う

①☞ getLinkCommunities(DAT*)

*DAT=as_edgelist(matrix or data frame or NETWORK)ref. TJO's Web

as_edgelistは、「"weight"なしのedge list」
get.edgelist as_edgelist or get.data.frame (in igraph pkg)を使う # get.edgelistは、igraph 2.0.0で終了

ref. StackOverflow

- cbind(as_edgelist(NETWORK), round(E(NETWORK)$weight, 3))
- get.data.frame(NETWORK)

gl.lc <- getLinkCommunities(as_edgelist(DAT))plot(gl.lc, type="graph") # ネットワークplot(gl.lc, type="members") # 複数コミュニティに属するノード

②☞ getOCG.clusters(DAT)

*DAT=as_edgelist(matrix or data frame)ref. MSato's web....

モジュラリティ(Q)

- Qが大きい=コミュニティ内のリンクが期待されるより大きい（Mori 2018-講義資料）
- モジュラリティ(Q)抽出法 ref. Takemoto's Web; TJO's Web; yokkun's
  - 最適分割時のQ 値とコミュニティの数（Takemoto's Web）

☞ Q = max(d$modularity)☞ #Q <- max(d$membership)

- - 分割時毎のQ値のplot（TJO's Web） ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ Q値の決定

- - 分割時毎のQ値のplot（yokkun's）

中心性

: どのnodeが重要かを測る尺度（複数の考え方がある）

Ref.: reruru's web・Workshop Web・Takemoto's Web・SAS Japan・Qiita

- - 次数中心性（0~Vertice#）：高い次数（辺の数）を持つnodeが重要

:そのnodeの次数（他と繋がるnode）

☞ degree(DAT)/(vcount(DAT)-1)

0~1の値にnormalize次数分布 ☞ plot(degree.distribution(DAT))

- - 媒介中心性（0~）：全nodeから他の全nodeへの最短距離を考える時、最も多く通過するnodeが重要（ref. Qiita）

☞ betweenness(DAT)

- - 近接中心性：他の全てのnodeへの平均距離が最短なnodeが重要（最短距離の和の逆数）

:各nodeの平均測地適距離の逆数☞ closeness(DAT) *unconnected graphは不可

- - 固有ベクトル中心性（0~1）：重要な（次数が高い）nodeに繋がっているnodeが重要（ref. Qiita）

：次数中心性の拡張版

☞ evcent(DAT)$vector

☞ center_eigen(DAT, directed=T, normalized=T)$vector [SYN]

ハブ・Authority
モチーフ

Visualization

Open & reproducible microbiome data nanalysis spring school 2018 by S. A. Shetty, L. Lahti, GDA. Herms
RPubs: Network Visualization by igraph by RStudio
◎ Chord Diagram作り方 using Circlize pkg
◎ Chord Diagram作り方 using chorddiag pkg, usage1
R Gallery Book Chapter 8 ... gggraph, plot, igraph etc ... ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ ⬅︎ "Chord Diagram"
- Dynamics: Priest et al 2024（詳細＝Oldenburg et al 2024）

Time-series analysis

- 1. "time-series signal"を検出（singal in segmenTier/segmenTools pkg, Machné et al 2017）
    - data=relative ASV abundance
    - frequency・amplitude・phase of abundances in each annual cycleを"oscillation signals"と呼び、抽出する
  2. 各ASVについてOscillation signalsを抽出（fprocessTimeseries in segmenTier pkg）
    - 一年の間に単一のpeak(頂点)とtrough(谷)を持つASVを、"annually oscillating"として抽出する
  3. 各ASVのperiodic patternの可視化：Phase-Rectified Signal Averaging（PRSA）により"phase variability"を除いて、可視化

Co-occurrence network using "Time-series data"

多重検定（松田 2008）... 多群の違いがどの群とどの群に違いがあるのかを突き止める方法

FDR (Fails Discovery Rate) ... Benjamini and Hochberg 1995（HB法）：ref. Biopapyrus

- 1. - 多数の変数に対して同時に仮説検定を行う場合に使う。p値の過誤を補正する
    - Rではp.adjust関数を使う：

@R% q.values <- p.adjust(p.values, method="BH")@R% is.significant <– (q.values < 0.1)

Correlation network in R:

refs.

Corrr：corrr pkg-manual; corrr_jp解説
相関行列：統計×データサイエンス
使用例： DATA NOVIA (corrr); TheRGraphGallery (igraph)

- 1. 各ASVのoscillation signalを総当たりで比較（Pairwise Pearson's correlations：Multiple testing corrections [FDR method]）し、有意な相関を示すものを抽出して"co-occurrence network"を作成する。
    - coefficient >0.7 & p<0.05となったデータをco-occurrence networkに使用 [edge=correlation coefficients]（Priest et al 2024）
    - 正の相関があるものを使用（負の相関によるノイズを減らす）
  2. Co-occurrence correlation networkの描画：
    - in igraph + Cytoscape
    - Edge-weighted Spring-Embedded Layout=edgeを重み付け+Spring layout（=nodeにかかるバネの力が最小になるようにedgeを決める方法）
    - community (network cluster)の検出=Louvain algorithm (Blondel et al 2008)
Circular graph ... ggplot

Spiec-Easi including SparCC

ref. GitHub; Kurtz et al. 2015

Phyloseqオブジェクトも使用できる

Installation

事前インストールが必要:

@MacOS %xcode-select --install@R

pulsar: モデル選択（SparCCに追加。高速モデルあり）
huge, devtools etc...

@R% library(devtools)@R% install_github("zdk123/SpiecEasi", ref='dev') # ref.GitHub#36@R% library(SpiecEasi)

Usage

@R:SpiecEasi

data=amgut1.filt（127 OTUs × 289 samples）
Using "Phylotag" package @R:SpiecEasi

Errors in SpiecEasi

@R:SpiecEasi

data=amgut1.filt（127 OTUs × 289 samples）
Using "Phylotag" package @R:SpiecEasi

MBPro intelでは途中で止まる。。。おそらくメモリ不足

➡︎ MBPro M1はいける

--- ERROR!!---> ig2.mb <- adj2igraph(getRefit(se.mb.amgut2),vertex.attr=list(name=taxa_names(amgut2.filt.phy)))
*** caught segfault ***address 0x1, cause 'memory not mapped'
Traceback: 1: t(object) 2: t(object) 3: .class1(object) 4: as(t(object), "sparseVector") 5: .local(object, ...) 6: Matrix::isSymmetric(adjmatrix) 7: Matrix::isSymmetric(adjmatrix) 8: graph.adjacency.sparse(adjmatrix, mode = mode, weighted = weighted, diag = diag) 9: igraph::graph.adjacency(Adj, mode = "undirected", weighted = TRUE, diag = diag)10: adj2igraph(getRefit(se.mb.amgut2), vertex.attr = list(name = taxa_names(amgut2.filt.phy)))
Possible actions:1: abort (with core dump, if enabled)2: normal R exit3: exit R without saving workspace4: exit R saving workspaceSelection:

Phyloseq

ref. GitHub-Joey711 (Tutrial)

ref. Ushio's blog (基本的使用方法)

ref. 疫学とR（phyloseqのデータ作成）

ref. GitHub

ref. Phyloseq tutorial (Vaulot's GitHub)

ref. Rで学ぶデータサイエンス8（ネットワーク解析）

グラフのsave

ref. ぬいぐるみライフ？

library(ggplot2)ggsave(file="xxxxx.png", plot=plot.obj, dpi=100, width=6.4, height=4.8)*画像形式は拡張子で自動判別

どのように使う？

PCA-PMI (藤井研究室:非線形相関解析 ) ... Zhao et al 2016

導入

ref. ：:日本地図を使った解説

igraph on R

Workshop（日本語）：Network analysis with R and igraph: NetSci X Tutorial （日本語版）

Workshop（英語）： Network analysis with R and igraph: NetSci X Tutorial

manualに沿った解説：igraphでネットワーク解析（Konishi's）

Workshopの追加説明（詳細な解説）: Takemoto's Labo

「Rで学ぶデータサイエンス–ネットワーク分析–」に沿った実践例: TJO's ブログ

コミュニティ抽出：Murata 2009

-----------------

.gmlファイルの読み込み

read_graph("./data/network/network__newid.gml", format="gml")

------

plot parameters (ref. Nemoto's web)

ノード

vertex.color ノードの色
vertex.frame.color ノードの縁の色
vertex.shape “none”, “circle”, “square”, “csquare”, “rectangle”, “crectangle”, “vrectangle”, “pie”, “raster”, “sphere”の中から1つ
vertex.size ノードの大きさ (デフォルトは15)
vertex.size2 ノードの2つ目の大きさ (ノードが長方形の時のもう一方の辺の長さなど)
vertex.label ノードにラベルをつけるために用いられる文字列ベクトル

☞ vertex.label=NA（ラベルなし）

vertex.label.family ラベルのフォント名 (“Times”, “Helvetica” など)
vertex.label.font フォント: 1 プレーン, 2 ボールド, 3, イタリック, 4 ボールドイタリック, 5 シンボル
vertex.label.cex フォントのサイズ (倍率)
vertex.label.dist ラベルと頂点の距離
vertex.label.degree 頂点に対するラベルの位置：0だと右側、“pi”だと左側、“pi/2”だと下、“-pi/2”だと上

エッジ

edge.color エッジの色
edge.width エッジの太さ (デフォルトは1)
edge.arrow.size 矢印のサイズ (デフォルトは1)
edge.arrow.width 矢印の太さ (デフォルトは1)
edge.lty 線の種類：0 か “blank”, 1か“solid”, 2か“dashed”, 3か“dotted”, 4か“dotdash”, 5か“longdash”, 6か“twodash”
edge.label エッジにラベルをつけるために用いられる文字列ベクトル
edge.label.family ラベルのフォント名 (ノードに同じ)
edge.label.font ノードに同じ
edge.label.cex エッジのラベルののフォントサイズ
edge.curved エッジの曲がり具合を0-1で表わす(FALSEだと0, TRUEだと0.5に設定される)
arrow.mode エッジに矢印があるかどうかを特定するベクトル(0だと矢印なし、1だと後ろ向き、2だと前向き、3だと両方向)

その他

margin プロット周囲にある空スペースのマージンで長さ4のベクトル
frame もしTRUEなら、プロットは枠付きになる
main 設定するとプロットにタイトルが付く
sub 設定するとプロットにサブタイトルが付く

微生物群集統計解析

Qiime2を用いた16S rRNAアンプリコン解析

ANCOM (analysis of composition of microbiomes) (Mandal et al 2015)

Page updated

Report abuse