Topic Word リスト (左) と Topic Document リスト (右) を提示します。
Topic Word リストは、トピックごとに含まれる単語と、weight、そのトピックに含まれる頻度、そのトピック全体の頻度です。
Topic Document リストは、ファイルごとにどのトピックの単語がどれくらいの割合で含まれているかと、そのトピックに含まれる単語全体の頻度を示しています。
グラフ
これらのデータを使って、ネットワークグラフを描くことができます。
ネットワークグラフ
Topic Word リストでは、トピックと単語、Topic Document リストでは、トピックと文書ファイルとの結びつきをもとに、ネットワークグラフを描きます。
ここでは、Topic Word リストの Weight で値の高い順に並べ替えて、閾値を 100 にしてネットワーク図を書いてみます。オプションは下の通りです。
少しオプションを変更して描いてみます。
閾値 - 値を選択した場合、Topic-Word では、Weight、Topic-Document では割合の閾値以上の項目を利用します。項目を選ぶと、上位のその単語数を利用します。
レイアウト - R の igraph のレイアウトオプションが選べます。
方向性 - 方向性にチェックを入れると線が矢印になります。
ノード - トピックや単語を表す図形です。
サイズ - ノードの大きさを決めます。固定で大きさを指定します。固定しない場合は、次数 (どれだけのノードがつながっているか) もしくはトピックノード頻度に比例した大きさにできます。
形 - ノードの形です。なしにするとラベルだけになります。
色 - 選択はすべてのノードが選択した同じ色になります。コミュニティを選ぶと、igraph が分けたコミュニティーごとに、カラーパレットの色が割り当てられます。
トピックラベルサイズ - トピックのラベルは、固定するか次数もしくはノード頻度に比例した大きさにできます。その際は、最大値と最小値を指定できます。
その他のラベルサイズ - 単語や文書ファイルのノードのサイズを指定します。
エッジ - ノードをつなぐ線です。
幅 - 幅を固定するか使用する値の倍数にするか、媒介性 (どれだけ重要なつながりであるかを示す) を使うかを指定します。
色 - 選択で指定するか、Gray で灰色にするか、ノード色を使うかを選びます。α で半透明にもできます。
曲線 - エッジの線を曲線にします。湾曲度が指定できます。