Word Count は、単語・n-gram リストを作成するツールです。
単語・n-gram リストを作成します。
機能語など、リストに含めたくない単語でストップワードリストを作成して適用します。
単語ではなくレマの集計をしたり、異なる綴りを同じ単語として扱います。
単語・n-gram リスト作成後にリストを絞り込みます。
統計値を利用して、左右のリストを比較し、キーワード・キーフレーズを抽出します。
テーブルの単語・n-gram リストをプレインテキストファイルとして書き出します。
プレインテキストや CSV で用意した単語・n-gram リストをテーブルに読み込みます。
アドバンストモード
設定の WC にあるアドバンストでアドバンストモードにチェックを入れると利用できる機能です。
ワイルドカードや正規表現で検索をしてヒットした単語・フレーズのリストを作ります。
連続する 2 単語ではない 2 つの単語の組み合わせの頻度集計ができます。
n-gram の単語のうち一つをスロット (*) として集計したリストが作成できます。
POS タグの付いたテキストファイルから単語リストを作成します。
タグなしテキストに POS タグを付与する処理をしてから単語リストを作成します。