CasualConc には、ファイルを読み込みながら外部アプリケーションで POS タグ付与し、テキストの検索・集計を行う機能があります。ただ、POS タグを付与する時間がかかるため、一時的に確認する用途では問題ありませんが、繰り返し検索・頻度集計を行うのであれば、あらかじめテキスト自体にタグ付けをして、タグ付けをしたテキストを分析する方がいいでしょう。
ファイルを読み込みながら POS タグ付けを行うには、設定のタガーにある品詞タグ処理でタグ処理にチェックを入れます。タグ付けは、TreeTagger と MeCab が利用できます。Stanford CoreNLP は処理速度が遅いため、オプションにはありません。将来的には追加する可能性はあります。
出力の形式は、下に示すように、タグがつくものはアンダーバー ( _ ) でタグを単語の後ろにつける形式で、TreeTagger では、単語+タグ (word_tag)、レマ (lemma)、レマ+タグ (lemma_tag)、タグのみ (tag) の 4 つの選択肢があります。これらに加えて、MeCab では、単語のみ (word) のオプションがあります。これは、単語ごとに分割するという意味で、分ち書きをする出力形式になります。
TreeTagger の Sym 削除、MeCab の記号削除は、句読点を含めた記号についている POS タグを削除するオプションです。つまり、記号はタグなしのそのままの記号としてテキストに残ります。