ここでは、CasualConc のツール全体に適用できる、読み込んだファイルのテキストを分ち書き処理したり、テキストに POS (Part of Speech: 品詞) タグをつける処理をしたりする機能や、バッチで POS タグをつける機能などを説明します。
TreeTagger (POS タグ)
MeCab (形態素分析)
Stanford CoreNLP (POS タグ)
macOS の機能を使った分ち書き (トークン化)
macOS の標準機能を利用して、テキストファイルを読み込む際に分ち書きをしてから、検索・集計処理ができます。
外部アプリケーションを利用して、テキストファイルを読み込む際に POS タグを付与してから、検索・集計処理ができます。繰り返し検索・集計処理を行う場合は、下のバッチ処理でファイル自体に POS タグを付与する方がいいでしょう。
バッチ処理で、外部アプリケーションを利用したファイルのテキストへの POS タグ付けができます。
テキストファイルの分割など、分析前の下処理ができます。