Word Count でのテーブル上の単語・n-gram リストの絞り込みを行います。
一番単純な方法は、左右のテーブル右上にある検索ボックスに絞り込むための文字列を入力します。
絞り込みのオプションは以下の通りです。
含む - 入力した文字列を含むエントリを抽出します。
で始まる - 入力した文字列で始まるエントリを抽出します。
で終わる - 入力した文字列で終わるエントリを抽出します。
含まない - 入力した文字列を含まないエントリを抽出します。
Like - 入力した文字列に一致するエントリを抽出します。* と ? がワイルドカード文字として使えますが、CasualConc のワイルドカード持ちとは異なり、* は 0 文字以上の連続する任意の文字列、? は任意の 1 文字。lik* とすると like, likes, likelihood などが残ります。lik? とすると like のみが残ります。
で終わらない - 入力した文字列で終わらないエントリを抽出します。
POS タグを認識させてリストを作成した際に、POS タグの列が存在すれば、以下のオプションも選択できます。
POS が含む - POS タグが入力した文字列を含むエントリのリストを抽出します。
POS が始まる - POS タグが入力した文字列で始まるエントリのリストを抽出します。
POS Like - POS タグが入力した文字列に一致するエントリを抽出します。* と ? も使えます。
検索ボックスの左側にあるチェックボックスにチェックを入れると、CasualConc のワイルドカード文字を使って絞り込みができます。* は任意の 0 文字以上、? は任意の 1 文字以上、! は任意の 1 文字に対応します。下の例のように context? と入力すると、context の後に文字列が連続するものがリストに残りますが、context 自体は後に文字列が続かないので残りません)。
検索文字列を入力したら、return キーを押して絞り込みを実行します。
CasualConc にはさらに高度な絞り込み機能があります。
メニューの表から Word Count フィルタを選びます。
Word Count フィルタパネルが表示されるので、追加ボタンをクリックしてフィルタを設定し、設定が終わったら適用ボタンをクリックします。
対象列 - どの列の情報で絞り込むかを指定します。
フィルタタイプ - 値をどのように扱うかを選びます。
値 - 対象列の情報でフィルタをかけたい値を入力します。値は、コンマ区切りで複数入力できます。
AND/OR - 複数の値をどのように扱うかを選びます。
C - 値の大文字小文字を区別して処理します。
D - 値のダイアクリティカルマークの有無を区別します。デフォルトでは a と á、u と ü は a や u で両方とも残りますが、チェックが入っているとこれらは区別されるので a でフィルタをかけると á は残りません。
対象列は、表示されているものだけがリストに現れます。統計値や POS などがテーブルに表示されていれば、このリストにも現れrます。フィルタタイプは、検索ボックスのものとほぼ同じですが、以上・以下、超える・未満は、頻度や割合などの数値の場合に使えます。等しいは、数値の場合は同じ数値、文字の場合は同じ文字列ということになります。
テーブル下の AND/OR は、複数のフィルタのすべてに適応 (AND) もしくはフィルタのいずれかに適応 (OR) で、どちらのテーブルの結果を絞り込むかを指定して、適用をクリックします。
stress を含んで頻度が 5 以上の設定で絞り込みをかけた結果が以下の通りになりました。