CasualConc でのヘッダタグは、ファイルの情報を記録したヘッダ部分を読み込んで処理する・しないファイルを篩い分ける機能です。
メインウィンドウ左上のタグ設定ボタンをクリックして表示されるタグ設定パネルの右上にあるスイッチでヘッダを選びます。
この機能を使うには、パネル上のヘッダ情報でフィルタリングにチェックを入れるか、メインウィンドウ左上の H タグスイッチをオンにします。
ヘッダタグの設定は、コンテクストタグと同様に、正規表現 (Regex) と XML のオプションがあります。
Regex モードは、指定したタグのテキストを正規表現を利用して判別し、ファイルのフィルタリングに利用するモードです。
まずは、ヘッダタグ ラベルにヘッダタグ部分のタグラベルのみを入力します。ファイルの情報を、<info> ... </info> という info タグの部分に記述している場合、ヘッダタグ ラベルに info と入力します。AND と OR は、テーブル上のリストでチェックが入ったものすべてに当てはまるファイルを選ぶ場合は AND、どれかを含むファイルを選ぶ場合は OR を選ぶ。
ヘッダタグ ラベルを入力したら、テーブル右下にある追加ボタンで、テーブルにエントリを追加します。2 番目の列にあるのは、一番右の列の列の文字列をどのように利用するかを指定するためのものです、
含む:一番右の列に入力した文字列を、指定したタグのテキストが含む場合
=:一番右の列に入力した文字列と指定したタグのテキストが一致ファイルを読み込みたい場合
マッチ:一番右の列に入力した正規表現にマッチしたファイルのみを読み込みたい場合
上の例では、次のような構造のヘッダ部分で、jn (Journal Name) のテキストが applied linguistics を含むかどうかでフィルタをかけています。
<info>
<jn>Applied Linguistics</jn>
<title>TITLE OF THE ARTICLE</title>
</info>
XML モードは、XPath を利用して、ヘッダの情報でファイルをフィルタリングするモードです。
まずは、ヘッダタグ ラベルにヘッダ部分のタグのラベルを入力して分析をクリックします。ここでは、<info> ... </info> 部分にファイルの情報を XML 形式で記録したとして、info と入力して分析をクリックします。そうすると、XPath のところの選択肢にヘッダ部分のタグへの XPath が記録されます。ここでは <jn> ... </jn> のテキストに論文誌名が記録されているので、//info/jn を選びます。
ここでは属性ではなくテキストに情報が記録されているので、テキストの左にあるボタンから = を選びます。これは、テキストのテキストボックスに入力された値を <jn> ... </jn> に持つファイルだけを選別するという意味になります。ここで = を選んだ後に、XPath を選び直すと、テキストのところの選択肢に、<jn> ... </jn> のテキスト部分の情報が記録されます。ここでは、コーパスに 3 つの論文誌が含まれるので、選択肢には 3 誌の名前が表示されています。
これで、テーブル右下の追加ボタンをクリックしてリストに登録します。リストに登録されたフィルタは、一番左のチェックボックスにチェックを入れることで適用されます。