シンプル・レギュラーのファイルモードでは、ファイルの情報などを XML 形式でコーパスファイルに含めている場合、その情報を使ってファイルリストから特定のファイルを抽出できます。
例えば、コーパスファイルに次のような形でファイル情報とテキスト部分にタグがつけてあるものを想定しています。
<info>
<ttype>Journal Articles</ttype>
<jn>Applied Linguistics</jn>
<year>2004</year>
<vol>25</vol>
<issue>3</issue>
<title>The Discursive Construction of Collaborative Care</title>
<author>YRJO ENGESTROM</author>
<author>RITVA ENGESTROM</author>
<author>HANNELE KEROSUO</author>
<resmeth>Qualitative</resmeth>
<rm_detail>Discourse Analysis</rm_detail>
</info>
<text>
<abst>
THE ABSTRUCT
</abst>
<main>
THE MAIN TEXT OF THE FILE
</main>
</text>
まずは、ヘッダタグの設定で、抽出に使う情報を指定します。ここでは、jn (論文誌名) が Applied Linguistics であるファイル抽出したいとします。
抽出に使いたい情報をタグ設定で登録したら、ヘッダ情報でフィルタリングにチェックを入れます。これで準備が整いました。
ファイルビューで左下のコーパスファイルリストテーブル左上の、ファイルリストを表示にチェックを入れて、左上のコーパスリストテーブルで、ファイルを抽出したいコーパスを選びます。これで、左下のコーパスファイルリストテーブルに、選んだコーパスに含まれるファイルのリストが表示されます。
ファイルリストが表示された状態で、ファイルリストテーブル下のファイルを抽出をクリックします。
これで、右上の追加ファイルリストテーブルに、ヘッダタグの情報を利用して選別されたファイルが追加されます。
ここでは、applied linguistic という論文誌名 (jn) のファイルが抽出されました。つまり、Applied Linguistics 誌の論文ファイルだけが抽出されたことになります。
この抽出されたファイルでサブコーパスを作成します。