レギュラー - データベースモードは、コーパスファイルのテキストを段落ごとに分けて SQLite データベースのエントリとして登録し、Concord での KWIC 検索の高速化を試みたモードです。Concord の KWIC 検索やその応用の Collocation での検索では、文脈の範囲を段落に設定してあればレギュラー - ファイルモードに比べて検索速度が向上しますが、文脈の範囲をファイルに設定したり、すべてのテキストデータを利用する単語などの頻度集計では、かえって処理速度が遅くなります。これは、一度ファイル後のとすべてのテキストを読み込んで処理を行うためです。
Version 4.0 からは、CasualTranscriber のタイムスタンプ付き RTF ファイルを読み込んで、マルチメディアデータベースを作成することもできます。
ファイルビューでは、4 つのエリアがあります。
右上 - 追加ファイルリスト:データベースに追加するファイルを一時的に登録するリストです。追加ボタンをクリックしてファイルやフォルダを選ぶか、ファイルもしくはコーパスファイルが含まれるフォルダを直接ドラッグ&ドロップしてファイルを追加します。
右下 - プレビューエリア:ファイルプレビューもしくはプレビューにチェックが入っていると、追加ファイルリストもしくはデータベースファイルリストで選んだファイルの中身を表示します。
左上 - データベースリスト:データベースのリストです。分析に使うデータベースは、このリストのチェックボックスにチェックを入れます。
左下 - コーパスファイルリスト:ファイルリストを表示にチェックを入れて左上のテーブルでデータベースを選ぶと、そのデータベースに含まれるファイルのリストが表示されます。データベースから削除したいファイルをリストから削除することができます。
データベースを作成するには、右上の追加ファイルリストテーブルに、追加ボタンを押してフォルダ・ファイルを選ぶか、フォルダ・ファイルをドラッグ&ドロップして登録し、左上のデータベースリストテーブルの右下にある新規ボタンを押すと、データベースに名前をつけて保存するように促されます。すでに同じ場所にあるデータベースと同じ名前にはできません。
データベース作成が開始されると、タグ設定を利用してテキストを抽出するかどうかを尋ねる確認パネルが表示されます。コンテクストタグの設定を利用しない場合は、一度中止して、タグ設定をオフにしてからデータベースを作成してください。
CasualTranscriber のタイムスタンプ付き RTF (CT RTF) ファイルを利用してマルチメディアコーパスデータベースを作成するには、データベースを保存するオプションで、データベースのタイプにマルチメディアを選びます。
これでデータベースを作成すると、CT RTF ファイルに紐付けされたメディアファイルのパスとタイムスタンプがテキストに結びつけてデータベースに記録されます。