CasualConc J

© 2008-2010 Yasu Imao

CasualConc

CasualConc は Mac OS 10.5 Leopard 以降用のコンコーダンサー(コーパス分析ソフト)です。研究目的ではない、普段使いを想定しています(研究に使用してもらってもかまいませんが、検索結果に責任を持てない、ということです)。 100万語ほどのコーパスならそれなりの速度で動きますが、1000万語になると、検索結果やツールによっては処理にそれなりの時間がかかります(うちのマシンは Mac mini C2D 1.86GHz です)。機能としては kwic、単語クラスター分析、共起分析、単語頻度表作成などがあります。


ちょっと思うところがあって、最近パラレルコンコーダンサーなんぞを作り始めてみました。まだまだ簡単な機能しかありませんが、もし興味があったら試してみてください。今のところは、英語のページにしか情報はなく、情報も古いのであまり使い物にならないかもしれません。基本的には、CasualConc と同じような見た目で使い方も同じようなものなので、特別なことをしない限りは問題なく使えると思います。ちなみに CasualPConc という名前です。こちらからダウンロードできます(英語のサイトです)。もし使っていただいた場合には、使い勝手など知らせていただけるとうれしいです(自分ではあまり使うものでもないので)。




現在のバージョン:1.0.2 - 最終更新日 11/16/2009

システム要件:Mac OS X 10.5 (Leopard) 以降専用で 、画面表示は 1280x800 以上に最適化されています。メモリは多ければ多いだけ、最低でも 1GB 位はあるとそれなりに動きます。一応、Universal Binary になっています。現在は Snow Leopard で開発していますが、Leopard でも動くはずです。

テキストファイルフォーマット
:プレインテキストファイル (.txt) で、ASCII もしくは UTF-8 でエンコードされているものが基本です。その他文字コードや、他のテキストを含むファイル形式にも対応させてありますが、プレインテキストファイル以外のファイル形式の場合、ファイルの処理に時間がかかります。PDF ファイルを使う場合は透明テキストが埋め込まれているか、テキストベースのものである必要があります。詳しくは、使い方を参照してください。

処理できる言語
:読み込める文字コードで保存されたテキストファイルであれば、たいてい動きます。ただ、右から書く言語などは、試してもいませんし、多分うまく動かないのではないかと思います。2バイト文字言語では、標準(単語間スペースなし)と分かち書き(半角スペースで単語を区切った)をしたもの対応しています。スペースなしの場合は、いくつかの機能が制限されます。各ツールの機能の仕方も変わります。日本語の分かち書きファイルはをつくるには、どこかで Chasen を使うか、MeCab-Ruby をインストールして CasualMecab を試してください。MeCab および、MeCab-Ruby のインストールの仕方は、その他のアプリケーションにあるリンクをたどってください。日本語を扱う場合は、Prefereces(環境設定)の Concord にある Corpus Text Type を Japanese にしてから使ってください。

このような方に:Mac 利用者で、ちょっとしたコーパスを使った単語検索や、初期研究でちょっとコーパスを探ったり、教材を準備するために、わざわざ Windows マシンを立ち上げたり、BootCamp で Windows にスイッチしたり、Virtual PC、Parallels、VMWare Fusion などを立ち上げたりするのが面倒な人。研究用のメインのツールとして使用に耐えるかどうかはわかりません。

試してみたい方は、ダウンロードページからダウンロードして使ってみてください。その際は、casualconc (at) gmail.com まで使用感などを送ってもらえるとうれしいです。( (at) を @ に置き換えてください)。

CasualConc はフリーウェアのつもりで開発しています。でも、気に入ったら、どこかで万が一お会いする機会があった時に、コーヒー、おいしいチョコレートなどいただけるとうれしいです(まあ、ないでしょうが)。

 

ついでに、このサイトには言語研究や言語教育などで使えるかもしれないいくつかのアプリケーションも置いてあります。機能の保証はありませんが。すべて Mac の Leopard 以降専用です。とりあえず、β版ということにしておきます。