UserDictionary Maker
このアプリケーションは、OS X 標準の『辞書.app』で使える辞書パッケージを作るためのユーティリティです。Dictionary Development Kit というツールを利用するので、Apple Developer Connection から Auxiliary Tools for Xcode をダウンロードして、ディスクイメージに含まれる Dictionary Development Kit を入手しておいてください(要登録:無料)。
基本的には、タブ区切りのテキストを読み込むかコピー&ペーストしてから辞書パッケージの作成に入る、2 段階の作業になります。また、実験的に、英辞郎のテキストファイルから辞書データを作成する機能も付けてみました。
Download: UserDictionary Maker (on Google Drive)
最終更新日: 2013/08/31
システム必要条件:Mountain Lion (OS 10.8) が動いている Mac (Lion でも動くかもしれません)
GateKeeper には対応していませんので、初回起動時には、2 本指クリック(右クリック)して、Control キーを押さえながら、コンテクストメニューの「開く」を選んでください。場合によっては、管理者パスワードが必要になるかもしれません。
MeCab の機能を使うには MeCab がインストールされている必要があります。このページに詳しいインストール方法があります。
UserDictionary Maker の使い方
このアプリケーションを使う前に、Apple Developer Connection のこのページにアクセスして Auxiliary Tools for Xcode - Late July 2012 をダウンロードします。もし、Developer 登録をしていなければ、無料ですので登録してください。
ディスクイメージの中に Dictionary Development Kit が入っています。これを適当なところに移動するか、ディスクイメージを開いたまま UserDictionary Maker を起動してください。
初回の起動時に、Dictionary Development Kit の場所を聞かれるので、移動させた場所もしくはディスクイメージの Dictionary Development Kit フォルダを指定してください。
操作手順
まずは、基本的な単語リストなどからの作成手順です。
はじめに、データとなるテキストを用意します。タブ区切りのテキストが必要となるので、テキストエディタで作成するか Excel でデータを用意します。
基本は 2 列(コラム)で、日英対応の場合は、1 列目に日本語、2 列目に英語、3 列目はオプションで、出典などの情報を入れるために、定義の終わりに括弧付きで追加されます。
データを用意したら、テーブルにデータを読み込みます。一番簡単な方法は、Excel などで必要なデータを選択してコピーし、UserDictionary Maker でメニューから Edit -> Paste Data を選ぶか Command + Shift + V でテーブルに読み込みます。
また、File -> Open で、保存してあるデータを読み込むこともできます。ファイルを読み込む際は、拡張子が .txt もしくは .csv のファイルで、Tab-delimited か CSV を選んで読み込みます。Excel から書き出したファイルを読み込む場合は、Encoding で Mac OS J (Mac Excel) を選んでください。
データを読み込んだら、各種の設定をします。また、テーブル上のデータは修正することができます。
左上のポップアップメニューから、データの形式を選びます。
J-E/E-J: 日英もしくは 2 言語の対応リストなどの作成用です。両方の列(コラム)の文字列から見出し語を作成するので、日英のリストの場合、日->英、英->日の辞書ができます
Glossary: 用語とその意味を記述したリスト用です。
Jiro: 英辞郎などのデータを変換するための物です(後述します)。
Detailed Indexing: J-E/E-J と Glossary では、見出し語の index 作成の詳細を設定できます。Detailed Indexing にチェックが入っていない状態では、見出し語を一つの単語として index が作られて、出来上がった辞書は、前方一致検索になります。
Detailed Indexing にチェックを入れると、次の選択肢が現れますが、各単語が半角スペースで区切られていない場合(日本語など)は、ここの単語として扱われません。ただし、MeCab がインストールされていると、MeCab を利用して日本語でも前方一致以外のインデックスを作成できます。
見出し語が文章であったりする場合、index が大きくなるので、処理時間が長くなりファイルサイズが大きくなりますので注意してください。
Each Word: 各単語で index を作り、一部の機能語を除いて、見出し語に含まれるどの単語でも、検索にかかります。
Full: 見出し語中のどの単語からでもフレーズ検索にかかるようになります。
Full (detail): MeCab がインストールされていれば、見出し語の日本語の読み、各単語から始まるフレーズで検索できるようになります。また、英語のインデックスは、lemma と簡易的な英米綴り対応表から、原型および異なる綴りでも検索にかかるように試みています。lemma は関西大学の染谷先生が作られた e-lemma ファイルを利用しています。
Data: Full (detail) と機能的には同じですが、読み込み、または、テーブル上で入力もしくは処理したデータを使って、日本語のインデックスを作ります。
J-E/E-J もしくは Glossary で Japanese を選んだ場合に、Preferences で Additional Info にチェックが入った項目のデータを読み込む、または、Wakachi ボタンをクリックして、日本語の見出し語からデータを作成し、修正して使います。
Preferences で Definition for J-E/E-J にチェックを入れると、J-E/E-J 形式の時に、見出し語の定義(意味)も追加することができます。これにチェックを入れてあると、ファイルの読み込みやデータのペースト時に、4 列目が定義、5 列目が定義の出典情報として処理されます。
Use Data: Detailed Indexing の処理で、テーブル上にデータがある場合は、そちらを優先して使うことができるようになります。
Divider(左下): J-E/E-J で English の列に複数の単語がある場合、ここで指定した文字列で区切ると、その区切られた文字列で見出し語が作られます。
Dictionary ID: 辞書ファイルに固有の ID を付ける必要があるので、アルファベットで他に作成した辞書に付けた ID とは異なる文字列を入力してください。
Dictionary Name: 辞書ファイルおよび『辞書.app』で表示される名前になります。
すべての情報を入力、設定したら、Process ボタンをクリックします。Dictionary ID と Dictionary Name が入力されていないと、作成できません。処理が終わったら、『辞書.app』を(再)起動すると、作成した辞書が現れます。
テーブル上のデータを保存することもできます。その際は、メニューバーの File -> Save As Data を選んでください。Preferences で Skip Save As Data Panel にチェックが入っていると、上書き保存になります。そうでない場合は、毎回、別名で保存するか上書きするかを尋ねられます。
保存したデータは File -> Open Data で開くことができます。データファイルを開く場合はテーブルに追加することになるので、データを置き換えたい場合は、Clear Table ボタンをクリックしてデータを削除してからにしてください。
メニューバーの Window -> User Dictionary Manager を選ぶと、User Dictionary Manager パネルが開いて、ユーザー辞書の削除ができます。同じファイル名の辞書ファイルを作成すると、末尾に数字が追加され別のファイルとして保存されるので、辞書ファイルを作り直す場合は、ファイルを削除してからにしてください。削除されたファイルはゴミ箱に移動されるので、あとで戻すこともできます(その場合は手動になります)。
ウィンドウ上の検索窓に文字を入力すると、テーブル上のデータを検索できます。検索するコラムを指定したい場合は、左端の虫眼鏡アイコンをクリックして選んでください。
画面下の方の「i」マークをクリックすると、ウィンドウ下にテキストボックスが現れます。ここに、辞書.app の環境設定で辞書を選んだ際に表示される情報を加えることができます。デフォルトでは、Copyright Name だけが表示されるようになっていますが、上のテキストボックスに入力したテキストが、クレジットの上に表示されます。
操作手順(Jiro 形式)
この機能は実験的につけた物です。動作は保証しません。
書籍版もしくは電子データで辞郎シリーズの辞書データを入手されていれば、その .txt ファイルから『辞書.app』用の辞書ファイルを作成できます。
File -> Open で、Type から Jiro を選び、Dictionary でどの辞書を読み込むのかを選んで、辞郎シリーズのデータファイル(.txt)を開きます。No Yomi にチェックを入れると、定義中の漢字の読みを削除し、No Source Info にチェックを入れると、例辞郎などの出典情報を削除して、ファイルサイズを削減できます。
英辞郎、和英辞郎などは、ファイルサイズが大きいので、読み込みに時間がかかります。また、お使いの Mac のメモリ搭載量が 4GB 未満の場合は、メモリ不足により処理に失敗する可能性があります。ファイルサイズ増大につながるので、Detailed Indexing 機能は使えないようになっていますが、使えるようにすることも考えています。
データを読み込んだら、Process ボタンをクリックして処理を開始します。この処理はかなりの時間がかかります(24 時間近くかかる場合もあります)。