木簡・くずし字解読システム(MOJIZO)

新Googleサイトへの移行の際,自動変換されたファイルです.修正版はこちら

昨年の大地震のため,紹介するのを忘れていたので,公開1周年を機に後れ馳せながら紹介したい.

古文書を勉強している人にとって,待ちに待った解読システム(フリー)である.本システムは奈良文化財研究所東京大学史料編纂所によって開発された.

古文書の文字画像(一文字)をウェブブラウザ上で稼働する解読システムの所定の場所に貼り付けてやると,画像を認識して「似ている度合い」を調べ,類似した文字をデータベースから選択し,表示してくれるというものである.表示は二段階で,最初の表示(8表示)で見当たらない場合は「さらに見る」をクリックすると100文字の候補が表示される.

実例を紹介したい.

システムにアクセスすると,次のメニューが表示される.「画像選択1文分」をクリックしてパソコンの画像ファイルを指定する.あるいは画像をドラックしてもよい.

解析例

テストに使用した解読対象4文字の前に「江戸」の文字が存在する.

実例

一番目の文字

一番目の文字を1字切り出した画像を読み込ませ,「解析する」をクリックすると下図の結果が得られる.「申」と判読される.

二番目の文字

1字切り出した画像を読み込ませ,「解析する」と下図の結果が得られる.

解析結果から「来」であることがわかる.

三番目の文字

見慣れた「候」である.

四番値の文字

「段」と思われる.

同じ古文書の中で,上の例と少し書き方が異なるが,やはり「段」である.2段階解析で該当する候補が表示された.

解析結果

テストに使用した解読対象4文字の前に「江戸」の文字が存在する.

「(江戸より)申し来たり候の段」となるものと考えられる

実例

解析結果

1 申

2 来

3 候

4 段

本システムを使ってもどうしても解読できないものがあるが,そのような場合は前後の文章を考慮に入れるとよい.

今後,人工知能を取り込んだ連続文字の解読システムが開発されることが期待される.

資料

奈良文化財研究所

東京大史料編纂所

関連報道(朝日新聞)

・古文書資料からの文字の切り出し:Macの場合は,Previewのメニューから,[ファイル]→[スクリーンショットを撮る]→[選択部分]で簡単に実行できる. Windows10の場合は,[Windowsアクセサリ]→[Snipping tool]で部分選択すればよい.

(2017年)