くずし字認識アプリ

「みを」の活用例

細川忠利書状

くずし字,認識アプリ,「みを」,細川忠利,書状

細川忠利の書状を古文書くずし字認識アプリ「みを」を使って読んでみた.幸い翻刻したテキストがウエブ上に存在するので,どの程度よめるか検証した.

2の部分

一,熊本地震之事,少ツヽ切々淘候へとも,此程ハ遠の

         き候.あふなく候て,庭のなき本丸にハ被居不申候,

         本丸二ハ二条敷者有之庭ハ無之,四方高石垣,

         其上矢倉,天主,中/\あふなき事二て候事

一,罷下得  御意,地震屋を仕候庭を取不申候へハ,

        本丸にハ被居不申候,此由(を)柳生殿へ物語可申候事

古文書くずし字認識アプリ「みを」による解析

一. 恋本地夜之事, 少つゝ切ゝ陶候へ共, 此程は遠の

        き候, あふなく候て, 庖のなき本丸には節不之,  

       本丸ニは二条敷と有之. 庭は無之, 口ま高名塩, 

       其上矢倉. 天主, 中/\あふなき事にてし事

一, 罷下得 御意, 地君屋と仕ゝ庭も取不?候へは, 

       本丸ニはこのふし,  此四迄柳殿へ物語一事, 

AIは, 開発段階において, 「源氏物語」のような古文によって, 系統的な学習を行っている. 永青文庫で行っているわけではないが, それなりの認識をしているとみなすことができる. 

スマホは画面サイズが小さく見にくいので, タブレット(Fire HD8)を用いた. 原文の上に, 認識結果が緑色で表示される.画像はそのスクリーンショットの一部である.

原文には「候」の文字が9回書かれていいるが,それぞれ筆致が異なるため,「みを」は4回しか認識していない.「候事」を「し事」と2回解釈している.「あぶなく候て」を読めているので,類似の崩し字も読めてもよいような気がするが,そこまで学習できていないようだ.二段目には,「を」の文字が3回書かれているが解読されていない.∑」みたいな文字で書かれている部分である.

熊本城調査研究センター年報 2(平成27年度) には前段部分(1の部分)もテキスト化したものが記載されている.

卯月廿五日之書状具ニ見申候、柳生殿・我等儀ハ国

廻知行割緩々と可仕候、御年寄衆よりも時分可被

仰由、 折々忝 御意之由過分候由可申候 

一、   黒田殿未御礼無之由軈而可被仰出由、年寄衆被申

           通早々可相済事を何たる事ニて候哉、扨ハ所かへ

           高もへり候様ニ可申候へ共、此上ハ左様にも有間

           敷と存候、更共いか成うつけたる御請なと被仕候哉

一,熊本地震之事少つゝ 陶 候へ共此程ハ遠の

          き候、あふなく候て庭のなき本丸ニハ被居不申候、

          本丸ニハ二 条敷と有之庭ハ無之四方高石垣、

          其上矢倉・天主中/\あふなき事にて候事
一、罷下得 御意、地震屋を仕候、庭を取不申候へハ

          本丸ニハ被居不申候、此由を柳生殿へ物語可申候事

以上
五月十一日 (忠利)

狩野是斎

「みを」認識結果

延知行刻駿々と可仕ゝ御年奇衆も時分一に

仰と折々忝御意之過分候に可し

一し男末御礼無之に福而可々ほ出四年寄衆ニ申

返早々可相済事も似たる事からを扨は所かへ

高もへりら様ニ可申候共此上左様にも有方

敷とろゝ魚いか成うつけたる御請つしら仕ゝを

「みを」による認識結果の要修正個所

延(廻)知行刻(割)駿々と可仕ゝ(候),御年奇(寄)衆も時分一(可)に(被)

仰と(由),折々忝御意之(由)過分候に可し(由可申候)

一し男(黒田殿)末御礼無之に(由)福(軈)而可々ほ出四被仰出由), 年寄衆ニ(被)申

へ返(通)早々可相済事も(を)似たる事からを(二テ候哉), 扨は(ㇵ)所か(かへ)

高もへりら(候)様ニ可申候(へ)共, 此上左様にも有方(間)

敷とろゝ(存候), 魚(更共)いか成うつけたる御請つし(なと)ら(被)仕ゝを(候哉)

「みを」の説明には,「くずし字認識の対象としては、江戸時代の版本を得意としますが、手書きの古文書にも使えます。」と書かれている.,手書きでも今回のようなくずし字は不得意に違いない.ユーザーが修正したものを学習する方式ではないので,開発側のグレードアップを待つしかない.

(2023.10.1)