くずし字認識アプリ
「みを」の活用例
細川忠利書状
細川忠利の書状を古文書くずし字認識アプリ「みを」を使って読んでみた.幸い翻刻したテキストがウエブ上に存在するので,どの程度よめるか検証した.
2の部分
一,熊本地震之事,少ツヽ切々淘候へとも,此程ハ遠の
き候.あふなく候て,庭のなき本丸にハ被居不申候,
本丸二ハ二条敷者有之庭ハ無之,四方高石垣,
其上矢倉,天主,中/\あふなき事二て候事
一,罷下得 御意,地震屋を仕候庭を取不申候へハ,
本丸にハ被居不申候,此由(を)柳生殿へ物語可申候事
古文書くずし字認識アプリ「みを」による解析
一. 恋本地夜之事, 少つゝ切ゝ陶候へ共, 此程は遠の
き候, あふなく候て, 庖のなき本丸には節不之,
本丸ニは二条敷と有之. 庭は無之, 口ま高名塩,
其上矢倉. 天主, 中/\あふなき事にてし事
一, 罷下得 御意, 地君屋と仕ゝ庭も取不?候へは,
本丸ニはこのふし, 此四迄柳殿へ物語一し事,
AIは, 開発段階において, 「源氏物語」のような古文によって, 系統的な学習を行っている. 永青文庫で行っているわけではないが, それなりの認識をしているとみなすことができる.
スマホは画面サイズが小さく見にくいので, タブレット(Fire HD8)を用いた. 原文の上に, 認識結果が緑色で表示される.画像はそのスクリーンショットの一部である.
原文には「候」の文字が9回書かれていいるが,それぞれ筆致が異なるため,「みを」は4回しか認識していない.「候事」を「し事」と2回解釈している.「あぶなく候て」を読めているので,類似の崩し字も読めてもよいような気がするが,そこまで学習できていないようだ.二段目には,「を」の文字が3回書かれているが解読されていない.「∑」みたいな文字で書かれている部分である.
熊本城調査研究センター年報 2(平成27年度) には前段部分(1の部分)もテキスト化したものが記載されている.
卯月廿五日之書状具ニ見申候、柳生殿・我等儀ハ国
廻知行割緩々と可仕候、御年寄衆よりも時分可被
仰由、 折々忝 御意之由過分候由可申候
一、 黒田殿未御礼無之由軈而可被仰出由、年寄衆被申
通早々可相済事を何たる事ニて候哉、扨ハ所かへ
高もへり候様ニ可申候へ共、此上ハ左様にも有間
敷と存候、更共いか成うつけたる御請なと被仕候哉
一,熊本地震之事少つゝ 陶 候へ共此程ハ遠の
き候、あふなく候て庭のなき本丸ニハ被居不申候、
本丸ニハ二 条敷と有之庭ハ無之四方高石垣、
其上矢倉・天主中/\あふなき事にて候事
一、罷下得 御意、地震屋を仕候、庭を取不申候へハ
本丸ニハ被居不申候、此由を柳生殿へ物語可申候事
以上
五月十一日 (忠利)
狩野是斎
「みを」認識結果
延知行刻駿々と可仕ゝ御年奇衆も時分一に
仰と折々忝御意之過分候に可し
一し男末御礼無之に福而可々ほ出四年寄衆ニ申
返早々可相済事も似たる事からを扨は所かへ
高もへりら様ニ可申候共此上左様にも有方
敷とろゝ魚いか成うつけたる御請つしら仕ゝを
「みを」による認識結果の要修正個所
延(廻)知行刻(割)駿々と可仕ゝ(候),御年奇(寄)衆も時分一(可)に(被)
仰と(由),折々忝御意之(由)過分候に可し(由可申候)
一し男(黒田殿)末御礼無之に(由)福(軈)而可々ほ出四(被仰出由), 年寄衆ニ(被)申
へ返(通)早々可相済事も(を)似たる事からを(二テ候哉), 扨は(ㇵ)所か(かへ)
高もへりら(候)様ニ可申候(へ)共, 此上左様にも有方(間)
敷とろゝ(存候), 魚(更共)いか成うつけたる御請つし(なと)ら(被)仕ゝを(候哉)
「みを」の説明には,「くずし字認識の対象としては、江戸時代の版本を得意としますが、手書きの古文書にも使えます。」と書かれている.,手書きでも今回のようなくずし字は不得意に違いない.ユーザーが修正したものを学習する方式ではないので,開発側のグレードアップを待つしかない.
(2023.10.1)