「みを」AIくずし字認識

スマホカメラ利用

大学や公立図書館の高解像画像文字を対象にしたAIくずし字OCRシステムについては前に紹介した.今回はスマホのカメラで撮影した「画像に含まれるくずし字」をAIが現代の文字に変換してくれるソフトの紹介である.まずは開発者のメッセージを見てほしい.

くずし字資料を読みたい!でも読めない!「みを」はそんな人を手助けするアプリです。カメラで資料を撮影し、ボタンを押せば、AIがくずし字を現代の文字に変換してくれます。くずし字資料の世界へようこそ。

ROIS-DS人文学オープンデータ共同利用センター(CODH)では、画像に含まれるくずし字を現代の文字に変換する(翻刻する)機能を備えたAIくずし字認識技術を開発しました。この技術が誰でも気軽に使えることを目指して開発したのが、AIくずし字認識スマホアプリ「みを(miwo)」です。 ーHP転載ー

アプリはGoogle Playストアで無料で「みを」AIくずし字認識アプリが入手可能である.

「みを」でできることが,次のよう書かれている.それに沿って試してみた.

【miwoアプリでできること】

★カメラで撮影した画像や、ネットからダウンロードした画像を対象に、くずし字を認識して現代の文字に変換する(翻刻する)ことができます。

★認識した文字を画像上に表示できます。また文字の位置を表す四角形を表示することもできます。

★認識結果が正しくない場合、文字を修正することができます。

★認識結果をテキストとして出力し、コピーして他のアプリで使うことができます。

★認識結果をアプリ内に保存し、後で呼び出すことができます。

★CODHのくずし字データセットと連携し、アプリ内からくずし字の用例を検索できます。  ーHP転載ー

テスト結果

2011年に「古文書の勉強サイト」で紹介した我家に伝わる史料をテストしてみた.まず,表紙の認識結果を以下に示す.

御禮次第書法段格等之雑録

他見不相成

他人が見てはいけないと書かれた史料の42頁末尾に,「切支丹」の書き方について江戸から通達があったことが記載されている.最後の二行に注目してほしい.

以前紹介した際には,以下のように解釈した.

一 切支丹之支之字向後?(此)死之字(当可申旨段)江戸(申来候段)貞享二年三月(五)日被為御達候事

今回のAI支援による変換結果(未修正)は以下のとおりである.

一 切丹之支字向後は此死之字可申段江戸申来候段貞享二年三月五日口及蓮御

1. 切支丹の「支」の字は今後「死」の字を当てるよう江戸より通達があった. 貞享2年3月5日お達しください.

以下スマホ操作のスクリーンショットである.電球色蛍光ランプの下でスマホのカメラで撮影した資料であるが,問題なく読み込んでくれた.

画像 カメラ& アルバム

認識,ー〇スライド

▢で文字位置表示

認識文字選択

テキスト表示,複写

コメント入力

メニュー

保存データの呼び出し

スマホはAQUAS SH-L02 (Android 7.0),Androidタブレット(Fire HD8 第7世代)でも同様の結果がえられた.高精細画像を必要としないでそれなりの結果が得られるのは立派である.AIのさらなる成長を期待したい.