国会図書館デジタルコレクションの古典におけるくずし字をオンラインで解析する方法は以下の2ステップです。
くずし字認識サービスページを開く。https://codh.rois.ac.jp/kuronet/
四角い枠で囲まれた "KuroNetくずし字認識ビューアを起動" と書かれているフォームの中に国会図書館デジタルコレクションのページの右下に提供されているIIIF形式のURLを入れる。
例えば「花壇綱目」という天和元年(1681年、江戸初期)の園芸本があり、各ページをオンラインで見られます。試しに3巻をみてみましょう。44ページ目に肥料らしきものを記載した面白そうなページがあります。ここを読み取ってみましょう。次のリンクを開いてください。 https://dl.ndl.go.jp/pid/2536268/1/44
大きなページなのでブラウザ右端のスクロールバーを下げていくと途中に「IIIFマニフェストURI https://dl.ndl.go.jp/api/iiif/2536268/manifest.json 」
という記載があります。このWWWアドレスをくずし字認識ビューワのフォーム内にコピペします。最初にスペース等が入ると 「IIIFデータを取得できませんでした」となるので、注意してアドレスのみコピペしてください。
くずし字認識ビューワ内に「花壇綱目」の表紙が出てきます。左上のページ番号を調整して44ページに移動し、右と同じ画面を出してください。
次に右上の「ログイン」と書かれたリンクをクリックしてログインします。メールアドレスとパスワードを登録すれば誰でも無料でログインできます。
ログインするとビューワの右上には自分の名前が表示され、みている書籍の右上部分に黒い■ (四角のマーク)が出ます 。これをクリックすると画面の領域選択ができます。四角い領域の始点と終点をクリックで指定します。
くずし字ビューワで領域を選択したらポップアップウィンドウが出てきます。ポップアップのタイトルにある「KuroNetくずし字認識サービス」のリンクをクリックします(下のWWWアドレスは画像データDL)。
ダッシュボード画面に移行します。「くずし字OCR」の列に「予約:実行」というリンクがあるのでこれを押すと処理が実行され、「成功:閲覧」というリンクが出てきます。これを押すと赤字で書かれているようにくずし字を読み取ってくれます。ブラウザの「戻る」ボタンでダッシュボードに戻れます。ダッシュボードの「自動テキスト化」列の「処理:実行」リンクはコピペできる文字列にしてくれるようですが、今はサーバのタイムアウトで成功しません (2025年5月)。
上の例で読み取られた文字の一部をここに書いておきます。
「馬糞 寒気を痛草に宜し 暑気を嫌草にも少宛 根のまわりへ用也」
痛草の意味はわかりません。しかし、馬糞なら寒気や暑気に弱い草に少量、根のまわりへ撒くことが推察されます。
「下肥 強こやしてよき草に用へし 但土にませ置久しくして用也」
下肥(人のうんち)は、たくさん肥料をやって良い草に用い、土に混ぜて長期間おいてから用いることとあります。
「小便 大方の草にくるしからす 但葉花に不懸 根廻へ雨の降まへを見合かくへきなり」
小便はたいていの草にやってよい ただし葉や花にはかけず(懸を「かけ」と読む) 根の周りに雨が降る前にかけなさいと言っているのでしょうか。
こんなふうに、くずし字でも内容を読み取れるようになります。