雙表記テキスト

表記包括タグ「Yモード」による、テキストの動的變換マクロ「やちまた」の試案yati0505を公開してゐます。

このページは豫告なく内容を更新する事があります。御海容ください。

(拔き刷り)新しい「舊字・舊かな」文書處理

【ダウンロード】「やちまた」試行版

(環境により、ダウンロードがブロックされます。強行してください。)

【ダウンロード】AutoHotkey

【ダウンロード】Yモードタグおよび變換テーブルデータ


【概説】

ワンクリックで「現代仮名遣⇔歴史的假名遣」「略字⇔正字」のテキスト變換します。Windows上で動作しますが、原理としては單純な檢索置換の繰返しですので、他の環境にも容易に移植可能の筈です。特に各種ワープロなどは文字修飾情報を失はぬやう、別段のマクロを組む必要があります。


「カット&ペースト」の途中、切り取られた文章は「クリップボード」といふ場所に一時保存されます。これを横取りし、檢索置換をかけた上で元に戻す仕組みです。あたかも自動演奏のピアノのやうに、一連の動きをマクロプログラム「AutoHotkey.exe」で自動實行させてゐます。特定のソフトウェアに依存せず、たとへばブラウザ上の文字入力窓でも高い確率で實行可能です。


類似のプログラムは從來より各種ありましたが、

・ 日本語IMEのやうに、あらゆる場面のテキスト編輯で使へる。

・ ローカル環境でも作動する。

・ 必要に應じ、現代表記に戻せる。

點がこれまでにない特色です。柔軟な「動的テキスト環境」を目指し、たとへばローマ字や元號の變換などへの應用も摸索中です。


以下のフリーソフトを利用しました。多大な恩惠に感謝申上げます。

poorsed : テキストの檢索置換。本システムの心臟部分。荒魂之會の小澤さん謹製。「ezsed」も同趣。

AutoHotkey : 著名なキーボードマクロ。

また筆者自身は以下のシェアウエアソフトを愛用してゐます。

換の玉 : マイクトソフトワードの連續置換マクロ。秋桜舎。

秀丸エディタ : 定番のエディタ。テキストの色分け強調表示と縱書きが秀逸。

【注意點】

マクロプログラム「やちまた」は「キーボード操作の再現」つまり自動演奏のピアノの如き振舞ひをします。ピアノの構造が少しでも異れば、音が出ないかもしれません。文章全體が消える可能性すらあります。ただほとんどの場合、その文章は本當に失はれたのではなくOSのどこかに殘ってゐます。ほとんどの場合、「コントロール+z」もしくは「Alt+E」で復元できる筈ですが、ソフトウェアにより異同はあります。またWindows10以降「Win+v」でクリップボードの履歴を辿れるやうになりました。この機能はあらかじめ「設定」の「システム」の「クリップボード」で設定しておく事を強くお勸めします。また異常な動きが止らない場合、「無変換+ESC」で「やちまた」の動きそのものを停止できます。いざといふ時パニックに陷らぬやう、復元方法によく慣れておきませう。


以上、3種類の危機管理に御注意ください。

・ 多くの場合「コントロール+z」もしくは「Alt+E」でうっかり操作を戻せる。

・ 「Win+v」でクリップボード履歴の參照や貼付ができる。

・ 「無変換+ESC」で「やちまた」の動きそのものを停止できる。

以上、申し譯ありませんが如何なる損失にも作者は責任を取れません。自己對應で御願申上げます。

【動作】

AutoHotkeyのスクリプトの多くは以下の三段階から成ります。

(1) テキストを切り取り(範圍指定がなければ全部指定)

(2) 切り取ったテキストを連續檢索置換

(3) 元の場所に貼り付け


上記のトリガーキーのほとんどを[無変換]キー單獨、もしくは[無変換]をシフトキーの樣に各種キー押し下げで作動します。日本語Imeと竸合する可能性もありますので、できればImeのキー設定から[無変換]を外しておいた方がより安全に動きます。


原理として特に目新しいものはありませんが、

(1) 高速な檢索置換を「poorsed.exe」で實現

(2) 「AutoHotkey」により複雜な動作を自動實行

(3) 目的に沿った變換テーブルの開發と改善

の三要素により、實用的なものとなりました。

【インストール】


先づ「やちまた」の解凍とコピー、次に「AutoHotkey」のインストールへと進みます。インストールを後にする理由は後述します。


(1) 「やちまた」のコピー

yati_r505.zip」ダウンロードはこちら

(環境により、ダウンロードがブロックされます。強行してください。)

  「yati_r505.zip」を解凍すると「ahk」フォルダが生成されます。これをcドライブにそのままコピーしてください。本來、Cドライブをあまりいぢりたくはないのですが、相對パス指定がなかなかうまくゆきませんので、位置を固定して絶對パス指定にしました。

C:\ahk\

         「Yati.ahk」「AutoHotkeyU64.exe」2つのファイルがある筈です。

C:\ahk\poorsed

「やちまた」用のsed、「poorsed.exe」他があります。

C:\ahk\table

變換用テーブルファイル群です。


(2) 「AutoHotkey」のインストール


配布元(https://www.autohotkey.com/)の「Download」には2つのバージョンがあります。

・Download v2.0

・Download v1.1(deprecated)

どちらのインストールでもよいのですが、v2.0をお勸めします。v1.1はインストール時の選擇項目が複雜だからです。「やちまた」はv1.1用に記述されてをり、じつはv2.0下では使へません。しかし「やちまた」を實行しようとすると「これはv1.1用スクリプトの樣なので、v1.1をダウンロードしてよいか?」と表示されます。「Yes」で自動的にインストールされ、結果として動くやうになります。v2.0は令和4年(2022年)秋の登場ですので、これから對應してゆきたく思ってをります。

(v2.0インストール中)

(インストール成功)

(ここでA:\ahk\yati.ahkをクリック。するとv1.1のインストールが促される)

(v1.1のインストール成功)

(再びA:\ahk\yati.ahkをクリックで、スクリプトが正常に開始)

この時は通知領域に緑色の[H]マークが出るだけで、目立った動きはありません。ここで重ねてA:\ahk\yati.ahkをクリックすると、以下の樣な警告が出ますが、「はい」でロードし直されます。

異るスクリプトファイルをクリックすると[H]マークが2つ現れ、兩方とも同時に利用できます。


  v1.1のインストールはこちら

https://pouhon.net/ahk-install/661/

が詳しいです。


  起動の都度、スクリプトファイルをクリックするのは面倒ですので、スクリプトファイルもしくはそのショートカットをスタートアップフォルダに置くと、起動時に自動實行されます。


  またこれはあくまで簡易的な方法ですが、エクスプローラーなどファイルアイコンの見える場所で、スクリプトファイルを「AutoHotkeyU64.exe」へドラッグ&ドロップしても實行できます。ただしバッチファイルではうまくゆきませんでした。また「AutoHotkeyU64.exe」以外のバージョン、たとへば「AutoHotkeyA32.exe」などでは起動しませんでした。「やちまた」では上記「AutoHotkeyU64.exe」を「yati.ahk」と同じ場所に置いてゐます。


【終了】

通知領域に緑色の[H]マークを右クリック、最下段の「Exit」クリックでスクリプトが終了します。また「やちまた」の機能として、[無変換]+[Esc]で終了するやうにしました。動作が暴走した時など緊急時に打鍵してください。


【典型的使用例】

範圍指定(シフト+カーソルキー)の後、下記のトリガーキーを押す。範圍囲指定がなければ文章全體を對象とする。


[無]+Esc 「やちまた」スクリプトの停止。緊急時にどうぞ。

[無]を1囘のみ打鍵 カーソル上の漢字を正字・略字に相互變換。假名遣は「Yモード」で變換。

カーソルは必ず變換したい文字の後方に。「くゎ"」や「おう」などは最後方に。

「~してしまう」など「まう」と誤認識されるので「う」のみ範圍指定が必要。

假名文字は數文字遡って切り取るため、特に段落の冒頭近くは範圍指定する方が無難。

「ワード」などリッチテキストは文字修飾を崩す可能性あり、必ず範圍指定を。

[無]の連打 「簡易モード」の漢字・假名遣變換。タグ文字は入らない。

[無]+スペース 直前1文字の漢字を偏と旁に分解。假名文字は清音濁音の變換。OCRの修正對策。

[無]+t 縱書編輯への對應。カーソルが縱横に動いて讀んでゆく。再度押すと横方向に戻る。

[無]+x 簡易漢和辭典。「メモ帳」でデータテキストの該當字を檢索する。

[無]+v 簡易モードで正字正假名のペースト。コントロール+C などの後に實行する。

[無]+b 略字のペースト。上記と同樣に使ふ。將來は假名遣も現かなに戻したい。

[無]+F11 Yモードの假名遣變換。漢字はそのまま。

實行は必ず最初1囘のみ限定。2囘目は表示がをかしくなります。

[無]+F12 Yモードの漢字・假名遣變換

上記と同樣に實行は必ず最初1囘のみ。わざと押しにくい位置に設定しました。

[無]+g Yモードテキストで現代假名遣に變換。

[無]+r Yモードテキストを歴史的假名遣に變換。

[無]+1 漢字を略字に(第1水準の意味で「1」キー)。「弁」の區別もある程度できます。

[無]+2 第2水準の範圍内で正字に。

[無]+3 第34水準の範圍内で正字に

[無]+4 ユニコードの範圍内で正字に


【私がよく使ふ順番】

(1) 既存の文章のコピー保存。

・ 現代表記のテキストをエディタに貼つけ。ファイル保存。

・ ファイルの標題をテキスト中からコピーし、[無]+vでリネーム。

・ 再度ファイルを開き、[無]+F12で正字正假名に變換。

・ 變換誤りは[無]單打などで修正。

(2) (やむなく現代表記IMEで)文章の入力。

・ 文章を入力しつつ、[無]單打で修正。

・ あるいは現代表記でまとめて入力し、範圍指定で[無]+F12。

・ 他からのコピーは[無]+vで自動的に正字正假名貼つけ。

・ 縱書き編輯の時は必ず[無]+t指定。さもないと暴走する。再度[無]+tで解除。

(3) 正字正假名文章中の語句を檢索したい。

・ 檢索したい語句をコピーし、檢索窓で[無]+b。略字に戻して檢索できる。

・ (ゆくゆくは現代假名にも戻したい)

(4) エクセルで歴史的假名遣順・現代假名順それぞれソートしたい。

・ 必ず「Yモード」でソートデータ作成。

・ ソートしたい列をエディタにコピーし、[無]+r または [無]+g。

・ エクセルに貼り戻し、Yモードのタグを取り除いてそれぞれソート。

・ (エクセルで連續置換マクロを組めば、直接實行可能)

(5) 「必ず現代表記」の投稿。

・ [無]+g および [無]+1 を實行し、更にYモードのタグを取り除いて提出。


Yモードの插入タグは槪ね以下の樣な性格になってゐます。

「'」 「はひふへ」などハ行と、四つ假名の「ぢづ」、また撥音「-む」

「"」 「ゐゑをくゎ」などワ行と、「あう・いう・えう」の長音

「""」 「やう」「きゃう」

「"'」 「あふ・えふ」

「''」 「あふる」「たふす」

詳細は「yati0505_變換テーブルデータ.xlsx」を。


實際の活用例を示します。靑空文庫からあへて略字現カナの『吾輩は猫である』をダウンロードし、加工してみます。「秀丸エディタ」は縱書きですので、忘れずに[無]+tを押して、縱書き對應にしておきませう。カーソル位置に【縱】記號が出現します。煩はしいことですが、「やちまた」は各アプリケーションの状態を取得できないため、指定しておく必要があります。

[無]+F11だけで、以下の樣に直せます。筆者の愛機はwindows10がやっと動く骨董品ですが、それでも『猫』全文を數秒で變換できました。[無]+F12なら、漢字もふくめて變換できます。「秀丸エディタ」は特定文字を色分け表示できますので、Yモードタグおよびその前の文字を強調表示し、假名遣の變換場所が一目瞭然です。

殘念ながら全自動ではありません。未變換や誤變換もあります。

「けんとう」が「けんたう」に直ってゐません。そこで「とう」の下にカーソルをあて、[無]單打で「けんたう"」になりました。また「見当」も略字のままです。「当」の下にカーソルをあて、[無]單打で「當」になりました。「当」の方がよければ、再び[無]單打で元に戻ります。上段でも申上げましたが、必ず[無]+tで縱書き對應状態にしておかないと、カーソルが横方向に動き、文章が崩れてしまひます。萬一崩れても焦らず、コントロール+zなどで復元しませう。

ここで[無]+gを押すと、全文が一齊に現代假名遣へ、また[無]+1で略字へ戻ります。

【課題】

・ 原因は不明ですが、起動して最初の變換のみうまくゆかない時があります。1囘限りでその後は大丈夫なのですが、最優先で改善を計ってゐます。

・ 古い機種でタイミングが合はず、作業を取りこぼす場合、速度調整的な仕組を考へてゐます。

・ 「辛(から)うじて」など、本文と振假名で切り離された場合の處理に惱んでゐます。「てんわう(天皇)」など連聲も同樣です。