投稿日: Feb 03, 2015 12:31:25 AM
いわゆるJIS漢字が決められた時期は、まだ日本語ワープロが試作段階の時代で、JIS漢字の直接の用途は漢字オフコンとか漢字ターミナルなどと、それにつながった連続用紙の漢字プリンタが対象だった。印字される内容は、商品名・社名・人名・事務文書的書面で、宛名はカタカナの時代であった。そのために自治体の名前の漢字ですらJISの第1第2水準から漏れるものもあった。地名人名に関しては法務省の取り扱いであったために、通産省のJISでは抵触しないということもあったと思う。
しかしコンピュータの漢字化が未着手であったのではなく、新聞のCTSは始まっていたし、ホストコンピュータ各社は独自に漢字のコード化やフォント化は行っていて、JISはその共通部分を取り出したようなものだったから、JIS漢字だけで仕事をするという局面はなかった。要するにJIS外字はそれなりに充実していたともいえる状況であった。
JIS漢字は今はISO10646(ほぼユニコード互換)となり、漢字数は3倍くらいになった。それでもまだ地名人名や異体字の拡張が続いている。このように漢字のコードやフォントの拡張を続けると既存の外字のシステムも影響を受け、運用する側は混乱するとか、ついていけなくなるのではないかと思う。
前職では20年ほど異体字の調査や規格化の作業もしていたのだが、あるむなしさを感じていて、そもそも漢字の形にいっぱいバリエーションが出来てしまうことは、漢字の成り立ちを良く知らないから起こることで、渡辺の辺の異体字が何十通りあるとか、本家の中国よりも扱う漢字が増えてしまうようなことはいいんだろうかと思った。
中国の場合は漢字の成り立ちは「篆書」に遡ればだいたいわかる。その後の隷書とか行書・草書による漢字の形の揺れ、また宋体とか後の明朝体などの形も、「デザイン差」として文字コードは分けないので、割と文字コードは安定していた。しかしISO10646のような作業を通じて文字コードの定義も変わってしまい、簡体字と繁体字は分けてしまったし、日本でも「デザイン差」を追加する方向になった。
漢字の形のバリエーションにニーズがあるのなら、その再現を実現できるようにすることは問題ないと思うが、それでも文字の成り立ちに戻って意味の解釈ができるようにしておかないと、コンピュータでの自動翻訳とか、そこまでいかなくても変換業務には差し障りがでてしまう。人名の名寄せをするにもいろんな変換テーブルを用意しなければならなくなるわけで、効率化を無視した標準化は疑問である。
検索エンジンでは若干の入力ミスがあってもそれらしい結果が出てくるように、漢字のバリエーションに左右されずに事務処理できる方がいいだろう。通常の事務処理は漢字であっても「音」でするので標準字形で済んでしまうのだから、本人のIDとしては特殊な字形が使われるにしても、情報交換用の標準字形への置き換えも自動でされる必要がある。文字拡張をするなら、こういう利用環境も同時に整備するべきだろう。
Top → Articles デジタルメディアビジネスの記事 過去記事→Archive