大学の学部4年生で配属された研究室は文字認識の研究室であった.もともと計算機でプログラムを書くことは好きであったが,他人の論文をコツコツと読み勉強するのは好きではなかった.すでに文字認識などのパターン認識では,さまざまな理論的な研究は開発されていたが,そのような理論を勉強することなく実現できる直感的な手法としてテンプレートマッチングがあった.例えば手書きのカタカナ文字「ア」を認識するためには,「ア」の標準的なパターンつまりテンプレートと入力パターンを重ね合わせ,その重なりが大きければそれを「ア」とする手法で,直感的でわかりやすい手法である.しかし,手書き文字の場合には少し変形するだけで重なりが悪くなるために,高い性能はでない.
修士1年に進学した時に,同期の4年生で学部で卒業した学生が試していた複合類似度をテンプレートマッチングに導入した.複合類似度はテンプレートマッチングとの相性は非常によく,すぐに試すことはできたが,やはり手書き文字の大きな変形では性能は出ない.ちなみに複合類似度は変形の少ない活字文字認識では高い性能が出る手法である.変形を生成させて変形に対応させるなどの新たなアイデアは出し,テンプレートマッチングベースの手法でも性能は向上したものの,当時の最先端の手法に比較すると性能は高くなかった.
現在の論文の採択の状況では,共通のデータベースを用いたベンチマークで最先端の手法と同等以上の性能がでなければ評価されないという厳しい状況であるが,当時のパターン認識分野の状況では,アイデアが面白ければ,部分的であっても性能が向上すれば論文に採択される時代であった.そのために,幸いにもこの変形を生成してマッチングを行うという手法は論文として採択された.当時の指導教員の多大なる支援のおかげでもあるが,これが私の最初の雑誌論文となった.現在のパターン認識分野の論文評価がなぜこんなに厳しくなっているかという理由は,非常に多数の研究者が同じ分野で研究していて差別化が難しい分野となっているためかもしれない.一方,当時のパターン認識はまだ発展途上で研究者の数も少なく,分野を盛り上げたいという考え方が互いにあったためだと思う.新しい研究分野を開拓することがいかに大切かということを改めて感じる.
またシンプルな手法は直感的にわかりやすく実装もしやすいが,高い性能はなかなか出せないことも感じた.世の中そんなに甘くはないのである.但し,後述することになるが,シンプルで直感的な手法は適用範囲が広いことが多く,この時の苦労した経験は後で大いに参考になった.詳細については後日書くことにする.