≪処理62≫ 誤認識文字置換

コム・ヘルパー (高機能情報処理ソフト)

【用 途】

文書をOCRソフトで読み取ったときに、誤認識したと思われる文字があるかを調査したり、それらを正しい文字に一括置換したいときに役立ちます。

【サンプル処理】

下のサンプルは、処理前のテキストの中で、

「ゴ一シュ」内の「ー」が「一」(漢数字の「いち」)に

「トランぺット」内の「ペ」が「ぺ」(ひらかなの「ぺ」)に

「クラりネット」内の「リ」が「り」(ひらかなの「り」)に

「卜ォテテ」内の「ト」が「卜」(漢字の「ぼく」)に

それぞれ誤認識されています。

1 処理前

2 処理後

3 処理設定

【処理説明】

対象範囲のフィールド内の対象文字種に誤認識したと思われる文字があるかを調査し、正しい文字に一括置換します

1 対象レコード:

選択レコードを対象とします

2 対象フィールド:

選択フィールドを対象とします

3 対象文字種:

半角数字、半角英字、全角カタカナのいずれかを選択してチェックします

4 置換対象文字の位置:

□置換対象文字が対象文字種の文字列の先頭にあるときは無視する

チェックがあるときは、誤認識したと思われる文字が対象文字種の文字列の先頭にあるときは無視します

※ この場合、例えば、

対象文字種が「半角数字」で、「l2345」(1が小文字のエルとき)

対象文字種が「半角英字」で、「0pen」(Oが数字のゼロとき)

対象文字種が「全角カタカナ」で、「口ーマ」(ロが漢字のくちのとき)

などのような場合は、対象となりませんのでご注意ください

□置換対象文字が対象文字種の文字列の末尾にあるときは無視する

チェックがあるときは、誤認識したと思われる文字が対象文字種の文字列の末尾にあるときは無視します

※ この場合、例えば、

対象文字種が「半角数字」で、「4321O」(0が英字のオーのとき)

対象文字種が「半角英字」で、「Mai1」(lが数字のイチのとき)

対象文字種が「全角カタカナ」で、「ペル一」(ーが漢字のいちのとき)

などのような場合は、対象となりませんのでご注意ください

※ 両方にチェックがあるときは、置換対象文字が対象文字種の文字列の間にある場合のみ対象となります

5 置換対象文字:

置換対象文字 誤認識されやすい文字です

置換後の文字 正しい文字です

※ 置換対象文字としないときは、チェックを外してください

6 置換対象プレビュー:

「予備調査」ボタンをクリックすると指定範囲を調査して、下のリストへその結果をセットします

置換前文字列 誤認識されていると思われる文字列です

置換対象文字 誤認識されていると思われる文字です

※ 「開始」時に置換処理対象としないときは、チェックを外してください

※ リストをWクリックすると、その文字列の場所が中央になるようにビューを更新します

⇒ 「開始」ボタンをクリックすると、処理を開始します