よくある質問
システム全体について
Q.なぜ、いまさらFaxなんですか?
- 病院や役所などの施設ではまだまだFaxが現役で使われています。そして日本だけでなく他の発展途上国でもFaxは使われています。そのような人たちに無料で便利で簡単なシステムを提供する為にこのプロジェクトがあります。
Q.読み取り枠内に、数字のガイドはいれられないのでしょうか?
- 現在のバージョンでは対応していません。PDFを自動生成した際、それぞれの読み取り対象枠内に薄く見本数字を入れることは、将来的に可能かも知れません。
デモシステム(ライブデモ)について
Q. FaxOCR のデモ環境の URL を教えてください
- A. http://faxocr.dip.jp/faxocr/ です。
ライブデモにつきましては、「1.概要:ライブデモ」の項を併せてご参照ください。
Q. FaxOCR のデモ環境はどういう環境で動いていますか?
- A. Amazon Web Service (Amazon EC2)上 で提供しています。
Q. Faxをデモ環境用の番号に送信した後は、どこを見ればよいですか?
- A. FaxOCRシステムにログインし、ご確認いただくことが可能です。
詳しくは、「1.概要:ライブデモ」の項を併せてご参照ください。
Q. コンビニからの Fax 送信がうまく行きません
- A. コンビニからFax送信を行うと、その番号には送信できませんというようなアナウンスがあり送信出来ないケースがあるようです。
デモ環境で利用しているファックスサーバが050番号を利用しており、これがコンビニ環境側の「送信できない」番号に該当することが関係しているようです。
こちらで送信テストを行った結果は以下のとおりですが(2011.11現在)、コンビニエンスストアで提供されているFaxサービスの詳細は、各コンビニエンスストアのサービス内容をご確認ください。また、併せて「3.システム要件:Faxサーバ」の項もご確認ください。
- ローソン : 利用不可
- セブンイレブン : 店舗により導入機種が異なり、機種によって利用可否があるようです。
Q. デモ利用が、どうもうまく行きません
- A. メーリングリスト faxocr@googlegroups.comに、ご相談下さい。
構築・設定方法について
Q. シートはどうやって作るのですか?
- A. FaxOCR で使用するシートは Excel で作ります。仕様については、「5.資料 - ヒアリングシート」をご参照下さい。
Q. OCRは、数字以外の文字種については対応していますか?
- A. Fax越しのOCRは非常に条件が悪く、数字のOCR以外については対応していません。
Q. FaxOCR サーバの POP などのメール設定について教えてください
- A. 「4.システム構築:AWS環境での構築」をご参照ください。
Q. AWSでシステム構築を行うと、VM再起動のたびにアドレスが変わってしまいませんか?
- A. DDNS (Dynamic DNSサービス)を用いることで解決しています。必要に応じ、お問い合わせ下さい。
Q. FaxOCR サーバでは、どこでPOP先 などの設定をしていますか?
- A. Amazon EC2環境では、 インスタンス起動時に User Data として指定しています。
独自サーバを利用する場合は、設定ファイルに書き込むことになります。
Q. FaxOCRのコードがgitで入手できません
- このプロジェクトでは、コードのレジストリをgoogle codeに置いていますが、Google codeでのgit利用は、gitプロトコルでなくhttpプロトコルに限られている一方で、git自身がhttpに対応したのがversion 1.6.6以降のようです。
git --versionとして、1.66以前の場合は、アップデートをして下さい。
なお、古いホストにgitを入れる場合、apt-get update git等がうまくいかないケースがあります。その際には、gitをソースから作り直すのが早いようです。 (http://goo.gl/56Ikp)
- http://git-scm.com/ にて、gitのソースを入手 (これは、gitプロトコルに対応しているので、古いgitで大丈夫)
- コンパイル前に、curl、curl-config (libcurl3-dev)をインストールしておいて下さい)
- make configure; make; make install、で、OKです
トラブルシューティング
Q. procfax.sh が動作しない
- A. 最新版の procfax.sh を利用してください。
古い procfax.sh だと ~faxocr/Faxsystem/ のサブディレクトリの個数が運用1年未満で32000個をこえてしまって procfax.sh が動作しなくなることがあります。(2013/4/8の修正でprocfax.sh実行時に処理対象がなければサブディレクトリを作成しないように修正しています。)
その他
Q. プロジェクトの開発体制について教えてください
- A. ボランティアが、以下の無料サービスを利用しながら開発を行っています。
- Official Site : https://sites.google.com/site/faxocr2010/
- MailingList: faxocr@googlegroups.com
- Project Management : http://redmine.sinsai.info/projects/faxocr
Q. OCRエンジンは、何を用いていますか?
- A. 開発当初、GNUのOCRエンジンであるgocrを用いていましたが、その後、より精度の高い独自のOCRエンジン、「kocr」へと移行しました。
Q. 送信された文字(数字等)は、正しく読み取られますか?
- A. ファックスは解像度が低く、白黒画像となるために、一般的なスキャナのような解像度を得たり、色の付いた枠線を自動的に消すなどの処理が困難です。そのために、本システムでの文字読み取りには、数パーセントの誤読が生じます。精度の向上に向けて様々な試みを行っていますが、 機械にとって読み取りにくい字があるだけでなく、 人間が見ても判別が難しい字もあることから、現在の手書き文字認識では100%の精度を得ることが出来ません。重要なデータについては、受信データの目視確認を必ず行うようにして下さい。
- 誤読の例
「9」にも「7」にも、読むことができます。
「1」とも読めますが、変形「2」が少し回転しているようにも読めます。
特殊な「7」ですが、機械にとっては「9」にも近い字です。
おそらく「9」ですが、機械は、右の「7」に近いと判断しました。
変形「3」ですが、形態上の特徴が、右の「9」に類似しています。
太いペンで書かれた「8」ですが、形態上の特徴が右の「6」に類似しています。
- 読み取りにくい文字
- 記入欄の枠線に文字がかかってしまっている、枠からはみ出している
- ペンが太く、文字の特徴が失われている
- 文字が小さかったり、極端に傾いている