スキャンとPDF
スキャン
用意するもの
- ハードウェア
非破壊的スキャン
― 業務用複合機: 中古の安いやつ (高い, 重い, 場所を取る代わりに早い, 綺麗, 中古での送料は15,000 円くらい)
― 複合機: Brother MFC-J6973CDW (家庭用, 安い, ADF (コピーした書類を自動で吸い込んでくれる機能) 対応がメリット)
― 専用スキャナ: EPSON DS-G20000 (業務用, 高め, 綺麗なことが多い, 省スペース)
見開きスキャンはイメージセンサーの違いで焦点深度の深さが大きく変わる。
破壊的スキャン
― Scansnap: Acrobat Standard 付属モデルが高コスパ。
― imageFORMULA: 器用貧乏。インストール不要モデルがすぐに使えて便利。
- ソフトウェア
スキャンデータの処理
― Scan Tailor: スキャンしたデータを分割、並び替え、最適化できる。白黒とグレースケール、カラーが混在した書類も扱うことができる。
― Photoshop CC 20XX: 規格が整ったスキャンデータであればバッチ処理で瞬殺。
オーサリングツール
― Acrobat Pro: これで全て整う。Clear Scan 機能で文字が非常に綺麗で読みやすくOCR できる。初めからこれを買った方が安上がり。
― Small PDF: オンライン型の無料PDF 作成サービス。OCR 以外、大まかな作業ができる。
― PhantomPDF Standard: PDF 作成ソフトの中では使いやすく低価格。OCR 対応。
― いきなりPDF COMPLETE: 低価格。OCR 対応。
― OpenSouce 系ソフトウェア: 非推奨。
- スキャンの設定のおすすめシチュエーション
よくありそうなケースを以下に示します。
― Before
カラー図版
グレースケール
白黒
手書き
経験的に、カラー図版は600dpi TIFF or JPEG がおすすめです。文字もあり、OCR 予定であればTIFF をお勧めします。グレースケールの書類は機種に拠ります。たとえば、Brother MFC-J6973CDW ではカラースキャンしたうえで色情報をソフトウェアで削除しますし、業務用複合機であれば白黒スキャンモードを使います。白黒は600dpi TIFF が一番です。手書きメモは用途に拠りますが、200 dpi ほどで十分だと思います。
保存型式はmultipage TIFF をお勧めします。JPEG は画像がツブされるためOCR 時にノイズで足を引かれます。
― After
カラー図版 (カラー, 600 dpi, TIFF)
グレースケール (カラー, 600 dpi, TIFF)
白黒 (白黒, 600 dpi, TIFF)
手書き (カラー, 200dpi, JPEG)
スキャンしたデータは引き続きScan Tailor で処理をします。