スキャンとPDF

スキャン

用意するもの

  • ハードウェア

非破壊的スキャン

― 業務用複合機: 中古の安いやつ (高い, 重い, 場所を取る代わりに早い, 綺麗, 中古での送料は15,000 円くらい)

― 複合機: Brother MFC-J6973CDW (家庭用, 安い, ADF (コピーした書類を自動で吸い込んでくれる機能) 対応がメリット)

― 専用スキャナ: EPSON DS-G20000 (業務用, 高め, 綺麗なことが多い, 省スペース)

見開きスキャンはイメージセンサーの違いで焦点深度の深さが大きく変わる。


破壊的スキャン

― Scansnap: Acrobat Standard 付属モデルが高コスパ。

― imageFORMULA: 器用貧乏。インストール不要モデルがすぐに使えて便利。


  • ソフトウェア

スキャンデータの処理

Scan Tailor: スキャンしたデータを分割、並び替え、最適化できる。白黒とグレースケール、カラーが混在した書類も扱うことができる。

― Photoshop CC 20XX: 規格が整ったスキャンデータであればバッチ処理で瞬殺。


オーサリングツール

Acrobat Pro: これで全て整う。Clear Scan 機能で文字が非常に綺麗で読みやすくOCR できる。初めからこれを買った方が安上がり。

Small PDF: オンライン型の無料PDF 作成サービス。OCR 以外、大まかな作業ができる。

PhantomPDF Standard: PDF 作成ソフトの中では使いやすく低価格。OCR 対応。

いきなりPDF COMPLETE: 低価格。OCR 対応。

― OpenSouce 系ソフトウェア: 非推奨。


  • スキャンの設定のおすすめシチュエーション

よくありそうなケースを以下に示します。

― Before

カラー図版

グレースケール

白黒

手書き

経験的に、カラー図版は600dpi TIFF or JPEG がおすすめです。文字もあり、OCR 予定であればTIFF をお勧めします。グレースケールの書類は機種に拠ります。たとえば、Brother MFC-J6973CDW ではカラースキャンしたうえで色情報をソフトウェアで削除しますし、業務用複合機であれば白黒スキャンモードを使います。白黒は600dpi TIFF が一番です。手書きメモは用途に拠りますが、200 dpi ほどで十分だと思います。

保存型式はmultipage TIFF をお勧めします。JPEG は画像がツブされるためOCR 時にノイズで足を引かれます。

― After

カラー図版 (カラー, 600 dpi, TIFF)

グレースケール (カラー, 600 dpi, TIFF)

白黒 (白黒, 600 dpi, TIFF)

手書き (カラー, 200dpi, JPEG)

スキャンしたデータは引き続きScan Tailor で処理をします。

Scan Tailor

データの読み込み


一括処理までの個別設定


一括処理後のアフターケア