解像度と色設定について

スキャン解像度と用途について

ペパレスでは、オプションでスキャン解像度を300-600dpi間で指定することができます。
解像度が高ければそれだけ拡大に強くなりますが、ファイルサイズが大きくなるにつれパソコンに大きな負荷がかかり重たく閲覧しづらくなるという弊害も忘れてはなりません。下記は各解像度の主な用途です。

スキャン解像度
用途の参考
300dpi
ペパレスで標準としています。パソコン上で文字や絵を見るうえではなんら遜色なく、拡大により新聞の1/4程度の文字サイズまで可読でき、読むという目的は十分達成でき、ある程度の綺麗さもあります。
400dpi
文字や画像が滑らかに表示される現実的なレベルでの最高設定です。高価な本を綺麗に最高品質で保存したい場合に適しています。様々なOCR処理ソフトで推奨解像度となっております。ペパレスオプションの「透明文字埋め込みPDF」処理を行う場合もテキスト品質はOCR性能に依存する為、推奨品質の透明文字を埋め込みたい場合、400dpiがお勧めです。
また300dpiを超えると「e-文書法」の適用を受ける全ての各省庁推奨基準を解像度面にて達成します。
600dpi
スキャン画像を最大限に拡大してご覧になられたい場合や一部の画像を抜き出して他の用途でご使用になるなど、1ページをじっくりと使用する等、特に細部まで詳細なデータを残したい場合にご利用ください。ただし、非常に重たく表示に負荷がかかりますので、軽快さが犠牲となります。最新PCでご利用下さい。

スキャン解像度とPDFファイルの関係について

 誤解されやすい注意点ですが、PDFファイルを開いた際に拡大・縮小を使いサイズを「100%」とした場合、この状態が解像度MAXの状態と思われる方もおられるようですが、 これは間違いで、元サイズと同じ大きさという意味での100%のようです。実際、下記の200-600dpiのpdfサンプルでそれぞれ100%の状態での閲覧性能に大差がなく、逆に解像度を上げることで拡大に強くなるという性質をご確認ください。
  200dpiでも300%程度の拡大までは、より細部まで表示されることが出来、ファイルを拡大することで、新聞の4分の1くらいのサイズの文字までは読むことができます。それ以上に拡大するとドットが現れてきます。

24ビットカラーサンプル
スキャンデータ
 
200-600dpiのデータを
並べて拡大耐性test
 
200dpi
400dpi
600dpi
250%拡大比較
1000%拡大比較
A5写真入り書籍
324kb
905kb
1937kb
B5イラスト入り書籍
496kb
1410kb
3110kb

スキャン解像度とパソコンディスプレイ・解像度の関係について

下記の表は、雑誌と小説の中間付近の、ビジネス本・自己啓発本によく使われる平均的なA5(縦21cm×横15cm)書籍のPDFファイルを様々な解像度ディスプレイで全体表示した場合の表示%と考察となります。
 いずれの解像度のディスプレイでも文字がくっきりと映り最高に見やすいPDF表示倍率は200%と考えますが、低解像度のディスプレイで閲覧すると、全体表示をとるか、可読性を優先し部分表示させるかと苦渋の選択を強いられます。新たにパソコンを購入される方はWUXGAディスプレイの選択をお勧めしますが、現状でWXGA付近の解像度ディスプレイの所有者様は、サンプルデータを参考にして閲覧に見づらさが付きまとうことを理解したうえで、用途に合わせてスキャニングサービスをご利用いただければと思います。また、見易さは解像度の影響を強く受けますが、画面のインチ数はそれほど関係ありません。あとは、光沢タイプ(グレア)の液晶のほうが、文字が濃く読みやすい傾向があります。
 また、携帯端末でも同様に解像度が画質に与える影響は大きい為、新型iPadなど、高解像度の端末での閲覧がお勧めです。

液晶解像度(ピクセル)
A5_PDFファイル
全体表示時の%
参考コメント
WSVGA
1024×600
約50%
ミニノートによくある規格ですが、PDF利用では完全にサブ的な用途での閲覧に限ったほうが良いです。たとえば出先で専門書を確認したい場合などであれば大変便利ですが、自宅でのんびり読書をする為に使うと逆にストレスを受けます。この規格のミニPCでPDFを閲覧する場合、2ページ表示にせず、液晶を縦に使い1ページ全表示にすると見やすいです。
WXGA
1280×768
約85%
全体表示すると、ドットが足りず、1文字1文字がややぼやけた感じとなり、見やすいとはいえません。辞書的な使い方や見慣れた書籍の収納などサブ的な使用方法ならこの規格の液晶を使った閲覧でも十分可能です。
WUXGA
1920×1200
約145%
スキャニング書籍を閲覧するには現状では最適なディスプレイ。WUXGA規格の液晶はノートPC・デスクトップPCともに上位機種に時々採用されています。全体表示にも耐え、はっきりと文字を認識でき、ストレスを感じない閲覧が可能です。フルHD規格ディスプレイもこの規格より多少劣る程度で快適です。
WQXGA
2560×1600
約210%
全体表示しても細部まで鮮明に写される為、目が疲れない。スキャン画像を閲覧するなら最も理想的な解像度と言え、WEBページを見るような感覚でストレスを感じずに閲覧できる。この規格のディスプレイはノートPCでは現状ほぼ存在せず。デスクトップPC用ではグラフィックデザインやプログラミング、DTMなどの用途向けに販売されている程度で価格も高価な為、普及はまだまだ。

白黒2値・グレースケール・カラーの違い

白黒2値
OCR処理用の設定です。多くのOCRソフトは、ソフトウェアが一旦画像を白黒2値化処理した上で識字するため、スキャン画像がカラーやグレースケールの場合、再度2値化への画像加工が施されることになり、わずかに識字率低下をもたらします。OCR後に手修正を施すなど、もっとも高い識字率でOCRを行いたい場合やスキャン画像を目視用に利用しない場合にご利用ください。ファイルサイズは最も小さいですが絵はつぶれ閲覧に耐えません。OCR専用の設定です。
グレースケール
小説や文庫本など黒1色で印刷された書籍をスキャンする場合、単色印刷のものであっても白黒2値とすると画像がつぶれ、逆にカラーとすると、単色なのにファイルサイズが大きくなる。グレースケールにすると、紙の黄ばみを排除でき、ファイルサイズを抑えつつ写真なども綺麗に閲覧出来る視認性の良いデータとなります。但し、昭和30年代レベルの古い書籍の場合、グレースケールスキャンすると強く黄ばんだ背景が設定で除去できずに黒い影として残りますので、この場合は、開き直ってカラースキャンしたほうがきれいにスキャン可能です。
24ビットカラー
画像表示に負荷を感じますが、カラー写真も1,670万色フルカラーで再現できる高性能スキャン。

ファイル形式について

電子化する場合のファイル形式についてはPDF・JPG・PNG・TIFの4種類からお選び頂けます。標準設定はPDF。推奨される形式は、書籍を1ファイル化できる「PDF」と広く一般的な「JPG」2タイプです。
ペパレスで電子書籍化を行う場合、PDFベースでスキャンを行いますので、それ以外の出力方法をご希望の場合、画像変換により各種形式のデータを出力しますので、たとえばtifをご希望の場合、PDFからtifファイルを変換作成することになります。
それぞれのファイル形式の画質の差は元来のものはファイルサイズに由来すると思いますが、実際の画質は形式よりも圧縮率に依存します。
ペパレスの納品データの画質については、高品質志向の方針ですので、圧縮はあまりかけておらず、画質の劣化はscansnapなどで作成されたデータよりははるかに低いです。強い圧縮をかけたコンパクトなデータをご希望の場合、「モバイル用強圧縮PDF」など強圧縮をほどこしたオプションファイルを追加希望(+200円)されるとよろしいかと思います。

200dpi24ビットカラーサンプル
各種形式でのファイルサイズと画質比較
A5写真入り書籍 326kb 199kb 1767kb 2992kb
B5イラスト入り書籍 496kb 289kb 2796kb 4910kb

各ファイル形式の特徴について


PDFファイル
アドビシステムズ社開発のファイル形式。複数の画像を1ファイルにまとめて好みの処理を施すことができる画像集約ファイル。ファイルサイズは元画像ファイルサイズに強く依存する。PDF編集用ソフトAdobe Acrobatがあれば各種編集・PDFファイル全ページをJPGなど画像として書き出しすることも可能。読取専用ソフトのAdobe Acrobat Readerは無料配布されています。画像ファイルをテキスト化(OCR)処理し、文字をPDF各ページに透明化して埋め込むことでページ内の文字を検索・右クリックコピーできる。
幅広く浸透した形式であることと、複数の画像ファイルなど本1冊を1ファイルに集約できる点、見開き表示・クリックでのページめくりなど、設定次第で本と変わらない操作が可能なことから、書籍の電子化には最適なので当サイトでは標準設定としています。

JPGファイル
静止画像データの非可逆圧縮方式であり、圧縮率が高うえに再現性もよい為、インターネット上での最も一般的なフォーマットとなっている。ただ、電子書籍として使うには、1画像1ファイルである為、フォルダの中にページ数分のファイルを容易する、というやや面倒な構成となり、データ移動に不便・ページ欠落など多少の心配が伴います。

PNGファイル
GIFに特許料という問題が発生した為に開発された、W3Cというインターネット標準化を行っている団体が推奨した規格。しかし、インターネットで公開するにはファイルサイズの大きさが気になる。

TIFファイル
MicrosoftとAldus社によって開発された画像データファイル形式。圧縮を伴わずに保存できる為、再現性は良いがファイルサイズが極端に大きいです。