ScanSnap1500導入
FUJITSU ScanSnap S1500 FI-S1500を導入しました。
理由は、iPad導入に向けて、本をPDF化するため。
(iPadを買うかどうか分からないけど、今年は何かしらタブレットマシンは買うと思う)
手始めに仕事関係の本を2冊読み込ませてみました。読み込ませたのはこの2冊。
●jQuery入門―魔法のJavaScriptリファレンス&サンプル
●Webプロフェッショナルのための黄金則 XHTML+CSS虎の巻 (Web Designing BOOKS)
jQueryの方は1色、虎の巻は4色です。
適当にやってみた設定はだいたいこんな感じ。
・スーパーファイン
→エクセレントはスピードが遅く、ファイル容量も大きい。300dpiで十分だろう。
・(jQuery)グレー、(虎の巻)カラー
→白黒2値はいかにも汚い。
・用紙向きの自動判別
→オフ
・文字をくっきり
→オン
・白紙を削除
→オフ
いろいろなところで言い尽くされていますが、用紙向きの自動判別は元々向きの揃っている原稿では不要だし、白紙を削除してしまうとページ数を合わせるのが面倒になってしまう。
ざっとやってみた感じでは、まぁまぁ読める。リファレンス用として使うには十分事足りるけど、じっくり読む本だといまいちかな。設定はもうちょっと考える必要が有りそう。
いずれの本も元々文字の色が薄めなこともあるが、スキャンしたらそれが強調されてしまった感あり。
また、jQueryの本はコード部分の背景にグレーの地色が付いている部分があるが、地と本文のコントラストが低くなるため、読みやすさや認識に影響した。この辺は致し方ないところと思う。
補正でコントラストを上げれば読みやすくなると思う。
100%表示時は小さい文字(注記やキャプション)や図版(図版の中に入っている文字)などは読みづらいが、元々結構大きく取り込んでいるので拡大すれば問題ない。300%までならドットも目立たない。
またScanSnapOrganaizerでのOCR(文字認識)は、日本語本文はなかなか優秀。途中に入っている英数文字に誤認識が目立った。また、いずれの本もHTML、CSS、JavaScriptのコードが入っているが、この部分も正しく認識できていない部分が多かった。和文英文が混ざった文章は苦手なのかも。
なんかマイナス点ばかりになってしまったが、そんなに深く考えずにつっこんで、適当設定で読み込んだ割には満足いく結果であったことは確か。スピードは超速いし、机の上のスペースは空くし、かなりおすすめできると思った。
今回試した本は、素材としての条件は結構厳しかったのではないかと予想。グレーの地色に文字が載っているコラムなんかは、そりゃ普通のコピーでも難しいよね。
今度は文庫小説でもやってみることにします。紙に黒文字が印刷されているだけのものならもっと読みやすいものが作りやすいはずだ。きっと補正もしやすい。楽しみになってきた。
理由は、iPad導入に向けて、本をPDF化するため。
(iPadを買うかどうか分からないけど、今年は何かしらタブレットマシンは買うと思う)
手始めに仕事関係の本を2冊読み込ませてみました。読み込ませたのはこの2冊。
●jQuery入門―魔法のJavaScriptリファレンス&サンプル
●Webプロフェッショナルのための黄金則 XHTML+CSS虎の巻 (Web Designing BOOKS)
jQueryの方は1色、虎の巻は4色です。
適当にやってみた設定はだいたいこんな感じ。
・スーパーファイン
→エクセレントはスピードが遅く、ファイル容量も大きい。300dpiで十分だろう。
・(jQuery)グレー、(虎の巻)カラー
→白黒2値はいかにも汚い。
・用紙向きの自動判別
→オフ
・文字をくっきり
→オン
・白紙を削除
→オフ
いろいろなところで言い尽くされていますが、用紙向きの自動判別は元々向きの揃っている原稿では不要だし、白紙を削除してしまうとページ数を合わせるのが面倒になってしまう。
ざっとやってみた感じでは、まぁまぁ読める。リファレンス用として使うには十分事足りるけど、じっくり読む本だといまいちかな。設定はもうちょっと考える必要が有りそう。
いずれの本も元々文字の色が薄めなこともあるが、スキャンしたらそれが強調されてしまった感あり。
また、jQueryの本はコード部分の背景にグレーの地色が付いている部分があるが、地と本文のコントラストが低くなるため、読みやすさや認識に影響した。この辺は致し方ないところと思う。
補正でコントラストを上げれば読みやすくなると思う。
100%表示時は小さい文字(注記やキャプション)や図版(図版の中に入っている文字)などは読みづらいが、元々結構大きく取り込んでいるので拡大すれば問題ない。300%までならドットも目立たない。
またScanSnapOrganaizerでのOCR(文字認識)は、日本語本文はなかなか優秀。途中に入っている英数文字に誤認識が目立った。また、いずれの本もHTML、CSS、JavaScriptのコードが入っているが、この部分も正しく認識できていない部分が多かった。和文英文が混ざった文章は苦手なのかも。
なんかマイナス点ばかりになってしまったが、そんなに深く考えずにつっこんで、適当設定で読み込んだ割には満足いく結果であったことは確か。スピードは超速いし、机の上のスペースは空くし、かなりおすすめできると思った。
今回試した本は、素材としての条件は結構厳しかったのではないかと予想。グレーの地色に文字が載っているコラムなんかは、そりゃ普通のコピーでも難しいよね。
今度は文庫小説でもやってみることにします。紙に黒文字が印刷されているだけのものならもっと読みやすいものが作りやすいはずだ。きっと補正もしやすい。楽しみになってきた。
コメント