[How To] 自炊のススメ(3):スキャン編(上)

さて、自炊のススメということで書いてきた一連のエントリーシリーズも3回目になりました。
まだ未読の方は第1回、第2回も目を通していただけるとうれしいです。

(1)[How To] 自炊のススメ(1):裁断編(コミックス)

(2)[How To] 自炊のススメ(2):スキャナー選び編

第1回ではコミックスの裁断の仕方、そして第2回ではスキャナーの選び方を見てきました。
これで、スキャナーと裁断済みのコミックスがそろいましたので、いよいよ、実際にスキャンする作業に入ります。


簡単におさらいをしますが、コミックスはカバーをはずし、表紙の厚紙を剥いて、背表紙に当たる部分を裁断。これにより、カバーと表紙の厚紙は元の状態のまま、そして本体部分はばらばらの紙の状態になっています。
そして、私が使っているスキャナーはCanon DR-C125です。



ですので、今回のエントリーでの、具体的な設定方法や操作方法などについては、すべてこのスキャナーを使っての前提で書いていますのでご承知ください。

実際の説明に入る前に、まず自炊した本を電子書籍にした場合、どのようなファイル形式でデータを読むか、という大前提の判断が必要です。
ほとんどの場合は、(1)PDFファイル(2)JPGをZIPで圧縮した、俗に「CBZ」などと呼ばれるファイル、のいずれかと言うことになります。
メリット・デメリットとしては、
【PDFファイル】
[メリット]
  ・ページレイアウトが基本的には綺麗にそろえられている。
  ・単一ファイルなので後からの操作でページの順番がばらばらになってしまうことがない
  ・(スキャナにOCR機能がついていれば)文字情報をテキストデータとしてファイルに保持することができる。
[デメリット]
  ・ファイルサイズが大きくなってしまう。
  ・ファイル作成後の修正が困難。
  ・複数回に分割して読み込む場合、後から合体させることが(対応しているソフトがないと)できない。
【CBZファイル】
[メリット]
  ・JPGファイルなので、読み込み後に傾きを直すなどの修正が可能。
  ・ファイル名で順番が決まるので、ページの順番を入れ替えるのが容易
  ・ZIPファイルで圧縮しているJPG画像のため、ほとんどすべての端末で再生可能。(事前に解凍さえしてやればポータブルゲーム機などでも読める)
[デメリット]
  ・OCR非対応。
  ・ページの入れ替えや内容の修正が簡単なため、誤ってページの順番がめちゃくちゃになったり、ファイルを破損してしまったりする可能性がある。
といった具合でしょうか。
ですので、私は「文庫本や新書本といった、文字主体の書籍についてはPDFファイルにしてOCRでテキスト情報も埋め込み」「コミックスはCBZ」で、というスタンスで作業をしております。

文字主体の書籍についてPDF化する際の手順はまた後日ご紹介するとして、このエントリーではコミックスをCBZにする作業に特化して説明をします。


それでは、具体的な作業の説明に入ります。

私の場合、作業は大まかに以下のような流れに沿って行います。
1.書籍名がついたフォルダを作成。
2.カバーと表紙を、そのまま(前面と後面を1枚の画像として)全体をスキャン。1のフォルダ内に適当な名前を付けて保存。
3.2のカバーと表紙の画像から、前面部分を切り出して別ファイルとして保存。
4.本体部分を保存。
5.2のカバーと表紙の画像から、後面部分を切り出して別ファイルとして保存。
6.フォルダごとZIPファイルに圧縮。

これで、
カバー前→表紙前→本体→表紙後→カバー後 (最後に、前後を切り離す前のカバーと表紙が横長に2枚)
という構成になり、おおむね、実際の書籍を読むのと同じ順番で電子書籍として読むことができます。

それでは、実際に処理する際の設定などを見ながら、順を追って詳細に見ていきたいと思います。
(今回はコミックスをサンプルにしていますので、CBZ形式の電子書籍を作ります。PDF形式はまた別の機会に。)

1.書籍名がついたフォルダを作成。


これについては特に説明は不要かと思いますが、各々個人によって、フォルダ名で判別できるようにするための規則性を持たせるといいかと思います。
たとえば私の場合は、前回のエントリでサンプルとして使った大東京トイボックスの場合で見ると
  (コミック) [うめ] 大東京トイボックス09
というようなフォルダ名を作成しています。
規則としては
  (媒体種別) [著者名] タイトル巻数
となっています。
媒体種別は、コミックや雑誌、文庫など(もう少し細かく分けたいという人であれば青年誌とか青年コミック・少年コミックなどとしても)書籍の形態を入力。
著者名は、たとえば漫画の場合で原案と作画が分かれている場合などは「・」で分けて連盟にするなどします。
タイトルの後ろの巻数を入力する場合は、長くなることが分かっている作品であればできるだけ2ケタ以上を使って入力するとよいでしょう。後々タブレットなどに入れて読む際、2ケタで入力したおかなければ、ファイル名順で並べたとき、1巻の次に10巻が来ることになってしまうからです。

2.カバーと表紙を、そのまま(前面と後面を1枚の画像として)全体をスキャンして保存。


実際にスキャナをセットします。
文章で説明してもわかりにくいかもしれないので写真をご用意しました。
画像

この写真のように、カバーを伸ばした状態でスキャナーにセットし、スキャンするという事です。
この時、ポイントになるのが、スキャナー右側にある、下の写真のレバー。
画像

DR-C125は、このレバーを上下に切り替える事で、排紙を前面の下側に吐き出すようにするか、前面排紙パネルにたまるようにするかを切り替えできます。
しかし、表紙のように厚みがある場合は、うまく紙を丸めることが出来ず、紙詰まりを起こします。そのため、この段階では、レバーを下に下げ、前面下側から排紙するようにして実行します。

この時、もう1点注意が必要なのですが、実は、標準の設定でこれを実行しても、恐らくエラーになるはずです。
というのも、DC-C125には、紙の長さによって紙詰まりや重送が発生していることを検知する機能が備わっていて、A4用紙の縦より長い紙(356mm以上)をスキャンしようとすると、途中でエラーになります。
これを解消するために「長尺モード」という設定で動かすことになるのですが、私はここの設定で一度はまりました。

DC-R125を使うためのソフト「CaptureOnTouch」は、通常、画面右下にあるWindowsトレイの中にショートカットが設定されていて、スキャナの状態を自動的に監視したりしています。
画像

スキャン時の解像度など、標準的な設定についてはこのCaptureOnTouchというソフトを起動した後の設定画面で設定をするのですが、この長尺モードに切り替える際の設定は、実はこのソフト内では設定できません。
で、どこで設定をするのかというと、DR-C125のドライバやユーティリティをインストールした際に作製される「スタート」→「Canon DR-C125」フォルダの「Canon imageFORMULAユーティリティ」というソフトを使って設定します。
画像


このユーティリティソフトを起動すると、設定対象となるスキャナを選択するダイアログが出てくるので「DR-C125」を選択して「プロパティ」を開きましょう。
すると、ダイアログが表示されますので、次のように「メンテナンス」タブを選択してください。
画像

この中で「長尺モード(1000mm)」または「長尺モード(3000mm)」を選んでください。
これにより、1メートルまたは3メートルの長さの紙まで、一気にスキャンすることが出来ます。
基本的には1000mmで充分だと思います。
これを選ぶことによる弊害としては、紙が詰まってしまったことを検知する際、長い時間がかかってしまうという事ですが、前回のエントリで説明したように、ボンドをしっかりとばらしておいて、紙と紙がくっついていない状態にさえしたおけば、重送して紙詰まりが起こることはほとんどないため、それほど大きな問題にはならないはずです。
私はほとんど常時1000mmのモードで動かしています。

この長尺モードでスキャンすれば、
画像

このように、縦に長いカバーなどもそのままスキャンすることが出来ます。

さらに、ここでもう一工夫して、作業効率をアップさせます。
画像を回転させること自体はスキャンした後で手動でも可能なのですが、複数読み取った画像に対して操作する場合には1枚1枚指定する必要が出てきてしまいます。
また、A4サイズでは使えないテクニックになりますが、スキャナは縦方向にスキャンしていくため、本をスキャンする際、横にセットした方が読み込む幅が短くて済むため短時間でスキャンできます。
ですので、私の場合、漫画は常に横向きでスキャンするようにし、自動的に90度補正をかけるようにしています。

これらの設定は、先ほど説明したCaptureOnTouchの設定画面で行います。
まずはCaptureOnTouchを起動後、「スキャナの設定」ボタンをクリックすると、画面下に設定項目が表示されます。
この時、画面上にある設定項目で簡単に設定しても良いのですが、画面最下部にある「詳細設定ダイアログボックスを使う」をONにすることでより詳細にスキャナの動きを設定できます。
画像

画像が当初意図した物とは違うものを誤って貼り付けていましたので修正しました。1年以上も間違った状態で貼り付けていた…はずかしぃ… 2014/3/30
詳細設定ダイアログボックスを使うをONにすると、右側の歯車のアイコンボタンがクリックできるようになりますので、クリックしてください。

すると、ダイアログが表示されます。
ダイアログには「基本」「明るさ」「画像処理」「搬送」「その他」の5つのタブがありますが、この中で確認が必要な項目についてみていきます。
まず、「基本」では、
画像


まずは「カラーモード」です。
私の場合、古い漫画作品をスキャンした時、日焼けしているページをグレイスケールでスキャンすると、日焼けがほとんど目立たなくなり、まっさらな新品の書籍ページのような状態で読むことが出来るようになるという事もあり、通常「自動で検知する」にしています。
これにより、カラーページはカラーで、モノクロページはモノクロでスキャンしてくれます。
ちなみに、日焼けがひどい本をカラーでスキャンした場合とグレイスケールにした場合はこんな感じになります。
画像
画像
「神戸在住」(ℂ木村紺/講談社)より


但し、あまりにも色やけがひどい場合には、紙の焼けている色自体がカラーと判定されてしまい、白黒ページをカラーページとしてスキャンしてしまう事があります。
この場合は、先ほどの「自動で検知する」の下にある「設定」ボタンをクリックして、色彩や色の大きさなどを調整することで、白黒と判定されやすくすることで、色やけがひどい本でもグレイスケールでスキャンできます。
もし、どうしてもカラーの色や消した状態でスキャンされてしまう場合は、仕方がないので「自動で検知する」のセレクトボタンをクリックして「256階調グレー」を選びましょう。
「白黒」を選ばないように注意してください。白黒は黒いインクでハンコを押したような状態になり、灰色の状態を持たない画像になってしまいます。

次に「用紙サイズ」は「原稿のサイズに合わせる」で問題ありません。

「解像度」ですが、こちらはおおむね150dpiが実寸といわれます。
しかし、実寸と同じサイズで表示していては、どうしてもスキャンの際に粗さが目立ってしまうため、高解像度ディスプレイで画像を表示させると文字がつぶれて読めなくなってしまいます。
一方で、画像解像度を上げると画像のファイルサイズがそれに比例して大きくなりますし、何より、スキャンそのものに係る時間もかなり長くなってきます。
私の場合は、一番よくスキャンする一般的な青年コミックスのサイズの書籍の場合は「200dpi」を選び、文字や絵が細かいコミックスや、もともと版型が小さい少年漫画を、iPadなど大きな画面のディスプレイで拡大して表示させたいという場合には「300dpi」に解像度を上げてスキャンするようにしています。
大体、一般的な青年コミックスで、200dpiで1000*1430(1ページ当たり350Kb程度)前後、300dpiで1500*2160前後(1ページ当たり500Kb程度)になります。
大は小を兼ねるといいますが、塵も積もれば山となるとも言います。
ディスク領域との兼ね合いなどもありますので、お好きなサイズをご指定ください。

基本の最後は「読み取り面」ですが、私はこれは「白紙をスキップ」にしています。
タブレットなどで読む際は基本的に片面ずつ読んでいるためですが、もし、見開きで表示するソフトを使って読むのであれば、これは「両面」を選んでおいた方がいいかもしれません。
なぜなら、途中に白紙ページ(このソフトでいう白紙とは、画面全体が1色で塗られているページ、という事になるため、何も描かれていない真っ黒なページがあっても「白紙」とみなされ、無視されることになります)が入っていた場合、ページの見開きの組がおかしくなるため、ずれが生じることになります。
片面ずつ読むのが中心になるのであれば、ファイル容量の節約にもなりますので、スキップを選んでおくとよいでしょう。

以上で「基本」タブの説明は終わりです。

次に「明るさ」タブはほとんどの場合標準のままで問題ないはずですので、「画像処理」タブへと進みます。
画像

ここでは一番下の「裏写り/地色除去」に注目です。

この項目は、漫画雑誌のように、紙自体に色がついていたり、または紙をスキャンした際、裏側に描かれている分が一緒に写ってしまうような場合に、それを自動的に除去してくれる機能です。
一般的な漫画の単行本であればチェックする必要はありませんが、漫画雑誌をスキャンする際にはチェックするようにしましょう。

また、漫画の場合、スクリーントーンが張られた部分などをスキャンする際に、「モアレ」という細かい模様をスキャンした際に生じる変色が見られることがあります。
実際にスキャンをしてみて、もしこれが気になるようなら「もあれ除去」も「なし」から「高画質モアレ除去」を選びましょう。
但し、モアレ除去をすると、スキャンスピードがかなり遅くなります。
よっぽど影響が大きい場合を除き、モアレ除去はなしにしておいた方がいいかと思います。

次の「搬送」です。
画像

ここは基本的には標準で良いのですが、画像のように「超音波で検知」にチェックを入れておきます。
これは、DR-C125の選定をする際の特長にも書いた、超音波で重送を検知する機能を使う、という事で、これを使う事で、たとえば、糊付けされたページを1度にスキャンした場合などにも、しっかりと重送を検知することが出来ます。

但し、表紙などをスキャンする際、表紙と一番最初のページを、強度を持たせるために糊付けされている場合などは、ここにチェックが入っていると、重送としてエラー判定されてしまいます。
この場合は、紙を破って1枚にするか、またはここのチェックを外して、あえて重送してもエラー検地をしないようにしましょう。

最後に「その他」です。
画像

ここで重要なのは「画像回転」です。

先ほども説明したとおり、本をスキャンする際は横にしてスキャンした方がスキャンする幅が短いため作業効率が上がります。
しかし、この場合、当然ながら横倒しの画像としてスキャンされてしまうため、これを自動的に90度回転させてもとに戻すわけです。
漫画本のように左開きの本の場合は「90度右回転」を、右開きの本の場合は「90度左回転」を選びましょう。
これは、スキャナに紙をセットした際、スキャナの下側にそろえる方を、自分が裁断したのとは逆側(始めから開けている側)をセットするようにするためです。


以上で本をスキャンするときの基本的な設定は終了です。
何度か本をスキャンしてみて、自分なりの設定を見つけると、毎回本をスキャンするたびに設定を切り替えていてはかなり面倒です。
左側の「登録」ボタンを押すことで、今、選択している設定内容に、名前を付けて保存することが出来るので、自分なりの名前を付けて保存しておきましょう。


これで、スキャンを実行すれば、カバーと表紙の長い画像を読み取ることが出来たはずです。
画像

この後、そのまま本体をスキャンを続けてもいいのですが、私の場合はカバーの表面と表表紙だけを切り抜いて保存するため、この2枚の画像だけで一度保存をします。

「次へ進む」ボタンをクリックして、保存画面に進みましょう。
画像

まず一番上の「ファイル名」の右側の歯車アイコンをクリックすると次のダイアログが表示されます。
画像

ファイル名を設定するダイアログですが、「ファイル名の文字列」には、任意の適当な文字列を設定します。
その下の「日付を付加する」はOFFに、「ファイルに連番をつける」をONにすることで、
 ファイル名_0001.jpg
などという一連のファイルとして画像を保存することが出来るようになっています。
複数ファイルを保存する場合は、連番をつけるをONにしておくことで、自動的に順番通りに番号が割り振られていきます。
もし、すべてのファイルを1つにまとめたPDFファイルとして保存したい場合には、連番はOFFにしておきます。
「ファイル名」という枠にサンプル名が表示されるため、内容を確認し、問題がなければOKをクリックします。

もとの画面に戻ったら次に、ファイル形式で、複数の画像ファイル形式で保存したければ「JPG」を、全体をまとめた1つのファイルとして保存したいのであればPDFを選びましょう。

最後に「保存場所」のセレクトボタンをクリックして、一番初めに作成しておいた、書籍名を付けたフォルダを指定します。

内容がすべて完了すれば「保存する」ボタンをクリックすれば、カバーと表紙の2枚の画像が保存されたことを確認しましょう。

かなり長くなってしまいましたので、今回のエントリーはこの辺で。
続きはまた次回、説明いたします。



amazon.co.jpで買う
Amazonアソシエイト by 「自炊」のすすめ 電子書籍「自炊」完全マニュアル の詳しい情報を見る / ウェブリブログ商品ポータル

この記事へのコメント

この記事へのトラックバック

  • [How To] 自炊の小技(2):モアレ

    Excerpt: シリーズで書くと言っておきながら、前回のネタからだいぶ間が開いてしまいました。というか、もう半年以上経ってる?! 自分で今振り返って、どんだけ放置していたんだと、驚きました…。orz Weblog: ヤメ記者SEの徒然なるままに… racked: 2014-04-05 00:46

テーマ別記事