ペパレス > コラムTOP > 電子書籍は「読む」だけじゃない?その他の活用方法
「電子書籍」と言えば、大半の方は「読む」ものとして捉えます。
しかし、電子書籍として販売されているということは、見る角度を変えると人々に「提供するもの」となります。
つまり、本や書類の電子化は自分自身で読むだけでなく、著作権の問題等をクリアすれば商業用として扱うこともできます。
個人から出版社などの業者まで「電子化」というシステムを活用する方法はそれぞれありますが、今回のコラムではその中から基本的な2つの例を紹介します。
電子書籍が身近になったのは、スマートフォンやタブレット端末の普及で気軽に購入、試し読みができるようになったことが大きな要因です。
今では懐かしい漫画が電子書籍として改めて販売されるケースも増えています。
勿論作品を無断でスキャン代行業者に電子化してもらう、Web上に公開することは違法となりますが、出版社や著者など権利を所有している方の許諾を得たうえで行うのであれば問題ありません。
※スキャンできない書籍についてはこちら。
スキャナーの扱いに慣れていない場合は電子化に大変時間がかかりますし、画像に裏写りや縦線のノイズが入ることもあるので、スキャンは代行業者にお任せした方が良いでしょう。
漫画は余白も少ないので、裁断時に内側に描かれた絵や文字を切り落としてしまう可能性もあります。
ペパレスのスキャンサービスでは古くなった本にありがちな日焼けによる黄ばみを除去したり、挿入されているカラーページだけ補正値を変更したりするなど、コミック本も丁寧に電子化しています。
こちらが弊社での最大の補正レベルで古書の1ページをスキャンしたものです。
補正をかけすぎることで薄い色まで消えてしまう可能性もありますが、変色した紙もここまで補正することが可能です。
原則として市販本のスキャン代行は現在行っておりませんが、正式に許諾されたものであれば承りますので、商業用の電子書籍を紙媒体から作成する場合は是非ご検討ください。
弊社では標準の納品形式がPDFファイルとなっていますが、Webでの公開や画像の編集を行いたい方向けにJPEGファイルでの納品も選択できるようになっています。
また、ご自身で描かれた漫画やイラスト集などを電子化して活用することもできます。
少し前までイベントやインターネットで製本された作品を販売するのが主流でしたが、今では電子書籍としての販売や試し読みも当たり前となりました。
電子化することで過去の作品をデジタルデータとして残せるだけでなく、改めてWeb・アプリで公開したり販売したりすることも可能となります。
電子書籍化されていない作品は数えきれないほどあります。
時間と共に埋もれてしまった作品が、電子書籍として新しい読者の目に触れるのは素晴らしいことです。
もしそのような機会に立ち会えたならば、過去の作品を新しい形で販売してみてはいかがでしょうか。
昭和前期の作品や絶版本など、紙媒体でしか残っていない書籍は多数存在します。
出版社が過去に出版して管理しているものもあれば、著者の方が個人で出版して原本のみが手元にあるというケースもあるかと思います。
そのような本を「再出版」するのも、電子化システムの活用方法の1つです。
原本の文章を全て手作業で文字起こしするのは大変な時間と労力がかかりますが、スキャンして画像データにすることで、そのような手間を大幅に省くことが出来ます。
作成した電子書籍を元に、OCR認識で書かれている文章をテキストデータとして抽出します。
そうすることで紙媒体からテキストファイル、Wordファイルを作成し、改めて出版することが可能となります。
紙媒体でしか残っていないのであれば貴重な本と想定されますので、本の背を切り落とさない「裁断なしスキャン」ならば安心して電子化できるかと思います。
ペパレスにはスキャンデータからOCR処理を行うサービスもありますが、精度や用途別に5つのレベルがあり、このような目的をお持ちの方には「レベル3」以上のOCRサービスを推奨しています。
「OCR・テキスト化」ページのレベル3「手修正テキスト化作業」の概要には
・紙媒体しか残っていない本を再出版する為に、再テキスト化したい方
・各種目的・出版社様向け
と記載しています。
OCRソフトも完璧ではないので、機械任せの自動認識では誤認識も少なくなく、更に余分なヘッダー部分やページ番号まで認識してしまいます。
レベル3では原本の文章とOCR認識したテキストデータを並べて比較し、一文字ずつチェックして修正を行うので、料金は高くなりますが精度の高いテキストデータを作成することができます。
このサンプル画像では「す」を「寸」と誤認識しているので、このようなミスを手修正するのがレベル3のOCRサービスとなります。
更に精度の高いテキストデータの納品を希望される方に向けて、手修正したデータを別の担当者が再度チェックするレベル4のOCRサービスも用意しています。
ただし注意点として、手書きの文字をOCR認識することはできません。
また、旧字体は可能な限りそのままの状態で入力しますが、ソフトで変換できない文字は新字体、平仮名に置き換えます。
弊社では漢字での表記が不可能な場合、後から検索しやすくするため「●」に置き換え、そのうえで( )内に読み仮名を入力することをルールとしています。
原本が古くぼろぼろで変色も酷い場合はスキャン料金が割増になりますが、そのような古書のスキャンを行えるスキャン代行業者は恐らく少数派です。
旧字体が使われているような古書を再出版、文章の引用を行いたい場合、よろしければ弊社にご相談ください。
なお、OCRサービスはサンプルページをメールに添付していただければ、それを元に無料でお見積りを行い、サンプルデータをメールにてお送りいたします。
この度のコラムでは、電子書籍の活用方法の2つの例を紹介しました。
どちらかと言えば個人よりも出版社などの業者向けの内容となりましたが、電子書籍は読むだけでなく、自分にはこんな使い方もできるかもしれない!と思っていただける方が少しでも増えれば幸いです。
弊社はトップページにも記載している通り業務仕様の電子化サービスで、大学・学会・学術機関・出版社様のご利用が通算150機関を超えています。
書籍やコミック本の電子化、テキスト化をご検討の方は、ホームページのサービス概要を是非一度ご覧ください。
電子書籍は「読む」だけじゃない?その他の活用方法
「電子書籍」と言えば、大半の方は「読む」ものとして捉えます。
しかし、電子書籍として販売されているということは、見る角度を変えると人々に「提供するもの」となります。
つまり、本や書類の電子化は自分自身で読むだけでなく、著作権の問題等をクリアすれば商業用として扱うこともできます。
個人から出版社などの業者まで「電子化」というシステムを活用する方法はそれぞれありますが、今回のコラムではその中から基本的な2つの例を紹介します。
①漫画を電子書籍として公開・販売
電子書籍が身近になったのは、スマートフォンやタブレット端末の普及で気軽に購入、試し読みができるようになったことが大きな要因です。
今では懐かしい漫画が電子書籍として改めて販売されるケースも増えています。
勿論作品を無断でスキャン代行業者に電子化してもらう、Web上に公開することは違法となりますが、出版社や著者など権利を所有している方の許諾を得たうえで行うのであれば問題ありません。
※スキャンできない書籍についてはこちら。
スキャナーの扱いに慣れていない場合は電子化に大変時間がかかりますし、画像に裏写りや縦線のノイズが入ることもあるので、スキャンは代行業者にお任せした方が良いでしょう。
漫画は余白も少ないので、裁断時に内側に描かれた絵や文字を切り落としてしまう可能性もあります。
ペパレスのスキャンサービスでは古くなった本にありがちな日焼けによる黄ばみを除去したり、挿入されているカラーページだけ補正値を変更したりするなど、コミック本も丁寧に電子化しています。
こちらが弊社での最大の補正レベルで古書の1ページをスキャンしたものです。
補正をかけすぎることで薄い色まで消えてしまう可能性もありますが、変色した紙もここまで補正することが可能です。
原則として市販本のスキャン代行は現在行っておりませんが、正式に許諾されたものであれば承りますので、商業用の電子書籍を紙媒体から作成する場合は是非ご検討ください。
弊社では標準の納品形式がPDFファイルとなっていますが、Webでの公開や画像の編集を行いたい方向けにJPEGファイルでの納品も選択できるようになっています。
また、ご自身で描かれた漫画やイラスト集などを電子化して活用することもできます。
少し前までイベントやインターネットで製本された作品を販売するのが主流でしたが、今では電子書籍としての販売や試し読みも当たり前となりました。
電子化することで過去の作品をデジタルデータとして残せるだけでなく、改めてWeb・アプリで公開したり販売したりすることも可能となります。
電子書籍化されていない作品は数えきれないほどあります。
時間と共に埋もれてしまった作品が、電子書籍として新しい読者の目に触れるのは素晴らしいことです。
もしそのような機会に立ち会えたならば、過去の作品を新しい形で販売してみてはいかがでしょうか。
②デジタルデータのない本を再出版
昭和前期の作品や絶版本など、紙媒体でしか残っていない書籍は多数存在します。
出版社が過去に出版して管理しているものもあれば、著者の方が個人で出版して原本のみが手元にあるというケースもあるかと思います。
そのような本を「再出版」するのも、電子化システムの活用方法の1つです。
原本の文章を全て手作業で文字起こしするのは大変な時間と労力がかかりますが、スキャンして画像データにすることで、そのような手間を大幅に省くことが出来ます。
作成した電子書籍を元に、OCR認識で書かれている文章をテキストデータとして抽出します。
そうすることで紙媒体からテキストファイル、Wordファイルを作成し、改めて出版することが可能となります。
紙媒体でしか残っていないのであれば貴重な本と想定されますので、本の背を切り落とさない「裁断なしスキャン」ならば安心して電子化できるかと思います。
ペパレスにはスキャンデータからOCR処理を行うサービスもありますが、精度や用途別に5つのレベルがあり、このような目的をお持ちの方には「レベル3」以上のOCRサービスを推奨しています。
「OCR・テキスト化」ページのレベル3「手修正テキスト化作業」の概要には
・紙媒体しか残っていない本を再出版する為に、再テキスト化したい方
・各種目的・出版社様向け
と記載しています。
OCRソフトも完璧ではないので、機械任せの自動認識では誤認識も少なくなく、更に余分なヘッダー部分やページ番号まで認識してしまいます。
レベル3では原本の文章とOCR認識したテキストデータを並べて比較し、一文字ずつチェックして修正を行うので、料金は高くなりますが精度の高いテキストデータを作成することができます。
このサンプル画像では「す」を「寸」と誤認識しているので、このようなミスを手修正するのがレベル3のOCRサービスとなります。
更に精度の高いテキストデータの納品を希望される方に向けて、手修正したデータを別の担当者が再度チェックするレベル4のOCRサービスも用意しています。
ただし注意点として、手書きの文字をOCR認識することはできません。
また、旧字体は可能な限りそのままの状態で入力しますが、ソフトで変換できない文字は新字体、平仮名に置き換えます。
弊社では漢字での表記が不可能な場合、後から検索しやすくするため「●」に置き換え、そのうえで( )内に読み仮名を入力することをルールとしています。
原本が古くぼろぼろで変色も酷い場合はスキャン料金が割増になりますが、そのような古書のスキャンを行えるスキャン代行業者は恐らく少数派です。
旧字体が使われているような古書を再出版、文章の引用を行いたい場合、よろしければ弊社にご相談ください。
なお、OCRサービスはサンプルページをメールに添付していただければ、それを元に無料でお見積りを行い、サンプルデータをメールにてお送りいたします。
この度のコラムでは、電子書籍の活用方法の2つの例を紹介しました。
どちらかと言えば個人よりも出版社などの業者向けの内容となりましたが、電子書籍は読むだけでなく、自分にはこんな使い方もできるかもしれない!と思っていただける方が少しでも増えれば幸いです。
弊社はトップページにも記載している通り業務仕様の電子化サービスで、大学・学会・学術機関・出版社様のご利用が通算150機関を超えています。
書籍やコミック本の電子化、テキスト化をご検討の方は、ホームページのサービス概要を是非一度ご覧ください。