PDF化(スキャニング・OCR処理)

『解体の出来ない本・古書にも対応します』

 希少な本で解体が出来ない原稿のPDF作成もお受けいたします。
ただし解体してADFで流す作業に比べ、手で一枚ずつスキャンしますので時間もコストもかかってしまいますがあらかじめご了承下さい。(大量データの場合は他の方法にて対応いたします)

 また当然ながら作業をお受けできるのは著作権に問題がないことを確認させていただいてからになります。

 スキャニングにあたり本の解体やその再製本もお受けできますのでお問合せ下さい。

『透明テキストの付与』

 作成したPDFにOCR処理でのテキストや手入力からのテキストデータの付与もいたします。
代表的な作業の依頼としては

①PDF+OCRかけっぱなしテキスト付与
②PDF+OCRテキスト抽出+校正入力テキスト付与
③PDF+手入力+校正

です。
※コストと納期は①<②<③

『OCR処理テキスト抽出の苦手なところ』

 OCRでのテキスト抽出は、一定の条件さえあえば非常に効率の良い手法です。
ただし次のような条件下では著しく 誤認識が増加します。

①原稿が新聞のような多段組
②画像や図表が多い原稿
③紙に色がついているもの