PDF化(スキャニング・OCR処理)
『解体の出来ない本・古書にも対応します』
希少な本で解体が出来ない原稿のPDF作成もお受けいたします。
ただし解体してADFで流す作業に比べ、手で一枚ずつスキャンしますので時間もコストもかかってしまいますがあらかじめご了承下さい。(大量データの場合は他の方法にて対応いたします)
また当然ながら作業をお受けできるのは著作権に問題がないことを確認させていただいてからになります。
スキャニングにあたり本の解体やその再製本もお受けできますのでお問合せ下さい。
『透明テキストの付与』
作成したPDFにOCR処理でのテキストや手入力からのテキストデータの付与もいたします。
代表的な作業の依頼としては
①PDF+OCRかけっぱなしテキスト付与
②PDF+OCRテキスト抽出+校正入力テキスト付与
③PDF+手入力+校正
です。
※コストと納期は①<②<③
『OCR処理テキスト抽出の苦手なところ』
OCRでのテキスト抽出は、一定の条件さえあえば非常に効率の良い手法です。
ただし次のような条件下では著しく誤認識が増加します。
①原稿が新聞のような多段組
②画像や図表が多い原稿
③紙に色がついているもの
『文書内容からのキーワード付与も可能です』
ビジネス文書であれば、書類のタイトル・作成日付などが記載されているケースがほとんどだと思います。これらを弊社オペレーターが読解しPDFのファイル名として付与することが可能です。ファイル名がきちんと付与されたPDFがあれば、エクセルのハイパーリンク機能などを使って簡易的なデータベースとして運用することも容易です。
また文書内容からピックアップしたキーワードをPDFのプロパティに設定すればファイルの検索性を大幅に向上させることができます。
大量処理にとどまらずお客様の細かなご要望にお応えできるのも、ベテランオペレーターをそろえた弊社ならではの強みと言えます。