DocuWorks ワンポイントTIPS ―21.スキャンした表の文書をExcelに変換

文字認識結果のファイル出力

DocuWorksのOCR(文字認識)には、認識結果をMicrosoft® Excel®形式のファイルに出力する機能があります。紙でしか残っていない表の文書を再利用する際に、入力する手間を軽減することができます。

DocuWorks Desk上で文書を選択して[OCR(文字認識)]プラグインをクリックします。

DocuWorks Deskからプラグインをクリック

[OCR(文字認識)]のダイアログが出ます。
[設定]ボタンをクリックし、[OCRの詳細設定]ダイアログで[OCRの詳細設定]のボタンをクリックします。

OCRの設定

[OCRの詳細設定]ダイアログの[全般]タブが出ますので、[認識モード]を[認識率優先]とし、[原稿レイアウト]の構成を[表]にすると、再現性が高まります。

[ファイル出力]タブで、[認識結果をファイルとして出力する](出力形式:Excel)をチェックします。今まで開いたダイアログをそれぞれ[OK]していき、[開始]ボタンをクリックします。

OCRの詳細設定

Excel®ファイルが出力されます。

  • 注記文書の内容や構成、原稿の状態、スキャン時の解像度や品質によって、 OCR(文字認識)の認識結果の再現性は大きく異なります。 OCR(文字認識)の認識率は100%ではありません。確認、修正作業が必要です。

Excelに生成

もとのDocuWorks文書と、文字認識結果を出力したExcel®ファイル