3.1 スキャン読み取り後に自動的にOCR処理を行う

スキャン取り込み時に、OCR(文字認識)処理を設定する方法を説明します。

紙文書をスキャンして作ったDocuWorks文書の文字列は、画像データの一部なので、そのままではテキストデータとして扱えません。
OCR(文字認識)処理とは、文字の画像データをテキストデータに変換することです。この処理を施すことによって、紙文書から作ったDocuWorks文書の文字がテキストデータに変換され、そのデータを編集や検索などに利用することができるようになります。

スキャン取り込みタブでOCR処理(文字認識)を設定する

OCR処理を、スキャン読み取り後に自動的に行うように設定することができます。

[図1]

(1) Deskメニューの[ファイル]→[DocuWorksの設定]を選択すると、[環境設定]ダイアログボックスが表示されます。[図1]

(2) [DocuWorks Deskの設定]内の[スキャン取り込み]タブを選択します。

(3) [スキャン文書の後処理]内にある[スキャン文書にOCR(文字認識)の処理をする]のチェックボックスにチェックを入れ〈OK〉をクリックします。

Memo

  • [スキャン取り込み]タブの[スキャン文書の後処理]では、[スキャン後にOCR(文字認識)の処理をする]のほかに、[読める方向に全ページを自動回転する]を選択することができます。この設定を行うとスキャンで取り込んだ文書の向きが横向きや逆向きになることなく、自動的に向きを補正して表示されます。