自動文字抽出ができない(宛先、作成日、管理番号、期日)

コンテンツID(3011

概要

[文字列の自動抽出]で[する(見積書)]または[する(請求書)]を選んだときに発生する事象について、その対処方法を説明します。

補足
  • OCRは100%の精度を保証するものではありません。対象の文字列を抽出できても、誤った文字として認識される場合があります。

宛先、作成日、管理番号、期日のすべての項目の文字が抽出されない

宛先の文字が抽出されない

次の条件をすべて満たす場合に、宛先の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。

  • OCR推奨条件を満たしている。
  • 「御中」「様」「殿」などシステムが宛先名と判断できるキーワードが、宛先名の直後にある。
  • 横書き文字である。
  • 日本語である。

宛先が想定外の文字列で抽出される

  • 「御中」「様」「殿」などシステムが宛先名と判断できるキーワードが、原稿内に複数ないか確認してください。
    複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。
  • 宛先名の長さが最大値を超えていないか確認してください。
    宛先名の最大長は64バイトです。最大長を超えた文字は切り捨てられます。

作成日の文字が抽出されない

次の条件をすべて満たす場合に、作成日の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。

  • OCR推奨条件を満たしている。
  • 横書き文字である。
  • 「作成日」「発行日付」などシステムが作成日と判断できるキーワードが、作成日の直前にある。
    または、「平成** 年** 月** 日」「**** 年** 月** 日」「****/**/**」 などシステムが作成日と判断できる形式になっている。
    補足
    • 文書種類の設定の[作成日]>[日付形式]は、抽出した作成日をフォルダー名やファイル名に利用する場合の日付形式です。読み取り形式を指定するものではありません。

作成日が想定外の日付で抽出される

  • 「作成日」「発行日付」などシステムが作成日と判断できるキーワードや、「平成**年**月**日」「****年**月**日」「****/**/**」などシステムが作成日と判断できる文字が、原稿内に複数ないか確認してください。
    複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。

管理番号の文字が抽出されない

次の条件をすべて満たす場合に、管理番号の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。

  • OCR推奨条件を満たしている。
  • 「見積書番号」「請求書番号」などシステムが管理番号と判断できるキーワード、または管理番号用に指定した項目名が、管理番号の直前にある。
    補足

管理番号が想定外の文字列で抽出される

  • 「見積書番号」「請求書番号」などシステムが管理番号と判断できるキーワードが、原稿内に複数ないか確認してください。
    複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。
  • 管理番号の長さが最大値を超えていないか確認してください。
    管理番号の最大長は20バイトです。最大長を超えた文字は切り捨てられます。

期日の文字が抽出されない

次の条件をすべて満たす場合に、期日の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。

  • OCR推奨条件を満たしている。
  • 「有効期限」「お支払い期限」などシステムが期日と判断できるキーワード、または期日用に指定した項目名が、期日の直前にある。
    補足

期日が想定外の文字列で抽出される

  • 「有効期限」「お支払い期限」などシステムが期日と判断できるキーワードが、原稿内に複数ないか確認してください。
    複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。
  • 期日の長さが最大値を超えていないか確認してください。
    期日の最大長は32バイトです。最大長を超えた文字は切り捨てられます。

手順

管理番号に任意の文字列を指定する

  1. CentreWare Internet Servicesを起動し、業務別らくらくスキャンの文書種類を設定します。
    このとき、検索キーワードにしたい文字列を[管理番号]>[項目名]に入力します。
    この例では「顧客コード」と入力しています。

    image
     
  2. 複合機で業務別らくらくスキャンを起動し、スキャンを実行します。

    image
     

    指定したキーワード(「顧客コード」)で検索された文字列が抽出されます。

    image
     
  3. 内容を確認し、[送信]を押します。

期日に任意の文字列を指定する

  1. CentreWare Internet Servicesを起動し、業務別らくらくスキャンの文書種類を設定します。
    このとき、検索キーワードにしたい文字列を[期日]>[項目名]に入力します。
    この例では「対象日」と入力しています。

    image
     
  2. 複合機で業務別らくらくスキャンを起動し、スキャンを実行します。

    image
     

    指定したキーワード(「対象日」)で検索された文字列が抽出されます。

    image
     
  3. 内容を確認し、[送信]を押します。

OCR推奨条件

項目 推奨条件
原稿 プリント出力した原本であること(ファクス出力、繰り返しコピーした原稿は不可)
書体 ゴシック体、明朝体
文字(活字) JIS 第一水準漢字、JIS 第二水準漢字(一部)、英字、数字、ひらがな、カタカナ、ギリシャ文字
文字サイズ 8 ~ 24 ポイント
補足
  • 次の文字は正しく抽出できない可能性があります。
    • 小さいサイズの文字
    • デザイン文字(行書体、ポップ体、毛筆体など)
    • 色が薄い文字
    • 白抜き文字
    • 罫線と接触している文字
    • 取り消し線が引かれている文字
    • 印鑑が押されている文字
    • 画質が劣化した文字(ファクス画像、コピー画像)
    • 傾いた文字
    • 縦長に変倍された文字

この情報によってお客様の問題や疑問は解決しましたか?

設問への回答