国/地域:
紙文書をスキャンしてTIFFやJPEGなどのデジタル画像データに変換(デジタル化)することによって、紙資源の削減やワークフローの改善につなげることができます。ところが、FAX送信時の通信コスト削減、デジタル画像データの保存コスト削減、電子メール添付文書の容量制限など様々な理由から、多くの場合、低い解像度で紙文書がデジタル化されています。デジタル化時の解像度が低い場合、紙文書中の文字が元々持っていた情報が失われ、文字品質が低下するという問題が発生します。
そこで、富士ゼロックスは、紙文書中の文字が元々持っていた情報を復元して文字品質を向上させる、文字超解像技術を開発しました。文字超解像技術は、デジタル化によって低下した文字品質を、デジタル化前の紙文書中の文字品質まで向上させることを目指しています(図1)。
図1:文字超解像技術の目指す方向
文字超解像技術を用いることによって、文字品質を向上させ、綺麗で読みやすい文書を復元することができます。また、機械で文字認識を行った場合の認識精度の向上も期待できます。
複数の類似画像を用いて、デジタル化時に失われた情報(高い解像度の情報)を復元する処理を超解像と呼びます。一般には、動画の複数のフレーム(少しずつ異なる時刻に取得した画像)を類似画像とする超解像処理が行われます。しかし、文書では動画とは異なり、画像データが1枚のみしか存在していないことが多く、類似画像を複数枚得ることは困難でした。また、文書が複数枚あっても、各々の文書に異なる内容が記述されている場合、通常の超解像処理は不可能です。
図2:富士ゼロックスの文字超解像技術
ところが、文書内には同じ文字が何度も出現するという特徴があります。富士ゼロックスが開発した文字超解像技術は、この特徴を利用し、同じ文字を複数個集めて超解像処理を行うものです。図2に示すように、富士ゼロックスの文字超解像処理では、個々の文字を抜き出すことによって超解像処理を可能としています。文書の枚数が1枚だけの場合でも、複数回出現する文字に対しては超解像の効果を得ることができます。
図3:文字超解像処理の流れ
図3に文字超解像処理の流れを示します。まず、文字抽出処理において、入力画像データ内に存在している個々の文字を抽出します。次に、類似文字選択処理において、類似文字を選択します。ここでは、同じ文字だけを類似文字として選択し、異なる文字は選択しない技術が必要となります。例えば、同じ「あ」であっても、明朝とゴシックでは異なる文字として選択します。逆に、同じ形状であれば、異なる色であっても同じ文字として選択します。さらに、これら類似文字を用いて、文字ごとに超解像処理を行います。最後に、文字置換処理において、超解像処理処理前の文字データを処理後の文字データに置換して、出力画像データを生成します。