ページ内移動用のリンクです
サイト内共通メニューへ移動します
ローカルメニューへ移動します
本文へ移動します

国/地域:

シームレスドキュメントハンドリング技術(Seamless Document Handling)

移動体通信網の高速化、およびモバイル向け情報機器の高機能化により、オフィスの外で電子ドキュメントを扱う環境が整ってきました。しかし、携帯電話の画面は表示領域のサイズが狭く限られているため、ドキュメントの可読性が低くなることが問題でした。そこで富士ゼロックスでは、文書画像処理技術を利用する独自の解析処理を行うことにより、携帯電話のような小さな画面上における文書の可読性と操作性を改善するシームレスドキュメントハンドリング技術を開発しました。
A4サイズ(210mm×297mm)のビジネス文書を携帯電話で閲覧するためには、横・縦方向に頻繁なスクロール操作が必要です。本技術はイメージ化された文書を対象として、文書閲覧時のスクロール回数を低減することによる操作性の向上と、文書のレイアウト推定による可読性の向上が特徴です。
最初に文書画像処理技術を利用して、イメージ化された文書のレイアウト解析処理を行い、図1に示すとおり、文字、図/写真を個別のオブジェクトとして分離します。

図1:ビジネス文書を個別オブジェクトに分離
図1:ビジネス文書を個別オブジェクトに分離

次に、分離した各オブジェクトの座標情報、境界線、あるいは文字サイズなどのメタデータを抽出して、オブジェクト毎に個別の画像ファイルを出力します。最後に、抽出したメタデータを用いた探索アルゴリズムに従い、スクロール移動指示される方向(上下左右)に存在するオブジェクトの位置関係とスクロール量を推定します。探索アルゴリズムでは、横書き文書、または縦書き文書に応じて、オブジェクト毎の境界線へ上下左右の4段階で優先度を与えます。スクロール操作によって複数の境界線が検出される場合は、優先度が高く、かつ移動量を最小にする境界線を選定し、検出した境界線を画面端に合わせるようにスクロール量を算出します。

文書画像処理を用いて、イメージ化された文書から切り出された、一段落の文章を含む画像の部分領域(以下、画像領域)を、従来の一定量でのスクロール方式と本技術により算出した移動量でのスクロール方式によって閲覧する例を、各々図2、図3に示します。従来の一定量でのスクロール方式は、図2で示す通り、(1)~(4)の4画像領域間をスクロールし、各画像領域が含む文字列の一部が領域間で重複するため可読性が低下します。また、(2)、(4)は画面左右端に冗長な空白が表示されるため、スクロール操作による表示位置の補正が必要です。

図2:従来の文書スクロールと描画領域
図2:従来の文書スクロールと描画領域

一方、本技術により算出した移動量でスクロールする場合、図3中の画像領域(2)および(3)では一段落の文章を含む画像領域の左右の境界線を検出し、それぞれ画面の左端、右端に合うように移動量を算出することで、画面の左右端に冗長な空白が表示されないため可読性が向上します。また、画像領域の左右の空白を削除することで、閲覧時のスクロール回数が低減するため操作性が向上し、ドキュメント閲覧環境を改善することができます。

図3:シームレスドキュメントハンドリングによる文書スクロールと描画領域
図3:シームレスドキュメントハンドリングによる文書スクロールと描画領域

このページのトップへ