スキャン翻訳技術

経済・文化両面でのグローバル化が進み、海外から発信される情報をいち早く収集し、外国の方と円滑にコミュニケーションすることが求められています。このようなニーズに応えるため、既にインターネット上では様々な言語を機械的に翻訳するサービスが提供され、活用されています。しかし、本や配布物など、印刷物になった情報は、その都度キーボードで入力しなくてはならず、決して使いやすいサービスとは言えません。さらに、韓国語や中国語など読み方の難しい言語では、キーボードでの入力も容易ではありません。そこで、富士ゼロックスでは印刷物となった文章を、手軽に翻訳できるスキャン翻訳技術を開発しました。

図1に代表的な使用イメージを示します。まず、複合機のスキャナーに翻訳したい文書をセットします。次に、翻訳したい言語や利用したい翻訳辞書を選び、スタートボタンを押します。最後に翻訳完了を知らせるメールを確認してから、複合機でプリント指示するだけで、翻訳結果がプリントアウトされます。このように、複合機で文書を読み取るため、キーボードで入力する手間や時間がかからず効率的に翻訳することができます。さらに、読み方の分からない言語や文字が含まれている場合でも、自動で翻訳することができます。

図1:代表的な使用イメージ

富士ゼロックスでは、単に文章の翻訳だけを目的にするのではなく、ドキュメントを用いて言語の壁を越えたコミュニケーションを可能にするサービスの提供に重点を置いています。提供するサービスでは、母国語の異なる人同士が同じ文書を手にとって情報共有することが非常に有用であると考え、原文に対して訳文をルビ文字のように配置することで両者を照らし合わせながら読むことができる「ルビ風翻訳」を提案しています。この「ルビ風翻訳」は、原文と訳文を見比べる際に視線の移動量が少ないという利点も兼ね備えています。一方で、訳文だけをじっくりと読みたいという用途に対しては、文書中の原文を訳文でそっくり置き換える「置換え翻訳」、単語にだけ訳文をルビ文字のように配置する「単語訳」など、利用者の好みに合わせて選択できます。どの翻訳スタイルでも文書中の図や写真が翻訳結果に再現されるため、ドキュメントの内容を把握しやすい点も特長です。
なお、これらの翻訳機能は、紙文書だけでなく電子文書に対しても利用可能であり、かつ、翻訳結果は複合機からプリントアウトできるだけでなく、電子文書としてダウンロードすることも可能です(図2)。

図2:スキャン翻訳サービスの概要

このような特長の実現には、富士ゼロックスで培われた画像処理技術が重要な役割を果たしています(図3)。
まず、スキャンした文書(文書画像)に傾き補正等の前処理を施します。次に、画像解析処理によって文章領域と写真や図などの絵柄領域、および表けい線領域に分離し、レイアウト情報を抽出します。絵柄領域や表けい線は、レイアウト情報に基づいて背景画像として再現します。解析の結果、文章と判定された領域には、文字認識(OCR:Optical Character Recognition)処理を施し、テキスト情報を抽出します。抽出したテキスト情報は翻訳処理により指定した言語に変換し、訳文としてレイアウト情報に基づき最適なフォントサイズや場所を計算して背景画像上に配置します。

図3:スキャン文書に対する画像処理技術の概要

関連ソリューション