ページ内移動用のリンクです
サイト内共通メニューへ移動します
ローカルメニューへ移動します
本文へ移動します

国/地域:

Scan翻訳技術

経済・文化両面でのグローバル化が進み、海外から発信される情報をいち早く収集したり、外国の方と円滑にコミュニケーションしたりすることの重要性が高まっています。
このようなニーズに応えるため、既にインターネット上では様々な言語を機械的に翻訳するサービスが提供され、活用されてきています。しかしながら、このようなサービスにも様々な課題が残っています。例えば、本や配布物など、印刷物になった情報は都度、キーボードから入力しなくてはならず、ユーザーにとって使いやすいものではありません。さらに、韓国語や中国語など読み方の難しい言語では、ユーザーは必ずしも読み方が分かるわけではなく、その入力は容易ではありません。また、外国の方にとっての日本語の文書についても同様です。
そこで、富士ゼロックスでは印刷物となった文章を、手軽に翻訳できるシステムの研究開発に取り組んでいます。

富士ゼロックスで開発中のサービスの使用イメージを図1に示します。まず、複合機のスキャナーに翻訳したい文書をセットします。次に翻訳したい言語を選び、スタートボタンを押すだけで、翻訳された文章が複合機のトレイにプリントアウトされます。

図1図1

このように、コピーするような手軽さで他の言語に翻訳された文書を手にすることができます。この方法では、翻訳する文書の文章を都度キーボードから入力する必要がないため、効率的に翻訳が可能です。さらに、複合機で文書を読み取るため、ユーザーが読み方の分からない言語や文字が含まれている場合でも、自動で翻訳することができます。

富士ゼロックスでは、単に文章の翻訳だけを目的とするのではなく、ドキュメントを用いて言語の壁を越えたコミュニケーションを可能とするにはどのようにすべきか、という点に重点を置いています。
開発中のサービスでは、母国語の異なる人同士が同じ文書を手にとって情報を共有することができれば非常に有用であると考え、原文に対して訳文をルビ文字のように配置することで両者を照らし合わせながら読むことができる『ルビ風翻訳』というスタイルを提案しています。この『ルビ風翻訳』は、原文と訳文を見比べる際に視線の移動量が少なくてすむという利点も兼ね備えています。
一方で、訳文だけをじっくりと読みたいという用途に対しては、文書中の原文を訳文でそっくり置き換える『置き換え翻訳』というスタイルも提案しており、利用者が好みに合わせて選択できます。どちらの翻訳スタイルでも文書中の図や写真が翻訳結果に再現されるため、ドキュメントの内容を把握しやすい点も特長です。

このような特長の実現には、富士ゼロックスで培われたスキャンした文書に対する画像処理技術が重要な役割を果たしています(図2)。
まず、スキャンされた文書は画像解析により、文章領域と写真や図などの絵柄領域、および表罫線領域に分離され、レイアウト情報が抽出されます。絵柄領域や表罫線は、レイアウト情報に基づいて背景画像として再現されます。一方、文章領域には文字認識(OCR, Optical Character Recognition)処理が施され、テキスト情報が抽出されます。抽出されたテキスト情報は翻訳処理により指定した言語に変換され、訳文としてレイアウト情報に基づき最適なフォントサイズや場所が計算されて背景画像上に配置されます。このような画像処理を中心とした技術の組み合わせにより、簡単な操作で指定した言語に翻訳された文書を作成することが可能となっています。

このページのトップへ