ページ内移動用のリンクです
サイト内共通メニューへ移動します
ローカルメニューへ移動します
本文へ移動します

Automatic Document Genre Identification For Faceted Document Browsing And Searching

Francine Chen FX Palo Alto Laboratory, Inc
Andreas Girgensohn 同上
Lynn Wilcox 同上

企業内の大規模なリポジトリー中のドキュメントを閲覧し検索する手法が大きな課題になってきている。インターネットの検索結果にユーザーはほぼ満足している一方で、企業内におけるドキュメント検索にはデータタイプやユーザーの検索要求の違いのためにまだ改善の余地がある。我々は、企業内のリポジトリーの階層構造を保持したまま、文書ジャンルという新しい属性を含むファセットにより文書を閲覧・検索が可能なシステムを提案する。まず、電子文書・スキャン画像内の必要な情報の検索支援のため、文書の画像特徴から、技術文書、プレゼン資料、表、写真等の文書ジャンルを自動的に検出するソフトウェアを開発した。次に、選択されたファセットと検索条件にマッチした文書だけを表示するように文書とディレクトリーをフィルターし、可能性の高いディレクトリーを強調表示する。これらにより、ファイルの拡張子にかかわらずに、プレゼンテーションスライドだけを閲覧・検索すること等が可能となる。さらに、サムネールと自動的に抽出されたキーフレーズが必要な文書の選択を支援する。

XDW(DocuWorks)形式の文書をご覧になるには、DocuWorks Viewer Lightが必要になります。
DocuWorks Viewer LightDocuWorks ダウンロードページ

PDFをご覧になるためには、Adobe® Reader®が必要になります。
Get ADOBE® READER®Adobe® Reader®ダウンロードページ  [外部サイト]

目次へ戻る

このページのトップへ