国/地域:
近年、ICTの進化に伴い、電子カルテに代表されるように様々な医療情報を電子情報の形で管理し、各種医療活動の効率化や最適化に活用する研究が盛んに行われています。
富士ゼロックスでは、従来から、大規模なドキュメント集合を対象にして、データ中に潜む項目間の相関関係や順序のパターンを探しだすマイニング技術(意味抽出技術)を研究しており、現在、本技術を医療情報に適用する研究を進めています。
我々が研究しているマイニング技術は、ドキュメント集合中に埋もれている共通の木構造パターンを抽出するものです。木構造パターンについて、入院患者に対する薬剤の処方の様子を時系列に並べた例で説明します。

図1:患者Aさんの薬剤投与の木構造

図2:患者Bさんの薬剤投与の木構造

図3:共通木構造パターン
図1は、患者Aさんに手術前日に薬剤(1)と薬剤(2)が処方され、手術当日に薬剤(3)が処方された様子を木構造で表現しています。同じく図2は、患者Bさんに手術前日に薬剤(1)が処方され、手術当日に薬剤(3)と薬剤(4)が処方された様子を木構造で表現しています。図1と図2から共通の木構造パターンを抽出したものが図3です。この方法を応用すると、例えば、特定の疾病に対する薬剤の処方のデータをマイニングし、治療成果と比較することで、効率的な薬剤の処方パターンを抽出できる可能性があります。このように、医療現場における薬剤の処方の様子や、検査や看護を含めた様々な医療行為を木構造にまとめ、共通のパターンを抽出して解析することで、質の高い医療活動の標準化や効率化、さらに複数の医療機関からのデータ収集による最適医療方法の検討等に活用されることが期待されています。
木構造のマイニングには、木構造で表現された大きなデータ群の中から、部分的に共通なパターン(部分木)を抽出する「サブツリーマイニング(sub-tree mining)」と呼ばれているものもあります。図4に示すように親子関係を厳密に保持するのではなく、途中のノードを省略した共通パターンも抽出できる技術(embedded sub-tree mining)も研究しています。

図4:Embedded Sub-tree Mining
富士ゼロックスでは、分析対象となる医療情報の特徴や解析目的に合わせた木構造抽出方法を開発すると同時に、サーバーへの負荷低減による解析速度の向上やメモリー使用量の削減を実現するアルゴリズムの研究に取り組んでいます。