企業情報 > 技術開発への取り組み > テクニカルレポート > テクニカルレポート No.23 2014年 > 視覚情報処理モデルに基づいて改良した畳み込みニューラルネットワーク文字認識

視覚情報処理モデルに基づいて改良した畳み込みニューラルネットワーク文字認識

IT技術の進歩に伴い電子情報の処理速度は飛躍的に向上している。しかし、文字認識処理においては、人間のチェックが相対的に処理上のボトルネックとなっており、認識率の向上が望まれている。また、従来の文字認識手法において行われてきた人手による特徴量設計手法では、非常に手間がかかり、活字、手書き、多言語化のような認識対象字種の変更や追加が困難であった。そこで、畳み込みニューラルネットワーク(CNN; Convolutional Neural Network)と呼ばれる認識手法を用いて、特徴量設計を機械学習によって自動化した。さらに、CNNが基づいている脳の視覚野の処理モデルに立ち返り、従来型CNNでは利用が不十分であった位相不変性および交差方位抑制性と呼ばれる特徴を利用することで、認識率の向上を図った。評価実験の結果、ETL9Bにおいてトップ性能方式同等の99.51%の認識率、また、従来型CNNとの比較における認識率向上1.36%を得た。

執筆者

  • 関野 雅則
    研究技術開発本部 基盤技術研究所
  • 越 裕
    研究技術開発本部 基盤技術研究所
  • 木村 俊一
    研究技術開発本部 基盤技術研究所

DocuWork文書(.xdw)をご覧になるためには、DocuWorks Viewer Lightが必要になります。

DocuWorks Viewer Lightダウンロードページ

モバイル環境でご覧になる場合は、下記ページからダウンロードしてください。

  • 注記 App Storeは、Apple Inc.が運営するiPhone®、iPad™、iPod touch®向けアプリケーションソフトウェアのダウンロードを行えるサービスの名称です。

PDFをご覧になるためには、Adobe® Reader®が必要になります。

Adobe® Reader®ダウンロードページ