忍者ブログ

ニュースリリースのリリースコンテナ第一倉庫

ニュースサイトなど宛てに広く配信された、ニュースリリース(プレスリリース)、 開示情報、IPO企業情報の備忘録。 大手サイトが順次削除するリリースバックナンバーも、蓄積・無料公開していきます。 ※リリース文中の固有名詞は、発表社等の商標、登録商標です。 ※リリース文はニュースサイト等マスコミ向けに広く公開されたものですが、著作権は発表社に帰属しています。

2024'10.04.Fri
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

2007'04.11.Wed

富士通研究所、レイアウト定義不要な非定型帳票の認識技術を開発

業界初、レイアウト定義不要な非定型帳票の認識技術
~多様なレイアウトの帳票から、見出しやデータの論理構造を高精度に認識~


 株式会社富士通研究所(注1)は、見積書や納品書など多様なレイアウトの帳票から、確率推論技術を用いて高精度に見出しやデータの論理構造を認識する技術の開発に成功しました。今回開発した技術により、帳票データの入力業務コストを削減することが可能となります。帳票データの電子化を促進し、e-文書法や内部統制(注2)の支援に貢献します。

■ 開発の背景
 e-文書法や日本版SOX法(注3)により、帳票データの電子化の必要性が増大しています。納品書や見積書のように、さまざまな取引先から送られてくる帳票は、氏名や金額といった項目の論理的な構造は似ていても、それぞれレイアウトや見出し表記が異なっています(非定型帳票)。これら非定型帳票に対しては、定型帳票のようにあらかじめレイアウトを定義してからOCR(文字認識技術)を適用することはできず、一枚ずつ人がデータを手作業で入力するため、膨大なコストがかかっていました。そこで、見出しやデータをレイアウト定義なしで、論理的な構造を認識できる技術が必要となってきました。

 図1: 多様なレイアウトの帳票からのデータ入力業務(従来) 【関連資料 参照】

■ 課題
 従来、非定型帳票内の項目やデータの論理的な構造を認識する技術として、あらかじめ見出し辞書に登録してある「帳票番号」のような文字列をまず帳票中から認識し、次に、その見出しの位置から一定の範囲内文字列を帳票番号のデータと認識していました。しかし、この方式では、次のような問題点がありました。

1. 見出しとデータとを登録された位置関係から探索するため、さまざまなレイアウトの帳票への対応が困難。
2. 見出しが認識できないとデータも正しく認識できないため、複雑な階層の見出しや、見出しの抜けがある帳票では、データ認識が正しく行われない。

■ 開発した技術
 今回、確率推論を用いた、帳票の論理構造認識技術を新たに開発しました。まず、見積書や申込書などの帳票の種類に応じて、各論理要素(見出しやデータ)に対応する文字列の特徴と、論理要素間の関係を定義した論理構造パターンを知識として用意します。論理構造パターンは、見積書や請求書など帳票の種類ごとに用意すれば良く、従来と違って各帳票別のレイアウト定義は不要です。

 論理構造パターンにおいて論理要素間の関係を確率ネットワークとして表現し、そのネットワーク上で確率を伝搬させることで、各論理要素に対応する最も確からしい文字列を認識します。これにより、以下が可能になりました。(図2。特許出願済み)

1. 位置関係の登録が不要となり、多様なレイアウトに対応可能。
2. 確からしさの伝搬によって文字認識誤りを類推したり、省略された論理要素を検出したりすることによって、階層的な見出しを持つ複雑な帳票でも安定した認識が可能。

 図2: 本方式の特徴 【関連資料 参照】

■ 効果
 本技術を当社指定の評価文書(20文書)に適用し、論理構造認識率(論理要素に対する文字列の対応付け正答率)91.7パーセントを達成しました。

 また、従来手入力で行っていた非定型帳票からのデータ入力作業コストは、約60パーセント削減(コストモデルに基づく試算による)できます。たとえば、これまで5日かかっていたデータ入力作業を2日に短縮できます。さらに、本技術によりタグ付き検索のような新たな情報の利活用が可能になります。

■ 今後
 2007年度に、富士通株式会社のe-文書、内部統制関連ソリューションを支えるOCRソフト、スキャナ製品などへの搭載・提供を目指します。


以上


■ 注釈
(注1) 株式会社富士通研究所:
 代表取締役社長 村野和雄、本社 神奈川県川崎市。

(注2) 内部統制:
 事業経営の有効性・効率性を高め、企業の財務報告の信頼性を確保し、事業経営に関わる法規の遵守を促すことを目的として、企業内部に設けられて運用される仕組み。

(注3) 日本版SOX法:
 相次ぐ会計不祥事やコンプライアンスの欠如などを防止するため、米国のサーベンス・オクスリー法(SOX法)に倣って、会計監査制度の充実と企業の内部統制強化を求める日本の法規制のこと。具体的には、証券取引法の抜本改正である「金融商品取引法」がこれに該当。


■ 本件に関するお問い合わせ
株式会社富士通研究所 ITコア研究所 言語・メディア研究部
電話: 044-754-2678(直通)
E-mail: lm-pr@ml.labs.fujitsu.com

PR
Post your Comment
Name:
Title:
Mail:
URL:
Color:
Comment:
pass: emoji:Vodafone絵文字 i-mode絵文字 Ezweb絵文字
trackback
この記事のトラックバックURL:
[16816] [16815] [16814] [16813] [16812] [16811] [16810] [16809] [16808] [16807] [16806
«  BackHOME : Next »
広告
ブログ内検索
カウンター

忍者ブログ[PR]