OCRの読取精度に囚われ過ぎず、業務プロセス全体の効率化を

RPAとの組み合わせによって、更なる業務自動化、効率化が期待されるOCR導入。しかし、読取精度のみに着目してOCRツールを選定した結果、思うように導入効果が出ないといった声やお問合せをいただきご支援させていただくことが弊社では増加しています。本コラムでは、RPA×OCRの導入で押さえておくべきポイントや導入プロジェクトの進め方をご紹介いたします。


――前提知識 ~OCRとは~

 OCRとはOptical Character Recognition(光学的文字認識)の略称で、文字の画像をコンピューターが利用できるデジタルの文字情報に変換する技術です。OCR技術自体は1914年に開発されたと言われており、日本でも古くから金融機関や公共機関を中心に利用されてきましたが、近年のRPAの普及とOCR技術の向上に伴い、RPAだけでは効率化しきれない紙業務の効率化を実現するツールとして、OCRが注目されています。

 OCRの基本ステップは、①紙媒体をスキャンして画像データ化し、②OCRツールにかけてCSVなどのテキストデータ化するという流れになります。これにより、活字や手書きなどの様々な帳票から、テキスト形式で文字情報を抽出して、後続の処理をRPAで自動化することが可能となります。

 

大量、正確、そして高速で処理が可能なOCR

 

――RPA×OCR導入によって期待される効果

 1点目としてデータ(テキスト)入力の短縮化が挙げられます。

これは、例えば複数ページある明細などの大量データを、OCRで文字情報としてテキストデータ化し、誤読の可能性がある箇所のみ人チェックにまわした後、データをRPAでシステムに入力します。本来であれば、紙あるいはPDFなどから人が目視によって文字を判断・確認し、1つ1つ手入力していかなければならない時間のかかる作業になります。業務時間外にOCRやRPAを実行しておくことも可能なため、人が作業する時間を大幅に短縮することが可能となります。

 2点目に期待される効果として、正確性の向上(誤入力の削減)があります。

 通常、人によるテキスト入力では業務時間や疲労の蓄積も関係して、打ち間違いや入力漏れなどの人為的ミスが起こりやすくなります。ダブルチェックを行う体制を整備したとしても、チェック漏れが発生したり、またその工程に費やす時間が別途発生したりと、効率的に業務を進めるにあたって障壁があります。しかし、OCRでは人が実際にテキスト入力する必要がないため、誤入力や誤変換を防ぎ、より正確なテキスト入力を実現します。

 

OCR精度に囚われ過ぎず、業務プロセスの効率化を重視

 

――OCR精度100%を求めない

 まず、大前提として、OCRの精度は理論上、100%になることはありえません。つまり完全な自動化は出来ないということになります。そのため、OCR精度に囚われ過ぎず、人の作業が介在する業務プロセス全体で如何に効率化するかが重要になります。 (OCR精度が5%上がってもROI (Return on Investment)は5%上がりません。)

 代表的なOCR×RPAのプロセスは下図の通りです。

  ①紙媒体の画像データ化

  ②帳票の分類

  ③文字情報の抽出

  ④人による誤読箇所の修正

  ⑤テキストデータ(CSVなど)の出力

  ⑥出力データ活用

 

 

これらの基本要素を踏まえ、OCRで業務プロセスを構築し業務を効率化する際の最大のポイントは、人の確認・修正をどのタイミングで入れるかです。

OCRの精度や最終的なデータ出力仕様等を踏まえ、全量チェックをすべきか、突合して最後に不一致データだけ確認するかなどを検討する必要があります。

 

 

 また、OCRツールの機能や特性によって、帳票をデータ化するスキャン作業の内容が異なったり、レイアウト定義の容易さやツール形態がオンプレミス型かクラウド型かなどの違いによっても、運用・保守の工数に大きく影響が出てきます。そのため、お客様の業務とリソースに合わせたツールの選定が導入成功の鍵となります。

 

 とはいえ、OCRの精度によって、誤読を人がチェックする”量”が変動するため、精度向上の取り組みは必要になります。

 

――OCR精度を高めるためのアプローチ方法

 

 まず、OCR精度は、基本的に、帳票から読み取る場所を探す”場所特定率”とOCRエンジンでデータ化する”文字認識率”の掛け算で求められます。例えば請求書の様にレイアウトパターンが各社ごとに異なると場所特定率は下がりますし、紙が汚れていたり、筆記体や汚い手書き文字だと文字認識率は下がることになります。

 帳票をレイアウトの観点で分類すると、下図のように定義することができ、場所が特定しやすい定形帳票の方が場所特定率が高くなる傾向があります。

 

 

 よって、OCR精度を向上させるためには、実際の帳票を分析し、パターン毎にアプローチしていく必要があります。多くのパターンの帳票を繰り返し分析・検証~チューニングし、原因別にアプローチしていくことが精度向上のKSF(Key Success Factor)になります。

 

――帳票以外の観点で、精度に影響を与えるポイント

実際にOCR導入をご検討されるお客様の業務では、契約書や発注書、請求書などユーザー企業ごとに帳票フォーマットが異なっているもの、手書きやFAXによるものなど様々存在します。非定型帳票であるほど、OCR精度は高くないということをお伝えしましたが、一方でOCRツールやデータを読み込むためのスキャナ自体の設定もOCR精度に大きく影響してきます。

 

 

 このように、OCR導入業務で使用されている帳票パターンや周辺機器を踏まえた上で、業務に合う適切なOCRエンジンを搭載したOCRツールを選定することが、精度を高めるために重要となります。

ページトップ