OCRツール選定のポイントとOCRの現状 ~10年後のOCRに何ができるのか~

はじめに

業務削減のツールとして2017年頃から爆発的に注目を集め、導入されてきたRPA。
RPAと連携し業務削減効果を高めることで注目を集めてきたOCR。

弊社では、RPAの黎明期からRPA、OCRの業務支援を行い、本サイトにてRPA、OCRに関するコラムを連載してきました。

RPAについては国内の多くの大企業が導入済みの状況であります。
一方、OCRについては導入に踏み切れていない企業も多くあります。
また、OCRを導入する際の注意点がわからないなどの声をよく聞きます。

そこで本コラムでは、OCRツール選定のポイントとOCRの現状について整理していきます。(個別のOCRツールの評価については記載しません。)
なお、OCRにまつわる基本知識については、過去のコラムを参考にしてください。

 

従来OCRとの違い

ツール選定ポイントの前に従来OCRと現在のOCRの違いを押さえておくことは重要です。第三次AIブームにおけるOCRを”現在”、それ以前を”従来”OCRとします。

代表的な違いは以下5点になります。

従来OCRは認識精度、ツールとしての機能に課題があり、またOCRを導入してもユーザーがOCR結果を全て確認する必要があったため、業務削減の効果がありませんでした。

現在のOCRは認識精度、ツールとしての機能が従来OCRよりも向上し、業務削減の効果が出るツールとして再注目されてきました。

従来OCRとの違い
文字認識精度の向上ディープラーニングを活用した学習機能や辞書機能などの補正処理により認識率が向上しました。
準定型、非定型帳票への対応従来OCRでは定型帳票しか読み取ることができませんでしたが、現在のOCRでは準定型、非定型帳票への対応が可能となり、多種多様な帳票にOCR活用できるようになりました。
画像処理の向上画像処理時にノイズ除去、斑点除去、回転、白黒反転、傾き補正などの高度な画像処理が可能となりました。
ワークフロー機能の向上業務内容に合わせてワークフローを細かく設定できるようになりました。またOCR結果の確認、修正も手軽に行えるようになりました。
他システムへの連携RPAやBPMツールなど他システムとの連携が可能となり、OCRの使用範囲が広がりました。

 

OCRツール選定時のポイント

前述の従来OCRとの違いを読むと世に出ているOCRツールは非常に優れているように聞こえます。

しかし、いかなる場合でも認識率100%となるOCRツールはまだ世になく、画像データをデジタル化する技術として完成されていないのが現状です。

また、ツールによりますが、緻密なチューニング作業が必要な場合もあります。さらに、ツール選定を誤ると業務削減ばかりか、OCR結果の確認作業に追われ、逆に業務を圧迫している場合すらあります。

このようなOCR導入の失敗を避けるため、ツール選定時には以下二点のポイントについて理解しておくことが重要になります。



 

選定ポイント①~OCRツールの得意とする機能を理解すること~

各OCRツールには得意とする機能があります。例えば、「手書きの認識精度に強みを持つ」、「多くの言語に対応している」など得意とする機能があるので、OCRツール選定時には、各OCRツールの得意領域、機能群を理解することが重要になります。

OCRツールの機能を理解せずに選定すると、ツール選定ミスに繋がります。

ここでは、OCRツール選定時に着目すべき機能について列挙します。ツール選定の際にどの機能を重要視して選定するか、参考にして下さい。

機能一覧一言コメント
帳票対応種類定型

定型については、どのOCRツールも対応しているので、ポイントは以下二点になります。

・準定型、非定型帳票の対応を必要とするか。

・帳票設定の難易度

ツールにより帳票設定方法の難易度が異なります。システム開発の経験が求められる高難度なツールもあります。

準定型
非定型
文字種類活字

活字読込が得意なツールと手書き読込が得意なツールがあるので、業務要件に応じて選定する必要があります。

手書き
項目特定座標軸

項目特定の方法により、帳票設定の難易度も変わってきます。ルールベースでは、帳票の構造を理解し、チューニングする必要があります。

ルールベース
ディープラーニング/機械学習
画像処理分類

OCRツールにより搭載された画像処理機能が異なるので、選定時に確認する必要があります。

ノイズ・斑点除去
回転
白黒反転
傾き補正
補正処理辞書

認識精度を向上させる役割を担います。システム開発経験者であれば、API/スクリプト実装を行うことで精度向上が可能です。

API/スクリプト
確認・修正

ユーザーがOCR結果を確認する場合は、ユーザービリティが重要になります。UI画面のカスタマイズやワークフローの設定などが可能なOCRツールもあります。操作性、ワークフローは業務プロセス全体で効率化していく上での重要な機能です。

入力・出力形式

OCR処理させる際の入力方法、出力方法を業務要件に応じて選定する必要があります。

システム連携

RPAやBPMツールと連携するなど各OCRツールにより様々ですので業務要件に応じて選定します。

多言語対応

OCRツールにより日本語のみなどの制限がある場合もあります。選定時に確認する必要があります。

 

 

選定ポイント②~事前検証の実施~

OCRツール選定時には、事前検証することが大事です。事前検証することでOCR導入する上での課題点を事前に確認します。課題点は業務要件により異なりますが、一般論として挙げられる項目を以下に列挙します。

1.業務適合性の確認

実業務で利用する書類を用いて、実際にOCRの処理を行い、業務適合性を確認します。確認点としては、以下が挙げられます。

・読取り精度

読取り精度が問題ないか確認します。読取り精度が低いと、OCR導入してもワークフローとしてユーザーの確認作業に時間を要し、業務効率に繋がらなくなります。

・処理速度

OCRの処理速度が問題ないか確認します。大量処理する業務の場合には重要になります。

・ワークフロー

OCRは業務プロセス全体として効率化を行う必要があります。業務要件を満たしたワークフローが設定可能かを見極める必要があります。

2.開発、運用保守の進め方

開発、運用保守の進め方を事前に確認しておく必要があります。

・開発、運用保守を誰が担うのか

帳票の設定の難易度が高いツールから容易に設定できるツール、環境構築が大変なツールなど様々です。開発ベンダーが担うのか、業務担当者が担うのか事前に方向性を定めた上でツール選定することを推奨します。業務要件により帳票の変更頻度が高い場合では、運用保守に工数を要します。

3.導入、運用のしやすさ

実導入する上で、以下の点を確認します。

・サポート体制

業務担当者が開発、運用保守を担う場合、OCRツールベンダーのサポート体制が重要になります。

・導入規模、費用

OCRツールにはサーバー型、クラウド型などツールにより稼働環境は様々です。サーバー型はイニシャルコストが高くランニングコストが安い、クラウド型はイニシャルコストが安くランニングコストが高い傾向にあります。全社レベルで導入するのか、部署レベルでの導入するのか導入規模をきちんと把握し、費用対効果を踏まえて導入する必要があります。

10年後のOCRに何ができるのか

ここまでOCRツール選定のポイントについて記載してきましたが、今後10年のOCRについて考察してみます。
今後10年のOCRの成長は以下、二点に集約されるのではないかと思っています。

①レイアウト認識精度の向上

OCRの認識には「文字認識」と「レイアウト認識」の2種類あります。文字認識については、近年のAIブームもあり飛躍的に向上しました。一方、レイアウト認識については、準定型、非定型の設定に緻密なチューニング作業が必要になる場合やOCRツールベンダーが帳票ごとに設定するなどの対応を行っており、現在の課題点でもあります。今後は準定型、非定型の帳票設定が容易にでき、かつ、高精度にレイアウト認識できるようになるのではないかと思っています。

②OCRが日常生活のツールとして活用

現在のOCRはRPAやBPMとの連携が注目されていますが、今後は業務の範囲にとどまらず、日常生活の中で”当たり前”にOCRが活用されてくるのではないでしょうか。Office LensInsert date from pictureなど一部、既にそのような動きが出始めているように感じます。このように物体検出や物体検知などの技術とOCRを連携して、日常生活のツールとして活用したり、他のシステムと連携することで日常生活の中で”当たり前”にOCRが活用されるようになるのではないかと思っています。

①の認識精度については1960年代から研究が行われてきました。一方、②についてはここ最近なので、これから更に進化していくのではないでしょうか。

最後に

ここまでOCRについて、選定時のポイントと従来OCR、現状と今後について記載しました。OCR選定時の参考にして下さい。また、弊社では以下のOCRツールを取り扱っており、OCR選定ポイントに記載した各機能群について詳細な知見を有しております。OCR導入を検討しているが困っているなどありましたら、お問い合わせください。貴社のOCR導入を成功へと導きます。

弊社取扱い製品(2020年5月)
Scan Robo!RPAテクノロジーズ社が提供するBizRobo!の拡張製品。
LAQOOT日本のユニメディア社が提供する日本語手書き対応AI-OCR。
DEEPREAD日本のEduLab社が提供する日本語手書き対応AI-OCR。
ABBYY世界No.1OCRメーカーであるABBYY社が提供するOCRプラットフォーム。
DynaEye日本のPFU社が提供する日本語手書き・準定型対応AI-OCR。 
DX Suite日本のAI inside社が提供する日本語手書き対応AI-OCR。

 

関連記事

もっと知りたい方はこちら

ページトップ