OCRの裏技!画像編集ツールで精度を上げよう!

近年、OCRを導入した企業が多くなっていますが、中には思うように導入効果が得られない声も存在しています。

弊社もOCRについて、いくつの記事を上げさせていただいております。

OCRを導入すると、画像のレイアウトの分類や文字の検出率を上げるためのチューニング等が必要で、時にはスキャンデータの画質が悪く、文字検出率が非常に低い場合があります。

スキャンの品質を上げれば解決できる話ですが、複数な取引先から集めたデータや、手書きのデータなどスキャンの品質のコントロールが難しい場合もあります。

今回は実際に業務で実践した、画像編集ツールでOCRの読み取り精度や文字の検出率を上げる裏技を紹介します。

(参考)OCRへの事前知識を持っていない方はまず以下2つの記事をご覧ください。

OCRの読取精度に囚われ過ぎず、業務プロセス全体の効率化を

半構造化文書のデータが取れる、凄いぞABBYY社のOCR

事例を用いて、OCR x 画像編集ツールの精度検証

今回の事例に使用するOCRツールはABBYYです。

ABBYYは高い精度での文字認識を実現するだけでなく、 様々なフォーマットや言語で 作成された紙書類から読み取ることができるOCRソフトです。

では、まず以下の事例ご覧ください。

上記の画像は画質が低く、文字の検出率が0%でした。人間からすると割とまだ見えますが、問題点は表の線が薄すぎて、OCRが読み取るとき、認識に必要とする基準の線となるもの見つからないため、全く読み取れなかった結果になりました。次は、画像編集ツールで処理した画像をご覧ください。

上記の画像はPhotoshopによって編集され、線と文字を濃くしました。その結果、以下のように読み取れるようになりました。

誤読はあるものの、全く読み取れないから、ここまで読めるようになることになったことから、画像編集ツールはすごいです!

上記は線を太くすることによって、検出率をあげましたが、精度や検出率を上げる編集方法は基本以下4つのポイントになります。

  • 解像度を上げる。
  • 色をモノクロのみにする。
  • 文字や線の色を見やすくする。(コントラスト、明るさの調整)
  • 汚れを消す。

基本この4つのポイントを意識して、編集の設定を調整すれば、OCR精度や検出率を上げることができます。

画像編集のツールのご紹介

次は、画像編集ツールを簡単に紹介させていただきます。

1.PhotoShop

こちらはadobeのPhotoshopです。画像編集ソフトとして、よく知られています。機能が豊富で、高度な画像編集ができます。

Photoshopでの編集は明るさの調整、コントラストを上げたり、薄い線を濃くしたりするだけですが、きめ細かな設定ができるため、より良い画質の成果物が得られます。

性能的には非常に優れているソフトですが、学習コストがあります。

また、自動化が難しいため、RPAとの相性が良くないです。

基本人間で画像を編集する形になります。大量のデータ処理に向いていません。

2.ABBYY内蔵の画像編集機能

こちらの機能はABBYYに元々ついている機能で、ツールを別途導入する必要がありません。

上記の画像のように、PhotoShopと同じコントラスト、明るさの精度を上げるのに必要な機能が揃っています。また、ISOノイズ除去、傾き補正、モーションブラー除去など便利機能もあります。すぐ画面から編集の効果が確認できるため、初めて触る方でもすぐ使いこなせます。

3.ImageMagick

こちらはフリーソフトです。編集の機能はABBYY内蔵のツールより若干多いです。PhotoShopと同様に線を太くするなど便利な機能もあるため、非常に使いやすいです。それに、コマンドプロンプトで実行できるためRPAとの相性も良く、非常に自動化しやすく、大量のデータ処理に向いています。

こちら、実際の業務に使われていたImageMagickのコードの一部です。

magick convert input.jpg +contrast +contrast +contrast output.jpg(画像のコントラストを増強)

magick convert input.jpg -negate output.jpg(白黒反転)

magick convert input.jpg -morphology Dilate output.jpg(線を太くする)

magick convert input.jpg -negate output.jpg(白黒反転)

編集の効果は以下になります。

欠点といえば、使いこなすのにコーティングと画像編集の知識の両方必要です。また、コマンドプロンプトで操作するため、画像が表示されず、理想の結果ができるまで何回も試行錯誤が必要です。

これらの3つの編集ツールの比較は以下になります。

ツール編集の難易度コスト編集効果自動化の難易度
ABBYY低い低い低い
ImageMagick高い低い低い
Photoshop高い高い高い高い

上記の内容から、OCRツールがABBYYの場合、一番のおすすめはABBYYの内蔵のツールです。

ほかのOCRツールを利用する場合は、ImageMagickのほうがおすすめです。

利用場面及びRPAとの連携

実際の業務の中で、一枚一枚の画像に対して個別に編集をかけることは難しいです。一定の編集ロジックを組んで全部の画像を一律に自動編集するか、認識率の低い画像のみ個別に編集をかけることになります。一つの編集ロジックがすべての画像に対応できないため、編集後のほうが精度低い場合もあります。

そのため、画像編集ツールの適切な業務場面は、OCRが人間の代わりにデータを読み取り、人間が確認と修正を行うようなプロセスです。この中に、全く読み取れない、もしくは認識率の低いデータのみ、ロボットが自動的に画像編集をかけることによって、認識率を上げます。

このように、RPAxOCRによって、OCRの効果を向上させます。

最後に

今回は裏技として、画像編集ツールを使って、読み込みの精度をあげる方法を紹介しました。画像編集はあくまで一つの手段であり、OCRが期待通りの効果を得られるには、最適な処理プロセスを組む必要があります。

弊社では、OCR、RPAxOCRで最適なソリューションを提案し、業務の効率化を実現させていただきます。「RPAxOCRをさらにプラスα」、「OCRを導入したものの期待した効果が得られていない」などお困りのことがありましたらお問い合わせください

最後までお付き合いいただきありがとうございました。

最新情報をお届けします!

RPAに関する最新コラムやイベント情報をメールで配信中です。
RPA領域でお仕事されている方に役立つナレッジになりますので、ぜび登録してください!

最新情報を受け取る方はこちら

もっと知りたい方はこちら


ページトップ