ファーストアカウンティング社のAI-OCR「請求書Robota」を使ってみた
目次
はじめに
こんにちは。ゴールデンウィーク、皆様いかがお過ごしですか。
4都府県では3回目の緊急事態宣言という状況となってしまいましたが、自宅等でもリフレッシュできるといいですね。
さて、今回は、経理部門で扱うAI-OCRについてお話しします。
弊社では本年、ファーストアカウンティング株式会社(以下、FA社)とパートナー契約を締結いたしました。
FA社は、高い読取精度と学習能力を誇るAI-OCRサービス「Robota」「Remota」を提供しており、これらのサービスを導入することで、経理部門の支払確認業務の大幅な削減が期待されます。
直近で、FA社のAI-OCRを導入する業務がありましたので、今回はその業務内容およびAI-OCRの技術検証結果について、ご紹介していきたいと思います。
なお、「そもそもOCRとは何?」といったことにつきましては、関連記事をご参照ください。
(技術検証の前に)経理部門でのAI-OCRの需要の高まりについて
技術検証の前に…
経理部門でのAI-OCRの需要が高まってきている背景について、ご説明しておきます。
技術検証のみ興味のある方は、この項目は読み飛ばしていただいて構いません。
経費精算システム内で社員が入力した申請データと、請求書や領収書の実物の中身が一致しているかを確認することで不備・不正を見つける、という作業は、多くの会社さんで行われていることかと思います。
たとえば、次のような請求書があったとします。
請求書の例
この請求書では合計金額が29,700円とありますが、経費精算システムには29,000円などと登録してしまった場合、これがスルーされてしまうと、誤った会計につながってしまいます。そのため、経理部門では日々申請内容を突合チェックして、修正・差し戻しを行っています。
近年、上記のようなチェック作業を正確かつ速く行いたいというニーズは、ますます高まっています。その背景には、次のようなことがあると考えられます。
・同一取引先への二重払いが起きやすい環境(コロナ渦で、慣れないリモートワークが増えた影響)
・派遣の質の低下(派遣法改正により3年に一度新しい職場へ→仕訳など覚える前に異動→質の低下)
・派遣コストUP(派遣法改正により派遣社員への実費が正社員と同等に。費用が2割UP)
・業務効率化・コスト削減圧力(経理財務部門を筋肉質の組織へ変革するという圧力)
もちろん、悪意ある不正入力は一番あってはならないことですが、単純な手入力ミスなども含め、やはり不備・不正のある入力は起こり得るもので、正確にチェックが行われなければなりません。
不正を防ぐため、これまでに多くの会社の経理では、人材をあてて、目で見比べてチェックしてきました。とはいえ、規模が大きい会社となると件数も多いため、チェック担当者を多く集めなくてはならないですし、不正を見逃す可能性も大きくなってしまいます。
以上のような状況の中で、AI-OCR技術の進歩も相まって、人とAIが協業する新たな姿に、経理を変えていく必要があると考えられるようになってきているのです。
これまでと、これからの経理のイメージ
請求書Robotaによる業務改善・読み取り結果
さて、本題です。
今回はFA社の「Robota」の中でも請求書読み取りに特化した「請求書Robota」を導入しましたので、これの技術検証をしていきます。業務フローを記しながら、AI-OCRを導入した経緯と、実際に使って得られた読み取り結果をまとめていきます。
1)AI-OCR導入前の従来のフロー(AsIs)
まず、今回AI-OCRを導入する以前の日次の業務フローは、次の①~③のようなものでした。
AI-OCR導入前の日次業務フローイメージ
① 前日に登録された申請データ(社員が登録画面で入力したデータ)と、同時にアップロードされた請求書PDF(請求書実物をスキャンしたPDF)を、ロボで全量ダウンロードします。
② データとダウンロードPDF格納先リンクを並べた一覧表を、ロボで作成します。
作成する一覧表は次図のようなもので、申請データの項目内容と、ダウンロードした請求書PDFの格納先が並んでいるイメージです。
チェック担当者確認用一覧表のイメージ(実際の項目数はもっと多いです)
③ チェック担当者が②の一覧表を使って、申請データの内容と、格納先リンクから開いた請求書PDFに書かれた内容を目検チェックしていきます。内容が正しいことが確認できれば承認しますし、不正があれば修正したり申請者に差し戻したりします。
たとえば、次図のように「支払先情報」と「金額」を目で追ってみると、支払先情報は「株式会社ダミー」で一致していますが、金額は申請データで「29,000円」、請求書PDFで「29,700円」とあり違っていて、不正なデータということになります。
目検チェックの観点
従来のフローでは、①、②のDLと一覧表作成のロボ化による一定の業務量削減には成功しているものの、③のチェックはすべて人の目で行っているため、ここで労力がかかり、不正を見逃してしまう可能性もある状況でした。そこで、AI-OCRの力でこのチェックも自動化していくことになりました。
2)AI-OCR導入後のフロー(ToBe)と読み取り結果
今回は、AI-OCRで請求書を読み取り、読み取った結果と申請データを自動で突合し、不正となった項目がわかるような一覧表を作成していくようにします。フローのイメージは次の①~⑦のとおりです。
AI-OCR導入後の日次業務フローイメージ
各フローを確認しながら、請求書PDFを読み取らせた様子を示していきます。
① ここは従来と同じく、前日に登録された各データをダウンロードしてきます。
② ①でダウンロードした各請求書PDFをすべて画像化します。
請求書Robotaはファイル形式JPEGに対応している仕様ですので、PDFをJPEGに変換しています。
変換を自動的に行う方法はいろいろとあると思いますが、使いやすいと思えるものを実装すれば問題ないでしょう。今回はPythonのpdf2imageライブラリを利用しています。
PDFをJPEGに変換したイメージ(1ファイルのみの例ですが、実際はPDF全量に対して変換を行います)
③ ②で得られた各JPEGファイルを順に、請求書Robotaへ送信します。
今回は、API連携によって情報のやりとりを行います。
連携の方法としては、RPAから行ってもよいですし、コマンドで行う方法を実装してもよいでしょう。業務内容や環境に応じた方法でよいかと思います。
④ ③で連携したJPEGファイルごとに一意に振られる「個別ジョブID」が取得できます。
この後、個別ジョブIDを請求書Robotaに送信することで、読み取り結果が得られます。今回、ダミー請求書のJPEGファイルに対しては「1028_20210409182158.5517_54b7」という個別ジョブIDが取得できました。
なお、例として1ファイルのみに注目し続けていますが、実際には多くのJPEGファイル全量を順次連携し、JPEGファイルごとに固有の個別ジョブIDを得ていきますので、Excelにそれぞれの対応がわかるリストとして書き溜めておくようにしています。
⑤ 書き溜めておいた個別ジョブIDを、請求書Robotaに順に送信して、結果を確認します。
先ほどのダミー請求書JPEGファイルの個別ジョブIDも送信してみると…
⑥ 結果が返ってきました!
結果はJSONファイルで返ってきます。今回はこれをテキスト化して扱うようにしています。
ダミー請求書(左)と、ダミー請求書の読み取り結果をテキスト化したもの(右)
今回の検証でキモとなるところがうまくいきました!
テキスト化したデータ中のitemsの中身を見るとわかるように、各項目の値が読み取れています。すべての読み取り項目の細かい説明は割愛しますが、赤枠で囲ったように、
date(発行日、取引日) 「2021-04-09」
issuer(発行元) 「(株)ビッグツリーテクノロジー&コンサルティング」
recipient(請求先) 「株式会社ダミー」
amount(請求金額(税込)) 「29700」
など、それぞれダミー請求書どおりの取得結果となりました!(ほかの項目も正しく読めています!)
その他、各読み取り結果に対してのconfidences(信頼度)や、positions(位置情報)の値も得られます。
⑦ DLしておいた申請データと、OCR読み取り結果を突合して、不一致箇所を洗い出します。
ここでは、⑥でテキスト化した読み取り結果をExcelに取り込んだ後、Excelマクロなどで突合ロジックを実装しておきます。どの項目を突合するか、どのように出力するかは業務内容次第ですが、たとえば次図でオレンジ色セルにしているように、「金額」の項目が違う、ということがわかるような分析・出力結果を示していくとよいでしょう。
申請データとOCR取得結果の突合イメージ
②~⑥のような作業をロボで繰り返すことで、実際のお客様の請求書100枚ほどを送信し、読み取り結果を取得することができました!
そして⑦の突合まで自動で行うことで、今後、チェック担当者は突合の結果不一致のあった分のみチェックするようにし、すべて一致していたものはチェックなしで承認に持っていけるようになります!(もちろんその承認作業のロボ化もめざしていけます!)
請求書Robotaの強み・特徴
実際に使ってみた感触も踏まえて、請求書Robotaの強み・特徴をご紹介します。
非定型帳票に対応
テンプレートの事前定義は不要で、さまざまな形式の請求書に対応しています。ユーザーがテンプレートを定義していく作業が不要となり、これはとても大きな強みだと思います。
実際、今回送信した100枚ほどの請求書は、それぞれ発行元が異なるため形式はバラバラでしたが、ほとんどの種類の請求書で、値は取得できていました。一部読み取りづらい形式についても、フィードバックをもとに改善を続けていただけるとのことで、学習し続けるOCR恐るべし!という印象です。なお、このようにフィードバックによるAI-OCRのチューニングも、開発において大切な工程となります。
手書きの読み取り精度もかなり良い
活字はもちろん、手書きの字もきちんと読み取れます。実物のデータを載せることはできませんが、少し崩したような書き方をした手書きの箇所も、正しく読めていました。今回送信した100枚ほどのうち、手書きのものが5枚あったのですが、一部の崩した漢字での読み取り違いは起きるものの、日付や金額、振込先銀行口座番号など、数字に関するものがかなり正確でした! 致命的なチェック漏れを回避してくれる強みといえます。
補完機能も搭載されている
たとえば、請求元会社名が読み取れていなくても、電話番号などの他の情報から会社名を引き当てて出力する、といったような補完機能も搭載されています。今回は会社名が読み取れるものばかりでしたが、今後、会社名の読み取りづらい請求書の場合などに、頼っていきたい機能です。
なお、OCRに慣れている方は、「ブラウザ画面でOCR読み取り結果を閲覧・操作することはできないのか?」と疑問に思われたかと思います。これについては、FA社の「Remota」「Robota」のうち、Remota(システム開発せずに使えるプラットホーム)であれば、画面で見られます。API型と、Remotaにより画面で操作する型の、どちらかを選択できるようになっており、今回の業務ではAPI型を選択しています。
おわりに
FA社の「請求書Robota」による業務フロー構築や技術検証について記しました。FA社では、上述のプラットホーム「Remota」や、「領収書Robota」「請求書Robota明細版」などの製品もあり、経理部門での強い味方となりそうです。
AI-OCRへの関心が高まっている中で、技術力と同時に、業務フローの構築も重要になってきます。今回ご紹介した業務では、予め請求書のダウンロードはRPAでロボ化していました。しかし、企業さんによっては、「OCR使って突合をしたくても、経費精算システムのPDFを片っ端からダウンロードしないと使えないよ……」と、躊躇することもあると聞きます。そのような場合は、ダウンロード箇所のロボ化もあわせたお手伝いをさせていただくかと思います。
弊社では、お客様の業務内容や課題を十分に理解したうえで、導入・開発・運用・保守のご提案をしております。「OCRで経費精算をラクにしていきたい、ミスをなくしていきたい」とお考えの際は、ぜひ弊社へご相談いただければと思います。
関連記事
最新情報をお届けします!
RPAに関する最新コラムやイベント情報をメールで配信中です。
RPA領域でお仕事されている方に役立つナレッジになりますので、ぜび登録してください!
- November 2024 (2)
- October 2024 (3)
- September 2024 (2)
- August 2024 (4)
- July 2024 (1)
- June 2024 (2)
- May 2024 (3)
- April 2024 (1)
- March 2024 (1)
- February 2024 (1)
- January 2024 (1)
- December 2023 (1)