Microsoft OCR(Windows.Media.Ocr)は優秀だよというお話
お疲れ様です。渡部です。急に寒くなりましたね。皆様お元気ですか。
今日はRPAではなくOCRのお話をしようと思います。
RPAと相性のいいソリューションとしてOCRがあることは皆さんご存知かと思います。
実はWindows10には「Microsoft OCR(Windows.Media.Ocr)」というOCR機能があります。
※実際にはWin8.1からあるようですが、その当時検証したことがなく。。。
このMicrosoft OCRですが、非常に優秀なので今回紹介します。
今回のサンプルファイルはこちらにします。
この画像ファイルをMicrosoftOCRを含む4つのOCRにかけてみて、結果を見比べたいと思います。
OCR結果
MicrosoftOCR
給与所得の源泉徴収票 平成30年分 (受給者番号) (個人番号) (役職名) 住所又は居所 払け者 受 支をる (フリガナ) 名 給与所得控除後の金額 所得控除の額の合計額 源泉徴収税額 障害者の数 非居住者 特別その他親族の数 人 種別 乂 払 金 額 (源泉)控除対象配偶 配偶者(特別) 控除の額 者の有無等老人 従有 0 である 控除対象扶養親族の数 (配偶者を除く) 人従人 16歳未満 扶養親族 の数 (本人除く) 特定 その他 人従人 人従人 有 人 人 0 生命保険料の控除額 社会保険料等の金額 地震保険料の控除額 住宅借人金等特別搾除の額 内 円 円 円 円 0 0 (摘要) 生命保険料新生命保険料 の金額の の金衵 内訳 住宅借人金等 住宅借入金特別搾除適用数 等特別控除 の額の内訳住宅借人金等 特別控除可能額 (フリガナ) (源泉・特別) 控除対象氏名 配偶者 個人番号 (フリガナ) 個人番号 (フリガナ) 除 2 氏名 対 個人番号 象 (フリガナ) 親 3 氏名 個人番号 (フリガナ) 4 氏名 個人番号 未 外 死 災 乙 本人が障害者 寡 婦 成 国 亡 年 人 退 者 の 者 他 般 別 円旧生命保険料 円 介護医療保 険料の金額 円 新個人年金 円旧個人年金 保険料の金 の金額 居住開始年月日 (1回目) 円居住閒始年月日 (2回印 保険料の金額 住宅借人金等特別 控除区分(1回ロ) 住宅借人金等特別 搾除区分(2回目) 円 住宅借人金等 年未残高(]回団 住宅借人金等 年末残高(2回目) 円 円 円 分 の得 者所 配合 国民年金保険 旧長期損害 保険料の金額 料等の金額 (フリガナ) 個人番号 (フリガナ) 分 2氏名 個人番号 の 扶 (フリガナ) 区 3氏名 族 個人番号 (フリガナ) 4氏名 個人番号 区分 区分 区分 区分 区分 区分 寡 勤 中途就・退職 受給者生年月 労 生 就職退職年月 明 大昭平年 夫 日 月 ロ 個人番号又は 法人番号 住所(居所) 払 又は所在地 氏名又は 名称 用
GoogleCloudVision
平成30年分給与所得D源泉徵收票 (受給者番号) (個人番号) 支をる を受け 住所又は居所 (役職名) ( 力士) 氏名 種別 | 支 金額 || 給与所得控除後金額」所得控除額合計額 | 源泉徵收稅額 給与 (源泉)控除对象配偶」配偶者(特別) 者D有無等「法人」控除()银 有 |從有 控除对象扶養親族少数 (配偶者充除<) 蚌定」 老人 その他、 人從人」內 人從人」 從人 16歲未滿 扶養親族 の数 障害者の数、 非居住者 (本人除<) である。 特別「 仁他 親族の数、 内人 | 社会保險料等)金額 | 生命保險料控除額 | 地震保險料控除額: | 住宅借入金等特別控除UD額, OO (摘要) 旧生命保險料 の金額 介護医療保 険料の金額 新個人年金 保険料の金額 旧個人年金 保険料の金額 居住開始年月日 (1回目) 住宅借入金等特別 控除区分(1回目) 住宅借入金等 年末残高1 ) 生命保險料 新生命保險料 の金額の の金額 内訊 住宅借入金等 住宅借入金特別控除適用数 等特別控除 0)額D内住宅借入金等 特別控除可能額 (71) (源泉·特 控除对象 | 氏名 配偶者 個人番号 可居住用始年月日 (2 ) 住宅借入金等特別 除区分(2回目) 住宅借入金等 年末残高(2回目) 区分 配偶者の 合計所得 国民年金保險 料等の金額 旧長期报告 保険料の金額 (フリガナ) (7)力十) 区分 区分 氏名 氏名 個人番号 個人番号 (7)力于) ( 力士) 区分 氏名 氏名 個人番号 個人番号 控除对象扶養親族 (フリガナ) 18歳未満の扶養親族 , ( 十) 区分 氏名 氏名 個人番号 個人番号 (2)力于) (7) }) 氏名 区分 氏名 区分 個人番号 個人番号 本人が障害者 寡婦 算 未成年者 外国人 死亡退職 災害者 乙棚 | 特 勤勞学生 中途就・退職 受給者生年月日 就職退職」年1月1日|明「大」唱「平」年|刀|日 他 「 般 」 別」 個人番号又は 法人番号 住所(居所) 又は所在地 受給者交付用 支扯者 氏名又は 名称
読取革命
受給者交付用 平成30年分給与所得の源泉徴収票 支払を受ける者 住所又は属所 (叉給者番号) (゛ (役駭名) 氏名 (フリガ力 種別 支払金額 給り所得控除後の金額 所得控除の額の合計額 源泉徴収税額 給与 内円 円 円 内、円 0 (源泉)控除対象配偶 配偶者(特別)控除の額 控除対象扶養観族の歓 (配偶抒を除く) 聯奕 `障害者の数 (本人除く) 言  ̄石応イLI悲寺 老人 特定 老人 その他 特別 その他 町 従存 円0 人 従人 内 人 従人 人 従人 人 内人 人 人 社会似険料等の金額 生命保険料の控除額 地震保険料の控除額 住宅借入金等特別控除の額 内円 0 0 円 円 円 (摘要) 守 新生命保険料 の介額 円 旧生命保険料 の金額 川 顔回鶴 円 新佃人年金保険料の金額 円 T日個人年金保険料の金額 円 住宅借入煢等特別搾除の額の内訳 仕宅借人金等特別控除適壯数 属住開始乍月口 (1同目) 住宅借入金等特別控除ド分(1回口) 住宅借人金等年末残鳥0回目) F! 住宅借人金等特別控除可能細 円 属住開始乍月日 (2回目) 特 り人金等特別戌分(2川目) 住宅借入金了年木残高(2回剛 円 G皆伊D (フリガナ) 一一一一一一 氏名 ㎜㎜㎜㎜㎜㎜㎜㎜ 区分 臂齟 円 国民年金保険料等の金初 円 旧長川損害保険料の金額 円 個人番り 控除対象扶養机族 1 {フリガナ) 氏名 一一一 --一一 区分 16歳未満の扶養親族 1 (フリガナ) 氏名 一一一一一一 区分 個人界口 個人番弓 2 (フリガナ) 一一一一一 氏名 区分 2 (フリガ力 一一一一 氏名 ㎜㎜㎜㎜㎜㎜㎜ 区分 個人訝吁 個人番号 3 (フリガナ)一一一一 氏名 区分 3 (フリガ到 氏名 ㎜㎜㎜㎜㎜㎜㎜㎜㎜ 区分 佃人界号 / 個人番弓 4 (フリガナ) 氏名 -一一一一一一一一 l兄分 4 (フリガナ) 氏名 ㎜㎜㎜㎜㎜㎜㎜㎜㎜ 区分 個人冷弓 個人冊号 未ダ 外国人 死亡退職 炎占 乙欄 本人が叶害占 寡婦 霖人 劵jF 中途就・退職 受給抒生年月口 特別 その他 一般 特別 就職 退職 年 月 囗 明 人 昭 平 年 月 囗 支払者 個人番吁又は 法人番叮 住所(居所)’又は所在地 氏名又は名称
AdobeOCR
受給者父付 fll 平成 30年分給与所得の源泉徴収票 支払を受ける者 仇 闘又 は 悛給者番サ)(11,lj人番号)1役駄名)IiI フリガナ 1氏名 種別給与 内 支 払 金額円 給']所得控除後の金額円 所得控除の額の合計額円 源泉徴収税額内、 111 陀控偶(特別)除者の額 地猿保険料 0)控除額 社会保険料等の金額 生命保険料の控除額 住宅偕入金等特別控除の額 内円 円 l'l Pl ゜ ~ 1摘要) l'l 料vJ飲頷訳生の印内金保 円 新生の印金保額検料旧生の令金保雑検 1料 l'I 介砂峨料底の税金紅呆 1 Pl 保 Ill防債料)けの「金金額 円保新験仰料人の年金金額 l'1 1/ ))1炉口 1守回 (I住控宅除枯区入分金 Pl屈仕 111121同始「年 I/lH 井住別宅控借除人可金能 '.1額 住控宅除偕区人分金 12守 1≪1特日別 1 年住木も残(片点;入 12金回等目) l'I 円 円 [フリガナ) l'l 特住別宅搾f井除人適金Ill等数 居住開 I回始□年)月口 年 it木宅 ,JI借点;(人\金同笠 ~II 住~ 0--)宅特額別(/0)与入控内令訳 除 (ill. 控杞泉除偶対特廿別)→ 氏名一 .象 -覧| 保 1n依 1,料 J1Jの m金害額 杞合侶計者ijj'岱) 同料民寺年の金金保賀防 i na I I I I I I I 仰人法番人番号又号は 支住所所(店在所地) -払 又は 者 氏名名又称は (源泉)控除対象配偶 者の有無等 ~ 布 1 従打 I 特定 l'I 人従人 控除対 li'i!象偶扶者を没除親く)朕の数 老人 内,人従)、 ' , I 歳茂 16扶 その他 その他 特別 ゜ }、人人, 内人従}、}、 I I (,~ 本舌人・者除のく数) の数親未;族占 非視で居炊あ住のる数者 \111A1序巧 1フリガナ) I 氏名閥 AIS乃 1フリガナ) V包名個人岱巧(フリガナ) 3 氏名個人番号 Iフリガナ) 4 [ 2 族 氏名個人番号 外 児 ~ fu 駐 (フリガナ) 区 -------.ー一覧 I 分個人番号(フリガナ) I 氏名 --------―― 区 2 氏名 .. -----------界| 分 m 個人番号の 1フリガナ) ----------------.区 分 氏名 3 岱 1 ~ ------------- 親族 似 J、番号(フリガナ) 区 -烙| 分似 1人番号乙本人が閃害・行 ~; 婦 4 氏名 c;,. 巾途就・退職 受給者生年 H日 > > I)(I 特 そ 特 I 平 n I□ IH I D J, の 樗 明 年 叫引退戯年 別 般 別 他
まとめ
どうですか、見た目でMicrosoft OCRの優秀さが分かると思います。ほぼ間違えてないです。しかもWindows10の機能なので無料です!最近AI-OCRの話がいろいろと出てきていますが、「今そこにあるOCR・Microsoft OCR」もおすすめなのでチャレンジしてみてください。(AI-OCR系と比べてどうのという話はすいませんまだコラムでは言えません。。。が少しずつ紹介していきます)
欠点としては、やはり簡単に使えるツールとして提供されていない点でしょうか。私を含むプログラマ出身のRPAエンジニアならいいのですが、サンプルソースを見ながらツールを作り上げていく必要があり、普通のユーザーが使うには現状まだ敷居が高いです。さらに、Microsoft OCR単体では、帳票定義や帳票形式(CSVなど)に出力する機能が無いため、RPAと組み合わせることが難しいです。
ではこのMicrosoft OCRの使い道はどこ?と思われるかもしれませんが、工夫次第でいろいろと実は使えますので、こういうのがあるという点は覚えておいていただければ幸いです。RPAとOCRの導入についてご相談されたい方はこちらからご連絡ください。
関連記事
最新情報をお届けします!
RPAに関する最新コラムやイベント情報をメールで配信中です。
RPA領域でお仕事されている方に役立つナレッジになりますので、ぜび登録してください!
- December 2024 (1)
- November 2024 (2)
- October 2024 (3)
- September 2024 (2)
- August 2024 (4)
- July 2024 (1)
- June 2024 (2)
- May 2024 (3)
- April 2024 (1)
- March 2024 (1)
- February 2024 (1)
- January 2024 (1)