覚えておきたいクラウド&データのキホン(第25回)AI-OCRとは?仕組みや用途、精度などについて紹介

自動化・AI

公開日:2022.09.26

  • PDF PDF
  • ボタンをクリックすることで、Myクリップ一覧ページに追加・削除できます。追加した記事は、「Myクリップ」メニューからいつでも読むことができます。なお、ご利用にはBiz Clipに会員登録(無料)してログインする必要があります。

 AI-OCR(AI-Optical Character Recognition)とは、AI(人工知能)技術を用いて文書を読み取り、デジタルで利用できるテキストデータなどに変換する技術のことです。活字だけでなく手書き文字も読み取り可能な点が特徴で、現在は、主に申請書、請求書、伝票、アンケートなどのデータ化作業に活用されています。社内で稼働する他システムとRPA(Robotic Process Automation)で連携させれば、データの自動処理などより高度な業務を行わせることも可能です。業務効率化、ペーパーレス化、データ活用など、ビジネスのさまざまな場面で活用できる可能性を秘めていることもあり、多くの企業がAI-OCRに注目しています。そこで今回は、AI-OCRの仕組みや実際の精度、考えられる活用方法について解説します。

目次
・AI-OCRとは
・AI-OCRの仕組み
・AI-OCRのメリット・デメリット
・AI-OCRの用途例
・導入を検討したい、おすすめAI-OCRツール
・まとめ

AI-OCRとは

 AI-OCRが現れるまで、ビジネスの現場ではOCRが多く活用されていました。OCRとは、主に活字をスキャナーなどで読み取り、デジタルテキストに変換する技術のことです。OCRが登場する前は、紙の文書を人が目で見て手入力していましたが、OCRの登場によって、手間と時間のかかる入力作業を「機械に行わせる」という発想やアクションが広まるようになりました。

 ただし、OCRには、「決められたフォーマットの文書しか読み込めない」「文字の認識精度が低い」などの課題がありました。読み込める文書に大幅な制限があり、また、読み取ったテキストの誤りも多く、活用のシーンが限定されていたのです。

 そのようなOCRの課題を解決する技術として登場したのが、AI-OCRです。OCRの文字認識精度を機械学習で大幅に向上させることに成功し、活用の幅も大きく広がりました。クセのある手書き文字や、さまざまなフォーマットの文書を読み取ることが可能になり、現在では、多くの企業、官公庁などで導入が進んでいます。

AI-OCRの仕組み

 AI-OCRは、機械学習を行うことでその精度を高めています。AIの機械学習は、大量のデータを読み込ませて似たものを認識させる「教師なし学習」と、ルールや意味などが付与(タグ付け)されたデータを大量に読み込ませて高度な学習をさせる「教師あり学習」の2つに分類されます。AI-OCRは、事前に教師あり学習を行わせることで、クセのある手書き文字から特徴を抽出し、もっとも近い文字を高精度で推定してテキストデータに変換することができるようになりました。

 認識した文字が間違っていた場合でも、さらに機械学習させることによって、認識精度をより高めていくことが可能です。

AI-OCRのメリット・デメリット

 AI-OCRには、どのようなメリット・デメリットがあるのでしょうか。導入を検討する際に把握しておきたい、具体的なポイントを見ていきます。

AI-OCRのメリット
 AI-OCR最大のメリットは、データ入力作業の省力化です。業務の効率化や人手不足の解消につながり、また、注意力を要するルーチンワークをツールに肩代わりさせることで、疲労やストレスの軽減効果も期待できます。

 また、ヒューマンエラーを減らせる可能性がある点も見逃せません。AI-OCRは機械ですから、人のように「うっかり打ち間違えてしまった」「疲れて見間違えてしまった」といったミスを起こしません。読み込んだ文字を誤って認識してしまうことはありますが、機械学習を繰り返して精度を高めれば、誤認識は減っていきます。

 さらに、大量の文書をスピーディーにテキストデータ化することが可能になり、ペーパーレスにつながる点もメリットと言えるでしょう。

AI-OCRのデメリット
 AI-OCRのデメリットは、一定のコストが発生することです。AI-OCRの利用価格は、読み取り項目数や機能、オプションなどによってさまざまです。「どの程度の項目を読み取る必要があるか」「どのような機能が必要か」「作業効率化メリットやエラー低減メリットとAI-OCRのコストを比較し効果があると言えるか」といったところをよく見て導入検討を進めるとよいでしょう。

 また、文字認識率は100%ではなく、最終的には人力によるチェックが必要である点にも注意が必要です。1から人力で入力をするより負荷は大幅に軽くなりますが、まったくのノーチェックで、すべて機械に任せるというわけにはいきません。その点も考慮する必要があります。

 読み取る文字が少ない場合は、人力のほうがコスト面で優位なこともあります。文書のボリュームについても確認しておきたいところです。

AI-OCRの用途例

 では、AI-OCRは、具体的のどのようなシーンで力を発揮するのでしょうか。ビジネスシーンでの用途例を紹介します。

手書きアンケートの自動集計
 手書きのアンケートは、フリーアンサーなども多く入力に手間がかかります。手書き文字の読み取りと入力の部分をAI-OCRに行わせることで、業務効率化を実現している企業も少なくありません。RPAと連携させれば、自動で集計業務を行わせることも可能です。

受注伝票の自動処理
 AI-OCRを使えば、FAXなどで送られた受注伝票をデジタルデータ化することが可能です。また、デジタルデータ化することで、社内の受発注システムと連携させることもできるようになります。必要なときにすぐにシステム上で閲覧したり、過去の伝票データをベースに新しい受発注伝票を起票したり、伝票に記載された項目を在庫管理に流用したりと、さまざまな活用が可能になります。

顧客名刺の自動読み取り
 名刺は、縦書きのものあれば横書きのものもあり、さらに社名や名前の位置、フォントなどもバラバラで、意外と読み取りが難しい文書です。AI-OCRなら、こうした、さまざまなフォーマットが混在する文書でも高い精度で読み取ることができます。AI-OCRで読み込んだデジタルデータは、貴重な顧客情報データベースとして、社内で活用することが可能です。

導入を検討したい、おすすめAI-OCRツール

 現在、さまざまな企業からAI-OCRが提供されています。ここでは、選択肢の1つとしてNTT西日本の「おまかせAI OCR」を紹介します。

 おまかせAI OCRは、トライアルでデータ入力精度が96.71%と、高精度な文字認識を可能にしています(※)。活字はもちろん手書き文書も高精度で読み取ることができ、くせ字や訂正、チェックボックス、押印の有無なども判別できます。

 使い方も簡単です。手書き文書が書かれた紙の帳票類をスキャナーなどでPDFファイルに変換し、アップロードして各種設定を行ったのち実行すれば、テキストデータ化できます。読み取り結果はCSV形式で出力できるので、データの集計や分析を行うことや社内の他システムと連携させることも容易です。

 料金は月額3万3,000円(読取箇所が月6,000項目まで、最低利用期間12カ月)からとなっており、スキャナーとインターネット環境があれば初期費用はかかりません。

「これを機にビジネス複合機を新しいものにしたい」「RPAツールとセットで導入し、効果的な運用を模索したい」といった相談にも、NTT西日本は対応しています。

※NTTグループが2018年8~9月に行った、おまかせAI OCRと同じ文字認識AIを用いたAI-OCRサービスのトライアル(参加企業3社)における、申込書・現金通帳(手書き文字を含む20,275文字)の読取精度(正解数/全文字数)の平均です

まとめ

 AI-OCRは、「高い精度で手書き文字を読み取ることができる」「データ入力の手間を削減し、人手不足の解消や業務効率化につなげることができる」「ヒューマンエラーの低減に寄与する」「データ活用の推進に役立つ」など、多くのメリットを備えています。

 少子高齢化によって生産年齢人口の減少がますます加速しつつある昨今、AI-OCRはより存在感が増していくものと考えられています。人材不足に悩む企業にとって、AI-OCRは課題解決に役立つかもしれません。まずは検討を進めてみてはいかがでしょうか。

※掲載している情報は、記事執筆時点のものです

執筆= NTT西日本

【MT】

あわせて読みたい記事

  • 注目のAIソリューション(第3回)

    AIによるOCR。自動でテキスト化、高精度

    自動化・AI

    2019.12.25

  • 注目のAIソリューション(第5回)

    「AI OCR」に安心の新プラン追加、セキュリティ強化も

    自動化・AI

    2021.08.04

  • Biz Clip調査レポート(第30回)

    いまだ紙を使う業務は。文書管理実態調査2022

    自動化・AI デジタル化

    2022.07.29

「自動化・AI」人気記事ランキング

連載バックナンバー

覚えておきたいクラウド&データのキホン

無料!おすすめのダウンロード資料

  • インボイス対応状況調査2022

    インボイス対応状況調査2022

    2023年10月1日に開始予定の「インボイス制度」。同制度は、課税仕入れ等に係る消費税額を控除する仕入税額控除のための新たな仕組みだが、企業においてはこれらに伴う社内システムの見直しなどが必要となります。本制度への対応状況について、企業はどのように準備をしているのだろうか。その最新動向について調査しました。

  • 企業のDX対応意識調査2023

    企業のDX対応意識調査2023

    データの利活用にとどまらず、デジタル技術を前提としたビジネスモデルの変革や経営革新の切り札として期待される「DX(デジタルトランスフォーメーション)」推進。企業はその対応に向けて何を進め、どのような点を課題に感じているのだろうか。こうした企業意識について調査を行いました。

  • 電子帳簿保存法対応調査2023

    電子帳簿保存法対応調査2023

    2022年に施行された改正電子帳簿保存法。その猶予期間が、2023年12月31日で終了となります。多くの企業にとって、インボイス制度(同年10月スタート予定)も鑑みつつ、本制度が定める電子取引データの電子保存などに対応するための準備が喫緊の課題となります。では、企業はどのように準備を進めているのだろうか。その最新動向について調査しました。

オンラインセミナー動画