2019年11月01日
RPAをやっていると、ある時点から、場合によっては最初から、避けて通れない道になるのが「書類のデータ化」即ち、OCRです。
今まで「OCR?なにそれ?」って感じだったのに、RPAに携わるようになってから急に使わなきゃいけなくなった!なんて方も多いのではないかと思います。
そして、RPAの普及に合わせるかのように、OCRも急激な進化を遂げています。
むしろ、歴史の長さを考えると、OCRの方が、近年の進歩の凄まじさは上でしょう。(起点をどこに置くかで変わりますが、日本では40年とか50年の歴史があると言われます)
この進化したOCRは、いわゆる「AI-OCR」として世間で注目されていますが、そもそもOCRってどういう技術なのか、どういう課題を持っている(いた)のかについて、解説していきたいと思います。
01
そもそもOCRって?
OCRはOptical character recognitionの略称で、日本語では光学文字認識と呼ばれます。(「OCR」という単語だけ覚えておけば大丈夫です)
要するに、紙に書かれた文字を電子データの文字列に起こしてくれるソフトです。
これがなければ、紙に書かれた情報は人間が全て手入力でシステムに登録することになります。データ入力作業の業務負荷を劇的に軽減しているという点では、「自動化」を広義に捉えたとき、RPAの大先輩とも言えるかもしれません。
身近なOCR
まず、無意識に日常生活の中で接しているOCR技術を何点か紹介していきます。
1.銀行窓口の依頼書
ネットバンキングの普及や、決済・割り勘アプリの登場などによる送金手段の多様化で、最近は記入する機会がほとんどないと思いますが、銀行窓口の依頼書はOCR用の帳票です。
枠の位置が決められており、1文字1枠で記入するようにできています。
この枠を、バックオフィス側でOCRソフトが読み取って電子データにしてくれることで、人力での入力作業を省力化しています。
2.QRコード
QRコードも、文字の読み取りではありませんが、画像を解析してデータを引っ張ってくる、OCRの一種です。
ちなみに↑のコードを読み取ると・・・
このブログのTOPページに飛ばされます。
3.手書き入力パッド
WindowsでもIMEパッドで、読み方の分からない字を手書きで文字入力することができますよね。これもOCR技術の上に成り立っています。
4.マークシートもOCRの仲間
各種試験などでお馴染みの「マークシート」は「OMR(光学式マーク読み取り装置)」という、OCRの親戚の技術です。
OCRから見れば下位互換のようなものなので、OCRソフトの中にはマークシート読み取り機能も具備しているものは多いです。
02
OCRの読み取りに重要な要素
OCRは、読み取った画像を解析し、文字データに変換します。正確に文字を読み取れるかどうかを影響する要素は、多岐に渡っていますが、特に大きいのは以下の3つでしょうか。
OCRの精度に大きく影響する要素
WHAT:読み取り対象の記述方法(手書き/活字)
WEHRE:読み取り対象の特定方法(座標指定/キーワード抽出)
HOW:文字枠の囲い方(固定ピッチ/フリーピッチ)
他にも精度に影響を与える要素は色々とありますが、特に影響の大きな3要素について、それぞれ解説していきます。
03
RPAとOCRの親和性
RPAはあくまでシステムであり、扱うことができるのはアプリケーションと電子のデータです。
しかし、業務の現場でインプットとなるデータは、紙に打ち出されていることは少なくありません。
そのため、OCRで用意したデータをRPAでガンガン回していく、という超強力なタッグが成立します。
大昔からあるOCRの技術に注目が集まってきているのは、読み取り技術の進歩も当然ありますが、RPAによる再評価もその背景にはあるのです。
04
でも今ってペーパーレスの時代じゃないの?
電子化が進んでる時代だから、今更紙の読み取りなんてニーズ少ないんじゃないの?という人もいるでしょう。
そうは言うんですけどね、やっぱり紙ってなくなってないんですよね。
ペーパーレス化の流れで電子化されたのって、社内会議どまりの企業が多いんじゃないでしょうか?
顧客対応窓口だと、申込書の記入に紙とタブレットを選べるところなんかも増えてきていますが、やはり紙はまだまだほとんどのところで健在ですよね。
「紙じゃないと抵抗感を示す顧客が少なくない」というのは実際に窓口業務の設計に携わっている方から聞いたことがあります。
若い方ならそんなことはないんでしょうが、「電子媒体に個人情報を入力する=流出とかなんか怖い!」という心理が働いたりするのでしょう。
実際は紙に書いたものだって当然バックヤードで電子媒体に入力されてるわけですが…。
こういう話題だとなんとなく「これだから日本人は…」みたいな声も聞こえてきそうですが、UiPathとか海外製のRPAツールにもOCR機能を標準で持っていたりするわけですし、2018年にもなったところで、ExcelにOCR機能が付く、なんてあたり、世界的にも馬鹿にできないトレンドと言えるかもしれませんね。
05
従来のOCRは、銀行や役場など特定の業務においては有用だけれど、帳票のフォーマットが固定されていなければならない、手書きには弱いなどの観点から、導入するほどの高い精度を得られず、膨大なマンパワーをかけて対処するしかないケースも存在していました。
「枯れた技術」と見る界隈もあったように思います。
しかし、RPAの登場で活躍の場は明確に増加しており、AI技術による飛躍的な性能の進歩もあって、捲土重来、現在は高い注目を集めています。
このようなツールと上手く付き合うことで、「自動化ライフ」の楽しみや歓びも増してくるんじゃないでしょうか。
6
TENEZはインターネットと人工知能ソリューションのサービスプロバイダです。本社を中国上海の自由貿易区張江ハイテクパークに構え、蘇州工業パークには開発センターを構えています。
TENEZは2016年の設立と共に、”新しい価値の創造を通じ、お客様の期待を超え、社会と人々に感動をお届し続けます“の使命を掲げ、デジタル技術を駆使して顧客に価値のある製品とサービスを提供し、提案、設計、開発、実装、運用などサービスを展開するハイテク企業です。現在の主な事業はRPA業務自動化ロボット設計開発、システム設計開発とデータ処理業務であり、製造、金融保険、旅行、育児などに及ぶ分野で、多くの大手日本企業及び中国企業に高品質な情報技術製品とサービスをご提供しております。
版权声明:
本文文章来源于アゲ出しLife,由本社相关负责人编辑设计排版。部分文章推送时未能及时与原作者取得联系,如涉及版权问题,敬请原作者联系删除,我们对原作者深表敬意。
本文观点仅代表原作者个人观点,特耐司科技对本文观点保持中立,仅供参考、交流之目的。本文观点敬请读者注意判断。