読者です 読者をやめる 読者になる 読者になる

masahirorの気まま記録簿

個人的な出来事や意見、生活などの記録を思うままにブログに記録

デル株式会社
マウスコンピューター/G-Tune

なぜ無料OCRソフトが今まで無かったのか

独自エンジンで画像から文字を認識し、Word/ExcelファイルやRTF/HTML/CSV/PDF形式で保存できる日本語OCRソフト「SmartOCR Lite Edition」v1.0.3が、17日に公開された。Windows XP/2000に対応するフリーソフトで、現在作者のホームページからダウンロードできる。

画像処理、活字 OCR の専門家集団スマートリーディング
http://www.smartread.biz/

いよいよ文字認識技術、OCR界にもフリーのソフトが登場。OCRも歴史は長いのになぜ今までフリー版が無かったのだろうか。
価格破壊や無料化、これは歴史においても革命的で、これまでの常識や決まりを打ち破ってきた。価格破壊で有名なもので言えば、牛丼やYahoo!BB、100円ショップの登場。
牛丼屋はこれまで400円程度が当たり前だったが、1社が200円台にしたことで、競合するチェーンはこぞって価格競争を始めた。今はBSEの影響で落ち着いているものの、これによる外食産業の影響と、牛丼がより身近になったことには変わりない。
Yahoo!BBも登場したときはすごいインパクト。今まさにADSLが広がっていくというときに突然の参入と驚愕の値段を発表した。もしかしたらADSLは埋もれていき、ブロードバンド化はもっと遅れたかもしれないが、これの登場により各社安いプランを発表したり、インターネットを始めた人も多いと思う。
無料化で言えば、ブラウザ。昔はネットスケープなどブラウザは「買ってくる」ものであったが、MicrosoftがインターネットエクスプローラをOSに標準で付けた。色々裁判等あったが、結局無料&バンドルにはかなわず、今やブラウザは「無料」が当たり前になっている。
しかし、大手の会社は大量生産、コストダウンにかけれる技術力・経済力があるのでこういった競争には参加できるが、小さい会社では太刀打ちが出来ない。そこで、こういった「低価格・無料」といったものに対し、同時に「高品質・高機能」を売りにしたビジネスも登場した。
さて、古くからある技術や一般的に浸透したもの・ソフトというのは早い段階でこういった現象が起こるものだが、OCR界においては今までこの現象がなかった。
それはなぜか。
それは、「スキャナがまだ一般的ではない」というのと「OCRは使えない」という考えが広まったからだ。
まずスキャナ。絵を描いたり、仕事で画像や文字を取り込む人はもってるかもしれないが、PCのある一般家庭ではほとんどもっていない。必要性を感じないからだ。一方、プリンタは年賀状の出番があるおかげで多くのPCをもつ家庭で置かれている。この差は大きい。
そしてOCRは、一度使ったことのある人は分かるだろうが、文字が書かれた紙をスキャンしてOCR認識させると、確かにある程度はちゃんと認識されるが100%ではない。80%ぐらいいけばいいところ。そうなると、誤認識の部分を手動で直さないといけない。それに、一見正しく認識したように見えても、実は似た違う字のこともあるので、結局は画像と認識結果をにらめっこしてひとつずつ確認しないといけない。こういった作業を考えれば、ある程度PCに慣れた人は紙を見ながら打ち直した方が結局早い。そう思うようになるとOCRをあんまり使わなくなり、結局OCRが普及しないという結果に。それに、新聞などのデータは良いが手書きの認識率はすごく低い。
そういった現状だから、需要が少なく、OCRにおいては価格破壊の流れがなかなか来なかったのだろう。
技術で言えば、「音声認識」も結構似たような感じ。昔はIBMが開発していて「ViaVoice」というものがあったが、最終的に普通のしゃべり声のスピードで認識できるようになったものの、やはり誤認識が多いので、キーボードの代わりとはなれなかった。しかし、それでも性能を上げ、Windowsに標準で音声認識が付くようになったことで音声認識を「買う」という認識がほとんどなくなってきた。精度もだいぶ上がっており、未来は期待できるかもしれない。これも「無料化」により、これから伸びるかもしれないもののひとつだ。ただ、他と比べ「PCに向かって話すのが恥ずかしい」というのもあり、そのペースはゆっくりだろう。

つまり、こういう「無料」「低価格」のものの登場により、価格破壊が生まれ消費者は喜ぶし、日本の技術力向上にも拍車がかかる、革命的な出来事なのだ。ひょっとしたら1つものがきっかけで歴史が大きく変わるかもしれない。
これはすごく歓迎すべきことなのだ。安くなることは、単純に枯れた技術を使いまわしで安くするだけではなく、それがベースとなり、ベースが安いので開発したい人の敷居が大きく下がり、よりいいものが作れる良い環境が出来上がるのだ。
OCRにおいても無料ソフトの登場により、革命が起こり、よりOCRソフトの低価格が期待でき生活に身近になり、同時に差別化を計るために安くは無いが高機能なソフトの登場、つまりOCR界の技術の進歩に大いに期待できる。
今後のOCR界に大注目。高精度の手書き認識の登場がかなり早くなるかも。