トップOCRソフトによる文字認識実験の結果

OCRソフトによる文字認識実験の結果

今回は音声認識関連の報告ではなく、OCRソフト文字認識)のテスト
レポートです。

これまでわたしは、ブログやホームページの記事作成には、限りなく
音声認識によるテキスト入力を活用してきました。

読み上げて原稿入力するオーソドックスな方法と、あらかじめ吹き込ん
でおいたICレコーダーの音声データから原稿入力する2つのやり方で。

ときどき、新聞や雑誌などで参考になる記事があったようなときは、
それを切り取っておき、あとで読み上げて音声認識で文章入力をしてい
ました。

しかし実は、もう一つの方法を持っていたのです。
それは、OCR、文字認識ソフトです。

書類や雑誌のプリントなどから、光学的に文字を読み取ってテキスト
データなどを生成するソフトです。

パソコンで印刷したようなきれいな印刷物の場合は、ほぼ完璧な文字
データに変換してくれます。

しかし一方で、フォントが崩したようなものであったり、間に線など
の不要な記号や図が入っていたり、部分的に文字や台紙の色が違った
りなどすると、変換精度は著しく低下します。

元の原稿をスキャンしてjpgやpdf化するときにも、少しスキャンする
面がウェーブしたりなどすると、やはり精度は低下してしまいます。

従って、パソコンなどの印刷物の変換では使っていましたが、ブログ
の記事作成用途では使っていませんでした。

ところが、ときが立つと状況も変わるものです。
ここのところ、英文入力がかなり多くなってきたのです。

それで何とか文字認識をうまく活用できないものかと、再度、トライ
をしてみたのでした。

実験の結論

結論から言うと、
 ・原稿に合った解像度にセット
 ・1P単位で波打たないようにして(本などは束ねたものを切り離す)
  スキャンすれば、95%以上の精度で復元できる。
  ‥‥でした。

OCRソフトとスキャナー 

テストで使った文字認識ソフトは、
 ・メーカー: Panasonic Solution Technologies
 ・ソフト名: 読取革命 Ver.15
 ・機能  : 日本語/英語(別々の読取セッティングになります) ・・・です。

 
また、原稿を文字認識する前に、スキャナーでpdfかjpgなどの画像に
変換しておく必要があります。

使ったスキャナーは、
 ・メーカー: エプソン
 ・型式  : PX-404A(一番安いスキャナー付きプリンタです)
 ・ソフト : EPSON SCAN(付属ソフト)

スキャナーの読取設定は、
 ・原稿種  :反射原稿
 ・取込み装置:原稿台
 ・自動露出 :書類向き
 ・出力設定
   イメージタイプ:24bit カラー
   解像度    :300 dpi
   オプション  :アンシャープマスク のみスイッチON
           モアレ除去、退色復元、逆光補正、ホコリ除去
           のオプションスイッチは入っていません。

要は、解像度だけは初期設定の240dpiより1ランク上げていますが、
その他は全て初期設定のままということです。

 

実験の英文原稿

まず最初に英文の読取テストを実施しました。
今回の主目的は、英文認識に力を入れていたためです。

ある雑誌に載っていた、小さな英文一覧をスキャンした画像データです。
文字認識の条件は、「英語認識モード」にセット。

p1e s

そしてそれを文字認識した結果(テキスト出力)です。

認識結果:
I need to find a new boyfriend.
How do you like your new boyfriend?
Be nice to the new boss.
How do you like my new hairstyle?
I'd like a new room.
Should we apologize later?
That's not you.
How old is your dog?
Tell me about your company.
Tell me about your country.
What's wrong with your car?
Tell me about your hometown.
I'm not sure if you'll like it.
How old is your computer?

考察1:
 わざときれいにスキャンできた部分をやったわけではありませんが、
 1箇所のご認識もなく復元できています。

次に日本語の部分をやってみました。
文字認識の条件は、「日本語認識モード」にセット。

p1j s

同じく文字認識した結果(テキスト出力)です。

認識結果:
新しい彼氏を見つけなくっちや。
新しい彼はどう?
新しい上司をいじめないように。
(私の)新しいヘアスタイルはどう?
新しい部屋にしていただきたいんです。
あとで謝った方がいいかな。
あなたには本当に似合わない。
あなたの犬は何歳?
あなたの会社について教えてください。
あなたの国について教えて。
あなたの車、こわれているの?
あなたの故郷について教えて。
あなたの好みかどうかわかりませんが。
あなたのコンピュータはいつのもの?

考察2:
 こちらも100%の結果が得られました。

まとめ

今回のテストでわかったのは、文字認識ソフトは相当のレベルになって
いるので、解像度以外、あれこれ操作は不要だということ。

問題は、読み取らせる原稿の状態や文字認識するための画像データを、
できるだけ誤認識しないようなセッティングで正しく読み取っておく
いうことに尽きる・・という結果でした。
 

a:2979 t:1 y:0