音声認識ソフトの実力評価と学習能力活用
トップ > 誤った評価され易いWindows音声認識。原因はマイク?
つい先日、音声認識のことについて検索していたところ、Google音声入力は素晴らしくて、Windows音声認識は認識精度がすごく低くて、使い物にならないと書いている記事を見つけました。「パソ活ラボ」というサイト。
以前も、Windows音声認識は精度が悪くて、使い物にならないと書いてあるサイトがあって、そんなことはまったくなくて誤解していると、Windows音声認識を擁護する記事を書きました。
Google音声入力の特徴:
・認識精度やスピードはかなり優秀
・iOSやAndroidのスマホ音声入力も認識精度が高いですが、それと同じくらい、
・Googleドキュメントの認識精度は非常に高いです・・・・
・・・・この記事の下書きで困ることはほとんどありませんでした。
以下の内容が、その記事の部分。
他の音声入力ソフトと比較
Google音声入力以外の音声入力ソフトについても使ってみたり動画を見たりして比較したので少し書いておきます。
=========================
Windows音声認識:
Windowsに標準で搭載されている音声認識がありますが、認識精度がすごく低くて最初の設定も時間がかかるし使い物になりません。
=========================
AmiVoice:
市販ソフトの AmiVoice (アミボイス)は、さすがに専用の音声入力ソフトだけあって、Google音声入力よりも認識精度・スピードともにかなり良くなります。
=========================
なぜこのような極端な評価結果となるのか、その理由がよくわかりません。
自分が使っているWindows7音声認識、Windows8.1音声認識、Windows10
音声認識においては、どれも変換精度に問題はなく、誤変換される割合は10行
の文章において1~3箇所程度。
「認識精度がすごく低くて・・使い物になりません。」という結果は、
以下の3つのどれかがが原因として推定されます。
①マイクの設定が悪いか、マイクそのものが悪い状態である
→専用外部マイク(ヘッドホンマイクなど)を使っているはずなのに、
設定はパソコンの内臓マイクになっているときなど。
''②マイクに向かって読み上げているとき、近くでTVの音声や音楽など
が聞こえて、音声認識の邪魔になっているとき。''
→マイクに複数の音声が入ると、著しく認識精度が落ちたりします。
③アナウンサーのようなクリアな読み上げ方になっていない。
→だらだらとした読み上げ方で歯切れが悪いので、変換する区切りの
グループがずれてしまう可能性がある。
いずれにしろ、変換精度を認めているAmiVoice と比較しても、まったく
遜色がなく、Windows OSのコマンド操作までできるWindows音声認識
は、本当に「優れもの」だと思っています。
何とかして音声認識でホームページやブログの記事を書きたいと思って
いる人は、もう一度何が悪いのかをよく調査してみると良いのではない
でしょうか。
必ずびっくりするほどの認識精度であることを、納得していただけると
確信しています。
a:1615 t:1 y:0