音声認識ソフトの実力評価と学習能力活用
トップ > Windows7とAmivoiceSPの音声辞書比較
今回は、Windows7音声認識とAmivoiceSPの音声辞書や学習機能について、比較評価してみました。
いずれの音声認識ソフトも、少しずつ自動学習させたり辞書登録を繰り返して、認識精度を上げていくようになっています。
もともとの認識性能はもちろん重要ですが、あとからの学習能力の性能も、長く使用していく上ではとても重要な点となります。
記事などの入力作業における、作業性や所要時間に大きく影響するからです。
従って、音声認識のソフトを導入する前に、その部分もよく調べて理解しておく必要があります。
Windows7の場合は、以下の3つのやり方で、学習/登録してレベルアップさせていくことができます。
1)チュートリアルを実施しながら、ソフト側が自動的にまとめて学習する
2)操作者が単語を入力後、その読み方を自分が発声し、吹き込んで登録する
3)誤変換された語を修正・編集する際に、その結果を辞書に反映
(ここは不明確。そのように感じている)
※修正時の動作:
変換されたものが目的の語でなかった場合、対象部分をドラッグしてリバース表示させて、再度発声して読み上げると、10個くらいの別の候補が表示されるので、そこで正しいものの番号を入力する。
(クリック又は音声で入力)(「2」OK・・のように言う)
一方、AmivoiceSPは、音声辞書登録の方法は一つだけだったように思います。(最近、使っていないので)
もしかしたら、誤変換されたものを修正するために、次の候補を表示させ、正しいものを選択した際に、その情報が登録されているのかも知れません。
しかし、使っていたときは、そのような気配は感じませんでした。
(修正の結果が辞書登録され、次のときに反映されているように感じられなかったので)
つまり、変換精度を上げるための学習方法は、ハンドで辞書登録するやり方一つだということ。
従って、誤変換されるものがあれば、どんどん辞書登録をしていけば良いという結果でした。
辞書登録のやり方は、変換対象の語句を入力し、その読み方をひらがなで入力するやり方でした。Windows7のように、音声を吹き込んで登録するといやり方ではありませんでした。
辞書登録をしたものは、誤変換される確率が低くなるという印象。
Windows7音声認識は音声を吹き込んで登録するのですが、登録したものが必ず優先順位1番に変換されるとは限らない・・という部分があります。(裏方のアルゴリズムは不明です)
従って、どちらのソフトも一長一短というところでした。
自分で使ってきた評価は、音声辞書の性能と学習機能の点で、わずかにWindows7の方に軍配を上げるというところでしょうか。
操作性などを含めたトータルの性能、使いやすさでは、わたしはWindows7音声認識の方に◎を上げたいと思います。
なので、結果的にWindows7の音声認識だけの使用になっていったのです。
そして、コストフリーなのもありがたい部分ですね!
■関連の記事:
・専門分野の翻訳精度比較
・ブログ記事で変換テスト
・同じ課題文で変換精度を再検証
・AmiVoice辞書切換の実力評価
a:3597 t:1 y:1