音声認識ソフトの実力評価と学習能力活用
トップ > 音声辞書の活用とその手順
今回は音声辞書を最大限に活用するため、そのやり方や特徴について細かく調査してみました。
音声辞書活用の目的は、大きく分けて2つあります。
1)入力できない文字
音声辞書に登録しておかないと、音声では絶対に出せない文字があります。
同じ読み方となる違う単語や記号など。
⇒その場合は、キーボードから直接入力するしかありません。
2)入力効率のアップ
誤変換されやすい文字などを音声辞書に登録することにより、大幅に誤変換を減らすことができます。結果として、入力効率のアップを図ることができます。
■入力時、動作のムダ:
また、音声による入力は動く部分が唇だけなので、移動などの動作の無駄がほとんどありません。そのため、入力するときの速度が速いです。
⇒マウスはカーソルの移動、キーボードは手の移動が時間ロスとなります。
⇒音声とマウス、あるいは音声とキーボード、さらには音声と左手がキーボード、右手はマウス操作として、3つを同時並行で操作し、高速入力することも可能です。
音声辞書への登録はとても簡単です。
(手順はあとで説明)
⇒Windows音声認識もAmiVoiceSPも、特にややこしい入力等はなく、決められた流れに沿って選択や語句入力をするだけです。
⇒手順を一口で言うと、登録する「単語(または文章)を入力」し、その単語の読み方を「録音」するだけ。
■Windows音声認識
そのやり方の違いから言うと、Windows音声認識の方が、自前の声を録音して登録するので、より自分の声に合った形で緻密に登録されているように感じます。
つまり、自分の声を使って録音して登録するので、声の個性が登録内容に反映されることになるという気がします。
オリジナルの声で登録されていくので、何となく自分に合った音声認識に作り上げていくような感覚があるのです。
■AmiVoiceSP
一方、AmiVoiceSPの登録の仕方は、「単語」と「読み方」をそのままキー入力してから、「登録」ボタンを押すというやり方。
自分で読み上げて録音する必要はなく、あくまでも入力されたテキストで音を判断(変換)するような仕組みになっているので、Windows音声認識よりは何となく認識精度が落ちるのでは・・と考えたことがありました。
しかし、実際に使った上での比較では、それほど顕著に精度に差があるような感じはしませんでした。
判定対象データに微妙な部分の差があるとしても、認識するソフトの検出アルゴリズムによって、最終の結果が出るわけなので、総合性能に差があるかというと、さほど大きな性能差はないと感じています。
ソフトの優劣の印象は、認識精度などの性能差の部分からではなく、ソフト操作や画面の見易さ、Windowsコマンド操作機能の有無などによる印象からの方が大きいです。(私個人の印象)
→「音声辞書を開く」と言えば、辞書編集メニューが開きます。
(コントロールバー上で右クリックするとプルダウンメニューが開き、その中の「音声辞書を開く」をクリックしても良いです)
→「新しい単語を追加する」をクリック
(声を出して発声しても良いです)
→例:「(1)」
→「完了」をクリック
→「録音」をクリック
→「既存の単語を変更する」をクリック
→登録済の単語一覧が出てくるので、編集する単語をクリック
→以下、登録するときと同じような手順で変更を行う。
AmiVoiceSPにおける単語登録の手順は、次の通りです。
→登録する単語と読みを入力する
→追加登録された単語が、リストの最後に表示された。
■Windows音声認識:
①録音したときと同じような速度で発音すると、
「パーソナルコンピューター」と変換された。
②少し早い速度で発音すると、
そのまま「パソコン」と変換されました。
■AmiVoiceSP:
一方、AmiVoiceSPの場合は、
①録音したときと同じような速度で発音
「パーソナルコンピューター」と変換。
②少し早く発音
「パーソナルコンピューター」と変換。
③少し遅く発音
「パーソナルコンピューター」と変換。
④かなり早く発音
「パーソナルコンピューター」と変換。
発音の速度に関係なく、同じように登録した語句に変換されました。
一長一短ですね!
誤変換を減らすため、間違い易い単語はできるだけ辞書登録するのが良いです。
短い文字数で登録し、変換されて入力されるものは文字数の多いもの(例えば
長い文章など)を一発変換させることにより、大幅に作業効率をアップさせる
ことができます。
また、誤変換を減らすことができ(修正作業にかかる時間は意外に大きい)、
わずかな操作(音声入力)で多くのテキストを入力することができます。
いずれのソフトにも、最初から単語登録の機能は用意されているのですから、
その機能を最大限に有効活用するべきと思います。
まずは自分なりに、徹底的に音声辞書を試して研究してみることにより、
一層、楽に早く音声入力ができるようになるのは間違いありません。
a:1495 t:1 y:5