音声認識ソフトの実力評価と学習能力活用
トップ > ICレコーダーマイク感度と音声認識率
先日、ICレコーダーを操作していたら、録音や再生の際の設定切り換
え操作を見つけました。
というより、購入時の設定のままで変換テストして問題無いレベルの
結果が出ていたので、まったく設定を変更してみようとしていなかっ
ただけでした。
音声認識の精度に係わる部分としては「録音設定」関係だと思います
が、このICレコーダーで関係ありそうなのが3つありました。
・シーンセレクト
・録音モード
・マイク感度
一つ目は「シーンセレクト」。
ターゲット会話の音質設定を変更するのではないかと思いますが、
録音するシーンに応じて選択できるようになっていました。
「メニュー」で「シーンセレクト」を選択すると、
・会議
・ボイスメモ
・インタビュー
・おけいこ
・オーディオ入力
のように、録音シーンを選択できるようになっています。
さらに録音モードでは、単位時間当たりのデータ記録量を変更するこ
とができます。
・mp3 192kbps
・mp3 128kbps
・
・
・MONO
・LPCM
・
・
また、マイクの感度の設定もあり、感度を「高」「中」「低」と設定
できるようになっていました。
(購入時の設定は、「ボイスメモ」で感度は「中」)
マイク感度など録音音質を設定できることがわかり、より良いものを
目指したいという性格がむずむずと出てきてしまいました。
それらの設定をどうやったら音声認識の精度が良くなって、どうやっ
たら悪くなるのか、あるいはあまり差がないのかを知りたくなったの
でした。
ということで、早速、実地テストをやってみました。
あれこれ同時に行うと、何の設定が効いたのかわからなくなるので、
今回はマイク感度の設定だけを変更して、認識精度を比較してみるこ
とにしました。
■オリジナルの文章:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
ことを、しばしば聞きます。
■Windows7音声認識(直接マイクに音声入力)
1回目結果:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
ことを、しばしば聞きます。
■ICレコーダーで再生(マイク感度:低)
1回目結果:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
ことを、しばしば聞きます。
2回目結果:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
ことを、しばしば聞きます。
■ICレコーダーで再生(マイク感度:中)
1回目結果:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
ことを、しばしば記事ます。
2回目結果:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
ことを、しばしば記事ます。
■ICレコーダーで再生(マイク感度:高)
1回目結果:
アヘンは「アヘン(何人かで部屋を借りる)」という
ことを、しばしば記事ます。
2回目結果:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
ことを、しばしば記事ます。
詳しく解説する必要はないと思いますが、今回の結果ではマイク感度
を高くするよりも低く設定する方が、音声認識精度は良かったという
結果でした。
前回のテストでは、購入時の設定「中」で行って100%の変換率でし
たが、今回は少しだけ誤変換がありました。
これは読み上げる側の若干のバラツキが出たような気がします。
音声認識を意識しての読み上げ方は、結構重要なポイントと思います。
いずれにしろそれなりのやり方で行うなら、ICレコーダーに録音した
音声をマイクの前で再生し、うまく音声認識させられるということを
再確認できたのでした。
■関連の記事
・ICレコーダーから文字化実験
・ICレコーダーから文章を生成
・ICレコーダーからテキスト変換
・ICレコーダー音声変換2
a:7353 t:2 y:0