トップICレコーダーマイク感度と音声認識率

ICレコーダーマイク感度と音声認識率

 先日、ICレコーダーを操作していたら、録音や再生の際の設定切り換
 え操作を見つけました。

 というより、購入時の設定のままで変換テストして問題無いレベルの
 結果が出ていたので、まったく設定を変更してみようとしていなかっ
 ただけでした。

 音声認識の精度に係わる部分としては「録音設定」関係だと思います
 が、このICレコーダーで関係ありそうなのが3つありました。

 ・シーンセレクト
 ・録音モード
 ・マイク感度

録音設定

 一つ目は「シーンセレクト」。

 ターゲット会話の音質設定を変更するのではないかと思いますが、
 録音するシーンに応じて選択できるようになっていました。

 「メニュー」で「シーンセレクト」を選択すると、
  ・会議
  ・ボイスメモ
  ・インタビュー
  ・おけいこ
  ・オーディオ入力
 のように、録音シーンを選択できるようになっています。

 さらに録音モードでは、単位時間当たりのデータ記録量を変更するこ
 とができます。

  ・mp3 192kbps
  ・mp3 128kbps
    ・
    ・
  ・MONO
  ・LPCM
    ・
    ・

 また、マイクの感度の設定もあり、感度を「」「」「」と設定
 できるようになっていました。
 (購入時の設定は、「ボイスメモ」で感度は「中」)

マイク感度変えて音声認識テスト

 マイク感度など録音音質を設定できることがわかり、より良いものを
 目指したいという性格がむずむずと出てきてしまいました。

 それらの設定をどうやったら音声認識の精度が良くなって、どうやっ
 たら悪くなるのか、あるいはあまり差がないのかを知りたくなったの
 でした。

 ということで、早速、実地テストをやってみました。

 あれこれ同時に行うと、何の設定が効いたのかわからなくなるので、
 今回はマイク感度の設定だけを変更して、認識精度を比較してみるこ
 とにしました。

 

使用した機材

     IC Recorder

SONY ステレオICレコーダー UX523 4GB シルバー ICD-UX523/S


テストの結果

 ■オリジナルの文章:
 アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
 ことを、しばしば聞きます。

 ■Windows7音声認識(直接マイクに音声入力)
 1回目結果:
 アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
 ことを、しばしば聞きます。

 ■ICレコーダーで再生(マイク感度:低)
 1回目結果:
 アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
 ことを、しばしば聞きます。

 2回目結果:
 アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
 ことを、しばしば聞きます。

 ■ICレコーダーで再生(マイク感度:中)
 1回目結果:
 アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
 ことを、しばしば記事ます。

 2回目結果:
 アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
 ことを、しばしば記事ます。

 ■ICレコーダーで再生(マイク感度:高)
 1回目結果:
 アヘンは「アヘン(何人かで部屋を借りる)」という
 ことを、しばしば記事ます。

 2回目結果:
 アメリカでは「部屋をシェアする(何人かで部屋を借りる)」という
 ことを、しばしば記事ます。

結果まとめ

 詳しく解説する必要はないと思いますが、今回の結果ではマイク感度
 を高くするよりも低く設定する方が、音声認識精度は良かったという
 結果でした。

 前回のテストでは、購入時の設定「中」で行って100%の変換率でし
 たが、今回は少しだけ誤変換がありました。

 これは読み上げる側の若干のバラツキが出たような気がします。
 音声認識を意識しての読み上げ方は、結構重要なポイントと思います。

 いずれにしろそれなりのやり方で行うなら、ICレコーダーに録音した
 音声をマイクの前で再生し、うまく音声認識させられるということを
 再確認できたのでした。

 ■関連の記事
  ・ICレコーダーから文字化実験
  ・ICレコーダーから文章を生成
  ・ICレコーダーからテキスト変換
  ・ICレコーダー音声変換2
 

a:5347 t:1 y:0