トップICレコーダーからの文字入力を動画検証

ICレコーダーからの文字入力を動画検証

さて今回は、前回の「Windows音声認識の誤変換ゼロを動画検証」記事の続編になります。

今度は、音声を直接入力しながら認識していくのではなく、一旦ICレコーダーに音声を録音しておき、あとでそれを再生しながら音声認識し文字化していくという実験を行いました。

ICレコーダーマイク感度のセッティング無しに実験を行ったため、一部だけ誤変換がありましたが、ほとんど問題なく使用ができる、実用性は十分あると判断できる結果になっています。

音声録音の状況と、それを再生しながら音声認識し文字化している状況を、動画を見ながらご確認ください。


1:課題文の音声を録音

前回と同じ課題文を、sony製のICレコーダーの前で読み上げて録音しました。

マイクの前、10cmくらいの距離から発声し、データはmp3ファイルで生成されます。

ーーーーーーーーーーーーーーーーーーーーーー
課題文
ーーーーーーーーーーーーーーーーーーーーーー
今回は外部マイクとコンピューター内蔵マイクとの性能の違いを確認してみました。
いつも音声認識を使って文書を入力するときは、外部マイクを接続してから
Windows音声認識を立ち上げて、文章を読み上げて文字入力していきます。

ほんのわずかなことですが、音声認識するときにマイクを着脱するということが
面倒なため、パソコンの内蔵マイクで精度良く変換することができるなら、
面倒な作業を一つ減らすことができるようになります。
ーーーーーーーーーーーーーーーーーーーーーー

 

 

2:録音音声を再生し音声認識

さて次は、先に課題文を録音したmp3データを、ICレコーダーでマイクの前で再生しながら音声認識を行っていきます。


3:変換結果

以下、変換後の文字入力結果です。

ーーーーーーーーーーーーーーーーーーーーーー
あ今回はアヘンのコンピューター内蔵マイクとの性能の違いを確認してみました。
いつも音声認識を使って文章を入力するときは、外部マイクを接続してから
、同ず音声認識を立ち上げて、文章を読み上げて文字入力していきます。

ほんのわずかなことですが、音声認識するときにマイクを着脱するということがEnter
面倒なため、パソコンの内蔵マイクで精度良く変換することができるなら、
面倒な作業を一つ減らすことができるようになります。
ーーーーーーーーーーーーーーーーーーーーーー

■誤変換部分:
①スタート部分のちょっとした音が、テキストに「あ」という文字に
②「今回は」の次にくる「外部マイクと」の文が「アヘンの」に
③「Windows」が「、同ず」に
④改行指示の「エンター」が、文字「Enter」に(改行されず)

以上、4箇所で誤変換がありました。

4.まとめ

誤変換の原因は、録音した音声が、
①直接マイクに向けて発する音声レベルよりわずかに低かったこと
②ICレコーダーのマイク感度調整が不十分
③再生用スピーカーとマイクの距離
④「Enter」の発音がクリアではなかった‥(改行と発声も可能)

などが、ベストセッティングではなかったことが考えられます。

次回は、それらをきっちり調整して、誤変換ゼロの結果を確認したいと考えています。
別途、再レポートします。

関連記事:Windows音声認識の誤変換ゼロを動画検証


a:1380 t:1 y:1