トップICレコーダー音声変換2

ICレコーダー音声変換2

■Windows7音声認識によるICレコーダー音声の変換テスト :

今回、Windows7 のプレインストールされた音声認識ソフトで、 ICレコーダーに吹き込んだ音声データからテキストデータに変換するテストを行ってみました。

結論から言うと、結果は「大成功」でした !

以前、「ICレコーダーから文字化実験」のページで、AmiVoice SPを使ってICレコーダーに吹き込んだ音声データの変換テストを行いました。

音声データを音声認識ソフトでテキストデータに変換するというテストでした。

その時は、AmiVoice SP には音声データ変換機能があるのですが、Windows7の音声認識にはその機能がないため、特にテストをしようとは考えていませんでした。

ところが、ずいぶん後になって
 「もしかしてWindows7でもできるのでは ?
と思うようになったのです。

その理由は、次のようなことからです。

ホームページに投稿する記事を、いつも音声認識で入力しているのですが、今使っているヘッドセットのマイクはとても感度が良いのです。
良過ぎると思ってしまうほどなのです。

それはなぜかというと、記事を読み上げている合い間に別の音を立ててしまったり、ヘッドセットの横で服やコードを擦って小さな音を立てると、それを検出してまうのです。

」や「」、あるいは BS(バックスペース)などが、余計に入力されてしまうのです。

感度良すぎると感じたので、何度かマイクのセットアップを行ってレベル調整したのですが、あまり変わりませんでした。

その感覚が頭に強く残っていたので、今回 ICレコーダーに音声を吹き込み、そしてそれをヘッドセットのマイクの横で直接再生させて、音声変換をやってみようと考えたのでした。

 

実験結果

結果は先に書いた通りですが、詳細の内容は次の通りです。

1)使った ICレコーダー: ソニー製ICレコーダー(型式:ICD-UX523)
2)音声認識ソフト   : Windows7音声認識
3)マイクセッティング :(次の画像の通りです)

感度が良いので、ICレコーダーのスピーカーはマイクから5cmほど
離れた位置にセットしました。

mic setting

SONY ステレオICレコーダー UX523 4GB シルバー ICD-UX523/S


4)音声認識サンプル文
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」ということを、しばしば聞きます。

5)変換後の結果
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」ということを、しばしば聞きます。

変換結果

考察

見ていただいた通り、100パーセント正確に変換しています。
サンプル文の後に「く」という文字が誤入力されたように見えますが、これはICレコーダーがすべての再生を終わると、最後に「ピッ」と音が出るので、それを変換してしまったためです。

短い簡単な文なので、いつでも 100パーセントの変換ができるとは限りませんが、正しく変換されそうな速度で入力した音声は、かなり正確に音声認識されるということが確認できました。

Windows7音声認識をメインで使っていますが、今後、ICレコーダーをもっともっと有効に活用することができそうです。

■関連ページ
 ・ICレコーダーから文字化実験  ・ICレコーダーから文章を生成
 ・ICレコーダーからテキスト変換 ・mp3からWindows7音声認識で直接文字変換
 

a:28286 t:1 y:0