音声認識ソフトの実力評価と学習能力活用
トップ > ICレコーダー音声変換2
■Windows7音声認識によるICレコーダー音声の変換テスト :
今回、Windows7 のプレインストールされた音声認識ソフトで、 ICレコーダーに吹き込んだ音声データからテキストデータに変換するテストを行ってみました。
結論から言うと、結果は「大成功」でした !
以前、「ICレコーダーから文字化実験」のページで、AmiVoice SPを使ってICレコーダーに吹き込んだ音声データの変換テストを行いました。
音声データを音声認識ソフトでテキストデータに変換するというテストでした。
その時は、AmiVoice SP には音声データ変換機能があるのですが、Windows7の音声認識にはその機能がないため、特にテストをしようとは考えていませんでした。
ところが、ずいぶん後になって
「もしかしてWindows7でもできるのでは ?」
と思うようになったのです。
その理由は、次のようなことからです。
ホームページに投稿する記事を、いつも音声認識で入力しているのですが、今使っているヘッドセットのマイクはとても感度が良いのです。
良過ぎると思ってしまうほどなのです。
それはなぜかというと、記事を読み上げている合い間に別の音を立ててしまったり、ヘッドセットの横で服やコードを擦って小さな音を立てると、それを検出してまうのです。
「ぐ」や「つ」、あるいは BS(バックスペース)などが、余計に入力されてしまうのです。
感度良すぎると感じたので、何度かマイクのセットアップを行ってレベル調整したのですが、あまり変わりませんでした。
その感覚が頭に強く残っていたので、今回 ICレコーダーに音声を吹き込み、そしてそれをヘッドセットのマイクの横で直接再生させて、音声変換をやってみようと考えたのでした。
結果は先に書いた通りですが、詳細の内容は次の通りです。
1)使った ICレコーダー: ソニー製ICレコーダー(型式:ICD-UX523)
2)音声認識ソフト : Windows7音声認識
3)マイクセッティング :(次の画像の通りです)
感度が良いので、ICレコーダーのスピーカーはマイクから5cmほど
離れた位置にセットしました。
4)音声認識サンプル文 :
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」ということを、しばしば聞きます。
5)変換後の結果:
アメリカでは「部屋をシェアする(何人かで部屋を借りる)」ということを、しばしば聞きます。
見ていただいた通り、100パーセント正確に変換しています。
サンプル文の後に「く」という文字が誤入力されたように見えますが、これはICレコーダーがすべての再生を終わると、最後に「ピッ」と音が出るので、それを変換してしまったためです。
短い簡単な文なので、いつでも 100パーセントの変換ができるとは限りませんが、正しく変換されそうな速度で入力した音声は、かなり正確に音声認識されるということが確認できました。
Windows7音声認識をメインで使っていますが、今後、ICレコーダーをもっともっと有効に活用することができそうです。
■関連ページ
・ICレコーダーから文字化実験 ・ICレコーダーから文章を生成
・ICレコーダーからテキスト変換 ・mp3からWindows7音声認識で直接文字変換
a:28286 t:1 y:0