トップCD音声をmp3変換して音声認識しテキスト化

CD音声をmp3変換して音声認識しテキスト化

今回は、CDの音声からデータ変換をして音声認識を行い、テキスト文を生成するテストをしてみました。

英語本に付属したCD音声を変換して、次の2つのやり方で変換テストを行いました。

まず一つは、日本語テキスト文の生成。
音声ファイルの日本語部分より、Windows7音声認識で日本語のテキスト文を作り出すテスト。

そしてもう一つは、英語テキスト文の生成。
音声ファイルの英語部分より、ONLINE DICTATION(英語用音声認識)を使って英語テキスト文を
作り出すテストです。

手順:

①CDより音声データ(WAVファイル)を取り出します。(QCDプレーヤーにて)
②そしてそれをNAVYで編集し、日本語部分と英語部分に分けて、それぞれを保存します。
③保存したWAVファイルをmp3に変換し、ICレコーダーへコピー

④ICレコーダーで日本語データを再生しながら、Windows7音声認識で変換。
⑤同じくICレコーダーで英語データを再生しながら、ONLINE DICTATIONで音声認識させて英文を生成。
という手順でテストを行いました。

テストで使用した音声データ:

1)日本語部分
↓クリック


2)英語部分
↓クリック


変換テストの結果:

結論から言うと、
Windows7音声認識での日本語文生成は失敗
ONLINE DICTATIONでの英語文生成は成功
でした。

なぜか理由はわかりませんが、肉声で録音した音声を再生する場合は、Windows7音声認識はほとんど正確に文字変換してくれたのですが、
CDデータからの音声は、すべて文字化けの結果となってしまいました。

 

日本語文変換結果:

・ICレコーダーのスピーカーをマイクの近くにもっていき再生し音声認識
寡婦しアヘンが減人が不法いった変化を指摘しアヘンしアヘンし、アヘンし

・ICレコーダーのイヤホーンジャックからの出力をPCのマイクへ直結し音声認識
寡婦しながらをにらみ過ぎの見直いった日は2ゴールの好きなっている足の会社は平らにしていないが開きパンパンる

どちらのやり方でも、まったく読み取れる文章にはなっていません。

一方、もう片方は‥

英語文変換の結果:

online dictation result

He has long legs
mrs. Davis has blue eyes
she has two cats
my company has seven branches in Taiwan

変換したときは横に一直線になっていますが、見易いように改行をさせています。
いずれにしろ、正確に音声認識されて正しい英文が生成されています。

一勝一敗という結果でした。

日本文において、なぜ肉声は問題なくてCDの音声データはだめなのか、もう少し研究とテストを続けてみます。

mp3からWindows7音声認識で直接文字変換
ICレコーダーマイク感度と音声認識率
ICレコーダーから文字起こし(その7)
ICレコーダーから文字起こし(その8)
 

a:2951 t:1 y:0