音声認識ソフトの実力評価と学習能力活用
トップ > CD音声をmp3変換して音声認識しテキスト化
今回は、CDの音声からデータ変換をして音声認識を行い、テキスト文を生成するテストをしてみました。
英語本に付属したCD音声を変換して、次の2つのやり方で変換テストを行いました。
まず一つは、日本語テキスト文の生成。
音声ファイルの日本語部分より、Windows7音声認識で日本語のテキスト文を作り出すテスト。
そしてもう一つは、英語テキスト文の生成。
音声ファイルの英語部分より、ONLINE DICTATION(英語用音声認識)を使って英語テキスト文を
作り出すテストです。
①CDより音声データ(WAVファイル)を取り出します。(QCDプレーヤーにて)
②そしてそれをNAVYで編集し、日本語部分と英語部分に分けて、それぞれを保存します。
③保存したWAVファイルをmp3に変換し、ICレコーダーへコピー
④ICレコーダーで日本語データを再生しながら、Windows7音声認識で変換。
⑤同じくICレコーダーで英語データを再生しながら、ONLINE DICTATIONで音声認識させて英文を生成。
という手順でテストを行いました。
1)日本語部分
↓クリック
2)英語部分
↓クリック
結論から言うと、
「Windows7音声認識での日本語文生成は失敗」
「ONLINE DICTATIONでの英語文生成は成功」
でした。
なぜか理由はわかりませんが、肉声で録音した音声を再生する場合は、Windows7音声認識はほとんど正確に文字変換してくれたのですが、
CDデータからの音声は、すべて文字化けの結果となってしまいました。
・ICレコーダーのスピーカーをマイクの近くにもっていき再生し音声認識
「寡婦しアヘンが減人が不法いった変化を指摘しアヘンしアヘンし、アヘンし」
・ICレコーダーのイヤホーンジャックからの出力をPCのマイクへ直結し音声認識
「寡婦しながらをにらみ過ぎの見直いった日は2ゴールの好きなっている足の会社は平らにしていないが開きパンパンる」
どちらのやり方でも、まったく読み取れる文章にはなっていません。
一方、もう片方は‥
He has long legs
mrs. Davis has blue eyes
she has two cats
my company has seven branches in Taiwan
変換したときは横に一直線になっていますが、見易いように改行をさせています。
いずれにしろ、正確に音声認識されて正しい英文が生成されています。
一勝一敗という結果でした。
日本文において、なぜ肉声は問題なくてCDの音声データはだめなのか、もう少し研究とテストを続けてみます。
・mp3からWindows7音声認識で直接文字変換
・ICレコーダーマイク感度と音声認識率
・ICレコーダーから文字起こし(その7)
・ICレコーダーから文字起こし(その8)
a:2951 t:1 y:0