音声認識ソフトの実力評価と学習能力活用
トップ > mp3音声データをAmivoiceSPで音声認識
今回、CDより取り込んだmp3音声データを使って、AmiVoiceSPで音声認識させ、うまくテキスト化できるかどうかをテストしてみました。
また、合わせて、文字テキストから音声合成にてmp3音声データを作り出し、そしてそれを今後は、AmiVoiceSPを使って逆にテキストに戻すというテストも行ってみましたので、結果について報告します。
今までの変換実験経緯:
mp3音声データを使って音声認識し、文字テキストに変換するという実験を今まで何度か行ってきました。
そして、
「Windows7音声認識では、CDから取り込んだ音声データではうまく変換できない」という結果。まったく意味不明のテキストに変換されてしまうというものでした。
一方、英文の場合は、CDから取り込んだ英文の音声データでも、「Online speech recognizerでは完璧に近いほどの英語テキストに変換できた」という結果。
課題文は次の通りで、前回Windows7音声認識でトライしたものと同じです。
日本語文と英文を交互に4セットを読み上げるという内容です。
Windows7音声認識には、mp3などの音声ファイルを指定してボタンをクリックすると、すぐにそれをテキストとしてエディターに取り込む機能があります。とても簡単に音声データからテキスト変換することができます。この機能は本当に便利な機能だと思っています。
Windows7音声認識にはこのような機能がないため、一旦mp3プレーヤーにデータを書き込んでから、それをマイクに向かって再生させて音声認識をしていました。とても作業性が悪かったです。
しかし、まずは結果ということで、早速実験を行ってみました。
■課題文1:
ーーーーーーーーーーーーーーーーーーーーーーー
彼は脚が長い。
He has long legs.
デービス夫人の目は青い。
Mrs. Davis has blue eyes.
彼女は猫を2匹飼っている。
She has two cats.
私の会社は台湾に支店が7つある。
My company has seven branches in Taiwan.
ーーーーーーーーーーーーーーーーーーーーーーー
変換した結果は次の通り。まったく意味不明だった Windows7音声認識よりは少しはマシという結果。日本語文は変換50点というところですが、英文はまったくダメでした。
■変換結果1:
ーーーーーーーーーーーーーーーーーーーーーーー
金は脚が長い批判資本前靴念入り筋の寝顔プレステ分散部分はです。彼女は猫2匹飼っている。市販支給期間わたしの会社は台湾に支店が七つあるまい根へセブン母音 CHU 全般をわたしは何がいいです。それでは、彼女はで耕に買っています。
ーーーーーーーーーーーーーーーーーーーーーーー
変換結果がズラズラーっと長い一つの文となっているのでわかりにくいため、課題文1に対応した形で分けて整理してみると、次のような感じになりました。
■整理した結果:
ーーーーーーーーーーーーーーーーーーーーーーー
金は脚が長い ←上段:日本文
批判資本前靴 ←下段:英文
念入り筋の寝顔
プレステ分散部分はです。
彼女は猫2匹飼っている。
市販支給期間
わたしの会社は台湾に支店が七つある
まい根へセブン母音 CHU 全般を
ーーーーーーーーーーーーーーーーーーーーーーー
次に実験2として、先にテキストから音声合成をして作ってあったmp3ファイルから、うまくテキスト変換できるかを試してみました。
Windows7音声認識では、音声認識がうまくいかずにまったく意味不明の結果となっていましたが、AmiVoiceSPではどうなるか・・というところです。
課題文は次の通りで、音声合成のときに使った課題文です。
■課題文2:
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
サニーレタスの新芽の成長は今
サニーレタスの新しく出てきた芽というか若葉の状況ですが、
本体全体の印象がパッとしない中、少しずつ大きくなってきています。
新芽というのはその成長力が活発だと思うのですが、
1日1日その姿が変わっていきます。
その動きが目で見てわかるほどなので、毎日見ていてとても楽しいですし、
植物の持つ強い生命力を感じさせられます。
野菜を栽培していてすごく楽しいなと思うのは、この生命力を毎日見せられ、
そこから何か前向きなエネルギーがもらえるからです。
サニーレタスとレタスの両方を水耕栽培しているのですが、
同じレタスでもいろいろな部分で特性が違っているようです。
上に書いたようにサニーレタスは新芽が出て成長を始め、
レタスは新芽は出ずに本体がまだまだ生彩を欠いていません。
この先どうなっていくのか、
もう少し今回の「成長点をカット」実験を続けてみようと思っています。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
変換した結果は次の通り。
それなりに変換はしており、Windows7音声認識よりはずい分まともな変換結果となっていますが、まだ実用上で自信もって使えるというレベルまではいっていません。(修正箇所が多くて、作業性が悪い)
■変換結果2:
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
他人レタスの新芽の成長は今種にレタスの新しく出てきためというか
若葉の状況ですが本体全体の印象がぱっとしない中徹子手術を大きく
なってきています。
貴信めというのはその成長力が活発だと思うのですが、達1日その姿
が変わっていきますと動きが目で見てわかるほどなのでって毎日見て
いてとてもたのしいですして植物の持ち強い生命力を感じさせられま
すと野菜を栽培していてすごく楽しいなと思うのはたこの生命力を
毎日見せられてそこから何か前向きなエネルギーがもらえるからです
他にレタスとレタスの両方を水子栽培しているのですがと同じレタス
でもいろいろな部分で特性が違っているようです。
田上に書いたようにサニーレタスは新芽が出て成長を始めたね明日は
新芽は出ずに本体がまだまだ制裁を欠いていません。たこ野崎どうな
っていくのか等を少し今回のて頂点を買っと実験を続けてみようと思
っています。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
肉声以外では、なかなかうまくいきません・・。
a:1846 t:1 y:0