トップmp3音声データを音声認識、文字化実験再トライ

mp3音声データを音声認識、文字化実験再トライ

前回、前々回と音声データをマイクに向けて再生させながら、ダイレクトに音声認識させて文字化する実験を行いました。

結果はまあまあでした。
十分使えるなと判断できるレベルで、誤変換が4箇所という結果。

4箇所はそれなりに少ない結果ですが、このくらいのレベルであるなら、何とか音声辞書を使うことで「誤変換ゼロ」にもっていけるのではないかと思ってしまいます。

ということで今回は、この4箇所の誤変換箇所をうまく音声辞書に登録して、誤変換をゼロにできるかどうかを、再度トライしてみました。

voice recognition1

前回の変換結果

まずは、前回の変換結果の復習です。

ーーーーーーーーーーーーーーーーーーーーーー
【課題文】
ーーーーーーーーーーーーーーーーーーーーーー
皆さんは、外国に旅行するとき、看板や交通標識、掲示などには注意を払っていますか。ちょっと注意して見ると、街中にはいろいろな看板や掲示があることに気づかれるでしょう。

交通標識のように安全な生活を守るために法規を順守させるもの、危険を避けるために設けられたもの、広告として人目を引くようにつくられたものなどなど。

こうした標識や看板でつかわれている行為や表現を使って「生活英語」に慣れ、パンチのいた表現を覚えていきましょう。
ーーーーーーーーーーーーーーーーーーーーーー
【変換結果】
ーーーーーーーーーーーーーーーーーーーーーー
皆さんは、外国に旅行するとき、看板や交通標識、掲示などには注意を払っていますか。
ちょっと注意して見ると、80にはいろいろな看板や刑事があることに気付かれるでしょう。
             ̄ ̄          ̄ ̄ ̄
交通標識のように安全な生活を守るために放棄を順守させるもの、危険を避けるために
                    ̄ ̄
設けられたもの、広告として人目を引くようにつくられたものなどなど。

こうした標識や看板でつかわれている行為や表現を使って「生活英語」に慣れ、パンチの
利いた表現を覚えていきましょう。あ

■誤変換箇所 :4箇所
■停止音による:1箇所
ーーーーーーーーーーーーーーーーーーーーーー

ここで停止音による1箇所(文章の一番最後の「あ」)ですが、これは使っているICレコーダーの持っている特性なので、こちらでは再生を停止したときの「キュッ!」という音を消すことはできません。

どうしてもなくしたいのなら、文字化したい文章が終了した時点で先に音声認識をOFFにすれば済むことなので、今回の対策を検討する対象からは外すことにしました。
 

 

具体的な対策立案

1)「街中には」→「80には」
これはこちらの読み上げ方が悪かったか、発音の仕方が良くなかったと思いますので、音声辞書を利用するのではなく、きっちりハキハキと発声するように注意します。

2)「掲示が」→「刑事が」
本当は平坦な読み方をしたときは「掲示が」となり、上げてから下げるような読み方をした場合は「刑事が」となって欲しいのですが、これは少し微妙でむずかしいと思います。

従って、「刑事」とは結びつかないよう、「掲示がある」までを音声辞書に登録してみることにします。

3)「法規を」→「放棄を」
これも「掲示が」と同じようなケースなので、「放棄」とならないよう「法規を順守」までを音声辞書に登録してみます。

4)「効いた」→「利いた」
こちらは前の部分と一緒にして、「パンチの効いた」で音声辞書登録してみることにしました。以上のご変換対策を行って、音声認識誤変換ゼロを目指して再トライです。

ーーーーーーーーーーーーーーーーーーーーーー
【課題文】
ーーーーーーーーーーーーーーーーーーーーーー
皆さんは、外国に旅行するとき、看板や交通標識、掲示などには注意を払っていますか。ちょっと注意して見ると、街中にはいろいろな看板や掲示があることに気づかれるでしょう。

交通標識のように安全な生活を守るために法規を順守させるもの、危険を避けるために設けられたもの、広告として人目を引くようにつくられたものなどなど。

こうした標識や看板でつかわれている行為や表現を使って「生活英語」に慣れ、パンチの効いた表現を覚えていきましょう。
ーーーーーーーーーーーーーーーーーーーーーー
        ↓
ーーーーーーーーーーーーーーーーーーーーーー
【変換結果】1回目  誤変換:2箇所
ーーーーーーーーーーーーーーーーーーーーーー
皆さんは、外国に旅行するとき、看板や交通標識、掲示などには注意を払っていますか。ちょっと注意して見ると、町じゅうにはいろいろな看板や掲示があることに気付かれるでしょう。

交通標識のように安全な生活を守るために法規を順守させるもの、危険を避けるために設けられたもの、広告として人目を引くようにつくられたものなどなど。

こうした標識や看板でつかわれている行為や表現を使って「生活英語」に慣れ、パンチの利いた表現を覚えていきましょう。                           
ーーーーーーーーーーーーーーーーーーーーーー
        ↓
ーーーーーーーーーーーーーーーーーーーーーー
【追加対策実施】
・「町じゅうには」→ 「街中には」で音声辞書に登録。
・「パンチの利いた」→ 一度登録を削除して、再登録(再度録音)。
ーーーーーーーーーーーーーーーーーーーーーー
        ↓
ーーーーーーーーーーーーーーーーーーーーーー
【変換結果】1回目  誤変換:0箇所
ーーーーーーーーーーーーーーーーーーーーーー
皆さんは、外国に旅行するとき、看板や交通標識、掲示などには注意を払っていますか。ちょっと注意して見ると、街中にはいろいろな看板や掲示があることに気付かれるでしょう。

交通標識のように安全な生活を守るために法規を順守させるもの、危険を避けるために設けられたもの、広告として人目を引くようにつくられたものなどなど。

こうした標識や看板でつかわれている行為や表現を使って「生活」に慣れ、パンチの効いた表現を覚えていきましょう。
ーーーーーーーーーーーーーーーーーーーーーー

まとめ

voice recognition2

音声辞書を活用することで、誤変換4箇所をゼロにすることはできました。
つまり、ある関係の話題に絞って使う場合は、あらかじめ誤変換するフレーズをどんどん音声辞書登録することで、限りなくゼロに近づけていくことができるということ。

ただし、全方位でどんな話題でも誤変換をゼロに近づけるということは、膨大な数のフレーズを登録することになり、登録がダブって相互干渉するものも出てくる可能性があり、かなりむずかしいと思われます。

前:ICレコーダー|mp3音声から音声認識でテキスト変換
前:ICレコーダー|再生音声から音声認識で文字変換テスト


a:1309 t:2 y:0