音声認識ソフトの実力評価と学習能力活用
トップ > 音声認識の精度を上げる単語登録の方法
音声認識を長く使い続けるかどうかは、その変換精度次第です!
テキスト入力の作業効率は、音声認識の変換精度の善し悪しが、大きく影響するからです。
昨今、多くの音声認識が登場し話題となっていますが、そのトータルの認識精度はどんなものなのでしょうか?
わたしは現在まで、Windows7プリインストール版の音声認識を使い続けています。そしてその認識精度を上げるために、いくつかのことをトライして向上を図ってきました。
マイクの感度の違い、再生レベル設定、マイクメーカーを替えて評価・・などのハード的なトライと、読み上げ方や単語登録方法などのソフト的なトライを。
今回はその中のとても重要なポイントの一つ、単語登録のやり方についてまとめてみました。そのやり方次第で、すごく誤変換が少なくなりますよ!
わたしはブログの記事作成を中心に音声認識を使っているので、専門用語などの登録はさほど多くありません。
また、作成する記事や話題によって出てくる語句は違いますので、異なるジャンルの様々な誤認識する語句について、一斉に取り上げることは不可能に近いです。
従って今回は、各話題に共通して出てくる語句や記号について、どのような単語登録の仕方を行って、誤変換率を減らしたか、・・という内容でまとめています。
■対象ソフト:Windows7(Windows8)プリインストール版の音声認識
■入力先 :メモ帳(その他何でも良いが、エクセルなどはクセ有り))
Windows7音声認識の単語登録のやり方は、先に対象語句を入力し、そしてその読み方を自分で声を出して吹き込むやり方になっています。
従って、「給料」を登録するに当たって、登録欄には「給料」と入力し、そして「サラリー」と読み上げたら、「給料」と変換生成されることになります。
逆にこのように登録してしまうと、「サラリー」と入力したい場合があったときは、そのまま「サラリー」とは出すことができず、生成された「給料」を「サラリー」に修正する必要があります。
従って、普段あり得ない語句で読み上げて登録する方が、このようなことにはならずに、誤変換は大幅に減らすことができます。
例えば、あり得ない語句として「つきさらりー(月サラリー)」で登録するなら、「給料」と「サラリー」ともに誤変換なく、一発入力することができます。
・つきさらりー ⇒ 給料
・さらりー ⇒ サラリー
少し極端な登録例だったかも知れませんが、自分で文字を見たらすぐに思いだせるような、覚え易い読み上げ方を設定するというのが、コツになります。
以下、登録する語句をどのように読み上げても良いという機能を利用して、単語登録を行っています。
その結果、ほとんどの記事入力のときに、95%以上の変換率でインプットすることができています。追加修正が少ないので、大幅な入力作業性の向上が図れています。
・短い読み方ほど誤変換多い。
・特に、ひらがなの1文字入力は、誤変換率が一番高い。
・長くなるほど誤変換がなくなる。
・複数文字、とくに単語よりも小文章的なレベルの部分毎の入力が、最も誤変換率が低い。
・日本語ではありそうもない「読み方」のもので設定すると、変換ミスはなくなる。
(再確認のための繰り返しです)
点、天(てん)などのように、同じ読み方の多い語は、単独だと誤変換が発生し易いが、短い文章的な長さでの入力だと、誤変換は起こりにくい。
単語レベルの読み上げで誤変換を防止したい場合は、それぞれを読み方を変えて登録しておけば、誤変換はかなり防げる。
■例:
点 ⇒ もじてん(漢字の漢をとって「かんてん」としたいが、寒天や観点があるので)
(「てんかん」も転換や癲癇などがあるため)
「文字点」という語句は、なかなか入力したいというときが無いはずと推定したので使った。
■他の例:
×改行 → ○エンター (日本語でエンターはあり得ない)
×削除 → ○デリート (この英単語は日本語化されていないので、
日本文には出て来ないので)
「の」 入力できず。コマンドの選択モードになってしまうため。
→「のはらのの」 と登録した。
(のはら だと入力することがありうる。
しかし、のはらのの と入力したいことは、普通はありえない)
「「」 ×かぎかっこ → ○かぎかっこひだり
「」」 ×かぎかっことじ → ○かぎかっこみぎ
「(」 ×かっこ → ○ひだりかっこ
「)」 ×かっことじ → ○みぎかっこ
「、」 → ○てん
「・」 ×てん → ○なかてん
(中央の高さにてん「・」があるので)
「‥」 ×てん → ○にてんりーだー
(長いけど誤変換発生率ゼロなので)
「…」 ×てん → ○さんてんりーだー
( 〃 )
「ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー」
×せん ×もじせん(文字1000 と出たりする)
→ ○ぎょうらいん
少し長く読み上げることと、あとで修正する手間を考えると、どちらが作業性が良いか・・ということをよく考えました。
そして、わたしの結論は、
誤変換多いものは、少し長い言い方で登録して誤変換を防ぐのが、
一番作業効率が向上する・・・でした。
a:10086 t:3 y:0