音声認識ソフトの実力評価と学習能力活用
トップ > 音声で誤認識のない記号入力の方法
音声認識で記事を入力するときに、作業効率に大きく影響するのが誤認識と誤変換。
とりわけ記号の入力をどう読み上げてやるのかが、一つの重要なポイントとなります。
その読み上げ方によって誤認識が発生し、その修正を繰り返すことにより、記事作成
の効率はどんどん低下していきます。
例えば、次の記号はどのように読み上げているでしょうか?
「(」は何?
「)」は何?
一般的な読み上げ方だと、
「(」→ ひだりかっこ
「)」→ みぎかっこ
このあたりはだいたいみな同じではないかと思いますが・・。
それでは次の記号はどう読み上げているでしょうか?
「「」→ ?
「」」→ ?
・
・
・
以前のわたしの設定は、
「「」→ ひだりかぎかっこ
「」」→ みぎかぎかっこ
としていました。
80%程度はOKなのですが、ときどきは誤認識が発生していました。
それで読み変えたのは、
「「」→ かぎかっこひだり
「」」→ かぎかっこみぎ
としてみました。
これはなかなか良かった例の一つですが、誤変換/誤認識はまったくと言っていい
ほど、なくなりました。
このように、誤変換を減らすための最終手段としては、読み方をよりユニークな
ものに変えて音声辞書に登録することにより、確実に誤変換を無くしていくことが
できます。
少しくらいは読み上げる語句の数が増えたとしても、確実に誤変換を無くせるのならば、
そちらのほうが作業性が向上し、トータルでメリットが大きいです。
この部分については、本人が「覚え易く」且つ「読み上げ易い」”読み”を工夫して設定
し、スムーズな記事の入力を図っていただいたら良いでしょう。
自分が作る記事でよく使う記号については、いずれもダブらないような読みを設定して
います。少しですが、例ということでご紹介します。
記号 | 読 み | 変換テスト結果 | 判定 | その他 |
---|---|---|---|---|
( | ひだりかっこ | ( | ○ | |
) | みぎかっこ | ) | ○ | |
「 | かぎかっこひだり | 「 | ○ | (ひだりかぎ)でもOK |
」 | かぎかっこみぎ | 」 | ○ | (みぎかぎ )でもOK |
・ | なかてん | ・ | ○ | |
、 | てん | 、 | ○ | |
。 | まる | 。 | ○ | |
- | まいなす | - | ○ | |
~ | からなみ | ~ | ○ | |
‥ | にてんりーだー | ‥ | ○ | |
… | さんてんりーだー | … | ○ | |
+ | ぷらす | + | ○ | |
= | いこーる | = | ○ | |
! | かんたんふ | ! | △ | (半角で変換されている) |
? | ぎもんふ | ? | △ | (半角で変換されている) |
< | しょうなり | < | ○ | |
> | だいなり | > | ○ |
■関連の記事:
・誤変換を減らすためのテスト(読み上げ長さ)
・音声認識の変換精度について考える
a:1599 t:1 y:1