トップ誤変換を減らすためのテスト(読み上げ長さ)

誤変換を減らすためのテスト(読み上げ長さ)

音声認識を使って文章入力して多くの記事を書いていると、その変換精度に
よって大きく作業効率が変わってきます。

音声認識ソフトの性能やマイクの調子の影響も大きいですが、その入力の仕方
(読み上げ方、読み上げる長さ)によって、誤変換の発生頻度が変わってきます。

今回、いくつかの表現について、読み上げ長さをいろいろと変えた場合、どの
ような読み上げ長さが良いのか、テストを行い確認してみました。

Voice-recognition test

テスト結果

[読み上げ対象]    [変換結果]
雲 ーーーーーーーーー→
雲が ーーーーーーーー→ 雲が
雲の上 ーーーーーーー→ 雲の上
雲の上から ーーーーー→ 雲の上から
空で雲が流れる ーーー→ 空で雲が流れる

[読み上げ対象]    [変換結果]
橋 ーーーーーーーー→ ★(発音が悪かった)
橋が ーーーーーーーー→ 橋が
橋の上 ーーーーーーー→ 橋の上
橋の上から ーーーーー→ 橋の上から
洪水で橋が流される ー→ 洪水で橋が流される

[読み上げ対象]    [変換結果]
最下位 ーーーーーー→ ★再開
再開 ーーーーーーー→ ★さ一回
再会 ーーーーーーー→ ★さ一回

[読み上げ対象]    [変換結果]
最下位 ーーーーーー→ ★再開
最下位だった ーーーー→ 最下位だった
私は最下位でした ーー→ 私は最下位でした

[読み上げ対象]    [変換結果]
再会 ーーーーーーー→ ★再開
再会した ーーーーー→ ★再開した
私は再会できました → ★私は再開できました

 

結論

少ない例ではありましたが、結論としては、
・「短い単語」で読み上げるよりは、
・「長い語句や文章」で読み上げる方が、誤変換が圧倒的に少ない。
という結果でした。(過去の実績においても同じ結果)

そして、一番むずかしいケースが、次のような全部同じような読みとなる
語句です。

上の例では「再開」、「再会」、「最下位」の3つの語が同じ読みとなり、
誤変換が発生し易くなります。

通常、たまにしか使わない語の場合は、あえて読み方を変えて別々に登録する
ことはせずに、誤変換されたときに修正(修正候補を出して正しいものを選択)
して正しいものを選んで対応しています。

しかし、それぞれが非常に良く使う表現の場合には、誤変換されずに一発で
目的の語が出てくるよう、それぞれを別の読みにして音声辞書に登録する必要
があります。

同じ読みとなる語句での対策

上の「再開、再会、最下位」のケースの場合は、例えばですが、
次の中央のひらがなのようにそれぞれの読み方を、変更して音声辞書に登録し、
変換テストをしてみました。

結果は次の通りです。

再開ーー→ さいひら ーー→ 再開
再会ーー→ さいかい ーー→ 再会
最下位-→ さいしもい ー→ 最下位

ひらがなの右矢印の先の漢字が変換結果で、100%正しく変換することが
できました。

しかし、何でもかんでもこのように読み方を変えて、音声辞書登録するのは少
し面倒であり、「再開する」のように漢字のあとにひらがなが続く場合は、
「さいひらする」というような読み方になり、慣れるまでは少し違和感を感じ
ます。

あまりにも誤変換が多いのは記事作成上問題ですが、何でもかんでも読み方を
変えて辞書登録するのもそれなりに大変なので、語句の出現頻度を考えて、
そのときどきに適当な対応をするのがベターだと思っています。

■関連の記事:
 ・音声認識の変換精度について考える
 ・音声で誤認識のない記号入力の方法
 

a:1730 t:3 y:0