トップ音声認識の誤変換ゼロへの実験と対策

音声認識の誤変換ゼロへの実験と対策

最近の音声認識は、使いはじめからかなりの精度で認識をしてくれるようになりました。しかし、どうしても誤変換してしまうものがあるというのも事実です。

今回は、誤変換を限りなくゼロに近づけるため、どういう部分が誤変換につながるのか、それに対して自分でできる対策はどのようなものがあるのかということについて、実験しながら考えてみました。

後半部分に、その結果とまとめをしていますので、是非参考にしていただき、誤変換の少ない効率的なテキスト入力につなげていただけたらと思っています。

voicerecognition


《 課題文 》

まずは課題文です。少しでも興味の湧くものと思って、最新の読売オンラインニュースよりピックアップさせていただきました。

(読売オンラインより:2017年12月3日9時15分)
ーーーーーーーーーーーーーーーーーーーーーーー
ボイジャー1号のエンジン、37年ぶり噴射成功

米航空宇宙局(NASA)は1日、
太陽の影響下にある「太陽圏」を離れて飛行中の
無人探査機ボイジャー1号に搭載され、
1980年以来使っていなかったエンジンを
37年ぶりに噴射させることに成功したと発表した。

探査機の寿命を2~3年延ばすことが可能になるという。

2014年から姿勢制御に使うエンジンが劣化し始めたため、
先月28日、
軌道制御の役目を終えて休眠状態にあった4基のエンジンを試し、
使えることを確認した。

1977年に打ち上げられたボイジャー1号は、2012年、
人工物として初めて「太陽圏」を離れ、「星間空間」に入った。

現在は地球から約200億キロ離れた宇宙で観測を続けている。
NASAの担当者は
「長く休んでいたエンジンが役目を引き継ぐことができ、
うれしく信じられない気持ちだ」とコメントしている。
ーーーーーーーーーーーーーーーーーーーーーーー
(読み上げごとに、1行にしています)

■1回目の音声認識結果:

ーーーーーーーーーーーーーーーーーーーーーーー
ボイジャー1号のエンジン、37年ぶり噴射成功

で高級宇宙局(NASA)は1日、
太陽の影響下にある「太陽県」を離れて飛行中の
無人探査機ボイジャー1号に搭載され、
1980年以来使っていなかったエンジンを
37年ぶりに噴射させることに成功したと発表した。

探査機の寿命を2から3年延ばすことが可能になるという。

2010余年から姿勢制御に使う隣人が劣化し始めたため、
先月28日、
軌道制御の役目を終えて休眠状態にあった4基のエンジンお試し、
使えることを確認した。

1977年に打ち上げられたボイジャー1号は、2012年、
人工物として初めて「太陽系」を離れ、「星間空間」に入った。

現在は地球から約20000000000キロ離れた宇宙で観測を続けている。
NASAの担当者は
「長く休んでいたエンジンが役目を引き継ぐことができ、
うれしく信じられない気持ちだ」とコメントしている。
ーーーーーーーーーーーーーーーーーーーーーーー

■誤変換した部分

①米航空宇宙局→で高級宇宙局
②太陽圏→太陽県
③~→から
④2014年→2010余年
⑤エンジン→隣人
⑥エンジンを試し→エンジンお試し
⑦太陽圏→太陽系
⑧200億キロ→20000000000キロ

合計:箇所

■誤変換結果への考察

①米航空宇宙局→で高級宇宙局
・読み方(発音)が悪かった。
・「べい」をきれいに発音→べい
・「米航空宇宙局」をきれいに発音
 →「米い航空宇宙局」
 →「べい航空宇宙局」
●必要なら単語登録をすべきとの結論

②太陽圏→太陽県
・読み方(発音)が悪かったかも・・
・再度意識してきれいに「太陽圏」を発音
 →「太陽県」 で変わらず。
●これも単語登録すべきとの結論

③~→から
・誤変換ではない
・「~」は「からなみ」として登録済なので、
・「からなみ」と発音
 →「~」 OK!

④2014年→2010余年
・読み方によってどちらにもなる
・「2014」と「年」の間に一瞬の間をおいて発音
・「2014 年」と発音
 →「2014年」 OK!

⑤エンジン→隣人
・読み方(発音)が悪かったの一言。
・「エンジン」ときれいに発音
 →「エンジン」 OK!

⑥エンジンを試し→エンジンお試し
・読み方(発音)が悪かったの一言。
・「エンジンを 試し」と間に間を取って発音
 →「エンジンを試し」 OK!

⑦太陽圏→太陽系
・これ読み方(発音)が悪かったの一言。
・「太陽圏」をきれいに発音
 →「太陽県」 やはりこれは単語登録です。

⑧200億キロ→20000000000キロ
・これは誤変換ではない
・読み上げ方をもう少し工夫する必要がある
・「200 億キロ」と間をおいて発音
 →「20000000000キロ」
・「200」で文字変換語、「億キロ」と発音
 →「200」「億キロ」 OK!

 

■まとめると・・

以上の結果より、誤変換の主な原因は、
1)読み上げの仕方(区切り位置ときれいな発音)
2)誤変換が避けられない語がある(単語登録必要)
の2つであるという結果でした。

この点を念頭に音声入力を行えば、かなり誤変換を減らして効率良くテキスト入力できると思います。以上の結論を検証するため、今度はそれを読み方に反映させて再トライしてみました。

■2回目の音声認識結果:

ーーーーーーーーーーーーーーーーーーーーーーー
ボイジャー1号のエンジン、37年ぶり噴射成功

米航空宇宙局(NASA)は 1日、
太陽の影響下にある「太陽圏」を離れて飛行中の
無人探査機ボイジャー1号に搭載され、
1980年以来使っていなかったエンジンを
37年ぶりに噴射させることに成功したと発表した。

探査機の寿命をに~3年とはすことが可能になるという。
        ̄
2010余年から姿勢制御に使うエンジンが劣化し始めたため、
先月28日、
軌道制御の役目を置いて休眠状態にあった4基のエンジンを試し、
使えることを確認した。

1977年に打ち上げられたボイジャー1号は、2012年、
人工物として初めて「太陽圏」を離れ、「星間空間」に入った。

現在は地球から約200億キロ離れた宇宙で観測を続けている。
NASAの担当者は
「長く休んでいたエンジンが役目を引き継ぐことができ、
うれしく信じられない気持ちだ」とコメントしている。
ーーーーーーーーーーーーーーーーーーーーーーー

■考察:
・誤変換はたった1箇所に減った。
・「2~3年」→「に~3年」の部分
・「2」「からなみ」「3年」と発音したため、
 「2」が「に」となってしまった。
 →1文字の読み上げは、いろんな文字に変換され易いので注意が必要。
・「米航空宇宙局」と「太陽圏」は単語登録したので、正しく変換。

・あとは、当然のことですが、
アナウンサーのようにクリアーにはっきりと発音することが最重要ポイント
でした!
 

a:1500 t:1 y:0