トップ文章読み上げ区切り位置の音声認識への影響を検証

文章読み上げ区切り位置の音声認識への影響を検証

現在も音声認識を使って記事を作っていますが、今回はそのテキストを入力するときの効率や変換精度などに影響がある、読み上げるときの区切り位置について、影響度確認の実験を行ってみました。

今回使った課題文は、前回使ったものの中から前側5行をピックアップして、変換実験をしました。

音声認識実験


前回の課題文:

(読売オンラインより:2017年12月3日9時15分)
ーーーーーーーーーーーーーーーーーーーーーーー
ボイジャー1号のエンジン、37年ぶり噴射成功

米航空宇宙局(NASA)は1日、太陽の影響下にある「太陽圏」を離れて飛行中の無人探査機ボイジャー1号に搭載され、1980年以来使っていなかったエンジンを37年ぶりに噴射させることに成功したと発表した。
探査機の寿命を2~3年延ばすことが可能になるという。
2014年から姿勢制御に使うエンジンが劣化し始めたため、先月28日、軌道制御の役目を終えて休眠状態にあった4基のエンジンを試し、使えることを確認した。

1977年に打ち上げられたボイジャー1号は、2012年、人工物として初めて「太陽圏」を離れ、「星間空間」に入った。現在は地球から約200億キロ離れた宇宙で観測を続けている。NASAの担当者は「長く休んでいたエンジンが役目を引き継ぐことができ、うれしく信じられない気持ちだ」とコメントしている。
ーーーーーーーーーーーーーーーーーーーーーーー

今回使用した課題部分:

今回の課題文:
米航空宇宙局(NASA)は1日、
太陽の影響下にある「太陽圏」を離れて飛行中の
無人探査機ボイジャー1号に搭載され、
1980年以来使っていなかったエンジンを
37年ぶりに噴射させることに成功したと発表した。

第1ラウンド

それでは、
「米航空宇宙局(NASA)は1日、」
よりテストを行ってみます。

注意:
・「 / 」は区切り位置。
・変換結果は「→」の右側。
・「・」は一瞬のポーズ

【01】米/航空/宇宙局/(/NASA/)/は/1日/、
べい/こうくう/うちゅうきょく/ひだりかっこ/なさ/みぎかっこ/は/ついたち/てん

べい航空宇宙局(NASA)は一日、

【02】米航空/宇宙局/(/NASA/)/は1日/、
べいこうくう/うちゅうきょく/ひだりかっこ/なさ/みぎかっこ/はついたち/てん

米い航空宇宙局(NASA)は一日、

【03】米航空宇宙局/(NASA)/は1日、
べいこうくううちゅうきょく/ひだりかっこ・なさ・みぎかっこ/はついたち・てん

米航空宇宙局(朝)は一日、

【04】米航空宇宙局(NASA)は1日、
べいこうくううちゅうきょく・ひだりかっこ・なさ・みぎかっこ・はついたち・てん

米航空宇宙局(NASA)は一日、

「太陽の影響下にある「太陽圏」を離れて飛行中の」

【05】太陽/の/影響下/にある/「/太陽圏/」/を/離れて/飛行中/の
たいよう/の/えいきょうか/にある/ひだりかぎ/たいようけん/みぎかぎ/を/はなれて/ひこうちゅう/の

太陽??にある「太陽圏」を離れて飛行中?
(?は別の動作となってうまく変換されなかったん)

【06】太陽の/影響下にある/「太陽圏」/を離れて/飛行中の
たいようの/えいきょうかにある/ひだりかぎ・たいようけん・みぎかぎ/をはなれて/ひこうちゅうの

太陽の影響下にある「太陽圏」を離れて飛行中の

【07】太陽の影響下にある/「太陽圏」を離れて飛行中の
たいようのえいきょうかにある/ひだりかぎ・たいようけん・みぎかぎ・を・はなれてひこうちゅうの

太陽の影響下にある「太陽圏」を離れて飛行中の

【08】太陽の影響下にある/「太陽圏」を離れて飛行中の
たいようのえいきょうかにある・ひだりかぎ・たいようけん・みぎかぎ・を・はなれてひこうちゅうの

太陽の影響下にある「太陽圏」を離れて飛行中の
 

 
 

第2ラウンド

「無人探査機ボイジャー1号に搭載され、」

【09】無人/探査/機/ボイジャー/1/号/に/搭載/され、
むじん/たんさ/き/ぼいじゃー/いちごう/に/とうさい/され/てん

無人探査機ボイジャー 1こうに搭載され、

【10】無人探査機/ボイジャー1/号に/搭載され、
むじん/たんさき/ぼいじゃーいちごうに/とうさいされ・てん

無人探査機ボイジャー1号に搭載され、

【11】無人探査機ボイジャー1号に搭載され、
むじんたんさき・ぼいじゃーいちごうにとうさいされ・てん

無人探査機ボイジャー1号に搭載され、

「1980年以来使っていなかったエンジンを」
「37年ぶりに噴射させることに成功したと発表した。」

【12】1980年以来/使っていなかったエンジンを
せんきゅうひゃくはちじゅうねんいらい/つかっていなかったえんじんを

1980年以来使っていなかったエンジンを

【13】1980年以来使っていなかったエンジンを
せんきゅうひゃくはちじゅうねんいらい・つかっていなかったえんじんを

1980年以来使っていなかったエンジンを

「37年ぶりに噴射させることに成功したと発表した。」

【14】37年ぶりに/噴射させることに/成功したと/発表した。
さんじゅうしちねんぶりに/ふんしゃさせることに/せいこうしたと/はっぴょうした・まる

37年ぶりに噴射させることに成功したと発表した。

【15】37年ぶりに噴射させることに成功したと発表した。
さんじゅうしちねんぶりに・ふんしゃさせることにせいこうしたとはっぴょうした・まる

37年ぶりに噴射させることに成功したと発表した。

第3ラウンド

米航空宇宙局(NASA)は1日、太陽の影響下にある「太陽圏」を離れて飛行中の
無人探査機ボイジャー1号に搭載され、1980年以来使っていなかったエンジンを
37年ぶりに噴射させることに成功したと発表した。

【16】上の3行の文を、それぞれ途中に「改行(えんたー)」を入れて読み上げて音声認識すると、


米航空宇宙局(NASA)は一日、太陽の影響下にある「太陽圏」を離れて飛行中の
無人探査機ボイジャー1号に搭載され、1980年以来使っていなかったエンジンを
37年ぶりに噴射させることに成功したと発表した。

【17】上の3行の文を、途中に「改行」を入れずに、すべてつなげて読み上げると、


米航空宇宙局(NASA)は一日、太陽の影響下にある「太陽圏」を離れて飛行中の無人探査機ボイジャー1号に搭載され、1980年以来使っていなかったエンジンを噴射させることに成功したと発表した。

■まとめ:

以上のテスト結果から判断して、Windows7音声認識の性能はなかなかのものです。
100点満点で言うと95点くらいつけてもいいのではないかと思います。

特徴をまとめてみると、
1)意味のある塊ごとに読み上げる方が誤変換が少ない。
2)1文字だけでの入力は、比較的不得意である。
3)1文字変換ではどうしてもうまく変換できないものがある。(「の」など)
4)一度正しく変換されると、その後も正しく変換されやすい。
5)どうしても正しく変換されない表現は、音声辞書登録するのがよい。
となりました。
 


a:1924 t:1 y:0