トップWindows音声認識の現状実力と3つの新たな課題

Windows音声認識の現状実力と3つの新たな課題

いつもWEBページの記事は音声認識を使って作成しているのですが、久しぶりに
現在の実力の評価と新たな課題がないかどうかを確認してみようと思い、評価テスト
をやってみました。

やり方としては、3つの文章難易度の異なったサンプル文章を用意し、それぞれで
変換テストを行って、その実力評価を行うというもの。

その結果から、何か新しい課題が見つかるのではないかと思ったからです。

1)こどもニュース(神奈川県の鈴廣かまぼこ博物館)

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
■難易度A:(やさしい)
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
かまぼこには、どうして板がついているんだろう? 板があることで、かまぼこの余分
(よぶん)な水分をすったり、くさりにくくする効果(こうか)がある。

鈴廣では、天然のモミの木を使っている。
かまぼこをおいしくさせるために、いろんな工夫があるんだね!

かまぼこはもちろん、魚や海にまつわるグッズがずらりとならんだおみやげ
コーナーも見どころだ。見て、体験して、たくさん遊べる鈴廣のかまぼこ博物館。

おいしくて、栄養満点のかまぼこ、ますますファンになっちゃうこと、まちがいなし!
ぜひみんなも体験してみてね。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
 
■認識結果:
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
蒲鉾には、どうしていたが付いているんだろう?いたがあることで、かまぼこの余分
(余分)や水分を吸ったり、腐りにくくする効果(効果)がある。

スズシロでは、天然のもみの木を使っている。
かまぼこをおいしくさせるために、いろんな工夫があるんだね!

蒲鉾はもちろん、魚や海にまつわるくっつがずらりと並んだを見上げ
コーナーも見どころだ。見て、体験して、沢山遊べる鈴広のかまぼこ博物館。

おいしくて、栄養満点のかまぼこ、ますますファンになっちゃうこと、間違いなし !
是非みんなも体験してみてね。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
 
■課題:
①漢字/ひらがな変換を指定できないため、あとで編集する必要がある。
②「鈴廣」などの固有名詞は、誤変換する確率が高い。
③「グッズ」を「くっつ」などと、登録の無いカタカナも誤変換しやすい。
④疑問/感嘆詞などは正しく変換するが、半/全角が指定できない。

2)登山(景信山へ山菜登山)

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
■難易度B:(ふつう)
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
東京都心から約1時間で到着し、毎年多くの人が訪れている高尾山の名物といえば
とろろそば。高尾山のふもと周辺などに店が並び、登山客の楽しみの1つとなっている。

もちろんとろろそばを味わうのもいいが、高尾山から少し足を延ばした景信山
(かげのぶやま)の山頂の茶屋では、美味しい山菜の天ぷらが食べられるらしい。

これから山菜の旬であり、当然山頂からの眺めは格別である。最高のロケーションで
春の味覚を楽しむため、景信山山頂を目指すことにした。

山菜天ぷらのために、まずは山頂を目指す。
景信山の登山は山頂まで2時間程度だという。登山初心者でも気軽に山登りを楽しめそうだ。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
 
■認識結果:
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
東京都心から約1時間で到着し、毎年多くの人が訪れている隆雄さんの名物といえば
とろろそば。高雄山のふもと周辺などに店が並び、登山客の楽しみの一つとなっている。

もちろんとろろそばを味わうのもいいか、高雄山から少し足を延ばした影の小山
(影の小山)の山頂の茶屋では、おいしい山菜のてんぷらが食べれるらしい。

これから3歳の主因であり、当然山頂からの眺めは格別である。最高のロケーションで
春の味覚を楽しむため、影の山山頂を目指すことにした。

3歳てんぷらのために、まずは山頂を目指す。
影の山の登山は山頂まで2時間程度だという。登山初心者でも気軽に山登りを楽しめそうだ。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
 
■課題:
①漢字/ひらがな変換の間違いはあとで編集する必要がある。
②やはり固有名詞は、誤変換する確率が高い。
 「高尾山→隆雄さん、高雄山」「景信山→影の小山」
③あきらかな誤変換あり。
 「山菜の旬→3歳の主因」。(発音が悪かったか・・?)

 

3)文化(福岡市の旧高宮貝島邸)

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
■難易度C:(むずかしい)
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
福岡市は、炭鉱業で財を成し安川、麻生と並び「筑豊御三家」と称された貝島家一族
の邸宅「旧高宮貝島邸」(南区高宮5)の一般公開に向けた整備を進めている。

今年度、整備や管理運営をする事業者を公募し、迎賓館的な機能を併せ持った文化
施設として2021年度にオープンさせる方針だ。

高宮貝島邸は、直方市出身で炭鉱王と呼ばれた貝島太助氏の弟、嘉蔵氏(1935年
に80歳で死去)の邸宅として1915年、直方市に建築され、27年に現在地に
移築された。

樹木に取り囲まれた約1・9ヘクタールの広大な敷地に母屋や茶室、衣装蔵を配する。
約507平方メートルの母屋は、どの座敷も床回りから欄間、天井まで細部にこだわ
った凝った造りだ。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
 
■認識結果:
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
福岡市は、観光業で財をなしやすかわ、あそうと並び「筑豊呉三桂」と称された貝島家一族
の邸宅「9高宮貝島邸」(南区高宮5)の一般公開に向けた整備を進めている。

今年度、整備や管理運営をする事業者を公募し、迎賓館的な機能を併せ持った文化
施設として2021年度にオープンさせる方針だ。

高宮貝島邸は、直方市出身で炭坑王と呼ばれた貝島太助氏の弟、★和夫★氏(1935年
に80歳で死去」の邸宅として1915年、直方市に建築され、27年に現在地に
移築された。

樹木に取り囲まれた約い、9haの広大な敷地に母屋や茶室、衣装蔵を配する。
約507平方メートルの母屋は、どの座敷も床回りから卵管、天井まで細部にこだわった凝った作り出。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
 
■課題:
①漢字/ひらがな変換の間違いはあとで編集する必要あり。
 「成し→なし」「安川→やすかわ」「麻生→あそう」「旧→9」
③あきらかな誤変換、「炭鉱業→観光業」(発音が悪かったか・・?)
 「1・9→い、」「ヘクタール→ha」「欄間→卵管」「造りだ→作り出」

以上、3つのサンプル文章を認識テストを行って、Windows7音声認識の弱点と課題が
見えてきました。

もちろん文章の難易度によって認識精度が異なるのは想像どおりですが、
明らかに誤変換となる部分には次のような傾向がありました。

①サッと聞いて理解できない固有名詞
②読み上げる単位と発音の正確さ
③漢字/ひらがな/カタカナの使い分け

考察してみると、

①の固有名詞についての対策は、
 どんどん音声辞書に登録していくしかない。

②の読み上げと発音の対策は、
 間の取り方とイントネーション、発音をもっと注意して発声する。

③の使い分けは、
 通常は漢字変換モードとして、どうしてもひらがなやカタカナで変換したい
 ものは、あらかじめ辞書登録しておくしかない。

・・という結果。

以上、かなり変換精度が上がって修正箇所は減ってきたものの、まだまだ改善の
余地が多数あることがわかりました。

もっと自分の望む方向の結果が出るような変換をティーチングしていくこと・・
(つまり音声辞書登録のやり方)がさらなる向上のポイントだということでした!

a:1545 t:1 y:0