トップ積極的な誤変換対策で認識精度アップを計画(続編)

積極的な誤変換対策で認識精度アップを計画(続編)

前回の続編です。4つの分野の異なる記事を、Windows音声認識で入力し、久しぶりに認識精度の再評価、誤変換に対する考察と音声辞書登録実否の判断を行いました。


1:政治

===========================================
沖縄タイムス
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
翁長雄志知事の急逝で混迷を深めるかに見えた知事選の後継候補の人選は、
知事の遺志により、自由党幹事長で衆院議員の玉城デニー氏(58)に
急速に固まる流れとなった。

県政与党からは
「最後の最後に翁長知事の遺志がオール沖縄を再結集させた」
と驚きにも似た声が上がる。

一方、対決する自民党関係者は
「相手は死去した翁長知事の残像で選挙の手応えが読めない」と戸惑いの
声を漏らす。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
【変換結果】
沖縄タイムス

を流融資知事の急逝で混迷を深めるかにえた知事選の後継候補の人選は、
知事の遺志により、自由党幹事長で衆院議員の玉城辞任し(58)に
急速に固まる流れとなった。

けん制い与党からは
「最後の最後にを流知事の意志がオール沖縄を再結集させた」
と驚きにも似た声が上がる。

一方、対決する自民党関係者は
「相手は市況したを流知事の残像で選挙の手ごたえが読めない」と戸惑いの
声を漏らす。         (考察は次回行います)
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
■誤変換箇所数:箇所 (87点)
・「翁長雄志」を「を流融資」は、固有名詞であり誤変換したのは仕方なし。
 →対策は、これを辞書登録するかどうか…ですが、今後、自分の記事で何度
  も出てくるものではないので、登録はせず。
・「見えた」が「みえた」と変換はやむなしだが、「見えた」を辞書登録する。
・「玉城デニー氏」を「玉城辞任し」は、やはり固有名詞で仕方なし。
・「県政」を「けん制い」は、誤変換。ここは正しく変換して欲しかったが…。
・「死去」を「市況」と変換したのは、読み上げの発音が悪かったからかな?

⇒まあこれくらいの誤変換(入力後修正)ならば、我慢できるレベルと評価。
===========================================

2:事件

===========================================
「大失態」逃走で府警に苦情2千件…本部長謝罪
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
大阪府警富田林署で勾留中だった無職樋田淳也容疑者(30)が面会室から
逃走した事件で、府警の広田耕一本部長が20日、署で報道陣の取材に応じ、
「住民に多大な不安と心配をかけ、改めておわび申し上げます」と謝罪した。

事件後、広田本部長が公の場で謝罪するのは初めて。

広田本部長はこの日、樋田容疑者が逃走した富田林署2階の面会室などを視察。
樋田容疑者の早期確保を捜査員に指示した。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
【変換結果】
「大失態」闘争で府警に九条2000件、本部長謝罪

大阪府警富田林署で留中だった無職飛騨淳也容疑者(30)が面会室から
逃走した事件で、府警の広田紘一本部長が二十日、で報道陣の取材に応じ、
「住民に多大な不安と心配をかけ、改めておわび申し上げます」と謝罪した。

事件後、広田本部長が公の場で謝罪するのはめて。

広田本部長はこの日、木田容疑者が逃走した富田林署2階の面会室などを視察。
木田容疑者の早期確保を捜査員に指示した。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
■誤変換箇所数:箇所 (88点)
・やはり名前などの固有名詞で誤変換多い。
・「勾留」を「拘留」は仕方のないところ。どちらが多く使われるか確認し、登録する。
・「署」を「所」、「初めて」を「始めて」と誤変換するのは、仕方ないところ。
 どちらもありうるので、あえて登録はしない。

⇒繰り返しもあって少し誤変換回数多かったが、まあこれくらいは・・。
===========================================
 

 

3:スポーツ

===========================================
バド女子48年ぶりV 5連覇中の中国破る アジア大会(朝日新聞デジタル)
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
バドミントン女子団体で5連覇中の中国を破り、優勝した日本の選手たち
=ジャカルタアジア大会第5日は22日、バドミントン女子団体決勝で、
日本が6連覇を狙った中国を3―1で破り、48年ぶりの金メダルを獲得した。

第1シングルスの山口茜(再春館製薬所)は敗れたが、続く第1ダブルスの
福島由紀、広田彩花組(岐阜トリッキーパンダース)はストレート勝ち、

最後は奥原希望、高橋礼華、松友美佐紀組(いずれも日本ユニシス)が
リオ五輪メダリストの実力をみせつけ、中国組を退けた。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
【変換結果】
バ同女子48年ぶりの部位 5連覇中の中国破る アジア大会

バドミントン女子団体で5連覇中の中国を破り、優勝した日本の選手たち
=ジャカルタアジア大会第五日は 22日、バドミントン女子団体決勝で、
日本が6連覇を狙った中国を 3‐1で破り、48年ぶりの金メダルを獲得した。

第1シングルスの山口あかねさい瞬間誓約書)は敗れたが、続く第1ダブルスの
福島、広田さやか組(岐阜トリッキー一般ダース)はストレート勝ち、

最後は奥原臨み、高橋冷夏、松友組(いずれも日本ユニシス)が
利用五輪メダリストの実力を見せつけ、中国組を退けた。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
■誤変換箇所数:10箇所 (83点)
・「バド」を「バ同」は仕方なし。これは辞書登録する。
・「V」を「部位」も仕方ないところ。辞書登録すると「部位」のとき「V」となる可能性高く、登録はせず。
・個人の名前で誤変換多いが、自分の記事作成時はまず出てこないので、登録はせず。

⇒やはり固有名詞の認識が苦手で、それ以外は問題無いレベル。
===========================================

4:健康

===========================================
人間ドックとは?
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
人間ドックの「ドック」とは、船の修理や建造用の施設『dock(ドック)』のこと。
次の航海で事故が起こらないよう、点検・修理をするために入る場所であることに
なぞらえたと言われています。

船と同様、人間の身体も定期的な点検や整備が必要であるという予防医学の観点から、
日本独自の発想で生まれた言葉です。

大きくは、生活習慣病にかかわる検査項目が中心の「基礎ドック」と、がんや脳、
心臓など死亡リスクが高い病気を発見するための「専門ドック」に分けられています。

病気の早期発見をはじめ、将来かかりやすい病気の傾向まで把握することを目的と
しています。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
【変換結果】
人間ドックとは?

人間ドックの「ドック」とは、船の修理や建造用の施設dock(ドック)のこと。
次の公開で事故が起こらないよう、点検・修理をするためにはいる場所であることに
なぞらえたといわれています。

船と同様、人間のも定期的な点検や整備が必要であるという予防医学の観点から、
日本独自の発想で生まれた言葉です。

大きくは、生活習慣病にかかわる検査項目が中心の「基礎ドック」と、がんや脳、
心臓など死亡リスクが高い病気を発見するための「専門ドック」に分けられています。

病気の早期発見を始め、将来かかりやすい病気の傾向まで把握することを目的と
しています。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
■誤変換箇所数:箇所 (95点)
・「『』」を「「」」としたのは仕方ない。辞書登録していなかったので、登録する。
・「航海」を「公開」としたのは、止む無しか…。いろいろな語があるので登録せず。
・「身体」を「体」も止む無し。両方あり得るので登録はしない。

⇒これくらの誤変換率ならば、記事入力作業が大幅に効率アップすることになる。
===========================================
 
前:積極的な誤変換対策で認識精度アップを計画


a:756 t:1 y:0