トップ音声認識でメモ帳をコントロールする

音声認識でメモ帳をコントロールする

いつも音声認識を使ったテキスト入力の実験について説明をしていますが、今後数回は、音声認識でメモ帳などのプログラムコントロールやwindowsのコマンド操作の部分にもフォーカスして、そのやり方を説明していきたいと思っています。

わたしは記事の作成にはいつもメモ帳を使っています。なのでまず今回は、メモ帳を立上げるところから、記事を入力し、修正を行ってから、保存してメモ帳を閉じるまでの全てを、音声認識でコントロールするやり方を、細かくまとめてみました。

とても簡単で、一度やってみたなら、細かくまとめて説明するほどのことはまったくないのですが、これからトライしてみようかなと考えている人にとっては、それなりに参考になるかと思います。

1)大まかな流れ

大まかな流れとしては、下に書いた5ステップとなります。
①メモ帳を開く
②音声認識にて記事を入力
③適宜、変換されたテキストの部分修正
④ファイル保存
⑤メモ帳を閉じる

マウスを使ってプログラムを操作して、キーボードを叩いてテキストを入力し、再度マウスでそれを保存するというやり方と何ら変わりはありません。

ただ、マウスとキーボードを使っている部分を、全て音声で行うというだけの違いです。
でもその違いが大きくて、音声認識をプログラムの操作やテキストの入力に使えるということは、本当に楽で簡単だということを、実際にトライして感じてみて欲しいと思います。

2)実施途中の状況

それでは実際にやってみたいと思います。
まずは音声認識の立ち上げです。

①コントロールパネルを開きます。

画像1

②「音声認識」をクリック。

画像2

③「音声認識の開始」をクリック。

画像3

④音声認識コントロール用アイコン左側の丸い「開始ボタン」をクリックします。

画像4

これで音声認識が開始され、準備完了です。

次は実際にメモ帳にテキストを入力していきます。

①「メモ帳を開く」といいます

画像5

②音声認識にて記事を入力

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
テスト用例文:
 昨日、ようやくアメリカ大統領選が終わり、トランプ氏が勝利しました。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

画像6

③適宜、変換されたテキストの部分修正

・修正箇所をリバース表示にします。
 「大統領を選択」という
画像7

・「総裁」という
画像8

・「1 OK」という
画像9

④ファイル保存
・「番号を表示」という
画像あ

・「5 OK」という
画像い

・「名前を付けて保存」という
画像う

・「大統領選」という
画像え

・「保存」という
画像お

⑤「メモ帳を閉じる」という
画像か

最後に音声認識を終了させます。

・音声認識のコントロールアイコンを右クリックします。
画像き

以上の中で、①と④、⑤はほんの一言、言うだけで終わりです。

②の入力と③の修正については、中身としていくつかのやり方がありますので、次項では
その部分について、もう少し細かく内容を説明をします。

 

2)テキストの入力

テキストの入力は音声で読み上げて行うのですが、入力先は「アクティブなウィンドウ」で、入力される部分は「カーソル」のある位置となります。

読み上げたら、音声の内容が順次テキスト変換され、カーソルの位置に入力されていきます。

メモ帳を使ってテキストを入力しているときに、何かの操作で別のプログラムのウィンドウがアクティブになれば、そちらの方へ入力ポイントが切り換わっていきます。

さほど気にしなくても良いのですが、もしもそのように切り換わってしまった場合は、入力しようとしているプログラム(メモ帳)のウインドウのどこかをカーソルでクリックすれば、そのウィンドウが再度アクティブに切り換わります。

そのように入力先を1クリックで変更できるので(もちろん音声でもできます)、メモ帳で
音声入力してそれをコピーして、エクセルをアクティブにしてその中に貼り付けをして、またメモ帳に戻ってアクティブにしてから、音声で再入力するということが簡単にできます。

 ※入力対象画面切換制御:「メモ帳」に切り替え/「ワードパッド」に切り替え

また、入力したときのテキストの変換と表示は、あるかたまりごとに処理されていきます。

一気に最後まで文を読み上げれば、最後の部分を発声してわずかに休止したら、そこで変換されたテキストの全文がまとめて表示されます。

また、ある部分の入力が終わったり、「、」のあとなどに少しの空白が入ると、そこでその前に入力した部分のテキストが表示されていきます。

途中、「、」の入力は「てん」、「。」の入力は「まる」と発声します。

改行したい場合は、「かいぎょう」若しくは「えんたー(=Enter)」と発声します。

2行改行したい場合は、「新しい段落」と言えば2行下に改行され、その先頭部分にカーソルが移動します。

今入力した部分を消したいときは、「それを削除」と発声。

1文字消して戻りたいときは、「ばっくすぺーす」と言います。

もちろん対象部分をドラッグなどでリバース表示させたら、修正や削除ができるようになりますが、それだけではなく「コピー」と発声してから、次の場所へカーソルを移動させて、「はりつけ」と言えば、そこにコピーした部分が貼り付けられます。

なお、テキストを修正するときの場所を指定するのには、若干コツがあり少し長くなるので、別のタイミングに詳細に説明したいと思います。

以上のように非常に簡単で、見ただけで想像のつく音声コマンドばかりなので、すぐに操作に慣れると思います。

Windowsマシーンなら、全て音声認識機能が搭載されていますので、マイクを接続したらすぐにトライできますので、一度、試してみてはいかがでしょうか。

きっと、手放せなくなりますよ!!
 

a:2828 t:3 y:0