トップ日本語テキストで音声合成の実験

日本語テキストで音声合成の実験

さて今回は、日本語での音声合成テスト結果について報告します。

前の記事で、OSがWindows7の場合には、すぐにできるのが英語の音声合成のみと書きましたが、もしかしてバージョンによって違うこともあるのかも知れませんので、その点はご了解ください。

また、Windows8の場合には、Microsoft Speech Platform「Microsoft Haruka Desktop [日本語]」があらかじめインストールされていて、すぐに使えるようです。

まだ確認していませんが、サブノートPCはWindows8.1なので、別途確認して報告するつもりです。

Platformのインストール

Windows7には「SAPI 5」タブ内に「Microsoft Zira Desktop [英語 (米国)]」がありましたが、「Microsoft Haruka Desktop [日本語 (日本)]」は登録されていないので、そのインストール作業をまず先に行いました。

いくつかのサイトでインストール方法が解説されていたのですが、次のサイトでインストールを行うのが一番簡単でした。

■まほろば
Microsoft Speech Platform 簡単インストーラー Ver.2.2
http://mahoro-ba.net/e1542.html

●ダウンロードとインストール
(1)「DownloadMssp_22.EXE」をダウンロードして、実行する。
       ・
       ・

注意:インストールがうまくいかない場合

上記まほろばサイトでインストールを行って、「SAPI 5」タブの横に「Microsoft Speech Platform」タブが追加されており、そこをクリックすると「Microsoft Haruka Desktop [日本語 (日本)]」が表示されているなら、インストールは完了しています。

インストールがうまくいった人は、この下の部分は読み飛ばしてください。

しかし、そのようになっていないのなら、次のサイトの内容を試してみてください。

実は私の場合は順序が逆で、さきに「ひまつぶし雑記帳」に書かれたインストールを行ってみて、①~②はOKだったのですが、③のレジストリの設定でエラーが出たため、まほろばサイトに移動して(再?)インストールを行い、Harukaが使えるようになりました。


ひまつぶし雑記帳
https://t2aki.doncha.net/?id=1444733015

やることは3つ

①Microsoft Speech Platformのインストール
https://www.microsoft.com/download/en/details.aspx?id=27225
x64_SpeechPlatformRuntime.msi(64bit)
x86_SpeechPlatformRuntime.msi(32bit)
↑どっちか。

②TTS音声Harukaのインストール
https://www.microsoft.com/download/en/details.aspx?id=27224
MSSpeech_TTS_ja-JP_Haruka.msi

③レジストリの設定
上記のページを参考に。コマンドプロンプトを管理者モードで立ち上げて

reg COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech Server\v11.0\Voices\Tokens" HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens /s /f
↑をコピペして実行


 

実験用テキスト文

サニーレタスの新芽の成長は今

サニーレタスの新しく出てきた芽というか若葉の状況ですが、
本体全体の印象がパッとしない中、少しずつ大きくなってきています。

新芽というのはその成長力が活発だと思うのですが、
1日1日その姿が変わっていきます。

その動きが目で見てわかるほどなので、毎日見ていてとても楽しいですし、
植物の持つ強い生命力を感じさせられます。

野菜を栽培していてすごく楽しいなと思うのは、この生命力を毎日見せられ、
そこから何か前向きなエネルギーがもらえるからです。

サニーレタスとレタスの両方を水耕栽培しているのですが、
同じレタスでもいろいろな部分で特性が違っているようです。

上に書いたようにサニーレタスは新芽が出て成長を始め、
レタスは新芽は出ずに本体がまだまだ生彩を欠いていません。

この先どうなっていくのか、
もう少し今回の「成長点をカット」実験を続けてみようと思っています。

実験の手順

1)「Microsoft Speech Platform」タブを開き
「Microsoft Haruka Desktop [日本語 (日本)]」を選択

(Haruka一つだけが表示されているので、タブをクリックするだけで指定したことになる)

2)上記のテキスト文を「balabolka」ウィンドウに、コピー&貼り付け

3)ウィンドウ上部に並んでいる再生ボタン「>」を押す

以上の3手順で再生が始まります。

最初、テキストの文字色は黒ですが、再生(合成)されていくとその部分が青色に変わっていくため、どこを再生しているかがすぐにわかります。

日本語変換中画面

再生の結果

合成された無機質な音声とは思えないほどの、かなり自然な女性の読み上げ音声でした。このレベルならば、さまざまな用途での音声ガイダンスに使えるのではないかと思います。予想以上でした!

次にその再生音声をアップしますので、聞いてみてください。
▼ここをクリック


日本語の再生(音声合成)は、英語の読み上げよりも出来が良いように感じました。次は、合成音声をmp3で保存して、そのデータを使って音声認識のテストをしてみる予定です。

結果は次回報告します。

前:英文テキストを音声合成保存、再生して音声認識
前:テキストから音声合成、その音声から音声認識
 

a:2593 t:2 y:0