Skip to content
No description, website, or topics provided.
Shell
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
scripts
LICENSE
README.md

README.md

HTS_installer

Open JTalkなどで使用される、音響モデルファイル(htsvoice)を生成、およびその環境を構築するシェルスクリプトです。
(注:このスクリプトを実行すると、自動的にいくつかのプログラムをダウンロードされます。
これらのプログラムのライセンス・使用条件については、それぞれのプログラムを参照してください)

動作環境

Ubuntu 16.04

インストール方法

  1. 以下のサイトの Stable release (3.4.1) > Linux/Unix downloads > HTK source code から HTK-3.4.1.tar.gz をダウンロードしてください。
    http://htk.eng.cam.ac.uk/download.shtml
    (ダウンロードにはユーザー登録が必要です)

  2. 以下のサイトの HDecode Download Stable Release (3.4.1) > Linux/Unix downloads から HDecode-3.4.1.tar.gz をダウンロードしてください。
    http://htk.eng.cam.ac.uk/prot-docs/hdecode.shtml
    (ダウンロードにはユーザー登録が必要です)

  3. git cloneします。

git clone https://github.com/NON906/HTS_installer.git
  1. 以下のコマンドでインストールします。
cd HTS_installer/scripts
sh install.sh /path/to/HTK-3.4.1.tar.gz /path/to/HDecode-3.4.1.tar.gz

( /path/to/ には HTK-3.4.1.tar.gz や HDecode-3.4.1.tar.gz をダウンロードしたディレクトリを指定してください)

実行方法

cd HTS_installer/scripts
sh make_htsvoice.sh 音声ファイルのディレクトリ /path/to/result.htsvoice

(音声ファイルのディレクトリ とは、音源となるwavやmp3が入っているディレクトリのことです)
(生成した音響モデルファイルは /path/to/result.htsvoice に保存されます)
(実行中は多くのメモリ領域を使用しますので、あらかじめswapファイルを追加しておくことをおすすめします)
(完了まで数時間~数日程度かかります)

追加機能

Google cloud speech API を使用する

以下のコマンドで実行することで音声認識の一部の処理にGoogle cloud speech APIを使用することができます。
(APIKEYの取得にはユーザー登録が必要です)

cd HTS_installer/scripts
sh make_htsvoice.sh -G APIKEY 音声ファイルのディレクトリ /path/to/result.htsvoice

単語辞書の最適化

以下のコマンドを実行することで単語辞書を最適化することができます。
(注:このコマンドを実行すると先述の「Google cloud speech API を使用する」を行うことが出来なくなります。何らかの事情でAPIを使用できないときにのみ使用してください)
(完了まで数時間程度かかります)

cd HTS_installer/scripts
sh make_dic_julius.sh
You can’t perform that action at this time.