- このソフトウェアは,円滑な音声収録を目的として,名古屋工業大学徳田研究室により開発されたものです.
- Windowsのみインストーラを用意していますが,Javaを用いているため,ビルド次第では他のOSで動作できる可能性があります.
- リリースページからVoist.msiをダウンロードしてください.
- ダウンロードしたVoist.msiを実行し,起動したインストーラに従ってください.
- メニューの左上にある『ファイル』から『ユーザの変更』を選択して,任意のユーザ名を入力して『変更』ボタンを押します.
- PCを共有していない場合,ユーザ名を変える必要はありません.
- 音声ファイルは
C:/Users/(Windowsのユーザ名)/Documents/Voist/recording/(ユーザ名)/(プロンプト名)/
以下に保存されます.
- メニューの『設定』→『プロンプト』→ 『フォントタイプ』から好みのフォントを選択します.
- F2, F3キーでも変更可能です.
- メニューの『設定』→『プロンプト』→ 『フォントサイズ』からフォントの大きさを設定します.
- マウスホイールでも調整可能です.
- 『サンプル再生』ボタンを押して,お手本の音声を聞きます.
- サンプル音声ファイルは
C:/Users/(Windowsのユーザ名)/Documents/Voist/sample/(プロンプト名)/
以下に配置されている必要があります. - サンプル音声ファイル名は録音ファイル名と同一である必要があります.
- サンプル音声が無い場合や,お手本に従う必要がない場合はスキップしてください.
- サンプル音声ファイルは
- 『収録開始』ボタンを押すとビープ音が再生されるので,一拍置いてから文を読み上げます.
- 文を読み終わったら,同様に一拍置いてから『収録停止』ボタンを押します.
- 「収録に失敗しました」というメッセージが出た場合,メッセージに従って再収録してください.
- 必要に応じて『収録音声再生』ボタンを押して,収録音声を確認します.
- 『次の文へ』ボタンを押して,すべての文を収録するまで同様の操作を繰り返します.
- メニューの『表示』→『収録フォルダ』から収録した音声を確認できます.
- 収録の成功条件を厳しくしたいです.
- メニューの『設定』→『音声収録』から所望の設定に変更してください.
- 漢字の読めない小さな子に読ませたいです.
- メニューの 『設定』→『プロンプト』→『ルビタイプ』からBを選択してください.
- F1キーでも変更可能です.
- 一文当たりの録音の最大時間は何秒ですか.
- 20秒です.
- サンプリング周波数を変更したいです.
- インストールされた
Voist/res/properties/system.Voist.properties
のSAMPLE_RATE
を変更してください. - 1000Hz ~ 96000Hzまで対応しています.
- インストールされた
- ビットレートを変更したいです.
- インストールされた
Voist/res/properties/system.Voist.properties
のSAMPLE_SIZE
を変更してください. - 2 (16bit), 3 (24bit), 4 (32bit)のみ対応しています.すべて整数型です.
- インストールされた
- サンプル再生ボタンを隠したいです.
res/properties/system.Buttons.properties
のUSE_SAMPLE
をfalse
にしてください.
- 音声合成器を作りたいです.
- Visual Studio 2022
- .NET framework 2.0 (for WixEdit)
- 前準備
git clone https://github.com/sp-nitech/Voist.git
CallPortAudio.dll
とportaudio_x64.dll
がシンボリックリンクになっているか確認する.tools/
以下にあるmake1.bat
を実行する.tools/java/jdk-21_windows-x64_bin.exe
を実行してJDKをインストールする(インストール先はデフォルトのまま).tools/
以下にあるmake2.bat
を実行する.
- ASIO SDKをダウンロード
- SteinbergからASIO SDKをダウンロードする.
- ダウンロードしたzipファイルを解凍する.
- 解凍してできたディレクトリを
ASIOSDK
にリネームする. - リネームした
ASIOSDK
をtools/portaudio/src/hostapi/asio/
に配置する.
- PortAudioをコンパイル
tools/portaudio/msvc/portaudio.sln
を開く.- プロジェクトの変換について聞かれるのでOKを押す(警告が出るが無視する).
- ソリューション構成をDebugからReleaseに変更する.
- プラットフォームがx64になっているか確認する.
- 『プロジェクト』→『プロパティ』→『構成プロパティ』→『C/C++』を選択する.
- プラットフォームがx64になっているか確認する.
- 『最適化』→『フレームポイントなし』を『はい/(Oy)』にする.
- 『コード生成』→『ランタイムライブラリ』を『マルチスレッド(/MT)』にする.
- 『コード生成』→『浮動小数点モデル』を『Fast/(fp:fast)』にする.
- 『ビルド』→『ソリューションのビルド』を実行する.
- CallPortAudioをコンパイル
extern/CallPortAudio.sln
を開く.- ソリューション構成をDebugからReleaseに変更する.
- プラットフォームがx64になっているか確認する.
- 『ビルド』→『ソリューションのビルド』を実行する.
- Voistをコンパイル
- Eclipse FoundationからEclipseのインストーラをダウンロードする.
- インストーラを実行する.
- Eclipse IDE for Java Developersを選択して,そのままINSTALLボタンを押す.
- Eclipseを起動する.Workspaceは任意で良い.
- 『File』→『Open Projects from File System...』から,このリポジトリのルートディレクトリを指定する.
- 『Run』→『Run』で動作確認する.
- インストーラを作成
- Eclipseの『File』→『Export...』→『Java』→『Runnable JAR file』からJARファイルを出力する.
- Launch configuration:
Voist - Voist
- Export destination:
Voist/package/bin/Voist.jar
- Package required libraries into generated JAR: チェック
- Launch configuration:
tools/launch4j/launch4j-3.50-win32.exe
を実行してLaunch4jをインストールする.- Launch4j.exeを起動してJARファイルをEXEファイルに変換する.
package/res/launch4j.config.xml
を開く.- Build wrapper(歯車のボタン)を実行する.
tools/wixedit/WixEdit-0.8.2712.17.msi
を実行してWixEditをインストールする.- WixEditを起動してインストーラを作成する.
package/res/wixedit.config.wxs
を開く.- 『Build』→『Build MSI setup package』を実行する.
- インストーラ
package/bin/Voist.msi
を実行して動作確認する.
- Eclipseの『File』→『Export...』→『Java』→『Runnable JAR file』からJARファイルを出力する.
- 後処理
tools/llvm/LLVM-19.1.0-win64.exe
を実行してclang-format
をインストールする.- パスが通っているか(環境変数Pathに
C:\Program Files\LLVM\bin
があるか)をチェックする. tools/
以下にあるformat.bat
を実行する.
@InProceedings{sp-nitech2016voist,
author = {吉村建慶 and 橋本佳 and 大浦圭一郎 and 南角吉彦 and 徳田恵一},
title = {クラウドソーシングによる音声収集のための収録ソフトウェアの設計},
booktitle = {日本音響学会2016年春季研究発表会},
pages = {307--308},
year = {2016},
}