クラウド型音声認識を利用するCUIツールである.
なお,このプログラムは,公開許可があった上で公開している.
UNIX/Linux,あるいはWindowsにおけるCygwinにおいて,添付しているMakefileを 利用してビルドすればよい. srcディレクトリに移動した上で,以下のようにすること.
$ make
デバッグ用のバイナリを作成する場合は,以下のようにすること.
$ make DEBUG=true
余談だが,最近のg++なら,以下のようにすれば,かなりの最適化がかかるように してある. (古いg++だと未対応のオプションを用いている)
$ make OPT=true
また,Microsoft Visual C++のコンパイラでもコンパイル可能である. msvc.mkはnmake向けに書かれたMakefileであり,以下のようにすれば,コンパイル できる.
> nmake /f msvc.mk
音声が記録されたwavファイルを対象として,次のように使用する.
$ ./sr [音声認識を行うwavファイル]
もしくは,wavファイルが格納されたディレクトリを指定してもよい.
$ ./sr [wavファイルがいくつかはいったディレクトリ]
これで,wavファイルと同一ディレクトリにwavファイルの音声の認識結果が 出力される. 出力ファイル名は,
- [wavファイル名].txt
となる.
このプログラムのコマンドライン引数として,以下のオプションが使用可能である.
- -h, --help
- プログラムの使い方を表示する.
- -l [target-language], --language [target-language]
- 対象ディレクトり以下のwavファイルを音声認識させる
srcディレクトリにソースコードがあり,各Makefileとコンパイラの対応は以下のように なっている.
Makefile名 | 対象コンパイラ |
---|---|
Makefile | g++ |
clang.mk | clang(ただし,未対応) |
msvc.mk | Microsoft Visual C++コンパイラ用 |
以下のライブラリを,このリポジトリ内に組み込んでいる.
- CLX C++ Libraries (BSDライセンス)
- C++のネットワークプログラミング用ライブラリ(ヘッダのみで構成されている)
- http://sourceforge.jp/projects/clxcpp/releases/51423
- PicoJSON (BSDライセンス)
- JSONパーサ(ヘッダのみで構成されている)
- https://github.com/kazuho/picojson
- getopt(MSVCのみ) (BSDライセンス)
- コマンドライン引数のオプション処理用のライブラリ
- UNIX/Linux系では,標準ライブラリだが,MSVCでは非標準ライブラリ
- https://svn.xiph.org/trunk/theora-exp/win32/compatibility/
各Makefileに記述してあるように,依存ライブラリへのインクルードパスは, コンパイラのオプションで通している. Makefileを用いずにコンパイルする場合は,インクルードパスをコンパイラに与える こと.
- ビルドと動作に成功した環境とコンパイラ
- Windows7 : Cygwinのg++
- Ubuntu12.04 : g++
- ビルドに失敗した環境とコンパイラ
- Windows7 : Cygwinのclang
- Windows7 : MinGWのg++
- Ubuntu12.04 : clang
- ビルドに成功したが,動作しない環境とコンパイラ
- WindowsのMSVCコンパイラ(英語のみ動作可能)
これ以外の環境については,確認していない.