Permalink
Browse files

Merge branch 'master' of https://github.com/julius-speech/julius

  • Loading branch information...
nitslp-ri committed Feb 4, 2019
2 parents 7a81ec6 + 9954e3d commit 5774be598ef10d54d8c2e9d5fffe8d37defeca2e
Showing with 2,901 additions and 1,568 deletions.
  1. 0 .editconfig → .editorconfig
  2. +9 −7 .vscode/manual.code-snippets
  3. +9 −3 INSTALL.txt
  4. +15 −9 README.md
  5. +21 −9 adinrec/README.ja.md
  6. +27 −10 adinrec/README.md
  7. +51 −21 adintool/README.ja.md
  8. +66 −28 adintool/README.md
  9. 0 binlm2arpa/00readme-ja.txt
  10. 0 binlm2arpa/00readme.txt
  11. +55 −0 binlm2arpa/README.md
  12. +0 −39 dnntools/00readme.txt
  13. +51 −0 dnntools/README.md
  14. +148 −0 doc/Audio.md
  15. +85 −0 doc/Feature.md
  16. +170 −0 doc/Normalize.md
  17. +493 −358 {julius → doc}/Options.md
  18. +44 −0 doc/README.md
  19. +133 −0 doc/VAD.md
  20. BIN doc/image/map-cmn.png
  21. BIN doc/image/vad-module.png
  22. BIN doc/image/vad_lvzc.png
  23. +0 −62 generate-ngram/00readme.txt
  24. +98 −0 generate-ngram/README.md
  25. +0 −80 gramtools/accept_check/00readme.txt
  26. +83 −0 gramtools/accept_check/README.md
  27. +0 −51 gramtools/dfa_determinize/00readme.txt
  28. +47 −0 gramtools/dfa_determinize/README.md
  29. +0 −49 gramtools/dfa_minimize/00readme.txt
  30. +51 −0 gramtools/dfa_minimize/README.md
  31. +0 −75 gramtools/generate/00readme.txt
  32. +87 −0 gramtools/generate/README.md
  33. +0 −66 gramtools/mkdfa/00readme.txt
  34. +1 −1 gramtools/mkdfa/Makefile.in
  35. +131 −0 gramtools/mkdfa/README.md
  36. +162 −0 gramtools/mkdfa/mkdfa.py
  37. +0 −81 gramtools/nextword/00readme.txt
  38. +111 −0 gramtools/nextword/README.md
  39. +57 −0 gramtools/yomi2voca/README.md
  40. +0 −46 jclient-perl/00readme.txt
  41. +93 −0 jclient-perl/README.md
  42. +0 −184 jcontrol/00readme.txt
  43. +188 −0 jcontrol/README.md
  44. +98 −34 julius/README.md
  45. +0 −104 mkbingram/00readme.txt
  46. +119 −0 mkbingram/README.md
  47. +0 −69 mkbinhmm/00readme-mkbinhmmlist.txt
  48. +0 −77 mkbinhmm/00readme.txt
  49. +83 −0 mkbinhmm/README.md
  50. +0 −50 mkgshmm/00readme.txt
  51. +37 −0 mkgshmm/README.md
  52. +0 −55 mkss/00readme.txt
  53. +78 −0 mkss/README.md
File renamed without changes.
@@ -1,9 +1,9 @@
{
// Place your global snippets here. Each snippet is defined under a snippet name and has a scope, prefix, body and
// description. Add comma separated ids of the languages where the snippet is applicable in the scope field. If scope
// is left empty or omitted, the snippet gets applied to all languages. The prefix is what is
// used to trigger the snippet and the body will be expanded and inserted. Possible variables are:
// $1, $2 for tab stops, $0 for the final cursor position, and ${1:label}, ${2:another} for placeholders.
// Place your global snippets here. Each snippet is defined under a snippet name and has a scope, prefix, body and
// description. Add comma separated ids of the languages where the snippet is applicable in the scope field. If scope
// is left empty or omitted, the snippet gets applied to all languages. The prefix is what is
// used to trigger the snippet and the body will be expanded and inserted. Possible variables are:
// $1, $2 for tab stops, $0 for the final cursor position, and ${1:label}, ${2:another} for placeholders.
// Placeholders with the same ids are connected.
// Example:
// "Print to console": {
@@ -25,7 +25,9 @@
"",
"# ${1:Title}",
"",
"## Synopsys",
"Short description",
"",
"## Synopsis",
"",
"```shell",
"% ${1:Title} [options]",
@@ -72,4 +74,4 @@
],
"description": "README option"
}
}
}
@@ -32,11 +32,17 @@ specifying "--prefix=..." to configure script.
Linux (tested on Ubuntu-14.04)

% sudo apt-get install build-essential zlib1g-dev libsdl2-dev
% sudo apt-get libasound2-dev (or libpulse-dev, whichever you like)
% sudo apt-get libasound2-dev (or libpulse-dev, whichever you want to enable)
% ./configure
% make
% (optional) make install

If you want only one audio interface, use `--with-mictype=xxx`.

% ./configure --with-mictype=pulseaudio
% make
% (optional) make install

-----------------------------------------------
Mingw on Ubuntu (tested on 16.04)

@@ -47,7 +53,7 @@ cannot be build on Ubuntu.
% sudo apt-get install libz-mingw-w64-dev
% ./configure --host=x86_64-w64-mingw32 --disable-sdl
% make

-----------------------------------------------
Cygwin

@@ -115,5 +121,5 @@ your own compiler flags via "CFLAGS" environment value, like this:
% make

(tested on cross-compilation on Ubuntu)

-----------------------------------------------
@@ -1,14 +1,14 @@
(Moved from julius.osdn.jp since 2015/09, this is official)
(Moved from julius.osdn.jp since 2015/09, this is official)
(Since 2019/1/2, master has UTF-8-purified codes. We are still keeping the snap of old encoding at 4.5 release at branch "master-4.5-legacy".)

Julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine
==========================================================================
[![DOI](https://zenodo.org/badge/DOI/10.5281/zenodo.2530396.svg)](https://doi.org/10.5281/zenodo.2530396)

Copyright (c) 1991-2019 [Kawahara Lab., Kyoto University](http://sap.ist.i.kyoto-u.ac.jp/)
Copyright (c) 2005-2019 [Julius project team, Lee Lab., Nagoya Institute of Technology](http://www.slp.nitech.ac.jp/)
Copyright (c) 1997-2000 Information-technology Promotion Agency, Japan
Copyright (c) 2000-2005 Shikano Lab., Nara Institute of Science and Technology
Copyright (c) 1991-2019 [Kawahara Lab., Kyoto University](http://sap.ist.i.kyoto-u.ac.jp/)
Copyright (c) 2005-2019 [Julius project team, Lee Lab., Nagoya Institute of Technology](http://www.slp.nitech.ac.jp/)
Copyright (c) 1997-2000 Information-technology Promotion Agency, Japan
Copyright (c) 2000-2005 Shikano Lab., Nara Institute of Science and Technology

# About Julius

@@ -107,15 +107,21 @@ If you have any language or acoustic model that can be distributed as a freeware

Recent documents:

- Current version's Julius command reference is kept up-to-date at [README.md in Julius folder](https://github.com/julius-speech/julius/blob/master/julius/)
- Up-to-date document is now provided in markdown at [doc/](https://github.com/julius-speech/julius/blob/master/doc/).
- Updating all documents to recent version, work in progress.
- Finished Section:
[Options](https://github.com/julius-speech/julius/blob/master/doc/Options.md),
[Audio](https://github.com/julius-speech/julius/blob/master/doc/Audio.md),
[Feature](https://github.com/julius-speech/julius/blob/master/doc/Feature.md),
[Audio](https://github.com/julius-speech/julius/blob/master/doc/Audio.md)
[VAD](https://github.com/julius-speech/julius/blob/master/doc/VAD.md).
- All options are listed in [Sample.jconf](https://github.com/julius-speech/julius/blob/master/Sample.jconf) and also be output when invoked "julius --help".
- Full history and short descriptions are in [Release Notes](https://github.com/julius-speech/julius/blob/master/Release.txt) ([JP version](https://github.com/julius-speech/julius/blob/master/Release-ja.txt))
- For DNN-HMM, take a look at [00readme-DNN.txt](https://github.com/julius-speech/julius/blob/master/00readme-HNN.txt) for how-to and [Sample.dnnconf](https://github.com/julius-speech/julius/blob/master/Sample.dnnconf) as example.

Other, very old documents:
Other, old documents:

- [The Juliusbook 3 (English) - fully translated from Japanese for 3.x](http://julius.sourceforge.jp/book/Julius-3.2-book-e.pdf)
- [The Juliusbook 4 (English) - commands and options for 4.x](http://sourceforge.jp/projects/julius/downloads/47534/Juliusbook-4.1.5.pdf)
- [The Juliusbook 3 (English) - translated from Japanese for 3.x](http://julius.sourceforge.jp/book/Julius-3.2-book-e.pdf)
- [The Juliusbook 4 (Japanese) - full documentation in Japanese](http://julius.osdn.jp/juliusbook/ja/)
- [The grammar format of Julius](http://julius.sourceforge.jp/en_index.php?q=en_grammar.html)

@@ -6,7 +6,7 @@

1発話の音声入力データをファイルに記録する

## Synopsys
## Synopsis

```shell
% adinrec [options...] file.wav
@@ -16,13 +16,18 @@

`adinrec` はオーディオ入力から音声発話を検出し、ファイルに保存して終了します。

このツールはJuliusのVADモジュールを使用して音声検出を行います。使用するアルゴリズムとパラメータはJuliusと同一であり、Juliusの動きを再現することができます。
このツールはJuliusのVADモジュールを使用して音声検出を行います。使用するアルゴリ
ズムとパラメータはJuliusと同一であり、Juliusの動きを再現することができます。

保存オーディオファイルの形式は 16bit モノラルの .wav ファイルです。指定されたファイル名が既にある場合は上書きします。ファイル名が "-" のときは no header (raw) 形式で標準出力へ出力されます。
保存オーディオファイルの形式は 16bit モノラルの .wav ファイルです。指定された
ファイル名が既にある場合は上書きします。ファイル名が "-" のときは no header
(raw) 形式で標準出力へ出力されます。

### Prerequisites

マイク入力を用いる場合は実行環境に音声録音デバイスが必要です。複数デバイスがある場合はデフォルトのデバイスが使用されます。環境変数でデバイスを変更することができます(Juliusと同様に)
マイク入力を用いる場合は実行環境に音声録音デバイスが必要です。複数デバイスがある
場合はデフォルトのデバイスが使用されます。環境変数でデバイスを変更することができ
ます(Juliusと同様に)

### Installing

@@ -42,7 +47,8 @@
% adinrec -freq 48000 test.wav
```

adinnet から音声ストリームを受信しながら音声検出と保存を行う。また libfvad ベースのVADモジュールを使用する。
adinnet から音声ストリームを受信しながら音声検出と保存を行う。また libfvad ベー
スのVADモジュールを使用する。

```shell
% adinrec -input adinnet -fvad 3 test.wav
@@ -60,7 +66,10 @@ raw (no header) 形式で出力 (Default: .wav 形式で出力)

### Other options (-input, -lv, ...)

音声入力部に Julius のライブラリを用いており、Juliusの音声入力オプションがすべて指定可能です。環境変数による入力デバイスの選択や、レベル閾値の設定、区間前後の無音区間マージンの長さの変更、Julius用の jconf ファイルの読み込み、等を指定できます。詳しくは Juliusのマニュアルの音声入力オプションの項を見てください。
音声入力部に Julius のライブラリを用いており、Juliusの音声入力オプションがすべて
指定可能です。環境変数による入力デバイスの選択や、レベル閾値の設定、区間前後の無
音区間マージンの長さの変更、Julius用の jconf ファイルの読み込み、等を指定できま
す。詳しくは Juliusのマニュアルの音声入力オプションの項を見てください。

## Environment Variables

@@ -74,12 +83,15 @@ OSS で音声入力デバイス名を指定 (default: "/dev/dsp")

### PORTAUDIO_DEV

PortAudio で音声入力デバイの番号を指定。起動時にデバイスリストが出力されるのでその中から番号を指定する。
PortAudio で音声入力デバイの番号を指定。起動時にデバイスリストが出力されるのでそ
の中から番号を指定する。

### LATENCY_MSEC

マイク入力のレイテンシをミリ秒で指定。小さくすると遅延は少なくなるが動作が不安定になる。デフォルト値はデバイス・OSによって自動決定される。
マイク入力のレイテンシをミリ秒で指定。小さくすると遅延は少なくなるが動作が不安定
になる。デフォルト値はデバイス・OSによって自動決定される。

## License

本ツールは Julius と同じオープンソースライセンスを保有しています。詳しくはJuliusのライセンスをご覧ください。
本ツールは Julius と同じオープンソースライセンスを保有しています。詳しくはJulius
のライセンスをご覧ください。
@@ -6,7 +6,7 @@

Record one utterance from audio device and save to a file.

## Synopsys
## Synopsis

```shell
% adinrec [options...] file.wav
@@ -16,14 +16,17 @@ Record one utterance from audio device and save to a file.

`adinrec` detects an utterance input and store it to a file.

This tool uses Julius's internal VAD module for speech detection. The detection algorithm and parameters are the same as Julius.
This tool uses Julius's internal VAD module for speech detection. The detection
algorithm and parameters are the same as Julius.

The audio format is 16 bit, 1 channel in Microsoft WAV format. If the given filename already exists, it will be overridden. When filename is "-" , the captured data will be streamed into standard
out with no header (raw) format.
The audio format is 16 bit, 1 channel in Microsoft WAV format. If the given
filename already exists, it will be overridden. When filename is "-" , the
captured data will be streamed into standard out with no header (raw) format.

### Prerequisites

You need one audio capture device on your machine. If several devices are available, the default one will be used.
You need one audio capture device on your machine. If several devices are
available, the default one will be used.

### Installing

@@ -43,7 +46,8 @@ Record one utterance with 48kHz, 16bit mono format:
% adinrec -freq 48000 test.wav
```

Receive audio stream from adinnet audio client, detect speech, and save the first speech segement into a file. Also activates libfvad-based VAD module.
Receive audio stream from adinnet audio client, detect speech, and save the
first speech segment into a file. Also activates libfvad-based VAD module.

```shell
% adinrec -input adinnet -fvad 3 test.wav
@@ -61,7 +65,9 @@ output in raw (no header) format. (Default: save in .wav format)

### Other options (-input, -lv, ...)

Julius's audio options are fully applicable to this tool. You can choose input device, set level threshold, change head/tail silence margin, load Julius's jconf file and so on. For the available options, see the options in Julius.
Julius's audio options are fully applicable to this tool. You can choose input
device, set level threshold, change head/tail silence margin, load Julius's
jconf file and so on. For the available options, see the options in Julius.

## Environment Variables

@@ -75,12 +81,23 @@ device name string for OSS (default: "/dev/dsp")

### PORTAUDIO_DEV

With portaudio, index of capture device to use. The available devices will be listed at startup.
With PortAudio, index of capture device to use. The available devices will be
listed at startup.

### LATENCY_MSEC

Input latency of microphone input in milliseconds. Smaller value will shorten latency but sometimes make process unstable. Default value will depend on the running OS.
Input latency of microphone input in milliseconds. Smaller value will shorten
latency but sometimes make process unstable. Default value will depend on the
running OS.

## Related tools

- "[adintool](https://github.com/julius-speech/julius/tree/master/adintool)" is
another recording software with rich functions.
- "[julius](https://github.com/julius-speech/julius/)" uses the same audio
detection algorithm.

## License

This tool is licensed under the same license with Julius - see the license term of Julius for defails.
This tool is licensed under the same license with Julius. See the license term
of Julius for details.
Oops, something went wrong.

0 comments on commit 5774be5

Please sign in to comment.