In [None]:
cd ${KALDI_INSTRUCTIONAL_PATH} && pwd

# 0.0: `shell` Basics

`kaldi`는 `C++`를 이용하여 작성되었으며, 주로 `shell`을 이용하여서 실행할 수 있습니다. `C++`를 직접 수정하는 것은 어려운 일일 수도 있지만, `shell` 스크립트를 이해하고 실행할 수 있으며 수정할 수 있게 된다면 `kaldi`를 이해하는데 더욱 도움이 될 것입니다. 

`shell`에 관련된 자료들은 다음에서 확인하실 수 있습니다: http://www.tldp.org/LDP/Bash-Beginners-Guide/html/index.html

`shell` 혹은 `bash`에서 주로 사용되는 아래의 명령어들을 간단히 실행해보도록 하겠습니다. 

- `echo`
- `pwd`
- `cd`
- `ls`
- `mkdir`
- `cp`
- `mv`
- `cat`/`more`
- `head`/`tail`
- `grep`
- `|`
- variables
- `for` loop
- `if`/`then`
- `chmod`
- `sudo`

## `echo`: print

In [1]:
echo "Hello world"

Hello world


## `pwd`: print name of current/working directory
`pwd` 명령어는 현재 작업하고 있는 위치를 출력합니다. 

In [2]:
pwd

/scratch/kaldi/egs/INSTRUCTIONAL


## `cd`: change directory

`cd` 명령어를 이용해서 작업 위치를 변경할 수 있습니다. `cd` 이후에 아무런 위치도 지정하지 않으면, 작업 위치를 `/root`로 이동하게 됩니다. 위치를 지정했을 경우에는 해당 위치로 이동하게 됩니다. 

In [3]:
cd && pwd    # && can be put between two commands to do them consecutively

/root


In [4]:
cd /scratch/kaldi/egs/INSTRUCTIONAL && pwd

/scratch/kaldi/egs/INSTRUCTIONAL


상위 폴더로 이동하기 위해서는 `..`을 사용할 수 있습니다. 예를 들어, `cd ..`을 입력하게 되면 작업 위치를 `/home/kaldi/egs/INSTRUCTIONAL`에서 `/home/kaldi/egs`로 이동하게 됩니다. 만약 `cd ../..`를 입력했을 경우에는 작업 위치를 `/home/kaldi`로 이동하게 됩니다. 

`..` 뒤에 하위 폴더 명을 입력하여서 상위 폴더에 있는 다른 하위 폴더로 작업 위치를 변경할 수 있습니다. 

In [5]:
cd ../mini_librispeech && pwd

/scratch/kaldi/egs/mini_librispeech


## `ls`: list directory contents

`ls` 명령어는 해당 위치에 있는 모든 디렉토리 및 파일을 보여줍니다. `ls` 뒤에 아무 내용도 입력하지 않으면 현재 위치에 있는 디렉토리/파일들을 출력하고, `ls` 뒤에 위치를 지정하였을 경우에는 해당 위치에 있는 디렉토리/파일 이름을 출력합니다. 

In [6]:
pwd && ls

/scratch/kaldi/egs/mini_librispeech
[0m[01;34ms5[0m


In [7]:
ls ../mini_librispeech/s5

[0m[01;32mRESULTS[0m  cmd.sh  [01;34mconf[0m  [01;34mlocal[0m  [01;32mpath.sh[0m  [01;32mrun.sh[0m  [01;34msteps[0m  [01;34mutils[0m


`ls` 명령어 뒤에 `-lah`와 같은 3개의 `flag`를 사용할 수 있습니다. 
  - `-l` 명령어는 디렉토리/파일의 권한, 크기, 그리고 최근 수정 시간을 보여줍니다. 
  - `-a` 명령어는 숨겨져있는 폴더나 파일들을 모두 출력합니다 (`.` 으로 시작하는 파일 포함)
  - `-h` 명령어는 파일 크기를 읽기 편한 형식으로 변경하여서 출력합니다. 

In [9]:
ls -lah

total 12K
drwxr-xr-x 3 root root 4.0K May 29 04:30 [0m[01;34m.[0m
drwxr-xr-x 4 root root 4.0K May 29 04:30 [01;34m..[0m
drwxr-xr-x 6 root root 4.0K May 29 04:30 [01;34ms5[0m


## `mkdir`: make a new directory

`mkdir` 명령어는 새로운 디렉토리 (폴더)를 생성하는 명령어입니다. 폴더를 생성하고 그 내부에 새로운 폴더를 한 번에 생성하려는 경우 (`mkdir -p dir1/dir2`) `-p` flag를 사용하는 것이 에러를 방지할 수 있습니다. 

In [10]:
mkdir -p empty_folder_1/empty_folder_2

In [11]:
ls empty_folder_1

[0m[01;34mempty_folder_2[0m


In [12]:
ls empty_folder_1/empty_folder_2

## `cp`: copy files/directories

`cp` 명령어를 이용하여 파일들을 복사할 수 있으며, `-r` flag를 이용하여 폴더들도 이동할 수 있습니다. `cp` 명령어는 두 개의 논항을 취합니다. 처음 논항은 복사할 대상이며, 두 번째 논항은 복사한 대항을 붙여넣을 위치입니다. 

In [13]:
cd ${KALDI_INSTRUCTIONAL_PATH} && ls

[0m[01;32m0_0-shell_basics.ipynb[0m
[01;32m0_1-functionality_confirmation.ipynb[0m
10_HW-final_experiment.ipynb
[01;32m1_1-downloading_and_preparing_librispeech_files.ipynb[0m
[01;32m1_2-examining_required_files.ipynb[0m
[01;32m1_3-building_language_model.ipynb[0m
1_4-examining-language-model.ipynb
1_HW_template-examining_language_model.ipynb
[01;32m2_0-understanding_config_and_scripts.ipynb[0m
[01;32m2_1-run_prepare_data.ipynb[0m
2_10-inspecting_exp_dir.ipynb
2_11-examining_acoustic_models.ipynb
2_2-inspecting_data_dir.ipynb
2_3-run_feature_extraction.ipynb
2_4-inspecting_mfcc_dir.ipynb
2_5-examining_mfccs.ipynb
2_6-understanding_config.ipynb
2_7-run_train_phones-monophones.ipynb
2_8-run_train_phones-deltas.ipynb
2_9-run_train_phones-lda.ipynb
2_HW_template-examining_mfccs.ipynb
3_1-creating_G_fst.ipynb
3_2-examining_G_fst.ipynb
3_3-run_compile_graph-monophones.ipynb
3_4-run_compile_graph-triphones.ipynb
3_5-run_compile_graph-triphones_lda.ipynb
3_6-inspecting_HCLG_fst.

In [14]:
cp ../../README.md README_copy.txt && ls

[0m[01;32m0_0-shell_basics.ipynb[0m
[01;32m0_1-functionality_confirmation.ipynb[0m
10_HW-final_experiment.ipynb
[01;32m1_1-downloading_and_preparing_librispeech_files.ipynb[0m
[01;32m1_2-examining_required_files.ipynb[0m
[01;32m1_3-building_language_model.ipynb[0m
1_4-examining-language-model.ipynb
1_HW_template-examining_language_model.ipynb
[01;32m2_0-understanding_config_and_scripts.ipynb[0m
[01;32m2_1-run_prepare_data.ipynb[0m
2_10-inspecting_exp_dir.ipynb
2_11-examining_acoustic_models.ipynb
2_2-inspecting_data_dir.ipynb
2_3-run_feature_extraction.ipynb
2_4-inspecting_mfcc_dir.ipynb
2_5-examining_mfccs.ipynb
2_6-understanding_config.ipynb
2_7-run_train_phones-monophones.ipynb
2_8-run_train_phones-deltas.ipynb
2_9-run_train_phones-lda.ipynb
2_HW_template-examining_mfccs.ipynb
3_1-creating_G_fst.ipynb
3_2-examining_G_fst.ipynb
3_3-run_compile_graph-monophones.ipynb
3_4-run_compile_graph-triphones.ipynb
3_5-run_compile_graph-triphones_lda.ipynb
3_6-inspecting_HCLG_fst.

폴더를 복사하는 경우, `-r` flag (i.e., `recursive`)를 사용하시면 됩니다. 

In [15]:
cp -r resource_files resource_files_copy && ls resource_files_copy

[0m[01;34mfeature_viz[0m  [01;34mlanguage_model[0m  [01;34mresources[0m  [01;34musing_atmosphere[0m
[01;34mfst[0m          [01;34mlattices[0m        [01;34mtree_viz[0m


## `mv`: move files/directories

`mv` 는 파일이나 폴더를 새로운 위치로 이동하는 명령어입니다. 논항 구조는 `cp` 명령어와 동일합니다. 

In [16]:
ls

[0m[01;32m0_0-shell_basics.ipynb[0m
[01;32m0_1-functionality_confirmation.ipynb[0m
10_HW-final_experiment.ipynb
[01;32m1_1-downloading_and_preparing_librispeech_files.ipynb[0m
[01;32m1_2-examining_required_files.ipynb[0m
[01;32m1_3-building_language_model.ipynb[0m
1_4-examining-language-model.ipynb
1_HW_template-examining_language_model.ipynb
[01;32m2_0-understanding_config_and_scripts.ipynb[0m
[01;32m2_1-run_prepare_data.ipynb[0m
2_10-inspecting_exp_dir.ipynb
2_11-examining_acoustic_models.ipynb
2_2-inspecting_data_dir.ipynb
2_3-run_feature_extraction.ipynb
2_4-inspecting_mfcc_dir.ipynb
2_5-examining_mfccs.ipynb
2_6-understanding_config.ipynb
2_7-run_train_phones-monophones.ipynb
2_8-run_train_phones-deltas.ipynb
2_9-run_train_phones-lda.ipynb
2_HW_template-examining_mfccs.ipynb
3_1-creating_G_fst.ipynb
3_2-examining_G_fst.ipynb
3_3-run_compile_graph-monophones.ipynb
3_4-run_compile_graph-triphones.ipynb
3_5-run_compile_graph-triphones_lda.ipynb
3_6-inspecting_HCLG_fst.

In [17]:
mv README_copy.txt ../ && ls ..

[0m[01;34mINSTRUCTIONAL[0m  README_copy.txt  [01;34mmini_librispeech[0m


디렉토리도 동일한 방법으로 이동할 수 있습니다. 

In [18]:
ls

[0m[01;32m0_0-shell_basics.ipynb[0m
[01;32m0_1-functionality_confirmation.ipynb[0m
10_HW-final_experiment.ipynb
[01;32m1_1-downloading_and_preparing_librispeech_files.ipynb[0m
[01;32m1_2-examining_required_files.ipynb[0m
[01;32m1_3-building_language_model.ipynb[0m
1_4-examining-language-model.ipynb
1_HW_template-examining_language_model.ipynb
[01;32m2_0-understanding_config_and_scripts.ipynb[0m
[01;32m2_1-run_prepare_data.ipynb[0m
2_10-inspecting_exp_dir.ipynb
2_11-examining_acoustic_models.ipynb
2_2-inspecting_data_dir.ipynb
2_3-run_feature_extraction.ipynb
2_4-inspecting_mfcc_dir.ipynb
2_5-examining_mfccs.ipynb
2_6-understanding_config.ipynb
2_7-run_train_phones-monophones.ipynb
2_8-run_train_phones-deltas.ipynb
2_9-run_train_phones-lda.ipynb
2_HW_template-examining_mfccs.ipynb
3_1-creating_G_fst.ipynb
3_2-examining_G_fst.ipynb
3_3-run_compile_graph-monophones.ipynb
3_4-run_compile_graph-triphones.ipynb
3_5-run_compile_graph-triphones_lda.ipynb
3_6-inspecting_HCLG_fst.

In [19]:
mv resource_files_copy .. && ls ..

[0m[01;34mINSTRUCTIONAL[0m  README_copy.txt  [01;34mmini_librispeech[0m  [01;34mresource_files_copy[0m


`mv` 명령어를 이용하여 파일의 이름을 *변경할* 수도 있습니다. 

In [20]:
ls ..

[0m[01;34mINSTRUCTIONAL[0m  README_copy.txt  [01;34mmini_librispeech[0m  [01;34mresource_files_copy[0m


In [21]:
mv ../README_copy.txt ../README_copy_renamed.txt && ls ..

[0m[01;34mINSTRUCTIONAL[0m  README_copy_renamed.txt  [01;34mmini_librispeech[0m  [01;34mresource_files_copy[0m


## `cat`: print the contents of a file to the command line

`cat` 명령어를 이용하여 파일의 내용을 command-line에 바로 출력할 수 있습니다. 

In [22]:
cat ../README_copy_renamed.txt

Kaldi Speech Recognition Toolkit - Instructional version

This repository is a simplified version of the `kaldi` toolkit, used
for instructional purposes.

Resources
---------

See the `resources` directory.

Installation
------------

**Atmosphere Users**: Your image will *already* contain the `docker` image.
You do *not* need to run the Installation steps below.

### Building from `Dockerfile`

There is a `Dockerfile` that can be used to build a `docker` image.

```
cd docker
./build_container.sh
```

### `Pull`ing from `DockerHub`

You can also `pull` the built image directly from `docker hub` instead of building with the `Dockerfile`.

```
docker pull mcapizzi/kaldi_instructional
```

Running `docker` container
--------------------------

Once the `docker` container exists, it can be run easily with `./start_container.sh` which is found in the project root (`/home/kaldi`).
This will open port `8880` by default to access the `jupyter` kernel.  
If you prefer a different port it can 

## `head`/`tail`: print the `top` (or `bottom`) `n` lines of a file

`head` 명령어는 파일의 시작부터 10번째 줄까지의 내용을 출력하며, `tail` 명령어는 파일 맨 마지막 10개의 줄을 출력합니다. `-n` flag를 이용하여 몇 개의 줄을 출력할지 설정할 수 있습니다. 

In [23]:
head ../README_copy_renamed.txt

Kaldi Speech Recognition Toolkit - Instructional version

This repository is a simplified version of the `kaldi` toolkit, used
for instructional purposes.

Resources
---------

See the `resources` directory.


In [24]:
head -n2 ../README_copy_renamed.txt && tail -n5 ../README_copy_renamed.txt

Kaldi Speech Recognition Toolkit - Instructional version
You can `kill` any `tmux session` with:

```
tmux kill-session -t [session_name]
```

## `grep`: find lines matching a pattern
`grep` 명령어는 해당하는 `string pattern`을 검색하는 명령어입니다. 

`grep` 명령어는 찾고자 하는 `string pattern`과 일치하는 내용을 파일에서 검색할 수도 있습니다. 

In [25]:
cat ../README_copy_renamed.txt

Kaldi Speech Recognition Toolkit - Instructional version

This repository is a simplified version of the `kaldi` toolkit, used
for instructional purposes.

Resources
---------

See the `resources` directory.

Installation
------------

**Atmosphere Users**: Your image will *already* contain the `docker` image.
You do *not* need to run the Installation steps below.

### Building from `Dockerfile`

There is a `Dockerfile` that can be used to build a `docker` image.

```
cd docker
./build_container.sh
```

### `Pull`ing from `DockerHub`

You can also `pull` the built image directly from `docker hub` instead of building with the `Dockerfile`.

```
docker pull mcapizzi/kaldi_instructional
```

Running `docker` container
--------------------------

Once the `docker` container exists, it can be run easily with `./start_container.sh` which is found in the project root (`/home/kaldi`).
This will open port `8880` by default to access the `jupyter` kernel.  
If you prefer a different port it can 

In [26]:
grep "simplified" ../README_copy_renamed.txt

This repository is a [01;31m[Ksimplified[m[K version of the `kaldi` toolkit, used


`-E` flag를 사용하여서 `grep`에서 `regular expression`을 이용한 검색을 할 수도 있습니다. 

In [27]:
grep -E "[0-9]+" kaldi_config.json

        "value": "/scratch/kaldi/egs/INSTRUCTIONAL/raw_data/[01;31m[K3[m[K-gram.pruned.[01;31m[K3[m[Ke-[01;31m[K7[m[K.arpa"
        "value": "/scratch/kaldi/egs/INSTRUCTIONAL/raw_data/LibriSpeech/train-clean-[01;31m[K100[m[K_audio"
        "value": [01;31m[K4[m[K
        "value": [01;31m[K10000[m[K
        "value": [01;31m[K5000[m[K
        "value": [01;31m[K10[m[K
        "value": [01;31m[K4[m[K
        "value": [01;31m[K4[m[K
        "value": [01;31m[K10[m[K
        "value": [01;31m[K13[m[K.[01;31m[K0[m[K
        "value": [01;31m[K7000[m[K


**Note**: `grep`을 이용해서 할 수 있는 일은 정말 많습니다. 설명한 것 외에도 `grep`으로 할 수 있는 다른 몇 가지 일들을 [이 곳](https://www.panix.com/~elflord/unix/grep.html)에서 확인할 수 있습니다. 

## `|`: piping commands

두 개의 명령어 사이에 `|` (`shift + \`)를 삽입하게 되면, 첫 번째 명령어의 결과를 두 번째 명령어의 입력으로 사용하게 됩니다. 그리고 두 번째 명령어의 결과를 출력합니다. 

**Note:** `kaldi`에서는 `pipe`가 정말 많이 사용됩니다. `kaldi`에서 사용된 스크립트를 열어보면 `|`를 빈번하게 볼 수 있습니다. 

In [28]:
ls

[0m[01;32m0_0-shell_basics.ipynb[0m
[01;32m0_1-functionality_confirmation.ipynb[0m
10_HW-final_experiment.ipynb
[01;32m1_1-downloading_and_preparing_librispeech_files.ipynb[0m
[01;32m1_2-examining_required_files.ipynb[0m
[01;32m1_3-building_language_model.ipynb[0m
1_4-examining-language-model.ipynb
1_HW_template-examining_language_model.ipynb
[01;32m2_0-understanding_config_and_scripts.ipynb[0m
[01;32m2_1-run_prepare_data.ipynb[0m
2_10-inspecting_exp_dir.ipynb
2_11-examining_acoustic_models.ipynb
2_2-inspecting_data_dir.ipynb
2_3-run_feature_extraction.ipynb
2_4-inspecting_mfcc_dir.ipynb
2_5-examining_mfccs.ipynb
2_6-understanding_config.ipynb
2_7-run_train_phones-monophones.ipynb
2_8-run_train_phones-deltas.ipynb
2_9-run_train_phones-lda.ipynb
2_HW_template-examining_mfccs.ipynb
3_1-creating_G_fst.ipynb
3_2-examining_G_fst.ipynb
3_3-run_compile_graph-monophones.ipynb
3_4-run_compile_graph-triphones.ipynb
3_5-run_compile_graph-triphones_lda.ipynb
3_6-inspecting_HCLG_fst.

In [29]:
ls | grep "ipynb"

0_0-shell_basics.[01;31m[Kipynb[m[K
0_1-functionality_confirmation.[01;31m[Kipynb[m[K
10_HW-final_experiment.[01;31m[Kipynb[m[K
1_1-downloading_and_preparing_librispeech_files.[01;31m[Kipynb[m[K
1_2-examining_required_files.[01;31m[Kipynb[m[K
1_3-building_language_model.[01;31m[Kipynb[m[K
1_4-examining-language-model.[01;31m[Kipynb[m[K
1_HW_template-examining_language_model.[01;31m[Kipynb[m[K
2_0-understanding_config_and_scripts.[01;31m[Kipynb[m[K
2_1-run_prepare_data.[01;31m[Kipynb[m[K
2_10-inspecting_exp_dir.[01;31m[Kipynb[m[K
2_11-examining_acoustic_models.[01;31m[Kipynb[m[K
2_2-inspecting_data_dir.[01;31m[Kipynb[m[K
2_3-run_feature_extraction.[01;31m[Kipynb[m[K
2_4-inspecting_mfcc_dir.[01;31m[Kipynb[m[K
2_5-examining_mfccs.[01;31m[Kipynb[m[K
2_6-understanding_config.[01;31m[Kipynb[m[K
2_7-run_train_phones-monophones.[01;31m[Kipynb[m[K
2_8-run_train_phones-deltas.[01;31m[Kipynb[m[K
2_9-run_train_phones-lda.

In [30]:
cat ../README_copy_renamed.txt | grep "simplified"

This repository is a [01;31m[Ksimplified[m[K version of the `kaldi` toolkit, used


## `variables`

`shell`에서는 다음과 같은 방법으로 `variable` (변수)를 설정할 수 있습니다. 

```
variable_name="string or number to capture"
```

그리고 `${variable_name}`을 이용하여서 다시 불러올 수 있습니다. `echo` 명령어로 `variable`의 내용을 출력할 수 있습니다. 

In [31]:
some_variable="I love cats."
echo ${some_variable}        # many people think {} wrapped around variables is a useful convention for clarity

I love cats.


## `for` loop


`shell`에서 `for` 루프의 문법은 다음과 같습니다. 

```
for [variable] in [list]; do
    [some_command]
done
```

In [32]:
for letter in a b c; do
    echo ${letter}        
done

a
b
c


## `if`/`then`

`shell`에서 `if/then`의 문법은 다음과 같습니다. 

```
if [ <condition> ]; then
    some_command
fi
```



`condition`에 따라서 `if/then`의 구조는 더욱 복잡해질 수 있습니다. [이 곳](https://ryanstutorials.net/bash-scripting-tutorial/bash-if-statements.php) 에서 `shell`에서 사용되는 `if`/`then` 구조의 예를 볼 수 있습니다.

In [33]:
today=Tuesday
if [ ${today} == "Tuesday" ]; then
    echo "At least it's not Monday"
fi

At least it's not Monday


`elif` 나 `else` 는 다음과 같이 추가할 수 있습니다.

In [34]:
if [ ${today} == "Monday" ]; then
    echo "I hate Mondays"
elif [ ${today} == "Friday" ]; then
    echo "TGIF!  Woot!"
else
    echo "Can't wait for Friday"
fi

Can't wait for Friday


## `chmod`: change permissions of file

`linux` 체계에서는 파일 권한이 중요합니다. 파일에 실행권한이 제대로 주어져있지 않을 경우, 파일을 어떤 `interpreter`로 실행해야 하는지 명시해주어야 하므로, 조금 귀찮은 일이 생길 수 있습니다.

그러한 경우 `chmod` 명령어를 이용하여서 파일의 권한을 변경할 수 있습니다. `chmod` 명령어는 매우 복잡합니다. (참조: http://endlessgeek.com/2014/02/chmod-explained-linux-file-permissions/) 하지만 이번 워크샵에서는 `shell` 스크립트 (`.sh`) 파일들에 실행권한이 있는지만 확인하면 됩니다. 

실행권한이 주어져있지 않을 경우, `chmod a+rwx [filename]` 의 명령어를 입력하여서 권한을 부여할 수 있습니다. 

In [35]:
echo "I love cats" > sample_executable.sh   # make a quick script

`ls -lah` 명령어를 사용해서 보면 `읽기 전용` 권한이 부여되어 있음을 확인할 수 있습니다. 

In [36]:
ls -lah | grep sample_executable.sh

-rw-r--r-- 1 root root   12 May 29 13:12 [01;31m[Ksample_executable.sh[m[K


`chmod a+rwx` 명령어를 사용하여 다른 권한을 부여할 수 있습니다. 

In [37]:
chmod a+rwx sample_executable.sh && ls -lah | grep sample_executable.sh

-rwxrwxrwx 1 root root   12 May 29 13:12 [01;31m[Ksample_executable.sh[m[K


## `sudo`: become the super-user

Windows의 `관리자권한`과 비슷합니다. 파일을 실행하였을 때 `permission denied`와 같은 에러 메시지가 나온다면, `sudo`를 이용하여 명령어를 실행하거나 파일을 실행하여야 합니다. `sudo`는 모든 명령어 맨 앞부분에 위치하게 되며, 사용자 권한을 확인하기 위해서 비밀번호를 입력하여야 할 수도 있습니다. `kaldi`에서는 `/root`에서 파일을 다루는 경우가 많아, `sudo`를 거의 매 번 사용하게 됩니다. 

`sudo`에 관한 자세한 내용은 [이 곳](http://aplawrence.com/Basics/sudo.html)에서 확인하실 수 있습니다. 