해당 repo는 한국어 ENUNU를 위해 부분 수정 되었습니다.
lang_mode 옵션과 hed 및 table 파일을 변경하면 일본어 모델을 학습시킬 수 있습니다.
Windows 환경을 기준으로 작성되었습니다.
Python 3.8.* Download 클릭하여 다운로드 및 설치합니다.
- 가상환경 (venv)을 사용하는 것을 추천합니다.
bash shell 명령을 Windows에서 실행하기 위해 필요합니다.
Git Download 클릭하여 다운로드 및 설치합니다.
git clone https://github.com/Kor-SVS/Enunu-Training-Kit.git
또는 직접 다운로드를 사용할 수 있습니다.
CUDA Tool Kit ver.11.3을 설치합니다.
python -m pip install torch==1.12.0+cu113 torchvision==0.13.0+cu113 torchaudio==0.12.0 --extra-index-url https://download.pytorch.org/whl/cu113
해당 명령어를 입력하여 파이토치를 설치합니다.
한국어 가사에서 발음 방법에 알맞는 음소 생성 등의 작업을 위해 필요한 패키지들 입니다.
-
형태소 분석기 설치
-
mecab-ko 클릭하여 다운로드 합니다.
-
압축을 풀고
C:\
경로에 옮겨줍니다.
(작업을 완료하면C:\mecab
위치에서 mecab.exe를 찾을 수 있어야 합니다.) -
mecab-python-msvc 클릭하여 다운로드 합니다.
-
python -m pip install (다운로드 경로)
를 입력하여 설치합니다. -
python -m pip install git+https://github.com/Kor-SVS/g2pK.git
를 입력하여 g2pK 수정버전을 설치합니다.
-
-
enunu-kor-tool 설치
python -m pip install git+https://github.com/Kor-SVS/enunu-kor-tool.git
를 입력하여 설치합니다.
-
nnsvs 설치
python -m pip install nnsvs
를 입력하여 설치합니다.
-
기타 필요 패키지 설치
python -m pip install pydub hydra-optuna-sweeper mlflow
를 입력하여 설치합니다.
라벨 파일의 오류 확인은
lab_test.bat
을 실행하여 사용하시면 됩니다.
run.bat 또는 run_resf0.bat(권장)으로 실행할 수 있습니다.
보코더 학습은 run_vocoder.bat으로 실행할 수 있습니다.
ex) run_resf0.bat 0 6
(0 단계에서 ~ 6단계까지 실행)