New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
LexerNoViableAltException 로 인해 dataset.dataset_path를 지정할 수 없습니다. #147
Comments
shell script 에러인 것 같습니다. shell 커맨드를 개행문자 없이 실행해보시겠어요? |
개행문자 없이 다 한줄입니다 /home/tmvkrpxl0/STT_KO/bin/python3.9 /home/tmvkrpxl0/STT_KO/openspeech/openspeech_cli/hydra_train.py dataset=ksponspeech dataset.dataset_path=/home/tmvkrpxl0/다운로드/KoSpeech_Data/한국어_음성_분야 dataset.manifest_file_path=/home/tmvkrpxl0/다운로드/KoSpeech_Data/전시문_통합_스크립트/train.trn dataset.test_dataset_path=/home/tmvkrpxl0/다운로드/KoSpeech_Data/평가용_데이터/eval_clean dataset.test_manifest_dir=/home/tmvkrpxl0/다운로드/KoSpeech_Data/전시문_통합_스크립트/eval_clean.trn tokenizer=kspon_character model=deepspeech2 audio=melspectrogram lr_scheduler=warmup_reduce_lr_on_plateau trainer=gpu criterion=ctc |
한글이 포함돼서 그럴수도 있을 것 같습니다. |
경로에 한글이 포함되어 있어서 그랬습니다. 감사합니다. 그러나 실행 시도시 aihub_labels.csv 파일이 없어 문제가 발생합니다. 다른 이슈를 하나 더 생성할까요? |
@upskyy aihub_labels.csv 리드미 적당한곳에 올려둬야 될 것 같은데, 올려줄 수 있어요? |
@tmvkrpxl0 command에 tokenizer.vocab_path=VOCAB_PATH 추가해주시면 VOCAB_PATH에 label 파일 저장될 것 같습니다. |
@upskyy |
@tmvkrpxl0 kspon_character_labels.csv 파일은 다운 받은 데이터셋에 포함되어 있지 않고, 코드상에서 생성됩니다. |
|
여기보시면 조금 참고가 되실 것 같은데요. |
흠, 작업 폴더를 다시 살펴보니 aihub_labels.csv 파일이 생성되었습니다. 이를 활용하여 훈련을 시키려고 하였으나 VRAM 크기가 부족하여 계속 Out of memory 로 훈련에 실패하네요. |
cpu보다는 gpu 학습을 추천드립니다. 근데 2GB면 학습이 힘들 것 같기는 하네요 😢 |
❓ Questions & Help
LexerNoViableAltException 로 인해 dataset.dataset_path를 지정할 수 없습니다.
로그: https://www.toptal.com/developers/hastebin/tavosicufa.sql
Details
데이터셋의 위치는 환경변수를 거치지 않고 절대 경로를 사용하여 하였습니다. 시스템 환경은 Kubuntu 21.10 입니다.
다른 이슈 페이지 들러보면서 인수가 어떻게 다른가를 점검해 보았으나 무엇이 다른지 잘 모르겠습니다.
hydra_train.py 를 직접 수정하여 인수를 직접 정의하면 작동은 됩니다.
직접 정의한 환경변수는 HYDRA_FULL_ERROR=1 가 유일합니다
The text was updated successfully, but these errors were encountered: