Wav2Vec2 Finetune and Inference

Wav2Vec2 finetune and inference code for IITP AI Grand Challenge

이 코드는 IITP 주관 인공지능그랜드챌린지 4차대회 트랙2에 사용한 코드를 공개한 것입니다.
이 코드는 huggingface에서 제공하는 Wav2Vec2 Finetuning에 대한 sample code 를 참고하여 작성하였습니다.

Installation

pip install -r requirements.txt

Finetune

Dataset

{"audio_path": "data/000.wav", "transcript": "제주도를 가려고 지금 김포공항에 와있습니다!"}
{"audio_path": "data/001.wav", "transcript": "오늘 일찍 와가지고 일찍 도착해서 1시간만 기다리면 돼요"}
{"audio_path": "data/002.wav", "transcript": "제주도 신라 호텔을 오면은 꼭 먹어봐야 되는 차돌박이 짬뽕이에요"}

config_train.yml에서 train_data_path나 test_data_path로 입력받는 data json 파일은 위와 같은 형식으로 작성되어야 합니다.
{"audio_path": "your_audio_path", "transcript": "audio_transcript"}가 각 line에 입력되어야 합니다.

Finetuning

python main.py train

config_train.yml에서 arguments를 변경하실 수 있습니다.
pretrained_model_path에 huggingface에 등록된 wav2vec2 pretrained model을 입력하여 사용할 수 있습니다.
pretrained_model_path에 local checkpoint 경로를 입력하여 사용할 수도 있습니다.
다른 parameter들은 transformer documents 를 참조하시길 바랍니다.

Inference

Inference for one checkpoint

python main.py predict one

config_predict.yml에서 arguments를 변경하실 수 있습니다.

Inference for many checkpoint

python main.py predict many

config_predict.yml에서 arguments를 변경하실 수 있습니다.
checkpoint_dir은 각 checkpoint 폴더가 모두 포함된 directory 경로가 들어가야 합니다.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
LICENSE		LICENSE
README.md		README.md
config_predict.yml		config_predict.yml
config_train.yml		config_train.yml
dataset.py		dataset.py
main.py		main.py
predict.py		predict.py
requirements.txt		requirements.txt
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LICENSE

LICENSE

README.md

README.md

config_predict.yml

config_predict.yml

config_train.yml

config_train.yml

dataset.py

dataset.py

main.py

main.py

predict.py

predict.py

requirements.txt

requirements.txt

train.py

train.py

utils.py

utils.py

Repository files navigation

Wav2Vec2 Finetune and Inference

Installation

Finetune

Dataset

Finetuning

Inference

Inference for one checkpoint

Inference for many checkpoint

About

Releases

Packages

Contributors 3

Languages

License

voithru/wav2vec2_finetune

Folders and files

Latest commit

History

Repository files navigation

Wav2Vec2 Finetune and Inference

Installation

Finetune

Dataset

Finetuning

Inference

Inference for one checkpoint

Inference for many checkpoint

About

Resources

License

Stars

Watchers

Forks

Languages