Wav2Vec2 Finetune and Inference

Wav2Vec2 finetune and inference code for IITP AI Grand Challenge

이 코드는 IITP 주관 인공지능그랜드챌린지 4차대회 트랙2에 사용한 코드를 공개한 것입니다.
이 코드는 huggingface에서 제공하는 Wav2Vec2 Finetuning에 대한 sample code 를 참고하여 작성하였습니다.

Installation

pip install -r requirements.txt

Finetune

Dataset

{"audio_path": "data/000.wav", "transcript": "제주도를 가려고 지금 김포공항에 와있습니다!"}
{"audio_path": "data/001.wav", "transcript": "오늘 일찍 와가지고 일찍 도착해서 1시간만 기다리면 돼요"}
{"audio_path": "data/002.wav", "transcript": "제주도 신라 호텔을 오면은 꼭 먹어봐야 되는 차돌박이 짬뽕이에요"}

config_train.yml에서 train_data_path나 test_data_path로 입력받는 data json 파일은 위와 같은 형식으로 작성되어야 합니다.
{"audio_path": "your_audio_path", "transcript": "audio_transcript"}가 각 line에 입력되어야 합니다.

Finetuning

python main.py train

config_train.yml에서 arguments를 변경하실 수 있습니다.
pretrained_model_path에 huggingface에 등록된 wav2vec2 pretrained model을 입력하여 사용할 수 있습니다.
pretrained_model_path에 local checkpoint 경로를 입력하여 사용할 수도 있습니다.
다른 parameter들은 transformer documents 를 참조하시길 바랍니다.

Inference

Inference for one checkpoint

python main.py predict one

config_predict.yml에서 arguments를 변경하실 수 있습니다.

Inference for many checkpoint

python main.py predict many

config_predict.yml에서 arguments를 변경하실 수 있습니다.
checkpoint_dir은 각 checkpoint 폴더가 모두 포함된 directory 경로가 들어가야 합니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Wav2Vec2 Finetune and Inference

Installation

Finetune

Dataset

Finetuning

Inference

Inference for one checkpoint

Inference for many checkpoint

Files

README.md

Latest commit

History

README.md

File metadata and controls

Wav2Vec2 Finetune and Inference

Installation

Finetune

Dataset

Finetuning

Inference

Inference for one checkpoint

Inference for many checkpoint