Skip to content

songys/AwesomeKorean_Speech

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 

Repository files navigation

AwesomeKorean_Speech

음성과 신호처리(정리중)

  • 모두의연구소 ASR 랩에 참여하면서 논의된 내용을 바탕으로 정리하였습니다.

신호처리

음성 인식 automatic speech recognition (ASR)

데이터

영어

- LJSpeech
- [LibriSpeech](https://www.openslr.org/11/) : https://paperswithcode.com/sota/speech-recognition-on-librispeech-test-clean
- Libri-Light: 60k hour unlabelled speech + (10h, 1h or 10min) labelled speech (same as LibriVox???) https://github.com/facebookresearch/libri-light
- [open source voice and music datasets 정리된 자료](https://github.com/jim-schwoebel/voice_datasets)

한국어

- [KsponSpeech ](https://aihub.or.kr/aidata/105/download
- 모두의말뭉치[일상대화_음성_말뭉치](https://corpus.korean.go.kr/)
- [한국어 1인 음성 데이터 ]( https://www.kaggle.com/bryanpark/korean-single-speaker-speech-dataset)
- [로봇의 감정 및 개성을 표현할 수 있는 대화형 음성합성 오픈소스](https://github.com/songys/emotiontts_open_db)
  • 신청 접수 후 다운로드 가능
  • 철자 전사, 전사 기호(웃음 {laughing}등), 비식별화 기호(이름 &name& 등) 사용

툴킷

- [Librosa](https://librosa.org/doc/latest/index.html): python 패키지
- Touch Audio : 모델링
- [Kaldi](https://kaldi-asr.org/) : C++로 작성
- [Praat](https://www.fon.hum.uva.nl/praat/)  

한국어 구현

KoSpeech : https://github.com/sooftware/KoSpeech

speech-recognition : https://github.com/cosmoquester/speech-recognition

Automatic-Speech-Recognition-Models : https://github.com/hasangchun/Automatic-Speech-Recognition-Models

DECODE

CTC decode

한국어 음성합성

참고 링크 : https://pororo-tts.github.io/

About

음성인식과 신호처리

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published