Skip to content
This repository was archived by the owner on Oct 31, 2022. It is now read-only.

LemonDouble/Audio_processing_practice

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Audio_processing_practice

취미로 공부한 음성 처리 관련 스크립트들을 올리는 리포지토리입니다.

1. 해당 폴더의 파일 목록은 다음과 같습니다.

1. FFT.ipynb : 고속 푸리에 변환 (Fast Fourier Transform)을 Python에서 어떻게 사용하는지, 어떤 변환을 수행하는지 공부하기 위한 파일입니다.
https://techreviewtips.blogspot.com/2017/11/05-02-fft.html
의 코드를 참고하였습니다.

2. MFCC.ipynb : 음성 처리에서 자주 사용되는 Feature인 MFCC를 추출하는 방법에 대해 알아보기 위한 파일입니다.
MFCC를 구하기 위해 Mel Spectrum의 계산 또한 필수적이므로, Mel / Log Mel Spectrum 의 내용도 같이 찾아보실 수 있습니다.
https://ratsgo.github.io/speechbook/docs/fe/mfcc
https://youtu.be/jYgMMy8KAc0
의 코드와 강의를 참고하였습니다.

3. music_classification.ipynb : 파이썬 라이브러리를 사용하여 간단하게 음원을 분석하고, Classifiation, 유사 음원 추천 시스템을 만들어 보는 스크립트입니다.
https://jonhyuk0922.tistory.com/m/114
의 코드를 참고하였습니다.

About

취미로 공부하고 있는 음성 처리 관련 스크립트들을 모아두는 리포지토리입니다. 음성 처리에 관련한 Feature 추출, 라이브러리 사용법 등이 있습니다.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors