## 소리 데이터 적합한 데이터 증강 기법 (Data Augmentation)
- White noise 추가하여 원본 오디오 생성
- pip install soundfile

In [1]:
import numpy as np
import soundfile as sf
import IPython.display as ipd
import matplotlib.pyplot as plt

In [2]:
# 샘플 Wav 파일 로드
# WAV : 일반적으로 Windows에서 사용되는 오디오 파일 형식 -> 고해상도 및 대용량 오디오 파일을 저장하기 위해서 사용
file_path = "./data/blues.00001.wav"
data, sr = sf.read(file_path)

# 원본 오디오 실행
ipd.Audio(data, rate=sr)

### 노이즈 생성

In [3]:
noise_amp = 0.5 * np.random.uniform() * np.amax(data)
noise = noise_amp * np.random.normal(size=data.shape)

print(f"noise_amp : {noise_amp}")
print(f"noise : {noise}")

noise_amp : 0.019299355439290223
noise : [ 0.00700198  0.0093957   0.00385592 ... -0.00728295  0.03478755
  0.00600221]


### 노이즈 추가

In [4]:
data_noise = data.astype('float32') + noise.astype('float32')
print(data_noise)

[ 0.01041995  0.01369868  0.00522921 ... -0.1268203  -0.14016972
 -0.14518188]


### 노이즈가 추가된 음성 데이터 저장

In [5]:
save_path = "./data/sample_noise_add.wav"
sf.write(save_path, data_noise, sr)

### 노이즈가 추가된 음성 읽기

In [6]:
# 샘플 WAV 파일 로드 
sample_wav = "./data/sample_noise_add.wav"
sample_data, sample_sr = sf.read(sample_wav)

# 노이즈 추가된 오디오 실행
ipd.Audio(sample_data, rate=sample_sr)