# Augmentations samples

In [1]:
import os
os.chdir('../')

import torchaudio
import IPython.display as ipd
import datasets.augmentations as A
import importlib
importlib.reload(A)
pass


In [2]:
clean_wav_path = "../LibriTTS_R/train-clean-100/19/198/19_198_000000_000000.wav"
waveform, sr = torchaudio.load(clean_wav_path)
waveform = waveform[0]

In [3]:
def display_augmentor(augmentor):
    global waveform
    print("▶ Оригинальное аудио:")
    ipd.display(ipd.Audio(waveform.numpy(), rate=sr))

    print("▶ Аудио с шумом:")
    for _ in range(3):
        noisy_waveform = augmentor(waveform.unsqueeze(0)).squeeze(0)
        ipd.display(ipd.Audio(noisy_waveform.numpy(), rate=sr))


## RandomNoise

In [4]:
noise_root = "../datasets_fullband/noise_fullband"
noise_files_path = "datasets/splits/DNS_noise_split/train_files.txt"

augmentor = A.RandomNoise(root=noise_root, noise_files_path=noise_files_path, sr=24000)
display_augmentor(augmentor)

▶ Оригинальное аудио:


▶ Аудио с шумом:


## Impulse response

In [5]:
micro_ir_root = "../datasets_fullband/micro_irs"
micro_ir_files_path = "datasets/splits/micro_ir_split/train_files.txt"
room_ir_root = "../datasets_fullband/room_irs"
room_ir_files_path = "datasets/splits/DNS_ir_split/train_files.txt"

micro_augmentor = A.RandomImpulseResponse(root=micro_ir_root, ir_files_path=micro_ir_files_path, sr=24000)
room_augmentor = A.RandomImpulseResponse(root=room_ir_root, ir_files_path=room_ir_files_path, sr=24000)

print('Имитация микрофона')
display_augmentor(micro_augmentor)
print('-'*30)
print('Имитация замкнутого помещения')
display_augmentor(room_augmentor)

Имитация микрофона
▶ Оригинальное аудио:


▶ Аудио с шумом:


------------------------------
Имитация замкнутого помещения
▶ Оригинальное аудио:


▶ Аудио с шумом:


## Acrusher

In [None]:
augmentor = A.RandomAcrusher(sr=24000)
display_augmentor(augmentor)

▶ Оригинальное аудио:


▶ Аудио с шумом:


## Crystalizer

In [None]:
augmentor = A.RandomCrystalizer(sr=24000)

display_augmentor(augmentor)

▶ Оригинальное аудио:


▶ Аудио с шумом:


## Flanger

In [None]:
augmentor = A.RandomFlanger(sr=24000)

display_augmentor(augmentor)

▶ Оригинальное аудио:


▶ Аудио с шумом:


## Vibrato

In [None]:
augmentor = A.RandomVibrato(sr=24000)

display_augmentor(augmentor)

▶ Оригинальное аудио:


▶ Аудио с шумом:


## Codec

In [None]:
mp3_augmentor = A.RandomCodec(sr=24000, codec_types=['mp3'])
ogg_augmentor = A.RandomCodec(sr=24000, codec_types=['ogg'])

print('mp3')
display_augmentor(mp3_augmentor)
print('-'*30)
print('ogg')
display_augmentor(ogg_augmentor)

mp3
▶ Оригинальное аудио:


▶ Аудио с шумом:


------------------------------
ogg
▶ Оригинальное аудио:


▶ Аудио с шумом:


# Augmented dataset

In [43]:
import datasets.datasets as D
importlib.reload(D)
from omegaconf import OmegaConf

In [44]:
config = OmegaConf.load('configs/finally_stage1_config.yaml')
dataset = D.AugmentedLibriTTSR(
    root=config.data.trainval_data_root,
    files_list_path=config.data.train_data_file_path,
    mel_conf=config.mel,
    split=True,
    **config.data.dataset_args
)

In [9]:
for i in range(15):
    batch = dataset[i]
    print('-'*30)
    print("▶ Оригинальное аудио:")
    ipd.display(ipd.Audio(batch['wav'].numpy(), rate=16000))
    print("▶ Аугментированное аудио:")
    ipd.display(ipd.Audio(batch['input_wav'].numpy(), rate=16000))
    print('-'*30)

------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
------------------------------
▶ Оригинальное аудио:


▶ Аугментированное аудио:


------------------------------
