In [1]:
import os
from google.colab import drive
drive.mount('/content/drive',force_remount=True)

Mounted at /content/drive


# Creando Base de datos: RIRs sintéticas

Creo la base de datos con 29000 audios reverberados de 5 [s] de duración cada uno. Estos audios se generan a partir de RIRs con TRs de 0.2 a 3 [s], con pasos de 0.1, y 10 audios de voz.

**Preparación de la base de datos:**

Necesito 29000 audios, tomados de 29 tipos de tiempo de reverberación creados con ruido de distintas random seeds.

En concreto, voy a usar 100 RIRs distintas de cada una de las variables y 10 audios de voz distinto.

Por lo tanto:

* 29 tipos de tiempo de reverberación
* 100 random seeds por cada tipo
* 10 audios de voz

**Consideraciones**: Precio a todo, seleccioné manualmente 5 audios grabados de forma anecóica de hombres y 5 audios de mujeres de la base de datos de un solo micrófono de la ACE que cumplan con el criterio de ser mayores a 5 segundos!

Por tanto, ahora voy a cargar estos audios y reverberarlos según los criterios definidos anteriormente:

In [2]:
#Librerías necesarias:
import sys
sys.path.append('/content/drive/My Drive/Tesis/Notebooks/scripts')
from syntheticRIR import syntheticRIR
import numpy as np
import os
from scipy.signal import fftconvolve
import soundfile as sf
from librosa import load

#Valores de TR entre 0.2 a 3 [s] con pasos de 0.1:
TRs = np.arange(0.2, 3.1, 0.1, dtype=float)

#Cargo los path de los 10 audios anecoicos:
audio_files = []
for i in range(1,6):
  audio_files.append(f'/content/drive/My Drive/Tesis/Base de datos/ACE Challenge selected/F{i}s3.wav')
  audio_files.append(f'/content/drive/My Drive/Tesis/Base de datos/ACE Challenge selected/M{i}s3.wav')

In [3]:
#Me aseguro de estar en el directorio principal:
os.chdir("/content")
#Creo carpeta para guardar los audios:
os.mkdir("Base de datos")

In [4]:
#Genero los audios reverberados:
COUNT = 0 #Defino un contador

for i in range(int(len(audio_files))):
  data, fs = load(audio_files[i], sr=16000) #Cargo un audio

  name = audio_files[i].split('/')[-1]
  data = data[:int(5*fs)] #Recorto a 5 s

  for t in range(int(len(TRs))):
    TR = np.round(TRs[t],1) #Elijo un Tr

    for u in range(1, 101):
      RIR, seed = syntheticRIR(TR, fs) #Genero una RIR sintética
      reverbed_audio = fftconvolve(data, RIR, mode='same') #Agrego reverb al audio
      sf.write('/content/Base de datos/'+name.split('.wav')[0]+f'_Seed{seed}_Tr{TR}.wav', reverbed_audio, fs) #Guardo el audio
      print(f'Generado audio {COUNT}:'+name.split('.wav')[0]+f'_Seed{seed}_Tr{TR}.wav')
      COUNT+=1

[1;30;43mSe han truncado las últimas 5000 líneas del flujo de salida.[0m
Generado audio 24000:F5s3_Seed2536725249_Tr1.0.wav
Generado audio 24001:F5s3_Seed3086638710_Tr1.0.wav
Generado audio 24002:F5s3_Seed3460747616_Tr1.0.wav
Generado audio 24003:F5s3_Seed2406773281_Tr1.0.wav
Generado audio 24004:F5s3_Seed1512476721_Tr1.0.wav
Generado audio 24005:F5s3_Seed2756067941_Tr1.0.wav
Generado audio 24006:F5s3_Seed935292175_Tr1.0.wav
Generado audio 24007:F5s3_Seed93830128_Tr1.0.wav
Generado audio 24008:F5s3_Seed862496725_Tr1.0.wav
Generado audio 24009:F5s3_Seed1046944922_Tr1.0.wav
Generado audio 24010:F5s3_Seed3585872212_Tr1.0.wav
Generado audio 24011:F5s3_Seed3158684857_Tr1.0.wav
Generado audio 24012:F5s3_Seed355652788_Tr1.0.wav
Generado audio 24013:F5s3_Seed1435867174_Tr1.0.wav
Generado audio 24014:F5s3_Seed3960198539_Tr1.0.wav
Generado audio 24015:F5s3_Seed4033242820_Tr1.0.wav
Generado audio 24016:F5s3_Seed3259595528_Tr1.0.wav
Generado audio 24017:F5s3_Seed941464540_Tr1.0.wav
Generado audi

In [5]:
#Comprimo la carpeta de los audios:
os.chdir("/content/Base de datos")
!tar -zcvf ACE_RIRs_Sinteticas.tar.gz .

#Muevo la carpeta a otro directorio
path = '/content/drive/My Drive/Tesis/Base de datos'
!mv ACE_RIRs_Sinteticas.tar.gz '/content/drive/My Drive/Tesis/Base de datos'

[1;30;43mSe han truncado las últimas 5000 líneas del flujo de salida.[0m
./M3s3_Seed560527016_Tr1.8.wav
./F2s3_Seed1215603597_Tr0.5.wav
./F2s3_Seed3715081020_Tr2.8.wav
./M4s3_Seed637010429_Tr1.4.wav
./M5s3_Seed2185021112_Tr1.8.wav
./F3s3_Seed1895422622_Tr0.5.wav
./M3s3_Seed2538820119_Tr1.9.wav
./F2s3_Seed2463685778_Tr2.1.wav
./F2s3_Seed49637341_Tr2.9.wav
./F5s3_Seed1365318602_Tr3.0.wav
./F5s3_Seed3401392397_Tr0.6.wav
./M3s3_Seed1182092759_Tr0.2.wav
./M2s3_Seed2688854572_Tr0.3.wav
./F4s3_Seed274753243_Tr2.7.wav
./M2s3_Seed1480924628_Tr0.6.wav
./M5s3_Seed1968844860_Tr0.5.wav
./F5s3_Seed3958507829_Tr2.2.wav
./M1s3_Seed1270728679_Tr2.3.wav
./M1s3_Seed3178121625_Tr2.8.wav
./M1s3_Seed1068244190_Tr0.4.wav
./F5s3_Seed221194221_Tr2.6.wav
./M2s3_Seed2392956570_Tr1.4.wav
./M5s3_Seed306079345_Tr2.9.wav
./M1s3_Seed217563755_Tr2.7.wav
./F4s3_Seed1363790060_Tr0.6.wav
./F5s3_Seed925845462_Tr1.5.wav
./M5s3_Seed3163454162_Tr0.8.wav
./M1s3_Seed350602144_Tr0.3.wav
./F1s3_Seed3510294905_Tr0.5.wav
./F5s3_