In [59]:
import numpy as np 
import matplotlib.pyplot as plt 
import glob
import soundfile as sf
import librosa as lb
import acoustics
from scipy.optimize import curve_fit
from scipy.signal import hilbert, fftconvolve
from IPython.display import Audio
eps = np.finfo(float).eps
reales_path = '/mnt/datasets/impulsos/reales/'
sinteticos_path = '/mnt/datasets/impulsos/sinteticos/audios'
lista_rir_reales = glob.glob(reales_path+'**/*.wav',recursive=True)
lista_rir_sintetic = glob.glob(sinteticos_path+'**/*.wav',recursive=True)

def load_rir(path, target_fs, norm=True):
    rir, fs = lb.load(path, sr = target_fs)
    if norm:
        rir = rir / np.max(abs(rir))
    return rir, fs

def temporal_decompose(rir, fs, win = 0.0025):
    t_d = np.argmax(rir) # direct path
    t_o = int((win) * fs) #tolerance window in samples (2.5 ms)
    early= rir[(t_d - t_o):(t_d + t_o)+1]
    late = rir[t_d + t_o+1:]
    return early, late

def normalize(arr, valor=None):
    if valor is not None:
        return arr/np.max(abs(valor))
    return arr/np.max(abs(arr))

def promediar_intervalos(señal, intervalo):
    frames_enteros = int(len(señal)/intervalo)
    resto = len(señal)%intervalo
    salida = np.empty(len(señal))
    for n_frame in range(frames_enteros):
        salida[n_frame*intervalo:(n_frame+1)*intervalo] = señal[n_frame*intervalo:(n_frame+1)*intervalo].mean()
    salida[len(señal)-resto:] = señal[len(señal)-resto:].mean() 
    return salida

def curva(x, m, c):
    return m * x + c

def determinar_piso_de_ruido(path, fs):
    #importo el impulso y me quedo con la parte late
    rir, fs = load_rir(path, fs)
    rir_early, rir_late = temporal_decompose(rir, fs)
    rir_late = normalize(abs(rir_late))

    #obtengo los promedios por intervalos 10-50 ms
    intervalo_temporal = int((30 * 0.001) * fs) #30 milisegundos
    env = normalize(promediar_intervalos(rir_late, intervalo_temporal))

    #Escala logaritmica
    env_db = 20*np.log10(env+eps)
    rir_late_db= 20*np.log10((rir_late)+eps)
    t = np.linspace(0,len(rir_late)/fs,len(rir_late)) #vector de tiempo
    
    #Primera estimacion de piso de ruido
    ventana_ruido = int(len(env)*0.1) #10% de la señal
    nivel_ruido_db = env_db[-ventana_ruido:].mean()
    umbral = nivel_ruido_db + 5 # 5dB por encima del piso de ruido
    x_umbral = np.where(env_db<umbral)[0][0]
    y_umbral = env_db[x_umbral]
    
    #estimo la pendiente de caida
    A = np.vstack([[0, x_umbral], [1, 1]]).T
    y = [env_db[0], y_umbral]
    m, c = np.linalg.lstsq(A, y, rcond=None)[0]

    #determino punto de cruce 
    cruce_index = int((nivel_ruido_db-c)/m)
    cruce_valor = curva(cruce_index, m, c)
    nuevo_intervalo = int((-2-c)/m) #5 intervalos cada 10 dB
    env_nueva = normalize(promediar_intervalos(rir_late, nuevo_intervalo))
    env_nueva_db = 20*np.log10(env_nueva+eps)
    for i in range(5):
        index_inicial = np.where(env_nueva_db < cruce_valor-5)[0]
        if index_inicial.size == 0: 
            nuevo_nivel_ruido_db = env_nueva_db[-ventana_ruido:].mean()
        elif len(env_nueva_db[index_inicial[0]:])<ventana_ruido:
            nuevo_nivel_ruido_db = env_nueva_db[-ventana_ruido:].mean()
        else:
            nuevo_nivel_ruido_db = env_nueva_db[index_inicial[0]:].mean()

        distancia_al_piso = 10 #dB
        umbral = nuevo_nivel_ruido_db + distancia_al_piso

        x_umbral = np.where(env_nueva_db<umbral)[0][0]
        y_umbral = env_nueva_db[x_umbral]

        x_0dB = 0
        y_0dB = env_nueva_db[0]

        A = np.vstack([[x_0dB, x_umbral], [1, 1]]).T
        y = [y_0dB, y_umbral]
        m, c = np.linalg.lstsq(A, y, rcond=None)[0]

        regresion = curva(np.linspace(0, len(env)-1, len(env)), m, c)

        #determino nuevo punto de cruce 
        cruce_index = int((nuevo_nivel_ruido_db-c)/m)
        cruce_valor = curva(cruce_index, m, c)
    return cruce_index, cruce_valor

In [61]:
determinar_piso_de_ruido(lista_rir_sintetic[17], 16000)

(14493, -86.05966287847714)

-34.30972957068459
-34.30972957068459
-34.30972957068459
-34.30972957068459
-34.30972957068459
