In [157]:
# Imports
import os
import librosa
import numpy as np
import soundfile as sf
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from scipy.io import wavfile
from scipy import signal, fftpack
from testing_functions import test_hss
from process_functions import preprocessing_audio
from utils import find_and_open_audio, signal_segmentation, get_resp_segments
from heart_sound_segmentation.filter_and_sampling import downsampling_signal, \
    upsampling_signal
from source_separation.descriptor_functions import get_spectrogram
from IPython.display import Audio
from sklearn.feature_selection import SequentialFeatureSelector
from sklearn.neighbors import KNeighborsClassifier
from sklearn.decomposition import PCA
from sklearn import preprocessing, linear_model, svm
from pybalu.feature_selection import sfs

# Definición coeficientes cepstrales

In [79]:
# Funciones de características
def get_filterbanks(N, samplerate, freq_lim, n_coefs,
                    scale_type='mel', filter_type='triangular',
                    norm_filters=True, plot_filterbank=False):
    '''
    
    Parameters
    ----------
    N : ndarray
        Largo de la señal.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''
    def _freq_to_bin(f):
        # Definición del bin correspondiente en la definición
        # del intervalo de cálculo. Se usa (N - 1) ya que los bins
        # se definen entre 0 y (N - 1) (largo N)
        return np.rint(f / samplerate * (N - 1)).astype(int)
    
    
    def _triangular_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i] + 1] = \
                np.linspace(0, 1, abs(bins_points[i] - bins_points[i - 1] + 1))
            
            # Tramo descendente del filtro triangular
            filter_bank[i - 1][bins_points[i]:bins_points[i + 1] + 1] = \
                np.linspace(1, 0, abs(bins_points[i + 1] - bins_points[i] + 1))
            
        return filter_bank
    
    
    def _hanning_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = \
                np.hanning(abs(bins_points[i + 1] - bins_points[i - 1] + 1))
        
        return filter_bank
    
    
    def _squared_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = 1
        
        return filter_bank
    
    
    def _norm_filterbank(filter_bank):
        # Definición del banco de filtros de salida
        filter_bank_out = np.zeros((n_coefs, N))
        
        # Normalizar los filtros a energía 1
        for i in range(n_coefs):
            filter_bank_out[i] = filter_bank[i] / \
                                 sum(filter_bank[i] ** 2)
            
        return filter_bank_out
    
    
    # Definición de los bines en base a las frecuencias de cada filtro
    if scale_type == 'linear':
        # Definición de las "n_coefs" frecuencias equiespaciadas entre
        # 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya que se 
        # necesitan para definir los límites de los filtros.
        freqs = np.arange(0, (n_coefs + 1) + 1) * freq_lim / (n_coefs + 1)
    
    
    elif scale_type == 'mel':
        # Definición del límite en frecuencias de mel (para no pasarse del
        # freq_lim al devolverse)
        mel_freq_lim = 2595 * np.log10(1 + freq_lim / 700)
        
        # Definición de las "n_coefs" frecuencias espaciadas en escala mel 
        # entre 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya 
        # que se necesitan para definir los límites de los filtros.
        mel_freqs = np.arange(0, (n_coefs + 1) + 1) * mel_freq_lim / (n_coefs + 1)
        
        # Transformando de intervalos equi espaciados usando la escala
        # de mel. Es necesario hacer la transformación inversa ya que
        # en este caso se dice que lo equi espaciado viene de mel
        freqs = 700 * (10 ** (mel_freqs / 2595) - 1)
    
    else:
        raise Exception('Opción de tipo de coeficiente cepstral no válido.')
    
    
    # Transformando a bins
    bins_to = _freq_to_bin(freqs)
    
    
    # Obtención del banco de filtros
    if filter_type == 'triangular':
        filter_bank = _triangular_filter(bins_to)
        
    if filter_type == 'hanning':
        filter_bank = _hanning_filter(bins_to)
    
    elif filter_type == 'squared':
        filter_bank = _squared_filter(bins_to)
    
    # Normalizar por la energía de la señal
    if norm_filters:
        filter_bank = _norm_filterbank(filter_bank)
    
    
    # Gráfico del banco de filtros
    if plot_filterbank:
        plt.figure()
        
        # Definición del vector de frecuencias
        f_plot = np.arange(N) * samplerate / N
        
        for i in range(n_coefs):
            plt.plot(filter_bank[i])
            # plt.plot(f_plot, filter_bank[i])

        for i in bins_to:
            # plt.axvline(i * samplerate / N, c='silver', linestyle=':')
            plt.axvline(i, c='silver', linestyle=':')
            
        # plt.xlim([0, freq_lim])
        plt.xlim([0, bins_to[-1]])
        plt.show()
    
    
    return filter_bank


def get_filterbanks_plots(N, samplerate, freq_lim, n_coefs,
                          scale_type='mel', filter_type='triangular',
                          norm_filters=True, plot_filterbank=False):
    '''
    
    Parameters
    ----------
    N : ndarray
        Largo de la señal.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''
    def _freq_to_bin(f):
        # Definición del bin correspondiente en la definición
        # del intervalo de cálculo. Se usa (N - 1) ya que los bins
        # se definen entre 0 y (N - 1) (largo N)
        return np.rint(f / samplerate * (N - 1)).astype(int)
    
    
    def _triangular_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i] + 1] = \
                np.linspace(0, 1, abs(bins_points[i] - bins_points[i - 1] + 1))
            
            # Tramo descendente del filtro triangular
            filter_bank[i - 1][bins_points[i]:bins_points[i + 1] + 1] = \
                np.linspace(1, 0, abs(bins_points[i + 1] - bins_points[i] + 1))
            
        return filter_bank
    
    
    def _hanning_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = \
                np.hanning(abs(bins_points[i + 1] - bins_points[i - 1] + 1))
        
        return filter_bank
    
    
    def _squared_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = 1
        
        return filter_bank
    
    
    def _norm_filterbank(filter_bank):
        # Definición del banco de filtros de salida
        filter_bank_out = np.zeros((n_coefs, N))
        
        # Normalizar los filtros a energía 1
        for i in range(n_coefs):
            filter_bank_out[i] = filter_bank[i] / \
                                 sum(filter_bank[i] ** 2)
            
        return filter_bank_out
    
    
    # Definición de los bines en base a las frecuencias de cada filtro
    if scale_type == 'linear':
        # Definición de las "n_coefs" frecuencias equiespaciadas entre
        # 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya que se 
        # necesitan para definir los límites de los filtros.
        freqs = np.arange(0, (n_coefs + 1) + 1) * freq_lim / (n_coefs + 1)
    
    
    elif scale_type == 'mel':
        # Definición del límite en frecuencias de mel (para no pasarse del
        # freq_lim al devolverse)
        mel_freq_lim = 2595 * np.log10(1 + freq_lim / 700)
        
        # Definición de las "n_coefs" frecuencias espaciadas en escala mel 
        # entre 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya 
        # que se necesitan para definir los límites de los filtros.
        mel_freqs = np.arange(0, (n_coefs + 1) + 1) * mel_freq_lim / (n_coefs + 1)
        
        # Transformando de intervalos equi espaciados usando la escala
        # de mel. Es necesario hacer la transformación inversa ya que
        # en este caso se dice que lo equi espaciado viene de mel
        freqs = 700 * (10 ** (mel_freqs / 2595) - 1)
    
    else:
        raise Exception('Opción de tipo de coeficiente cepstral no válido.')
    
    
    # Transformando a bins
    bins_to = _freq_to_bin(freqs)
    
    
    # Obtención del banco de filtros
    if filter_type == 'triangular':
        filter_bank = _triangular_filter(bins_to)
        
    if filter_type == 'hanning':
        filter_bank = _hanning_filter(bins_to)
    
    elif filter_type == 'squared':
        filter_bank = _squared_filter(bins_to)
    
    # Normalizar por la energía de la señal
    if norm_filters:
        filter_bank = _norm_filterbank(filter_bank)
    
    
    # Gráfico del banco de filtros
    if plot_filterbank:
        plt.figure()
        
        # Definición del vector de frecuencias
        f_plot = np.arange(N) * samplerate / N
        
        for i in range(n_coefs):
            plt.plot(filter_bank[i])
            # plt.plot(f_plot, filter_bank[i])

        for i in bins_to:
            # plt.axvline(i * samplerate / N, c='silver', linestyle=':')
            plt.axvline(i, c='silver', linestyle=':')
            
        # plt.xlim([0, freq_lim])
        plt.xlim([0, bins_to[-1]])
        plt.show()
    
    
    return bins_to, filter_bank


def get_cepstral_coefficients_segment(signal_in, samplerate, freq_lim, n_coefs,
                                      scale_type='mel', filter_type='triangular',
                                      inverse_func='dct', norm_filters=True,
                                      plot_filterbank=False, power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''    
    # Definición de la cantidad de puntos a considerar
    filter_bank = get_filterbanks(len(signal_in), samplerate, freq_lim=freq_lim, 
                                  n_coefs=n_coefs, scale_type=scale_type, 
                                  filter_type=filter_type,
                                  norm_filters=norm_filters, 
                                  plot_filterbank=plot_filterbank)
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(np.fft.fft(signal_in)) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    filters_applied = filter_bank * energy_spectrum
    
    
    # Calculando el logaritmo de la energía de cada uno
    energy_coefs = np.log(filters_applied.sum(axis=1))
    
    # Calculando los coeficientes cepstrales
    if inverse_func == 'dct':
        cepstral_coefs = fftpack.dct(energy_coefs, norm='ortho')
    elif inverse_func == 'idft':
        cepstral_coefs = np.fft.ifft(energy_coefs).real
    else:
        raise Exception('Opción de tipo de función inversa no válida.')
    
    
    return cepstral_coefs


def get_cepstral_coefficients(signal_in, samplerate, spectrogram_params,
                              freq_lim, n_coefs, scale_type='mel', 
                              filter_type='triangular', inverse_func='dct', 
                              norm_filters=True, plot_filterbank=False, 
                              power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''    
    # Definición de la cantidad de puntos a considerar
    filter_bank = get_filterbanks(spectrogram_params['N'], samplerate, 
                                  freq_lim=freq_lim, 
                                  n_coefs=n_coefs, scale_type=scale_type, 
                                  filter_type=filter_type,
                                  norm_filters=norm_filters, 
                                  plot_filterbank=plot_filterbank)
    
    # Obtener el espectrograma de la señal
    t, f, S = get_spectrogram(signal_in, samplerate, N=spectrogram_params['N'], 
                              padding=spectrogram_params['padding'], 
                              repeat=spectrogram_params['repeat'], 
                              noverlap=spectrogram_params['noverlap'], 
                              window=spectrogram_params['window'], 
                              whole=False)
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(S) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    energy_coefs = np.dot(filter_bank[:,:spectrogram_params['N']//2 + 1], 
                          energy_spectrum)
    
    # Aplicando el logaritmo
    energy_coefs = np.log(energy_coefs + 1e-10)
    
    # Calculando los coeficientes cepstrales
    if inverse_func == 'dct':
        cepstral_coefs = fftpack.dct(energy_coefs, norm='ortho', axis=0)
    elif inverse_func == 'idft':
        cepstral_coefs = np.fft.ifft(energy_coefs, axis=-1).real
    else:
        raise Exception('Opción de tipo de función inversa no válida.')
    
    
    return cepstral_coefs


def get_bands_coefficients(signal_in, samplerate, spectrogram_params,
                           freq_lim, n_coefs, scale_type='mel', 
                           filter_type='triangular', norm_filters=True, 
                           plot_filterbank=False, 
                           power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''    
    # Definición de la cantidad de puntos a considerar
    filter_bank = get_filterbanks(spectrogram_params['N'], samplerate, 
                                  freq_lim=freq_lim, 
                                  n_coefs=n_coefs, scale_type=scale_type, 
                                  filter_type=filter_type,
                                  norm_filters=norm_filters, 
                                  plot_filterbank=plot_filterbank)
    
    # Obtener el espectrograma de la señal
    t, f, S = get_spectrogram(signal_in, samplerate, N=spectrogram_params['N'], 
                              padding=spectrogram_params['padding'], 
                              repeat=spectrogram_params['repeat'], 
                              noverlap=spectrogram_params['noverlap'], 
                              window=spectrogram_params['window'], 
                              whole=True)
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(S) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    energy_coefs = np.dot(filter_bank, energy_spectrum)
    
    return energy_coefs


def get_cepstral_coefficients_end2end(signal_in, samplerate, freq_lim, n_coefs,
                              scale_type='mel', filter_type='triangular',
                              inverse_func='dct', norm_filters=True,
                              plot_filterbank=False, power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''
    def _freq_to_bin(f):
        # Definición del bin correspondiente en la definición
        # del intervalo de cálculo. Se usa (N - 1) ya que los bins
        # se definen entre 0 y (N - 1) (largo N)
        return np.rint(f / samplerate * (N - 1)).astype(int)
    
    
    def _triangular_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i] + 1] = \
                np.linspace(0, 1, abs(bins_points[i] - bins_points[i - 1] + 1))
            
            # Tramo descendente del filtro triangular
            filter_bank[i - 1][bins_points[i]:bins_points[i + 1] + 1] = \
                np.linspace(1, 0, abs(bins_points[i + 1] - bins_points[i] + 1))
            
        return filter_bank
    
    
    def _hanning_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = \
                np.hanning(abs(bins_points[i + 1] - bins_points[i - 1] + 1))
        
        return filter_bank
    
    
    def _squared_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = 1
        
        return filter_bank
    
    
    def _norm_filterbank(filter_bank):
        # Definición del banco de filtros de salida
        filter_bank_out = np.zeros((n_coefs, N))
        
        # Normalizar los filtros a energía 1
        for i in range(n_coefs):
            filter_bank_out[i] = filter_bank[i] / \
                                 sum(filter_bank[i] ** 2)
            
        return filter_bank_out
    
    
    # Definición de la cantidad de puntos a considerar
    N = len(signal_in)
        
    # Definición de los bines en base a las frecuencias de cada filtro
    if scale_type == 'linear':
        # Definición de las "n_coefs" frecuencias equiespaciadas entre
        # 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya que se 
        # necesitan para definir los límites de los filtros.
        freqs = np.arange(0, (n_coefs + 1) + 1) * freq_lim / (n_coefs + 1)
    
    
    elif scale_type == 'mel':
        # Definición del límite en frecuencias de mel (para no pasarse del
        # freq_lim al devolverse)
        mel_freq_lim = 2595 * np.log10(1 + freq_lim / 700)
        
        # Definición de las "n_coefs" frecuencias espaciadas en escala mel 
        # entre 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya 
        # que se necesitan para definir los límites de los filtros.
        mel_freqs = np.arange(0, (n_coefs + 1) + 1) * mel_freq_lim / (n_coefs + 1)
        
        # Transformando de intervalos equi espaciados usando la escala
        # de mel. Es necesario hacer la transformación inversa ya que
        # en este caso se dice que lo equi espaciado viene de mel
        freqs = 700 * (10 ** (mel_freqs / 2595) - 1)
    
    else:
        raise Exception('Opción de tipo de coeficiente cepstral no válido.')
    
    
    # Transformando a bins
    bins_to = _freq_to_bin(freqs)
    
    
    # Obtención del banco de filtros
    if filter_type == 'triangular':
        filter_bank = _triangular_filter(bins_to)
        
    if filter_type == 'hanning':
        filter_bank = _hanning_filter(bins_to)
    
    elif filter_type == 'squared':
        filter_bank = _squared_filter(bins_to)
    
    # Normalizar por la energía de la señal
    if norm_filters:
        filter_bank = _norm_filterbank(filter_bank)
    
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(np.fft.fft(signal_in)) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    filters_applied = filter_bank * energy_spectrum
    
    
    # Calculando el logaritmo de la energía de cada uno
    energy_coefs = np.log(filters_applied.sum(axis=1))
    
    # Calculando los coeficientes cepstrales
    if inverse_func == 'dct':
        cepstral_coefs = fftpack.dct(energy_coefs, norm='ortho')
    elif inverse_func == 'idft':
        cepstral_coefs = np.fft.ifft(energy_coefs).real
    else:
        raise Exception('Opción de tipo de función inversa no válida.')
        
        
    # Gráfico del banco de filtros
    if plot_filterbank:
        plt.figure()
        
        # Definición del vector de frecuencias
        f_plot = np.arange(N) * samplerate / N
        
        for i in range(n_coefs):
            plt.plot(filter_bank[i])
            # plt.plot(f_plot, filter_bank[i])

        for i in bins_to:
            # plt.axvline(i * samplerate / N, c='silver', linestyle=':')
            plt.axvline(i, c='silver', linestyle=':')
            
        # plt.xlim([0, freq_lim])
        plt.xlim([0, bins_to[-1]])
        plt.show()
    
    
    return cepstral_coefs

In [117]:
# Dirección de la base de datos
db_original = 'C:/Users/Chris/Desktop/Scripts_Magister/Respiratory_Sound_Database/audio_and_txt_files'
db_folder = 'preprocessed_signals'

# Nombres de los archivos
filenames = [i[:-4] for i in os.listdir(db_folder) if i.endswith('.wav') and not 'Tc' in i]

# Definición de la frecuencia de muestreo deseada para 
# separación de fuentes
samplerate_nmf = 11025 # Hz
samplerate_cls = 4000  # Hz

# Gráfico de los filtros

In [113]:
filter_type = 'triangular'
inverse_func = 'dct'
scale_type = 'linear'
sr = 11025
N = 2048
n_coefs = 15

# Definición del banco de filtros
bins_to, filbank = \
          get_filterbanks_plots(N=N, samplerate=sr, freq_lim=4000, n_coefs=n_coefs,
                                scale_type=scale_type, filter_type=filter_type,
                                norm_filters=False, plot_filterbank=False)

%matplotlib notebook
plt.figure(figsize=(9,4))

# Definición del vector de frecuencias
f_plot = np.arange(N) * sr / N
for num, filt in enumerate(filbank):
    plt.plot(f_plot, filt, zorder=1)

for i in bins_to[1:-1]: 
    plt.axvline(i * sr / N, c='silver', linestyle=':', zorder=0)
    
plt.xlim([0, 4500])
plt.xlabel('Frecuencia [Hz]')
plt.ylabel('Magnitud')
plt.title('Banco de filtros linealmente separados')
plt.savefig('Images/LFCC_filterbank.pdf', transparent=True)
plt.show()

<IPython.core.display.Javascript object>

In [116]:
filter_type = 'triangular'
inverse_func = 'dct'
scale_type = 'mel'
sr = 11025
N = 2048
n_coefs = 15

# Definición del banco de filtros
bins_to, filbank = \
          get_filterbanks_plots(N=N, samplerate=sr, freq_lim=4000, n_coefs=n_coefs,
                                scale_type=scale_type, filter_type=filter_type,
                                norm_filters=False, plot_filterbank=False)

bins_to, filbank_norm = \
          get_filterbanks_plots(N=N, samplerate=sr, freq_lim=4000, n_coefs=n_coefs,
                                scale_type=scale_type, filter_type=filter_type,
                                norm_filters=True, plot_filterbank=False)

%matplotlib notebook
fig, ax = plt.subplots(2,1,figsize=(9,5), sharex=True)

# Definición del vector de frecuencias
f_plot = np.arange(N) * sr / N
for num, filt in enumerate(filbank):
    ax[0].plot(f_plot, filt, zorder=1)

for i in bins_to[1:-1]: 
    ax[0].axvline(i * sr / N, c='silver', linestyle=':', zorder=0)


for num, filt in enumerate(filbank_norm):
    ax[1].plot(f_plot, filt, zorder=1)

for i in bins_to[1:-1]: 
    ax[1].axvline(i * sr / N, c='silver', linestyle=':', zorder=0)

plt.xlim([0, 4500])
plt.xlabel('Frecuencia [Hz]')
ax[0].set_ylabel('Magnitud')
ax[1].set_ylabel('Magnitud')
ax[0].set_title('Banco de filtros separados en escala de Mel')

# Ajustando las etiquetas del eje
fig.align_ylabels(ax[:])
# Quitando el espacio entre gráficos
fig.subplots_adjust(wspace=0.1, hspace=0)

plt.savefig('Images/MFCC_filterbank.pdf', transparent=True)
plt.show()

<IPython.core.display.Javascript object>

In [83]:
bins_to

array([  0,  17,  36,  58,  82, 110, 141, 177, 217, 262, 313, 371])

# Escala de Mel

In [66]:
f = np.linspace(0,8000, 20000)
mel_scale = 2595 * np.log10(1 + f / 700)

%matplotlib notebook
plt.plot(f, mel_scale)
plt.plot([-300, 1000], [1000, 1000], color='silver', linestyle=':')
plt.plot([1000, 1000], [-100, 1000], color='silver', linestyle=':')
plt.plot(1000, 1000, linestyle='', marker='o', markersize=7, color='red')
plt.xlim([0, 8000])
plt.ylim([0, 3000])
plt.xlabel('Frecuencia [Hz]')
plt.ylabel('Escala de Mel')
plt.title('Escala de Mel vs Frecuencia')
plt.savefig('Images/Mel_scale.pdf', transparent=True)
plt.show()

<IPython.core.display.Javascript object>

# Energía por bandas

In [328]:
filename = f'{db_folder}/106_2b1_Pl_mc_LittC2SE.wav'
audio, samplerate = sf.read(filename)
N = 1024
nov = int(0.9 * N)

%matplotlib notebook
t, f, S = get_spectrogram(audio, samplerate, N=N, padding=0, repeat=0, 
                          noverlap=nov, window='hamming', whole=False)
print(f[140])
# Definición de los intervalos
f_intervals = np.arange(0, 501, 20)

print(f_intervals.shape)
print(t[105])
print(S.shape)

# Definición de la lista que almacenará los datos
energy_band = np.zeros(len(f_intervals) - 1)
energy_S = np.zeros((len(energy_band), len(t)))


for i in range(len(f_intervals) - 1):
    lower_lim = f_intervals[i]
    upper_lim = f_intervals[i + 1]
    
    # Definición de los índices de interés
    indexes = np.where((lower_lim <= f) & (f <= upper_lim))[0]
    
    # Definiendo el valor
    energy_S[i] = np.sum(abs(S[indexes,:]) ** 2, axis=0)


fig, ax = plt.subplots(1, 2, figsize=(7,5), gridspec_kw={'width_ratios':[3.5,1]})
# ax[0].pcolormesh(t, f, 20 * np.log10(abs(S)), cmap='jet')
ax[0].pcolormesh(t, f[:N//4], 20 * np.log10(abs(S))[:N//4], cmap='jet')
rect = patches.Rectangle((2, 1), width=1, height=498, linewidth=3, edgecolor='b', facecolor='none')
ax[0].add_patch(rect)
for i in f_intervals:
    ax[0].axhline(y=i, color='k')
# plt.colorbar()
ax[0].set_xlim([0,10])
ax[0].set_ylim([0,500])
ax[0].set_xlabel('Tiempo [segs]')
ax[0].set_ylabel('Frecuencia [Hz]')

ax[1].plot(20 * np.log10(abs(energy_S[:,105])), 0.5 + np.arange(len(energy_S)), zorder=1, marker='.')
ax[1].invert_xaxis()
# ax[1].axis('off')
ax[1].get_xaxis().set_ticklabels([])
ax[1].get_xaxis().set_ticks([])
ax[1].get_yaxis().set_visible(False)
ax[1].set_xlabel('Energía por\nbandas')
ax[1].set_xlim([-30, -150])
ax[1].set_ylim([0, len(f_intervals) - 1])
for i in range(len(f_intervals)):
    ax[1].axhline(y=i, color='silver', zorder=0, linestyle=':')
    

ax[1].spines["bottom"].set_visible(False)
ax[1].spines["top"].set_visible(False)
ax[1].spines["left"].set_visible(False)
ax[1].spines["right"].set_visible(False)
    
# s1 = ax[1].pcolormesh(t, np.arange(len(f_intervals)), 20 * np.log10(abs(energy_S)), cmap='jet')
# ax[1].set_xlim([0,10])
# plt.colorbar(s1)

fig.align_xlabels(ax[:])
fig.subplots_adjust(hspace=0.1, wspace=0.01, bottom=0.16)

plt.suptitle('Espectrograma y energía por bandas')
plt.savefig('Images/Spectrogram_band_energy.png', transparent=True)
plt.show()

546.875
(26,)
2.703749999999997
(513, 780)


<IPython.core.display.Javascript object>

