In [1]:
# Imports
import os
import librosa
import numpy as np
import soundfile as sf
import matplotlib.pyplot as plt
from scipy.io import wavfile
from scipy import signal, fftpack
from testing_functions import test_hss
from process_functions import preprocessing_audio
from utils import find_and_open_audio, signal_segmentation, get_resp_segments
from heart_sound_segmentation.filter_and_sampling import downsampling_signal, \
    upsampling_signal
from source_separation.descriptor_functions import get_spectrogram
from IPython.display import Audio
from sklearn.feature_selection import SequentialFeatureSelector
from sklearn.neighbors import KNeighborsClassifier
from sklearn.decomposition import PCA
from sklearn import preprocessing, linear_model, svm
from pybalu.feature_selection import sfs

# Definición coeficientes cepstrales

In [83]:
# Funciones de características
def get_filterbanks(N, samplerate, freq_lim, n_filters, norm_exp=1,
                    scale_type='mel', filter_type='triangular',
                    norm_filters=True, plot_filterbank=False):
    '''
    
    Parameters
    ----------
    N : ndarray
        Largo de la señal.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_filters : int
        Cantidad de filtros a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''
    def _freq_to_bin(f):
        # Definición del bin correspondiente en la definición
        # del intervalo de cálculo. Se usa (N - 1) ya que los bins
        # se definen entre 0 y (N - 1) (largo N)
        return np.rint(f / samplerate * (N - 1)).astype(int)
    
    
    def _triangular_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_filters, N))
        
        for i in range(1, n_filters + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i] + 1] = \
                np.linspace(0, 1, abs(bins_points[i] - bins_points[i - 1] + 1))
            
            # Tramo descendente del filtro triangular
            filter_bank[i - 1][bins_points[i]:bins_points[i + 1] + 1] = \
                np.linspace(1, 0, abs(bins_points[i + 1] - bins_points[i] + 1))
            
        return filter_bank
    
    
    def _hanning_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_filters, N))
        
        for i in range(1, n_filters + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = \
                np.hanning(abs(bins_points[i + 1] - bins_points[i - 1] + 1))
        
        return filter_bank
    
    
    def _squared_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_filters, N))
        
        for i in range(1, n_filters + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = 1
        
        return filter_bank
    
    
    def _norm_filterbank(filter_bank):
        # Definición del banco de filtros de salida
        filter_bank_out = np.zeros((n_filters, N))
        
        # Normalizar los filtros a energía 1
        for i in range(n_filters):
            filter_bank_out[i] = filter_bank[i] / \
                                 sum(filter_bank[i] ** norm_exp)
            
        return filter_bank_out
    
    
    # Definición de los bines en base a las frecuencias de cada filtro
    if scale_type == 'linear':
        # Definición de las "n_filters" frecuencias equiespaciadas entre
        # 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya que se 
        # necesitan para definir los límites de los filtros.
        freqs = np.arange(0, (n_filters + 1) + 1) * freq_lim / (n_filters + 1)
    
    
    elif scale_type == 'mel':
        # Definición del límite en frecuencias de mel (para no pasarse del
        # freq_lim al devolverse)
        mel_freq_lim = 2595 * np.log10(1 + freq_lim / 700)
        
        # Definición de las "n_filters" frecuencias espaciadas en escala mel 
        # entre 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya 
        # que se necesitan para definir los límites de los filtros.
        mel_freqs = np.arange(0, (n_filters + 1) + 1) * mel_freq_lim / (n_filters + 1)
        
        # Transformando de intervalos equi espaciados usando la escala
        # de mel. Es necesario hacer la transformación inversa ya que
        # en este caso se dice que lo equi espaciado viene de mel
        freqs = 700 * (10 ** (mel_freqs / 2595) - 1)
    
    else:
        raise Exception('Opción de tipo de coeficiente cepstral no válido.')
    
    
    # Transformando a bins
    bins_to = _freq_to_bin(freqs)
    
    
    # Obtención del banco de filtros
    if filter_type == 'triangular':
        filter_bank = _triangular_filter(bins_to)
        
    if filter_type == 'hanning':
        filter_bank = _hanning_filter(bins_to)
    
    elif filter_type == 'squared':
        filter_bank = _squared_filter(bins_to)
    
    # Normalizar por la energía de la señal
    if norm_filters:
        filter_bank = _norm_filterbank(filter_bank)
    
    
    # Gráfico del banco de filtros
    if plot_filterbank:
        plt.figure()
        
        # Definición del vector de frecuencias
        f_plot = np.arange(N) * samplerate / N
        
        for i in range(n_filters):
            plt.plot(filter_bank[i])
            # plt.plot(f_plot, filter_bank[i])

        for i in bins_to:
            # plt.axvline(i * samplerate / N, c='silver', linestyle=':')
            plt.axvline(i, c='silver', linestyle=':')
            
        # plt.xlim([0, freq_lim])
        plt.xlim([0, bins_to[-1]])
        plt.show()
    
    
    return filter_bank


def get_cepstral_coefficients_segment(signal_in, samplerate, freq_lim, n_coefs,
                                      scale_type='mel', filter_type='triangular',
                                      inverse_func='dct', norm_filters=True,
                                      plot_filterbank=False, power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''    
    # Definición de la cantidad de puntos a considerar
    filter_bank = get_filterbanks(len(signal_in), samplerate, freq_lim=freq_lim, 
                                  n_filters=n_coefs, scale_type=scale_type, 
                                  filter_type=filter_type,
                                  norm_filters=norm_filters, 
                                  plot_filterbank=plot_filterbank)
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(np.fft.fft(signal_in)) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    filters_applied = filter_bank * energy_spectrum
    
    
    # Calculando el logaritmo de la energía de cada uno
    energy_coefs = np.log(filters_applied.sum(axis=1))
    
    # Calculando los coeficientes cepstrales
    if inverse_func == 'dct':
        cepstral_coefs = fftpack.dct(energy_coefs, norm='ortho')
    elif inverse_func == 'idft':
        cepstral_coefs = np.fft.ifft(energy_coefs).real
    else:
        raise Exception('Opción de tipo de función inversa no válida.')
    
    
    return cepstral_coefs


def get_cepstral_coefficients(signal_in, samplerate, spectrogram_params,
                              freq_lim, n_filters, n_coefs, scale_type='mel', 
                              filter_type='triangular', inverse_func='dct', 
                              norm_filters=True, plot_filterbank=False, 
                              power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''    
    # Definición de la cantidad de puntos a considerar
    filter_bank = get_filterbanks(spectrogram_params['N'], samplerate, 
                                  freq_lim=freq_lim, n_filters=n_filters, 
                                  scale_type=scale_type, 
                                  filter_type=filter_type,
                                  norm_filters=norm_filters, 
                                  plot_filterbank=plot_filterbank)
    
    # Obtener el espectrograma de la señal
    t, f, S = get_spectrogram(signal_in, samplerate, N=spectrogram_params['N'], 
                              padding=spectrogram_params['padding'], 
                              repeat=spectrogram_params['repeat'], 
                              noverlap=spectrogram_params['noverlap'], 
                              window=spectrogram_params['window'], 
                              whole=True)
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(S) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    energy_coefs = np.dot(filter_bank, energy_spectrum)
    
    # Aplicando el logaritmo
    energy_coefs = np.log(energy_coefs + 1e-10)
    
    # Calculando los coeficientes cepstrales
    if inverse_func == 'dct':
        cepstral_coefs = fftpack.dct(energy_coefs, norm='ortho', axis=0)
    elif inverse_func == 'idft':
        cepstral_coefs = np.fft.ifft(energy_coefs, axis=-1).real
    else:
        raise Exception('Opción de tipo de función inversa no válida.')
    
    
    return cepstral_coefs[:n_mfcc]


def get_bands_coefficients(signal_in, samplerate, spectrogram_params,
                           freq_lim, n_coefs, scale_type='mel', 
                           filter_type='triangular', norm_filters=True, 
                           plot_filterbank=False, 
                           power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''    
    # Definición de la cantidad de puntos a considerar
    filter_bank = get_filterbanks(spectrogram_params['N'], samplerate, 
                                  freq_lim=freq_lim, 
                                  n_coefs=n_coefs, scale_type=scale_type, 
                                  filter_type=filter_type,
                                  norm_filters=norm_filters, 
                                  plot_filterbank=plot_filterbank)
    
    # Obtener el espectrograma de la señal
    t, f, S = get_spectrogram(signal_in, samplerate, N=spectrogram_params['N'], 
                              padding=spectrogram_params['padding'], 
                              repeat=spectrogram_params['repeat'], 
                              noverlap=spectrogram_params['noverlap'], 
                              window=spectrogram_params['window'], 
                              whole=True)
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(S) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    energy_coefs = np.dot(filter_bank, energy_spectrum)
    
    return energy_coefs


def get_cepstral_coefficients_end2end(signal_in, samplerate, freq_lim, n_coefs,
                              scale_type='mel', filter_type='triangular',
                              inverse_func='dct', norm_filters=True,
                              plot_filterbank=False, power=2):
    '''
    
    Parameters
    ----------
    signal_in : ndarray
        Señal de entrada.
    samplerate : float
        Tasa de muestreo de la señal de entrada.
    freq_lim : float
        Frecuencia límite para calcular los coeficientes cepstrales.
    n_coefs : int
        Cantidad de coeficientes a obtener.
    scale_type : {'mel', 'linear'}, optional
        Tipo de espaciado entre los bancos de filtros para el cálculo
        de los coeficientes cepstrales. Por defecto es 'mel' (MFCC). 
    filter_type : {'triangular', 'hanning', 'squared'}, optional
        Forma del filtro a utilizar para el cálculo de la energía en 
        cada banda. Por defecto es 'triangular'.
    inverse_func : {'dct', 'idft'}, optional
        Función a utilizar para obtener los coeficientes cepstrales.
        Por defecto es 'dct'.
    plot_filterbank : bool, optional
        Booleano que indica si se grafica el banco de filtros. Por 
        defecto es False.
    
    References
    ----------
    [1] http://practicalcryptography.com/miscellaneous/machine-learning/
        guide-mel-frequency-cepstral-coefficients-mfccs/
    [2] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon - Spoken Language 
        Processing A Guide to Theory, Algorithm and System 
        Development-Prentice Hall PTR (2001)
    '''
    def _freq_to_bin(f):
        # Definición del bin correspondiente en la definición
        # del intervalo de cálculo. Se usa (N - 1) ya que los bins
        # se definen entre 0 y (N - 1) (largo N)
        return np.rint(f / samplerate * (N - 1)).astype(int)
    
    
    def _triangular_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i] + 1] = \
                np.linspace(0, 1, abs(bins_points[i] - bins_points[i - 1] + 1))
            
            # Tramo descendente del filtro triangular
            filter_bank[i - 1][bins_points[i]:bins_points[i + 1] + 1] = \
                np.linspace(1, 0, abs(bins_points[i + 1] - bins_points[i] + 1))
            
        return filter_bank
    
    
    def _hanning_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = \
                np.hanning(abs(bins_points[i + 1] - bins_points[i - 1] + 1))
        
        return filter_bank
    
    
    def _squared_filter(bins_points):
        # Definición del banco de filtros
        filter_bank = np.zeros((n_coefs, N))
        
        for i in range(1, n_coefs + 1):
            # Tramo ascendente del filtro triangular
            filter_bank[i - 1][bins_points[i - 1]:bins_points[i + 1] + 1] = 1
        
        return filter_bank
    
    
    def _norm_filterbank(filter_bank):
        # Definición del banco de filtros de salida
        filter_bank_out = np.zeros((n_coefs, N))
        
        # Normalizar los filtros a energía 1
        for i in range(n_coefs):
            filter_bank_out[i] = filter_bank[i] / \
                                 sum(filter_bank[i] ** 2)
            
        return filter_bank_out
    
    
    # Definición de la cantidad de puntos a considerar
    N = len(signal_in)
        
    # Definición de los bines en base a las frecuencias de cada filtro
    if scale_type == 'linear':
        # Definición de las "n_coefs" frecuencias equiespaciadas entre
        # 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya que se 
        # necesitan para definir los límites de los filtros.
        freqs = np.arange(0, (n_coefs + 1) + 1) * freq_lim / (n_coefs + 1)
    
    
    elif scale_type == 'mel':
        # Definición del límite en frecuencias de mel (para no pasarse del
        # freq_lim al devolverse)
        mel_freq_lim = 2595 * np.log10(1 + freq_lim / 700)
        
        # Definición de las "n_coefs" frecuencias espaciadas en escala mel 
        # entre 0 y freq_lim. Se le agregan 2 puntos (0 y el freq_lim) ya 
        # que se necesitan para definir los límites de los filtros.
        mel_freqs = np.arange(0, (n_coefs + 1) + 1) * mel_freq_lim / (n_coefs + 1)
        
        # Transformando de intervalos equi espaciados usando la escala
        # de mel. Es necesario hacer la transformación inversa ya que
        # en este caso se dice que lo equi espaciado viene de mel
        freqs = 700 * (10 ** (mel_freqs / 2595) - 1)
    
    else:
        raise Exception('Opción de tipo de coeficiente cepstral no válido.')
    
    
    # Transformando a bins
    bins_to = _freq_to_bin(freqs)
    
    
    # Obtención del banco de filtros
    if filter_type == 'triangular':
        filter_bank = _triangular_filter(bins_to)
        
    if filter_type == 'hanning':
        filter_bank = _hanning_filter(bins_to)
    
    elif filter_type == 'squared':
        filter_bank = _squared_filter(bins_to)
    
    # Normalizar por la energía de la señal
    if norm_filters:
        filter_bank = _norm_filterbank(filter_bank)
    
    
    # Definición del espectro de la señal
    energy_spectrum = np.abs(np.fft.fft(signal_in)) ** power
    
    # Se aplica el banco de filtros sobre el espectro de la señal
    filters_applied = filter_bank * energy_spectrum
    
    
    # Calculando el logaritmo de la energía de cada uno
    energy_coefs = np.log(filters_applied.sum(axis=1))
    
    # Calculando los coeficientes cepstrales
    if inverse_func == 'dct':
        cepstral_coefs = fftpack.dct(energy_coefs, norm='ortho')
    elif inverse_func == 'idft':
        cepstral_coefs = np.fft.ifft(energy_coefs).real
    else:
        raise Exception('Opción de tipo de función inversa no válida.')
        
        
    # Gráfico del banco de filtros
    if plot_filterbank:
        plt.figure()
        
        # Definición del vector de frecuencias
        f_plot = np.arange(N) * samplerate / N
        
        for i in range(n_coefs):
            plt.plot(filter_bank[i])
            # plt.plot(f_plot, filter_bank[i])

        for i in bins_to:
            # plt.axvline(i * samplerate / N, c='silver', linestyle=':')
            plt.axvline(i, c='silver', linestyle=':')
            
        # plt.xlim([0, freq_lim])
        plt.xlim([0, bins_to[-1]])
        plt.show()
    
    
    return cepstral_coefs

In [84]:
# Dirección de la base de datos
db_original = 'C:/Users/Chris/Desktop/Scripts_Magister/Respiratory_Sound_Database/audio_and_txt_files'
db_folder = 'preprocessed_signals'

# Nombres de los archivos
filenames = [i[:-4] for i in os.listdir(db_folder) if i.endswith('.wav') and not 'Tc' in i]

# Definición de la frecuencia de muestreo deseada para 
# separación de fuentes
samplerate_nmf = 11025 # Hz
samplerate_cls = 4000  # Hz

# Pruebas coeficientes cepstrales

In [85]:
%matplotlib notebook
filename = f'{db_folder}/101_1b1_Al_sc_Meditron.wav'

audio, samplerate = sf.read(filename)

n_mfcc = 30
n_filters = 150
N = 2048
step = 512
mfcc_lib = librosa.feature.mfcc(y=audio, sr=samplerate, n_mfcc=n_mfcc, n_fft=N, 
                                hop_length=step, htk=True, window='hann',
                                n_mels=n_filters, fmin=0, fmax=2000)
# mfcc_my = get_cepstral_coefficients_segment(audio[512+512:512+512+2048], samplerate, freq_lim=samplerate/2, 
#                                     n_coefs=n_mfcc, scale_type='mel', 
#                                     filter_type='triangular', power=2,
#                                     inverse_func='dct', plot_filterbank=False)

spectrogram_params = {'N': N, 'noverlap': N-step, 'window': 'hamming', 'padding': 0,
                      'repeat': 0}
mfcc_m2 = get_cepstral_coefficients(audio, samplerate, spectrogram_params, freq_lim=2000, 
                                    n_filters=n_filters, n_coefs=n_mfcc, scale_type='linear', 
                                    filter_type='triangular', power=2,
                                    inverse_func='dct', plot_filterbank=True)
print(mfcc_m2.shape)

<IPython.core.display.Javascript object>

(30, 158)


In [88]:
%matplotlib notebook
plt.subplot(1,2,1)
plt.pcolormesh(mfcc_lib, cmap='viridis')
plt.colorbar()

plt.subplot(1,2,2)
plt.pcolormesh(mfcc_m2, cmap='viridis')
plt.colorbar()
plt.show()

<IPython.core.display.Javascript object>

In [42]:
np.corrcoef(mfcc_lib[:,10], mfcc_m2[:,10])

array([[1.        , 0.94405945],
       [0.94405945, 1.        ]])

# Preprocesamiento

In [4]:
def _conditioning_signal(signal_in, samplerate, samplerate_to):
    # Acondicionando en caso de que no tenga samplerate de 1000 Hz.
    if samplerate < samplerate_to:
        print(f'Upsampling de la señal de fs = {samplerate} Hz '
              f'a fs = {samplerate_to} Hz.') 
        new_rate = samplerate_to           
        audio_to = upsampling_signal(signal_in, samplerate, new_samplerate=new_rate)

    elif samplerate > samplerate_to:
        print(f'Downsampling de la señal de fs = {samplerate} Hz '
              f'a fs = {samplerate_to} Hz.')
        new_rate, audio_to = downsampling_signal(signal_in, samplerate, 
                                                 freq_pass=samplerate_to//2-100, 
                                                 freq_stop=samplerate_to//2)

    else:
        print(f'Samplerate adecuado a fs = {samplerate} Hz.')
        audio_to = signal_in
        new_rate = samplerate_to

    # Mensaje para asegurar
    print(f'Señal acondicionada a {new_rate} Hz para la separación de fuentes.')

    # Asegurándose de que el largo de la señal sea par
    if len(audio_to) % 2 != 0:
        audio_to = np.concatenate((audio_to, [0]))

    return audio_to, new_rate

In [5]:
# Parámetros utilizados para el preprocesamiento
lowpass_params = {'freq_pass': 140, 'freq_stop': 150}       # None
model_name = 'definitive_segnet_based'

# Definición de los parámetros NMF
nmf_method = 'replace_segments'
N = 1024
nmf_parameters = {'n_components': 10, 'N': N, 'N_lax': 100, 
                  'N_fade': 100, 'noverlap': int(0.9 * N), 'repeat': 0, 
                  'padding': 0, 'window': 'hamming', 'init': 'random',
                  'solver': 'mu', 'beta': 2, 'tol': 1e-4, 
                  'max_iter': 500, 'alpha_nmf': 0, 'l1_ratio': 0, 
                  'random_state': 0, 'dec_criteria': 'temp_criterion'}

# Parámetros de los descriptores
n_mfcc = 50
N = 1024
noverlap = int(0.75 * N)
window = 'hann'
spectrogram_params = {'N': N, 'noverlap': noverlap, 'window': window, 
                      'padding': 0, 'repeat': 0}

In [14]:
%matplotlib notebook

# Definición de los arrays donde se acumulará las características
X_data = list()
# Definición de los arrays donde se acumularán las etiquetas
Y_wheeze = list()
Y_crackl = list()

# Parámetros
preprocess = False
# Decisión de características
mfcc_bool = True
psd_bool = False


# Parámetros de extracción de características
collapse_mfcc = 'mean'
scale_type = 'mel'
filter_type = 'triangular'
func_type = 'cepstral_coefficients'


# Nombre del archivo .wav a utilizar
for num, name in enumerate(filenames[165:]):
    print(f'Iteración {num + 1}: {name}')
    print(f'--------------------------')
    
    filename = f'{db_folder}/{name}'

    # Cargando el archivo
    try:
        samplerate, resp_signal = wavfile.read(f'{filename}.wav')
    except:
        resp_signal, samplerate = sf.read(f'{filename}.wav')
    
    print(f'Samplerate = {samplerate}, largo = {resp_signal.shape}')
    
    # Normalizando
    resp_signal = resp_signal / max(abs(resp_signal))
    
    
    # Obteniendo la información de los segmentos de este archivo de audio
    resp_list_info = get_resp_segments(resp_signal, samplerate, 
                                       filepath=f'{db_original}/{name}.txt')
    
    
    # Para cada segmento, se obtiene la información de interés
    for resp_info in resp_list_info:
        # Definición de la lista de características a agregar
        features_to_append = list()
        
        # Calculando las características a partir del segmento
        if mfcc_bool:
            if func_type == 'cepstral_coefficients':
                features = librosa.feature.mfcc(y=resp_info[0], sr=samplerate_cls, n_mfcc=n_mfcc)
                
#                 features = \
#                     get_cepstral_coefficients(resp_info[0], samplerate, 
#                                               spectrogram_params,
#                                               freq_lim=2000, n_coefs=n_mfcc, 
#                                               scale_type=scale_type, 
#                                               filter_type=filter_type, 
#                                               inverse_func='dct', 
#                                               norm_filters=True, 
#                                               plot_filterbank=False, 
#                                               power=2)
                
            elif func_type == 'bands_coefficients':
                features = \
                    get_bands_coefficients(resp_info[0], samplerate, 
                                           spectrogram_params,
                                           freq_lim=2000, n_coefs=n_mfcc, 
                                           scale_type=scale_type, 
                                           filter_type=filter_type, 
                                           norm_filters=True, 
                                           plot_filterbank=False, 
                                           power=2)
            
            # Resumiendo
            if collapse_mfcc == 'mean':
                features_collapsed = features.mean(axis=1)
            elif collapse_mfcc == 'max':
                features_collapsed = features.max(axis=1)
            
            # Agregando a la lista de características
            features_to_append.extend(features_collapsed)
        
        if psd_bool:
            _, psd_to = signal.welch(x=resp_info[0], fs=samplerate_cls, window=window, 
                                     nperseg=N, noverlap=noverlap, nfft=N)
            
            # Agregando a la lista de características
            features_to_append.extend(psd_to)
        
        # Agregando la información a cada arreglo
        X_data.append(features_to_append)
        Y_wheeze.append(resp_info[1])
        Y_crackl.append(resp_info[2])


# Transformando listas a arrays
X_data = np.array(X_data)
Y_wheeze = np.array(Y_wheeze)
Y_crackl = np.array(Y_crackl)

Iteración 1: 140_2b2_Ll_mc_LittC2SE
--------------------------
Samplerate = 4000, largo = (80182,)


<IPython.core.display.Javascript object>



<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [96]:
# np.savez(f'_temp_files/symptoms_preprocessed_nmfcc{n_mfcc}{collapse_mfcc}.npz', X_data=X_data, Y_wheeze=Y_wheeze,
#          Y_crackl=Y_crackl)

In [201]:
print(X_data.shape)
print(X_data)

(4902, 50)
[[-339.58550546  159.17902191   63.14659902 ...   -2.0982689
     1.57126187    0.5851073 ]
 [-342.46551849  156.07946969   63.36104308 ...   -1.34944256
     1.49331852    1.06440592]
 [-338.56997676  127.19571591   45.18469605 ...   -0.48952062
     1.25058514    0.94143877]
 ...
 [-327.02726244  146.25320478   74.35312535 ...    1.01287793
     2.32714648    0.36331469]
 [-317.56511422  132.203034     66.96105935 ...    0.48553494
     1.34899078   -0.73982007]
 [-285.89449479  165.18153644   78.74249693 ...    1.41872573
     2.21675038    1.53666932]]


# Normalizando

In [7]:
scaler = preprocessing.StandardScaler()
X_data_norm = scaler.fit_transform(X_data)

# Testeando PCA

In [13]:
pca = PCA(n_components=10, random_state=0)
X_new = pca.fit_transform(X_data_norm)

%matplotlib notebook
# Definición de los puntos
X_wheeze_1 = X_new[np.where(Y_wheeze == 1)]
X_wheeze_0 = X_new[np.where(Y_wheeze == 0)]

X_crackl_1 = X_new[np.where(Y_crackl == 1)]
X_crackl_0 = X_new[np.where(Y_crackl == 0)]

plt.subplot(1,2,1)
plt.plot(X_wheeze_1[:, 0], X_wheeze_1[:, 1], color='blue', marker='o', linestyle=' ')
plt.plot(X_wheeze_0[:, 0], X_wheeze_0[:, 1], color='red', marker='x', linestyle=' ')

plt.subplot(1,2,2)
plt.plot(X_crackl_1[:, 0], X_crackl_1[:, 1], color='blue', marker='o', linestyle=' ')
plt.plot(X_crackl_0[:, 0], X_crackl_0[:, 1], color='red', marker='x', linestyle=' ')

plt.show()

<IPython.core.display.Javascript object>

# Testeando SFS

In [32]:
knn = KNeighborsClassifier(n_neighbors=3)#linear_model.Lasso()
sfs_wheeze = SequentialFeatureSelector(knn, n_features_to_select=5)
sfs_crackl = SequentialFeatureSelector(knn, n_features_to_select=5)

X_new_wheeze = sfs_wheeze.fit_transform(X_data_norm, Y_wheeze)
X_new_crackl = sfs_crackl.fit_transform(X_data_norm, Y_crackl)

%matplotlib notebook
# Definición de los puntos
X_wheeze_1 = X_new_wheeze[np.where(Y_wheeze == 1)]
X_wheeze_0 = X_new_wheeze[np.where(Y_wheeze == 0)]

X_crackl_1 = X_new_crackl[np.where(Y_crackl == 1)]
X_crackl_0 = X_new_crackl[np.where(Y_crackl == 0)]

plt.subplot(1,2,1)
plt.plot(X_wheeze_1[:, 0], X_wheeze_1[:, 1], color='blue', marker='o', linestyle=' ')
plt.plot(X_wheeze_0[:, 0], X_wheeze_0[:, 1], color='red', marker='x', linestyle=' ')

plt.subplot(1,2,2)
plt.plot(X_crackl_1[:, 0], X_crackl_1[:, 1], color='blue', marker='o', linestyle=' ')
plt.plot(X_crackl_0[:, 0], X_crackl_0[:, 1], color='red', marker='x', linestyle=' ')

plt.show()

<IPython.core.display.Javascript object>

In [25]:
selected_feats = sfs(X_data_norm, Y_wheeze, n_features=5, show=True)

def performance_for_features(feat_idxs):
    # train classifier
    knn = KNeighborsClassifier(n_neighbors=3)
    knn.fit(f_train_norm[:, feat_idxs], c_train)

    # predict and evaluate performance
    prediction = knn.predict(f_test_norm[:, feat_idxs])
    return performance(prediction, c_test)


values = [performance_for_features(selected_feats[:i]) * 100
          for i in range(1, N_FEATURES + 1)]

plt.bar(*zip(*enumerate(values)), tick_label=range(1, N_FEATURES+1))
plt.title("Performance vs. number of features")
plt.xlabel('selected features')
plt.ylabel('accuracy [%]')
plt.show()
print(a)

Selecting Features: 100%|████████████████████████████████████████████████████| 5.00/5.00 [00:00<00:00, 26.5 features/s]


[20  1  4  0 47]


In [34]:
sfs_wheeze.get_support(indices=True)
sfs_wheeze.support_

array([False, False, False,  True, False, False, False,  True, False,
       False, False, False,  True, False, False, False, False, False,
       False, False, False, False, False, False,  True, False, False,
       False, False, False, False, False, False, False, False, False,
       False, False, False, False,  True, False, False, False, False,
       False, False, False, False, False])

In [41]:
%matplotlib notebook
plt.subplot(1,3,1)
plt.plot(mfcc_lib[:,3])

plt.subplot(1,3,2)
plt.plot(mfcc_my)

plt.subplot(1,3,3)
plt.plot(mfcc_m2[:,0])
plt.show()

<IPython.core.display.Javascript object>

In [99]:
filter_type = 'triangular'
inverse_func = 'dct'
a = get_cepstral_coefficients_segment(signal_in=np.arange(2048), samplerate=11025, freq_lim=2000, 
                          n_coefs=30, scale_type='mel', filter_type=filter_type, 
                          plot_filterbank=True, norm_filters=True)
get_cepstral_coefficients_segment(signal_in=np.arange(2048), samplerate=11025, freq_lim=2000, 
                          n_coefs=10, scale_type='linear', filter_type=filter_type, 
                          plot_filterbank=True, inverse_func=inverse_func, norm_filters=True)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

array([53.67220259,  4.7346604 ,  1.82602534,  1.41343436,  0.93048172,
        0.76751625,  0.54225013,  0.41364105,  0.25546828,  0.13117709])

In [288]:
mfcc_lib.shape
mfcc_m2.shape

(20,)

In [104]:
n_mels = 30
filterbank = get_filterbanks(N=2048, samplerate=11025, freq_lim=2000, n_filters=n_mels, norm_exp=2,
                             scale_type='mel', filter_type='triangular',
                             norm_filters=True, plot_filterbank=False)
melfb = librosa.filters.mel(11025, n_fft=2048, n_mels=n_mels, fmin=0, fmax=2000, htk=True)
print(melfb.shape)

%matplotlib notebook
plt.figure()
for i in range(n_mels):
    plt.plot(filterbank[i], color=f'C{i}')
    fbi = melfb[i] / (sum(melfb[i] ** 2))
    plt.plot(melfb[i]*8, color=f'C{i}')
    
# a = get_cepstral_coefficients_segment(signal_in=np.arange(2048), samplerate=11025, freq_lim=2000, 
#                           n_coefs=10, scale_type='mel', filter_type=filter_type, 
#                           plot_filterbank=True, norm_filters=True)
plt.show()

(30, 1025)


<IPython.core.display.Javascript object>

In [62]:
melfb.sum(axis=1)

array([1.0239985, 1.0238984, 1.0241406, 1.0239197, 1.0239339, 1.0241331,
       1.023921 , 1.0239799, 1.0240446, 1.0240154, 1.0239327, 1.0240653,
       1.0239522, 1.0240496, 1.0239476, 1.0240203, 1.0240157, 1.023998 ,
       1.0239925, 1.023986 , 1.0240277, 1.0239823, 1.0240054, 1.0239948,
       1.0239933, 1.0240078, 1.0240116, 1.0239898, 1.0239966, 1.0239978],
      dtype=float32)

# Estudio del histograma de las MFCC

In [194]:
normal_pos = np.where((Y_crackl + Y_wheeze) == 0)
wheeze_pos = np.where(Y_wheeze == 1)
crackl_pos = np.where(Y_crackl == 1)

normal_hist, norm_edges = np.histogram(X_data[normal_pos], bins=100, range=(-0.0000002, 0.0000002))
wheeze_hist, whee_edges = np.histogram(X_data[wheeze_pos], bins=100, range=(-0.0000002, 0.0000002))
crackl_hist, crac_edges = np.histogram(X_data[crackl_pos], bins=100, range=(-0.0000002, 0.0000002))
print(X_data[normal_pos].shape)
print(normal_hist.shape)

print(normal_hist)
print(norm_edges)

%matplotlib notebook
plt.plot(norm_edges[:-1], normal_hist)
plt.plot(whee_edges[:-1], wheeze_hist)
plt.plot(crac_edges[:-1], crackl_hist)
plt.show()

(2304, 50)
(100,)
[    0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     0     0     0     0     0     0
     0     0 15034  8946  6334  4422  3605  2845  2463  2134  1808  1600
  1321  1217  1124  1008  1008   923   851   728   715   698   610   603
   569   528   567   482   438   432   426   420   420   362   359   339
   342   323   322   334   283   289   270   249   261   253   234   245
   234   220   260   223]
[-2.00000000e-07 -1.96000000e-07 -1.92000000e-07 -1.88000000e-07
 -1.84000000e-07 -1.80000000e-07 -1.76000000e-07 -1.72000000e-07
 -1.68000000e-07 -1.64000000e-07 -1.60000000e-07 -1.56000000e-07
 -1.52000000e-07 -1.48000000e-07 -1.44000000e-07 -1.40000000e-07
 -1.36000000e-07 -1.32000000e-07 -1.28000000e-07 -1.24000000e-07
 -1.20000000e-07 -1.16000000e-07 -1.12000000e-0

<IPython.core.display.Javascript object>

In [172]:
X_data[normal_pos]

array([[3.92116721e-04, 7.84972111e-05, 1.80807648e-05, ...,
        3.54702175e-09, 3.38521566e-09, 3.28429563e-09],
       [4.38816934e-04, 9.58281807e-05, 2.11958462e-05, ...,
        8.59065673e-10, 7.88628206e-10, 7.44924824e-10],
       [2.45695241e-04, 3.22206468e-05, 1.07916065e-05, ...,
        1.80301308e-10, 1.26485538e-10, 1.04474375e-10],
       ...,
       [6.63882878e-04, 2.58488253e-05, 5.27630378e-06, ...,
        3.25203267e-09, 3.11013032e-09, 3.00290958e-09],
       [8.43631221e-04, 1.42575428e-05, 3.28457629e-06, ...,
        2.12934184e-09, 2.04221159e-09, 1.91449121e-09],
       [9.10364387e-04, 1.07092205e-05, 4.51732625e-06, ...,
        4.62338311e-09, 4.09163177e-09, 4.01543981e-09]])

In [208]:
S = librosa.feature.melspectrogram(y=audio, sr=samplerate)
print(S.shape)

(128, 157)


# Recomposición de las funciones librosa

In [105]:
def mfcc(y=None, sr=22050, S=None, n_mfcc=20, dct_type=2, norm='ortho', **kwargs):
    if S is None:
        S = librosa.power_to_db(melspectrogram(y=y, sr=sr, **kwargs))

    return scipy.fftpack.dct(S, axis=0, type=dct_type, norm=norm)[:n_mfcc]


def melspectrogram(y=None, sr=22050, S=None, n_fft=2048, hop_length=512,
                   power=2.0, **kwargs):
    S, n_fft = _spectrogram(y=y, S=S, n_fft=n_fft, hop_length=hop_length,
                            power=power)
    
    # Obtener el espectrograma de la señal
    t, f,S1 = get_spectrogram(y, sr, N=n_fft, padding=0, repeat=0, 
                              noverlap=n_fft-hop_length, window='hann', 
                              whole=True)

    # Build a Mel filter
    mel_basis = librosa.filters.mel(sr, n_fft, **kwargs)

    return np.dot(mel_basis, S)


