# Extracción de Coeficientes MFCC
Este notebook está orientado a la extracción de coeficientes MFCC (Mel Frequency Cepstral Coefficients) a partir de una señal de audio.

## Índice:

1. Importación de Bibliotecas
2. Definición de Funciones para la Extracción de Coeficientes MFCC
3. Cargar Datos de Audio
4. Extracción de Coeficientes MFCC
5. Guardado de Coeficientes MFCC
6. Resumen de los Resultados

## 1. Importación de Bibliotecas
Se importan las bibliotecas esenciales para el procesamiento y extracción de características del audio.

In [None]:
# numpy es una biblioteca de Python utilizada para realizar operaciones matemáticas
# sobre arrays y matrices de manera eficiente. Se abrevia comúnmente como np.
import numpy as np

# librosa es una biblioteca de Python para el análisis de audio y música. 
# Proporciona las herramientas necesarias para extraer información de señales de audio
# tales como tiempo de duración, frecuencia, entre otras.
import librosa

## 2. Definición de Funciones para la Extracción de Coeficientes MFCC
Se presentan las funciones que se usarán para cargar los datos de audio y extraer/guardar los coeficientes MFCC.

### 2.1. Función para cargar datos desde un archivo
Carga datos desde un archivo utilizando la función `load` de numpy.

>**Parámetros:**
* **archivo_de_entrada (str):** Ruta o nombre del archivo del cual se cargarán los datos.

>**Retorna:**
* **ndarray:** Un array de numpy con los datos cargados desde el archivo.

In [None]:
def cargar_datos(archivo_de_entrada):
    return np.load(archivo_de_entrada)

### 2.2. Función para extraer características MFCC
Extrae los coeficientes MFCC (Mel-frequency cepstral coefficients) de cada frame de audio.P()]ara obtener los coeficientes por cada frame se utiliza la función [librosa.feature.mfcc()](https://librosa.org/doc/main/generated/librosa.feature.mfcc.html).

>**Parámetros:**
* **frames (ndarray):** Una matriz donde cada columna representa un frame de audio.
* **sample_rate (int):** Tasa de muestreo del audio.
* **num_coeficientes (int):** Número de coeficientes MFCC a extraer para cada frame.
* **nfft (int, opcional):** Número de puntos FFT a utilizar. Por defecto es 512.
* **n_mels (int, opcional):** Número de bancos de filtro Mel a utilizar. Por defecto es 40.
* **fmax (float, opcional):** Frecuencia máxima a considerar. Si es None, se considera Nyquist.

>**Retorna:**
* **ndarray:** Una matriz donde cada fila contiene los coeficientes MFCC de un frame.

In [None]:
def extraer_caracteristicas_mfcc(frames, sample_rate, num_coeficientes, nfft=512, n_mels=40, fmax=None):
    frame_len = frames.shape[1]
    mfcc_coeffs = np.zeros((frame_len, num_coeficientes))
    for i in range(frame_len):
        frame = frames[:, i]
        mfcc_frame = librosa.feature.mfcc(y=frame, sr=sample_rate, n_mfcc=num_coeficientes, n_fft=nfft, n_mels=n_mels, fmax=fmax)
        mfcc_coeffs[i, :] = mfcc_frame[:, 0]
    return mfcc_coeffs

### 2.3. Función para guardar coeficientes en un archivo
Guarda los coeficientes proporcionados en un archivo utilizando la función `save` de numpy.

>**Parámetros:**
* **archivo (str):** Ruta o nombre del archivo donde se guardarán los coeficientes.
* **coeficientes (ndarray):** Array de numpy que contiene los coeficientes a guardar.

In [None]:
def guardar_coeficientes(archivo, coeficientes):
    np.save(archivo, coeficientes)

## 3. Cargar Datos de Audio
Aquí se carga la señal de audio desde un archivo .npy.

In [None]:
# Ruta al archivo de datos
archivo_de_datos = "nombre_del_archivo_que_contiene_los_frames"
frames = cargar_datos(archivo_de_datos + '.npy')

## 4. Extracción de Coeficientes MFCC
A partir de la señal de audio cargada, se extraen los coeficientes MFCC.

In [None]:
# Número de coeficiente MFCC a extraer
num_coeficientes = 13
sample_rate = 32000
mfcc_coeffs = extraer_caracteristicas_mfcc(frames, sample_rate, num_coeficientes, n_mels=40, fmax=sample_rate//2)

## 5. Guardado de Coeficientes MFCC
Una vez extraídos los coeficientes MFCC, se procede a guardarlos en un archivo .npy.

In [None]:
# Ruta al archivo donde se guardarán los coeficientes MFCC
archivo_coeficientes = 'coeficientes_mfcc.npy'
guardar_coeficientes(archivo_coeficientes, mfcc_coeffs)

## 6. Resumen de los Resultados
1. Archivo original de frames: **nombre_del_archivo_que_contiene_los_frames.npy**
2. Número de coeficientes MFCC extraídos por frame: **13**
3. Archivo de salida con coeficientes MFCC: **coeficientes_mfcc.npy**