# Práctica de Procesamiento de Audio

En esta práctica, trabajaremos con archivos de audio en formato `.wav` para explorar y entender las diferencias entre audio estéreo y mono. A lo largo de la práctica, realizaremos las siguientes tareas:

1. **Importación de Módulos**: Importaremos las bibliotecas necesarias para el procesamiento y visualización de audio.
2. **Especificación de Directorios**: Definiremos los directorios de entrada y salida para los archivos de audio.
3. **Carga de Archivos de Audio**: Cargaremos un archivo de audio en formato `.wav` y mostraremos sus características principales.
4. **Reproducción de Audio**: Escucharemos el audio original en estéreo y luego el audio convertido a mono para notar las diferencias.
5. **Conversión de Audio Estéreo a Mono**: Convertiremos el audio estéreo a mono calculando la media de los dos canales.
6. **Guardado del Archivo Convertido**: Guardaremos el archivo de audio convertido a mono en el directorio de salida.
7. **Visualización de Formas de Onda**: Visualizaremos las formas de onda del audio estéreo y del audio mono en el dominio del tiempo.
8. **Comparación de Tamaños de Archivo**: Compararemos los tamaños de los archivos de audio estéreo y mono.

## Variables Utilizadas

- **audio_data**: `numpy.ndarray` - Datos del archivo de audio en formato estéreo.
- **audio_input_path**: `str` - Ruta del directorio de entrada donde se encuentran los archivos de audio originales.
- **audio_output_path**: `str` - Ruta del directorio de salida donde se guardarán los archivos de audio generados.
- **axs**: `numpy.ndarray` - Subplots utilizados para la visualización de las formas de onda.
- **cwd**: `str` - Directorio de trabajo actual.
- **fig**: `matplotlib.figure.Figure` - Figura utilizada para la visualización de las formas de onda.
- **file_name_2**: `str` - Ruta del archivo de audio original.
- **filename**: `str` - Ruta del archivo de audio cargado.
- **new_data_mono**: `numpy.ndarray` - Datos del archivo de audio convertido a mono.
- **sample_rate**: `int` - Frecuencia de muestreo del archivo de audio.

## Objetivos

- Entender las diferencias entre audio estéreo y mono.
- Aprender a cargar, procesar y guardar archivos de audio en formato `.wav`.
- Visualizar las formas de onda del audio en el dominio del tiempo.
- Comparar los tamaños de los archivos de audio estéreo y mono.

¡Comencemos!


In [None]:
# Importacion.
#import librosa  # Librería para análisis de audio (comentada porque no se usa en el código actual).
from scipy.io import wavfile  # Para leer y escribir archivos de audio en formato WAV.
import IPython  # Para la reproducción de audio en Jupyter Notebook.
import os  # Para operaciones del sistema de archivos, como rutas y directorios.
import numpy as np  # Para operaciones numéricas y manejo de arreglos.
import matplotlib.pyplot as plt  # Para la visualización de datos y gráficos.

# Especificar directorios de entrada y salida

Aquí definimos los directorios donde guardaremos los audios con los que vamos a trabajar, así como dónde se van a guardar aquellos que generamos a lo largo de la práctica.

- **Directorio de entrada**: Contiene los archivos de audio originales con los que vamos a trabajar.
    - Ruta: `/home/javier/Escritorio/Sistemas_Multimedia/Audio/S_M_Audio/audio/_input`
    
- **Directorio de salida**: Aquí se guardarán los archivos de audio generados a lo largo de la práctica.
    - Ruta: `/home/javier/Escritorio/Sistemas_Multimedia/Audio/S_M_Audio/audio/_output`


In [None]:
cwd = os.getcwd()  # Obtener el directorio de trabajo actual
audio_input_path = os.path.join(cwd, os.path.join('audio', '_input'))  # Definir la ruta del directorio de entrada de audio
audio_output_path = os.path.join(cwd, os.path.join('audio', '_output'))  # Definir la ruta del directorio de salida de audio
print(f'Directorio con los audios de entrada: {audio_input_path}')  # Imprimir la ruta del directorio de entrada
print(f'Directorio donde guardaremos los audios generados: {audio_output_path}\n')  # Imprimir la ruta del directorio de salida

## Cargar el archivo de audio

### Diferencias entre formatos de archivo para almacenar audio digital

- **.wav**: Archivo de audio sin comprimir (máxima calidad y gran tamaño de archivo). Típicamente utilizado en edición de audio debido a su fidelidad.
- **.mp3**: Archivo de audio comprimido (con pérdidas pero menor tamaño). Ampliamente usado.

En este caso, cargamos el archivo de audio en formato .wav.


In [None]:
# Cargamos el archivo de audio.
filename = os.path.join(audio_input_path, 'breaking_bad.wav')  # Definimos la ruta del archivo de audio.
sample_rate, audio_data = wavfile.read(filename)  # Leemos el archivo de audio utilizando wavfile.read.
print(f'Frecuencia de muestreo (sample rate): {sample_rate/1000} kHz')  # Imprimimos la frecuencia de muestreo en kHz.

## Vamos a escucharlo

Para que esto se haga correctamente, hay que indicarle la frecuencia de muestreo.

### Frecuencia de Muestreo

La frecuencia de muestreo, también conocida como tasa de muestreo, es la cantidad de muestras de audio que se toman por segundo para representar una señal de audio digitalmente. Se mide en Hertz (Hz) y determina la calidad y la fidelidad del audio digital. Una frecuencia de muestreo más alta significa una mejor calidad de audio, ya que captura más detalles de la señal original.

En este caso, la frecuencia de muestreo de nuestro archivo de audio es de 44.1 kHz, lo que significa que se toman 44,100 muestras por segundo.


### Escuchar el Audio

Vamos a escuchar el audio original en estéreo y luego el audio convertido a mono para notar las diferencias.

In [None]:
IPython.display.Audio(audio_data.T, rate=sample_rate)  # Reproduce el audio estéreo. .T se pasa únicamente si es audio estéreo.

## Mostrar principales características de la onda

Vamos a mostrar la información. Nota: es audio estéreo (dos canales).



In [None]:
# Mostrar informacion (sonido estéreo).
print('Datos de audio (estereo):')  # Imprime el encabezado de la información del audio estéreo.
print(f'- Tamaño:     {audio_data.shape}')  # Imprime el tamaño del arreglo de datos de audio.
print(f'- 1º canal:   {audio_data[:5, 0]}...')  # Imprime los primeros 5 valores del primer canal.
print(f'- 2º canal:   {audio_data[:5, 1]}...')  # Imprime los primeros 5 valores del segundo canal.
print(f'- Resolucion: {type(audio_data[0,0])}\n')  # Imprime el tipo de dato de los valores del audio.


### Información del Audio Estéreo

- **Tamaño**: Dimensiones del arreglo de datos de audio.
- **1º Canal**: Primeros 5 valores del primer canal.
- **2º Canal**: Primeros 5 valores del segundo canal.
- **Resolución**: Tipo de dato de los valores del audio.

El siguiente código imprime esta información:


### Conversión a Mono

Convertimos el audio estéreo a mono calculando la media de los dos canales para cada muestra de audio.



In [None]:
# Convertimos a mono mediante la media por canal (simplificacion).
new_data_mono = audio_data.mean(axis=1)  # Calculamos la media de los dos canales para cada muestra de audio.

print('Nuevos datos de audio (mono):')  # Imprimimos el encabezado de la información del audio mono.
print(f'- Nuevo tamaño: {new_data_mono.shape}')  # Imprimimos el tamaño del arreglo de datos de audio mono.
print(f'- Canal unico:  {new_data_mono[:5]}...')  # Imprimimos los primeros 5 valores del canal único.

# Mantenemos la misma resolucion que antes.
new_data_mono = new_data_mono.astype(np.int16)  # Convertimos los datos a tipo int16 para mantener la misma resolución.
print(f'- Resolucion:   {type(new_data_mono[0])}\n')  # Imprimimos el tipo de dato de los valores del audio mono.

## Guardar el Archivo de Audio Convertido

Vamos a guardar el archivo de audio convertido a mono en el directorio de salida especificado.

### Proceso de Guardado

1. **Crear el Directorio de Salida**: Si el directorio de salida no existe, lo creamos.
2. **Guardar el Archivo Mono**: Utilizamos la función `wavfile.write` para guardar el archivo de audio en formato `.wav`.

### Código para Guardar el Archivo

El siguiente código realiza el proceso de guardado:


In [None]:
# Crear el directorio de salida si no existe.
os.makedirs(audio_output_path, exist_ok=True)  # Crea el directorio de salida si no existe, con exist_ok=True para evitar errores si ya existe.

# Guardamos el archivo mono a un fichero de tipo wav.
wavfile.write(  # Utiliza wavfile.write para guardar el archivo de audio.
    filename=os.path.join(audio_output_path, 'breaking_bad_mono.wav'),  # Especifica la ruta y el nombre del archivo de salida.
    rate=sample_rate,  # Especifica la frecuencia de muestreo del archivo de audio.
    data=new_data_mono  # Especifica los datos de audio que se van a guardar.
)

## Vamos a escucharlo de nuevo

En esta sección, vamos a reproducir el audio convertido a mono para notar las diferencias con el audio estéreo original.

In [None]:
IPython.display.Audio(new_data_mono, rate=sample_rate)  # Reproduce el audio mono utilizando la frecuencia de muestreo original.

Se nota que ahora es sonido mono (sobre todo si se utilizan cascos).

### Diferencias entre Audio Mono y Estéreo

<ul>
    <li><b>Mono</b>: Se escucha lo mismo por el auricular derecho que por el izquierdo.</li>
    <li><b>Estéreo</b>: No se escucha el mismo sonido por ambos canales, sino que se notan variaciones entre los dos.</li>
</ul>

**Audio Mono**:
- Utiliza un solo canal para la reproducción del sonido.
- El mismo sonido se reproduce por igual en ambos altavoces o auriculares.
- Es más simple y ocupa menos espacio de almacenamiento en comparación con el audio estéreo.
- Ideal para situaciones donde la localización del sonido no es importante, como en llamadas telefónicas o altavoces de baja calidad.

**Audio Estéreo**:
- Utiliza dos canales independientes para la reproducción del sonido.
- Los sonidos pueden ser diferentes en el altavoz izquierdo y derecho, creando una sensación de espacialidad y profundidad.
- Es más complejo y ocupa más espacio de almacenamiento en comparación con el audio mono.
- Ideal para música y películas, donde la localización del sonido y la calidad de la experiencia auditiva son importantes.

En resumen, la principal diferencia radica en la cantidad de canales utilizados: el audio mono utiliza un solo canal, mientras que el audio estéreo utiliza dos canales, proporcionando una experiencia auditiva más rica y envolvente.

Vamos a ver las diferencias en tamaño de cada archivo.

In [None]:
# Mostrar el tamaño del archivo de audio estéreo original.
!ls -sh audio/_input/breaking_bad.wav  # Lista el tamaño del archivo breaking_bad.wav en el directorio de entrada.

# Mostrar el tamaño del archivo de audio convertido a mono.
!ls -sh audio/_output/breaking_bad_mono.wav  # Lista el tamaño del archivo breaking_bad_mono.wav en el directorio de salida.

Como podemos ver, el tamaño del archivo de audio se ha reducido a la mitad al convertirlo de estéreo a mono, manteniendo la misma frecuencia de muestreo. 

### Frecuencia de Muestreo (*Sample Rate*)

La frecuencia de muestreo es la cantidad de muestras de audio que se toman por segundo para representar una señal de audio digitalmente. Se mide en Hertz (Hz) y determina la calidad y la fidelidad del audio digital. Una frecuencia de muestreo más alta significa una mejor calidad de audio, ya que captura más detalles de la señal original.

En este caso, la frecuencia de muestreo del archivo de audio es de 44.1 kHz, lo que significa que se toman 44,100 muestras por segundo.

Mostramos por pantalla la frecuencia de muestreo (*sample rate*) del archivo de audio:

In [None]:
# Imprime la frecuencia de muestreo en kHz
print(f'Frecuencia de muestreo (sample rate): {sample_rate/1000} kHz\n')

## Visualización de Audio Estéreo y Mono

En esta sección, vamos a visualizar las formas de onda del audio estéreo y del audio mono en el dominio del tiempo.

### Gráfica del Audio Estéreo

La gráfica del audio estéreo muestra las formas de onda de los dos canales (izquierdo y derecho) del archivo de audio original. Cada canal se representa con una línea diferente en la gráfica.

### Gráfica del Audio Mono

La gráfica del audio mono muestra la forma de onda del archivo de audio convertido a mono. En este caso, la forma de onda es una combinación de los dos canales originales, calculada como la media de ambos.

### Código para Generar las Gráficas

El siguiente código crea una figura con dos subplots: uno para el audio estéreo y otro para el audio mono. Cada subplot muestra la forma de onda correspondiente en el dominio del tiempo.

In [None]:
# Crear una figura con dos subplots.
fig, axs = plt.subplots(2, 1, figsize=(15, 10))  # Crea una figura con dos subplots, uno encima del otro, y define el tamaño de la figura.

# Gráfica del audio estéreo.
axs[0].plot(audio_data[:1000, 0], label='Canal 1')  # Grafica los primeros 1000 puntos del primer canal del audio estéreo.
axs[0].plot(audio_data[:1000, 1], label='Canal 2')  # Grafica los primeros 1000 puntos del segundo canal del audio estéreo.
axs[0].set_title('Audio Estéreo en el Dominio del Tiempo')  # Establece el título del subplot para el audio estéreo.
axs[0].set_xlabel('Muestras')  # Establece la etiqueta del eje x para el subplot del audio estéreo.
axs[0].set_ylabel('Amplitud')  # Establece la etiqueta del eje y para el subplot del audio estéreo.
axs[0].legend()  # Muestra la leyenda del subplot del audio estéreo.

# Gráfica del audio mono.
axs[1].plot(new_data_mono[:1000], label='Mono', color='orange')  # Grafica los primeros 1000 puntos del audio mono.
axs[1].set_title('Audio Mono en el Dominio del Tiempo')  # Establece el título del subplot para el audio mono.
axs[1].set_xlabel('Muestras')  # Establece la etiqueta del eje x para el subplot del audio mono.
axs[1].set_ylabel('Amplitud')  # Establece la etiqueta del eje y para el subplot del audio mono.
axs[1].legend()  # Muestra la leyenda del subplot del audio mono.

# Mostrar la gráfica.
plt.tight_layout()  # Ajusta el diseño de la figura para que los subplots no se solapen.
plt.show()  # Muestra la figura con los subplots.

### Diferencia entre audio estéreo y mono

**Audio Mono**:
- El audio mono (monofónico) utiliza un solo canal para la reproducción del sonido.
- En un sistema de audio mono, el mismo sonido se reproduce por igual en ambos altavoces o auriculares.
- Es más simple y ocupa menos espacio de almacenamiento en comparación con el audio estéreo.
- Es ideal para situaciones donde la localización del sonido no es importante, como en llamadas telefónicas o altavoces de baja calidad.

**Audio Estéreo**:
- El audio estéreo (estereofónico) utiliza dos canales independientes para la reproducción del sonido.
- En un sistema de audio estéreo, los sonidos pueden ser diferentes en el altavoz izquierdo y derecho, creando una sensación de espacialidad y profundidad.
- Es más complejo y ocupa más espacio de almacenamiento en comparación con el audio mono.
- Es ideal para música y películas, donde la localización del sonido y la calidad de la experiencia auditiva son importantes.

En resumen, la principal diferencia radica en la cantidad de canales utilizados: el audio mono utiliza un solo canal, mientras que el audio estéreo utiliza dos canales, proporcionando una experiencia auditiva más rica y envolvente.