# Tarea 3: Introducción al análisis y procesamiento de audio con python

## Análisis de audio con Python y Jupyterlab:

In [None]:
# Importamos cada una de las librerias que necesitamos para realizar la tarea.
from scipy.io import wavfile
import IPython
import os
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# Aquí definimos los directorios donde guardaremos los audios con los que vamos a trabajar.
cwd = os.getcwd()
audio_input_path = os.path.join(cwd, os.path.join('audio', '_input'))
audio_output_path = os.path.join(cwd, os.path.join('audio', '_output'))
print(f'Directorio con los audios de entrada: {audio_input_path}')
print(f'Directorio donde guardaremos los audios generados: {audio_output_path}\n')

In [None]:
# Cargamos el archivo de audio .wav en este caso.
filename = os.path.join(audio_input_path, 'breaking_bad.wav')

sample_rate_1, audio_data = wavfile.read(filename)
print(f'Frecuencia de muestreo (sample rate_1): {sample_rate_1/1000} kHz')

In [None]:
# En este caso, mostramos el audio que hemos cargado.
IPython.display.Audio(audio_data.T, rate=sample_rate_1) # .T se pasa únicamente si es audio estéreo.

In [None]:
# En este punto se calcula cada una de las características del audio 'estereo'.
print('Datos de audio (estereo):')
print(f'- Tamaño:     {audio_data.shape}')
print(f'- 1º canal:   {audio_data[:5, 0]}...')
print(f'- 2º canal:   {audio_data[:5, 1]}...')
print(f'- Resolucion: {type(audio_data[0,0])}\n')

In [None]:
# Convertimos a mono mediante la media por canal (simplificacion) y mostramos las características del audio mono.
new_data_mono = audio_data.mean(axis=1)
print('Nuevos datos de audio (mono):')
print(f'- Nuevo tamaño: {new_data_mono.shape}')
print(f'- Canal unico:  {new_data_mono[:5]}...')

# Mantenemos la misma resolucion que antes.
new_data_mono = new_data_mono.astype(np.int16)
print(f'- Resolucion:   {type(new_data_mono[0])}\n')


In [None]:
# Guardamos el archivo mono a un fichero de tipo wav.
wavfile.write(
    filename=os.path.join(audio_output_path, 'breaking_bad_mono.wav'),
    rate=sample_rate_1,
    data=new_data_mono
)


In [None]:
# En este caso, mostramos el audio mono que hemos cargado.
IPython.display.Audio(new_data_mono, rate=sample_rate_1)

In [None]:
# En este punto se muestran las diferencias de tamaño entre cada punto.
!ls -sh audio/_input/breaking_bad.wav
!ls -sh audio/_output/breaking_bad_mono.wav

In [None]:
# Además, mostramos la frecuencia de muestreo del archivo de audio mono.
print(f'Frecuencia de muestreo (sample rate): {sample_rate_1/1000} kHz\n')

In [None]:
# En este punto, mostramos el número de muestras del audio estéreo y mono que se van a coger para realizar la grafica en el dominio del tiempo. 
ampl_values_1 = len(audio_data)
ampl_values_2 = len(new_data_mono)
print(f'Número de muestras del audio estereo (valores de amplitud): {ampl_values_1}')
print(f'Número de muestras del audio mono (valores de amplitud): {ampl_values_2}')

In [None]:
# A continuación, se construye un array que representa el eje 'X' del tiempo en la 
# grabación de audio, para ello se utiliza la función numpy.arange(). 
t1 = np.arange(0, ampl_values_1/sample_rate_1, 1/sample_rate_1)
t2 = np.arange(0, ampl_values_2/sample_rate_1, 1/sample_rate_1)

In [None]:
# Se imprimen los valores de los arrays t1 y t2, que contienen los instantes de tiempo en los que se tomaron las muestras de la señal de audio.
print(t1)
print(t2)

In [None]:
# Por último, se crea una figura con dos gráficos que muestran la señal de audio en el dominio del tiempo para dos tasas de muestreo diferentes.
fig, ax = plt.subplots(2, 1, figsize=(12, 6), sharex=True)

# Solo mostramos las primeras 50 muestras de amplitud (por claridad).
end = 50

# Señal a 48 kHz.
ax[0].plot(t1[:end], audio_data[:end], marker='X')
ax[0].set_title(f'Audio en el dominio del tiempo muestreado a {sample_rate_1} Hz')
ax[0].set_ylabel('Amplitud')
ax[0].grid(True)

# Señal a 24 kHz.
# Utilizamos ratio para ajustar el eje x de ambas gráficas
# ya que la fs es menor en esta señal.
ratio = sample_rate_1 / sample_rate_1 
ax[1].plot(t2[:int(end/ratio)], new_data_mono[:int(end/ratio)], c='tab:red', marker='X')
ax[1].set_title(f'Audio en el dominio del tiempo muestreado a {sample_rate_1} Hz')
ax[1].set_xlabel('Tiempo (s)')
ax[1].set_ylabel('Amplitud')
ax[1].grid(True)

# Mostramos la figura.
plt.tight_layout()
plt.show()
