***

In [None]:
from scipy.io import wavfile
import IPython
import os
import numpy as np

### Directorios de entrada y salida

Estos directorios se especifican para indicar de dónde se extraerán los ficheros de sonido a procesar y dónde se volcarán los audios modificados.

In [None]:
cwd = os.getcwd()
audio_input_path = os.path.join(cwd, os.path.join('audio', 'examples'))
audio_output_path = os.path.join(cwd, os.path.join('audio', '_output'))
print(f'Directorio con los audios de entrada: {audio_input_path}')
print(f'Directorio donde guardaremos los audios generados: {audio_output_path}\n')

### Cargar el archivo de audio

Diferencias entre formatos de archivo para almacenar audio digital.

<ul>
    <li><b>Formato .wav</b>: Este formato permite tener un archivo de audio sin comprimir por lo que no se pierde información por el camino consiguiendo máxima calidad y por lo tanto el tamaño del archivo es grande.</li>
    <li><b>Formato .mp3</b>: Este formato permite tener un archivo de audio comprimido por lo que, a diferencia del anterior formato, éste tiene pérdida de calidad aunque reduce el tamaño del archivo final.</li>
</ul>

Considerando el directorio de entrada de audios indicados anteriormente, se carga un archivo de audio .wav.

In [None]:
# Se carga el archivo de audio.
filename = os.path.join(audio_input_path, 'breaking_bad.wav')
sample_rate, audio_data = wavfile.read(filename)

print(f'Frecuencia de muestreo (sample rate): {sample_rate/1000} kHz')

Se indica la frecuencia de muestreo para poder reproducir el audio procesado.

In [None]:
IPython.display.Audio(audio_data.T, rate=sample_rate) # .T se pasa únicamente si es audio estéreo.

### Mostrar principales características de la onda

Al ser un audio estéreo se escuchará por ambos canales de diferente manera.

In [None]:
# Mostrar informacion (sonido estéreo).
print('Datos de audio (estereo):')
print(f'- Tamaño:     {audio_data.shape}')
print(f'- 1º canal:   {audio_data[:5, 0]}...')
print(f'- 2º canal:   {audio_data[:5, 1]}...')
print(f'- Resolucion: {type(audio_data[0,0])}\n')

Para convertir el audio de estéreo a mono se calcula la media por canal consiguiendo que el audio salga de la misma manera por ambos canales.

In [None]:
# Se convierte a mono mediante la media por canal (simplificacion).
new_data_mono = audio_data.mean(axis=1)  # Column-wise.
print('Nuevos datos de audio (mono):')
print(f'- Nuevo tamaño: {new_data_mono.shape}')
print(f'- Canal unico:  {new_data_mono[:5]}...')

# Se mantiene la misma resolucion que antes.
new_data_mono = new_data_mono.astype(np.int16)
print(f'- Resolucion:   {type(new_data_mono[0])}\n')

Vamos a guardarlo.

In [None]:
# Se guarda el archivo mono a un fichero de tipo wav.
wavfile.write(
    filename=os.path.join(audio_output_path, 'sample1_mono.wav'),
    rate=sample_rate,
    data=new_data_mono
)

Vamos a escucharlo de nuevo.

In [None]:
velocidad=1
IPython.display.Audio(new_data_mono, rate=sample_rate*velocidad)

 El audio al convertirse a formato .wav se aprecia que el sonido es mono: 

<ul>
    <li><b>Si es Mono</b>: se escucha exactamente lo mismo por ambos audífonos.</li>
    <li><b>Si es Estéreo</b>: no se escucha lo mismo por ambos canales, sino que se notan variaciones entre ellos.</li>
</ul>

El tamaño del audio varía en función del tipo de sonido que sea, si es mono o estéreo. 

In [None]:
!ls -sh audio/_input/sample1_stereo.wav
!ls -sh audio/_output/sample1_mono.wav

El tamaño se ha reducido a la mitad (manteniendo el la frecuencia de muestreo). Mostramos por pantalla la frecuencia de muestreo (*sample rate*) del archivo de audio: 

In [None]:
print(f'Frecuencia de muestreo (sample rate): {sample_rate/1000} kHz\n')