# Sesión 3 de SM: Introducción al análisis de audio con Python

---

# Configuración del Repositorio de GitHub, Conda y JupyterLab

## 0. Clonado del repositorio Github
- Se clona y se accede al repositorio de la tarea.

```bash
git clone https://github.com/MiguelMC-UNEX/Tarea3SM.git
```

```bash
cd Tarea3SM
```

## 1. Crear un entorno de Conda:

- Se creó el entorno `tarea3Miguel`.
```python
conda create --name tarea3Miguel
```  

## 2. Añadir la carpeta .ipynb_checkpoints/ al .gitignore:

- Se añade `.ipynb_checkpoints/` a `.gitignore`.

## 3. Activar el entorno Conda creado:

- En la terminal, se activa el entorno conda con:
```python
conda activate tarea3Miguel
```


## 4. Instalar Python 3.10, ipykernel y JupyterLab:

- Con el entorno activado, se ejecuta

```python
conda install python=3.10 ipykernel jupyterlab
```


```python
python3 -m ipykernel install --user --name=tarea3Miguel
```


## 5. Ejecutar JupyterLab y crear un notebook vacío:

- En la terminal (con el entorno activado), se ejecuta:

```bash
jupyter-lab
```



***

# Carga del audio (Desarrollo de la práctica)

<center><img src="img/mono_vs_stereo_diagram.jpg" alt="missing" width=500></center>

## Importar librerías y módulos de Python

<b>Nota</b>: Estas no son las únicas librerías de Python con las que se pueden trabajar para el procesamiento de archivos de audio (otro ejemplo podría ser <a href="https://librosa.org/doc/latest/index.html">Librosa</a>). Si alguien está familiarizado con otras librerías puede utilizarlas.

Importamos las librerías/módulos específicos de la siguiente forma, para pode trabajar con los ficheros de audio.

In [None]:
# Importacion.
# import librosa
from scipy.io import wavfile
import IPython
import os
import numpy as np

## Especificar directorios de entrada y salida

- Aquí definimos los directorios donde guardaremos los audios con los que vamos a trabajar, así como dónde se van a guardar aquellos que generamos a lo largo de la práctica.
- Lo haremos obteniendo el directorio actual y uniendo los path para obtener las ubicaciones de carga y salida de los ficheros de entrada y salida.

In [None]:
# Directorios que usaremos.
cwd = os.getcwd()
audio_input_path = os.path.join(cwd, os.path.join('audio', 'examples'))  # cambiar '_input' por 'examples'
audio_output_path = os.path.join(cwd, os.path.join('audio', '_output'))
print(f'Directorio con los audios de entrada: {audio_input_path}')
print(f'Directorio donde guardaremos los audios generados: {audio_output_path}\n')

## Cargar el archivo de audio estéreo

### Diferencias
Diferencias entre formatos de archivo para almacenar audio digital.

<ul>
    <li><b>.wav</b>: Archivo de audio sin comprimir (máxima calidad y gran tamaño de archivo). Típicamente utilizado en edición de audio debido a su fidelidad.</li>
    <li><b>.mp3</b> (por ejemplo): Archivo de audio comprimido (con pérdidas pero menor tamaño). Ampliamente usado.</li>
</ul>

### Carga del fichero
- Cargamos el archivo de audio the_last_of_us_reduced.wav en este caso.

In [None]:
# Cargamos el archivo de audio.
filename = os.path.join(audio_input_path, 'the_last_of_us_reduced.wav')
# audio_data, sample_rate = librosa.load(filename, sr=None, mono=False)
sample_rate, audio_data = wavfile.read(filename)
print(f'Frecuencia de muestreo (sample rate): {sample_rate/1000} kHz')

audio_datag = audio_data

Vamos a escucharlo. Para que esto se haga correctamente, hay que indicarle la frecuencia de muestreo (veremos más adelante qué es).

## Mostrar principales características de la onda del audio estéreo
### Explicación
Vamos a mostrar la información. Nota: es audio estereo (dos canales).

- con el `ls sh` mostramos el tamaño en MB
- Dividiendo la tasa de muestreo `sample_rate` entre 1000 obtenemos la frecuencia de muestreo.
- Accediendo a distintas posiciones de `audio_data` accedemos a los canales del audio.

In [None]:
# Mostrar informacion (sonido estéreo).
print('Datos de audio (estereo):')
!ls -sh audio/examples/the_last_of_us_reduced.wav
print(f'Frecuencia de muestreo (the_last_of_us_reduced.wav): {sample_rate/1000} kHz\n')
print(f'- 1º canal:   {audio_data[:5, 0]}...')
print(f'- 2º canal:   {audio_data[:5, 1]}...')
print(f'- Resolucion: {type(audio_data[0,0])}\n')


## Incluisión del widget para reproducir el audio estéreo.
### Explicación
- Lo haremos con `IPython.display.Audio` para poder generar el `widget` y así poder escuchar el audio, incluyendo la opción `.T` para audio estéreo.

In [None]:
IPython.display.Audio(audio_data.T, rate=sample_rate) # .T se pasa únicamente si es audio estéreo.

## Conversión del audio estéreo a mono
Por simplificación, para hacerlo vamos a calcular la media por canal para obtener un sonido mono. Para ello hacemos la media por columnas con `audio_data.mean(axis=1)` o que es lo mismo la `media por canal`.

In [None]:
# Convertimos a mono mediante la media por canal (simplificacion).
new_data_mono = audio_data.mean(axis=1)  # Column-wise.
print('Nuevos datos de audio (mono):')
print(f'- Nuevo tamaño: {new_data_mono.shape}')
print(f'- Canal unico:  {new_data_mono[:5]}...')

# Mantenemos la misma resolucion que antes.
new_data_mono = new_data_mono.astype(np.int16)
print(f'- Resolucion:   {type(new_data_mono[0])}\n')

Vamos a guardarlo.

In [None]:
# Guardamos el archivo mono a un fichero de tipo wav.
wavfile.write(
    filename=os.path.join(audio_output_path, 'sample1_mono.wav'),
    rate=sample_rate,
    data=new_data_mono
)

## Incluisión del widget para reproducir el audio mono.
### Explicación
- Lo haremos con `IPython.display.Audio` para poder generar el `widget` y así poder escuchar el audio.

In [None]:
IPython.display.Audio(new_data_mono, rate=sample_rate)

# Explicación del código de las gráficas 


## Instalamos pillow y matplolib si no lo tenemos en nuestro entorno (como es el caso)

In [None]:
pip install pillow


In [None]:
pip install matplotlib

## Explicación del código y diferencia entre audio esteréo y mono.
### Diferencia entre audio esteréo y mono
- El `audio esteréo` tiene dos canales y es una onda sobre otra y tiene una doble fuente de sonido y más de un canal, mientras que el `audio mono` solo tiene un canal y es solo una onda.

### Explicación del código

- 1. Utilizamos `matplotlib`, para graficar el audio mono y estéreo, con un tamaño de gráfica de `10x4`.
- 2. En cuanto al `audio estéreo`, al ser dos canales tenemos que ajustar las dimensiones en función del tiempo / la tasa de muestreo.
- 3. Como se ha comentado el `audio estéreo` al tener dos canales, tendremos que graficar cada uno, como ya hemos definido una función tiempo, con ella sabiendo que el `Canal Izquierdo` está en la posición cero y `Canal Derecho` en la posición uno, podremos graficarlas y así obtendremos la gráfica del `audio estéreo`. 

In [None]:
import matplotlib.pyplot as plt
import numpy as np


# Para el audio mono
plt.figure(figsize=(10, 4))
plt.plot(np.arange(len(new_data_mono)) / sample_rate, new_data_mono)
plt.title('Audio Mono en el Dominio del Tiempo')
plt.xlabel('Tiempo (s)')
plt.ylabel('Amplitud')
plt.grid(True)
plt.show()

# Para el audio estéreo
if len(audio_data.shape) == 2 and audio_data.shape[1] == 2:  # Verifica si los datos son estéreo
    plt.figure(figsize=(10, 4))
    tiempo = np.arange(audio_data.shape[0]) / sample_rate  # Ajusta la dimensión de tiempo
    plt.plot(tiempo, audio_data[:, 0], label='Canal Izquierdo')
    plt.plot(tiempo, audio_data[:, 1], label='Canal Derecho')
    plt.title('Audio Estéreo en el Dominio del Tiempo')
    plt.xlabel('Tiempo (s)')
    plt.ylabel('Amplitud')
    plt.legend()
    plt.grid(True)
    plt.show()
else:
    print("Los datos no son estéreo o no tienen dos canales.")

