# Configurar el repositorio de Github, conda y JupyterLab

## 1 Crear un repositorio vacio de Github para la tarea y clonarlo en local

Para este paso, inicio sesión en github y le doy a new para crear un nuevo repositorio, sin
seleccionar ninguna opción ya que queremos que esté inicialmente vacío.

Para clonarlo : `git clone https://github.com/Israel-akka-Rasi/Tarea3SM.git`

## 2 Crear un entorno de conda para trabajar con el repositorio

Para crear el entorno ejecuto el siguiente comando : `conda create --name entornoIsra`

## 3 Añadir la carpeta .ipynb_checkpoints/ al .gitignore para ignorarla.

En este paso, accedemos a la carpeta de nuestrro repositorio local y creamos el fichero gitignore con
el comando : `sudo nano gitignore`

Dentro de gitignore introducimos la carpeta que queremos que sea ignorada, en este
caso : .ipynb_checkpoints/

## 4 Activar el entorno conda creado.
    
Para activar el entorno : `conda activate entornoIsra`

## 5 Instalar Python 3.10, ipykernel y JupyterLab en el entorno.

Antes de nada, debemos asegurarnos de que nuestro entorno está activado.
    
- Para instalar Python 3.10 : `conda install python=3.10`
- Para instalar ipykernel : `conda install ipykernel`
- Para instalar JupyterLab : `conda install -c conda-forge jupyterlab`

## 6 Añadir el entorno conda a los kernels de JupyterLab.
    
Para añadir el entorno al kernel de Jupyter : `python3 -m ipykernel install --user --name=entornoIsra`

## 7 Instalar JupyterLab en el entorno conda.
    
Basta con ejecutar el comando : `conda install jupyter`

## 8 Ejecutar JupyterLab y crear un notebook vacío, seleccionando como kernel el entorno de conda creado anteriormente.
    
Para ejecutar JupyterLab ejecutamos el comando : `jupyter-lab`

Una vez dentro de jupyter-lab, creamos un notebook vacío y nos aparecerá la opción de escoger el
kernel, donde selecciono el que creé previamente llamado entornoIsra

![Seleccion de kernel](kernel.png)

## 9 Juega con el notebook para familiarizarte con los tres tipos de celda: Code, Markdown, y Raw. Prueba a ejecutar códigos sencillos de Python.

Este ejercicio se puede ver en el notebook llamado "PruebaEj9"


# Análisis de audio con Python y JupyterLab

El primer paso es importar las librerias necesarias para poder trabajar con archivos de audio

In [None]:
# Importacion.
# import librosa
from scipy.io import wavfile
import IPython
import os
import numpy as np


## Especificar directorios de entrada y salida

En esta parte definimos el directorio donde tenemos los archivos de audio con los que trabajaremos y el directorio donde guardaremos los archivos que generemos.

In [None]:
#Directorios que usaremos
cwd = os.getcwd()#Obtengo el directorio actual
audio_input_path = os.path.join(cwd, os.path.join('audio', 'examples'))
audio_output_path = os.path.join(cwd, os.path.join('audio', '_output'))
print(f'Directorio con los audios de entrada: {audio_input_path}')
print(f'Directorio donde guardaremos los audios generados: {audio_output_path}\n')

## Cargar el archivo de audio

En este caso, cargaremos un archivo .wav, el cual es un archivo de audio sin comprimir (máxima calidad y gran tamaño de archivo). Típicamente utilizado en edición de audio debido a su fidelidad.

In [None]:
import librosa

In [None]:
#Cargamos el archivo de audio.
filename = os.path.join(audio_input_path, 'interstellarStereo.wav')
#audio_data, sample_rate = librosa.load(filename, sr=None, mono=False)
sample_rate, audio_data = wavfile.read(filename) #Sample_rate = frecuencia de muestreo / audio_data = datos de audio
print(f'Frecuencia de muestreo (sample rate): {sample_rate/1000} kHz')

A continuación, escucharemos dicho archivo de audio

In [None]:
#Escuchar el audio
IPython.display.Audio(audio_data.T, rate=sample_rate) # .T se pasa únicamente si es audio estéreo.

## Mostrar características de la onda

Primero mostraremos las características de la onda en audio estéreo

In [None]:
#Mostrar informacion (sonido estéreo = 2 canales).
print('Datos de audio (estereo):')
print(f'- Tamaño:     {audio_data.shape}')
print(f'- 1º canal:   {audio_data[:5, 0]}...')
print(f'- 2º canal:   {audio_data[:5, 1]}...')
print(f'- Resolucion: {type(audio_data[0,0])}\n')

Ahora mostraremos las características de la onda en audio mono, que se hará calculando la media por canal

In [None]:
#Calcular la media por canal para obtener un sonido mono.
# Convertimos a mono mediante la media por canal (simplificacion).
new_data_mono = audio_data.mean(axis=1)  # Column-wise.
print('Nuevos datos de audio (mono):')
print(f'- Nuevo tamaño: {new_data_mono.shape}')
print(f'- Canal unico:  {new_data_mono[:5]}...')

In [None]:
# Mantenemos la misma resolucion que antes.
new_data_mono = new_data_mono.astype(np.int16)
print(f'- Resolucion:   {type(new_data_mono[0])}\n')

## Guardar el archivo pasado a sonido mono

Este paso se hace para luego poder observar la diferencia entre ambos archivos de audio

In [None]:
# Guardamos el archivo mono a un fichero de tipo wav.
wavfile.write(
    filename=os.path.join(audio_output_path, 'interstellar-mono.wav'),
    rate=sample_rate,
    data=new_data_mono
)

In [None]:
#Volvemos a escucharlo, como es mono no le pasamos la .T
IPython.display.Audio(new_data_mono, rate=sample_rate)

Podemos observar que el tamaño se ha reducido a la mitad, pero manteniendo la frecuencia de muestreo

In [None]:
#Vemos la diferencia de tamaño en cada archivo
!ls -sh audio/examples/interstellar.wav
!ls -sh audio/_output/interstellar-mono.wav

In [None]:
#Frecuencia de muestreo
print(f'Frecuencia de muestreo (sample rate): {sample_rate/1000} kHz\n')

## Mostrar la gráfica en el dominio del tiempo para el audio mono y estéreo.

El primer paso para este apartado es importar las librerías necesarias

In [None]:
import librosa
import matplotlib.pyplot as plt

Antes de empezar con las gráficas, es necesario guardar las rutas de nuestros archivos, además de cargar dichos archivos de audio y crear las figuras y los ejes que nos permitan representar las gráficas

In [None]:
# Rutas a los archivos de audio
ruta_audio_estereo = "audio/examples/interstellarStereo.wav"
ruta_audio_mono = "audio/_output/interstellar-mono.wav"

# Cargar archivos de audio
audio_estereo, sample_rate_estereo = librosa.load(ruta_audio_estereo, sr=None, mono=False)
audio_mono, sample_rate_mono = librosa.load(ruta_audio_mono, sr=None, mono=True)

# Crear figuras y ejes
fig, axs = plt.subplots(2, 1, figsize=(10, 8))

# Gráfica para audio estéreo
tiempo_estereo = librosa.times_like(audio_estereo)
axs[0].plot(tiempo_estereo, audio_estereo[0], label='Canal Izquierdo')
axs[0].plot(tiempo_estereo, audio_estereo[1], label='Canal Derecho')
axs[0].set_title('Audio Estéreo')
axs[0].set_xlabel('Tiempo (s)')
axs[0].set_ylabel('Amplitud')
axs[0].legend()

# Gráfica para audio mono
tiempo_mono = librosa.times_like(audio_mono)
axs[1].plot(tiempo_mono, audio_mono)
axs[1].set_title('Audio Mono')
axs[1].set_xlabel('Tiempo (s)')
axs[1].set_ylabel('Amplitud')

# Ajustar el diseño de las subplots
plt.tight_layout()

# Mostrar las gráficas
plt.show()

# Tarea 4
## Mostrar la gráfica en el dominio del tiempo para el audio mono y estéreo.

Este ejercicio lo realicé la semana anterior, se puede observar en el apartado anterior a este.

## Explicar con tus palabras:
### Frecuencia de muestreo

Velocidad a la que tomamos las muestras de una onda.

### Aliasing

Deformación de la onda que se produce cuando tomamos menos de 2 muestras por ciclo.

### Profundidad de bits

La profundidad de bits se refiere a la cantidad de bits utilizados para representar la amplitud de una muestra.

### Ancho de banda

Como el ancho de banda = frecuencia de muestreo + profundidad de bits, se puede definir como el rango de frecuencias que abarca la onda.

### Tasa de bits

La tasa de bits se entiende como la cantidad de bits que se transmiten por unidad de tiempo.

## Aplicar la Transformada de Fourier a un audio mono

Primero importo las librerías necesarias.

In [None]:
import numpy as np
import scipy.io.wavfile as wavfile
import matplotlib.pyplot as plt

In [None]:
#Aplicar la transformada de Fourier y obtener la frecuencia para representar la gráfica
Fs, audio = wavfile.read("audio/_output/interstellar-mono.wav")
n = len(audio)

tf_audio = np.fft.fft(audio)
abs_Fourier = np.absolute(tf_audio[:n//2])

#Crear y mostrar la grafica
plt.plot(np.linspace(0, Fs/2, n//2), abs_Fourier )
plt.xlabel('Frecuencia (Hz)', labelpad=10)
plt.ylabel('Amplitud', labelpad=10)
plt.title('Transformada de Fourier a un audio mono')
plt.show()


## Calcular la energía del espectrograma y la frecuencia de corte eligiendo un epsilon 


In [None]:
# Definimos una lista con diferentes epsilons para ir probando
eps = [1e-5, .02, .041, .063, .086, .101, .123]

eps = eps[1]
print(f'Epsilon: {eps}')

#Calculo el valor de corte para esta energia
energia_thr = (1 - eps) * np.sum(abs_Fourier)
print(f'Valor de corte para la energia del espectro: {energia_thr}')

energia = np.cumsum(abs_Fourier)

frecuencias_eliminadas = energia_thr < energia
print(f'Máscara: {frecuencias_eliminadas}')

#Frecuencia f0 por la que cortamos el espectro
f0 = (len(frecuencias_eliminadas) - np.sum(frecuencias_eliminadas)) * (Fs/2) / (n//2)
print(f'Frecuencia de corte f0 (Hz): {int(f0)}')

# Hacemos la grafica
plt.axvline(f0, color='r')
plt.plot(np.linspace(0, Fs/2, n//2), abs_Fourier)
plt.ylabel('Amplitud')
plt.xlabel('Frecuencia (Hz)')
plt.show()

### Comentario sobre la gráfica

A medida que voy variando epsilon, la barra roja vertical va cambiando de poisición. Esto se debe a que cada vez que cambio epsilon, se cambia tambien el umbral de energía acumulada que se utiliza para determinar la frecuencia de corte.

## Comprimir la onda aplicando downsampling, donde el factor se obtiene a partir de la frecuencia de corte anteriormente calculada

In [None]:
# Audio que vamos a comprimir
audio_comprimido = "interstellarComprimido.wav"
# Calculo el factor D
D = int(Fs / f0)
print(f'Factor de Downsampling: {D}')

# Obtengo los nuevos datos
nuevos_datos = audio[::D]

# Escribo los nuevos datos a un archivo .wav
wavfile.write(
    filename=os.path.join(audio_output_path, audio_comprimido),
    rate=int(Fs/D),
    data=nuevos_datos
)

# Cargo el nuevo archivo
new_sample_rate, new_audio_data = wavfile.read(filename=os.path.join(audio_output_path, audio_comprimido))

Ahora vamos a escuchar el audio

In [None]:
IPython.display.Audio(new_audio_data, rate=new_sample_rate)

## Mostrar el espectrograma de ambas ondas

In [None]:
fig, ax = plt.subplots(2, 1, figsize=(12, 8), sharex=True)

Pxx, freqs, bins, im = ax[0].specgram(audio, NFFT=1024, Fs=sample_rate, noverlap=512)
ax[0].set_title('Espectograma del audio original')
ax[0].set_ylabel('Frecuencia (Hz)')
ax[0].grid(True)

Pxx, freqs, bins, im = ax[1].specgram(new_audio_data, NFFT=1024, Fs=new_sample_rate, noverlap=512)
ax[1].set_title('Espectrograma del audio reducido/comprimido')
ax[1].set_xlabel('Tiempo (s)')
ax[1].set_ylabel('Frecuencia (Hz)')
ax[1].grid(True)

plt.tight_layout()
plt.show()


## Mostrar el tamaño de los archivos

In [None]:
# Obtener el tamaño del archivo original en MB
size_original_mb = os.path.getsize(os.path.join(audio_input_path, 'interstellarStereo.wav')) / (1024 * 1024)
print(f'Tamaño del archivo original: {size_original_mb:.2f} MB')

# Obtener el tamaño del archivo comprimido en MB
size_comprimido_mb = os.path.getsize(os.path.join(audio_output_path, 'interstellarComprimido.wav')) / (1024 * 1024)
print(f'Tamaño del archivo comprimido: {size_comprimido_mb:.2f} MB')

## Colocar también dos widgets para reproducir los audios

In [None]:
import ipywidgets as widgets
from IPython.display import display, Audio


In [None]:
# Función para cargar y mostrar un archivo de audio
def mostrar_audio(ruta):
    display(Audio(filename=ruta))

# Rutas a los archivos de audio
ruta_audio_original = "audio/examples/interstellarStereo.wav"
ruta_audio_comprimido = "audio/_output/interstellarComprimido.wav"

# Crear widgets para reproducir los audios
boton_audio_original = widgets.Button(description="Reproducir Audio Original")
boton_audio_comprimido = widgets.Button(description="Reproducir Audio Comprimido")

# Definir acciones al hacer clic en los botones
def reproducir_audio_original(_):
    mostrar_audio(ruta_audio_original)

def reproducir_audio_comprimido(_):
    mostrar_audio(ruta_audio_comprimido)

boton_audio_original.on_click(reproducir_audio_original)
boton_audio_comprimido.on_click(reproducir_audio_comprimido)

# Mostrar los botones
display(widgets.HBox([boton_audio_original, boton_audio_comprimido]))