In [2]:
%pip install ipywidgets numpy matplotlib scipy soundfile


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: C:\Users\deluc\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\python.exe -m pip install --upgrade pip


In [3]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.signal import butter, lfilter
import soundfile as sf
import ipywidgets as widgets
from IPython.display import display, Audio
import os
import random

# Función para generar una señal de tono (senoidal)
def generate_tone(freq, duration, sr):
    t = np.linspace(0, duration, int(sr * duration), endpoint=False)
    tone = np.sin(2 * np.pi * freq * t)
    return tone

# Función para cargar un archivo de audio. Si no se encuentra, genera un tono.
def load_audio(file_path, duration=3.0, sr=44100):
    if os.path.exists(file_path):
        try:
            signal, fs = sf.read(file_path)
            if signal.ndim > 1:
                signal = signal.mean(axis=1)  # convertir estéreo a mono
        except Exception as e:
            print("Error al leer el archivo, generando tono en su lugar. Error:", e)
            freq = random.uniform(100, 1000)
            print(f"Generando tono de frecuencia: {freq:.2f} Hz")
            signal = generate_tone(freq, duration, sr)
            fs = sr
    else:
        freq = random.uniform(100, 1000)
        print(f"Archivo no encontrado. Generando tono de frecuencia: {freq:.2f} Hz")
        signal = generate_tone(freq, duration, sr)
        fs = sr
    return signal, fs

# Función básica de distorsión: amplifica y recorta
def apply_basic_distortion(signal, distortion):
    """
    Aplica una distorsión básica a la señal, consistente en amplificar y recortar.
    
    Parámetros:
      - signal: array numpy con la señal de audio.
      - distortion: parámetro (de 0 a 1) que controla el grado de amplificación.
    
    Devuelve:
      - clipped: señal distorsionada tras la amplificación y el clipping.
    """
    # Normalizar la señal para asegurar que esté en el rango [-1, 1].
    signal = signal / np.max(np.abs(signal))
    
    # Calcular el factor de amplificación (drive).
    drive = 1 + distortion * 10  # drive varía de 1 a 11.
    amplified = drive * signal
    
    # Clipping duro: recortar la señal a un umbral fijo.
    threshold = 0.5
    clipped = np.clip(amplified, -threshold, threshold)
    
    return clipped

# Función para graficar comparativamente en 2 gráficos: uno en tiempo y otro en frecuencia.
def plot_signals(original, processed, sr, time_xlim, freq_xlim):
    t = np.linspace(0, len(original) / sr, len(original))
    N = len(original)
    f = np.fft.rfftfreq(N, d=1/sr)
    
    # Se calcula la magnitud del FFT para cada señal.
    orig_fft = np.abs(np.fft.rfft(original))
    proc_fft = np.abs(np.fft.rfft(processed))
    
    # Normalizamos cada espectro por separado (cada uno de 0 a 1).
    orig_fft_norm = orig_fft / np.max(orig_fft)
    proc_fft_norm = proc_fft / np.max(proc_fft)
    
    fig, axes = plt.subplots(2, 1, figsize=(12, 8))
    
    # Gráfico combinado en el dominio del tiempo.
    axes[0].plot(t, original, color='blue', label='Original')
    axes[0].plot(t, processed, color='red', label='Distorsionada')
    axes[0].set_title("Comparación en dominio del tiempo")
    axes[0].set_xlabel("Tiempo (s)")
    axes[0].set_ylabel("Amplitud")
    axes[0].set_xlim(time_xlim)
    axes[0].legend()
    
    # Gráfico combinado en el dominio de la frecuencia (usando los espectros normalizados).
    axes[1].plot(f, orig_fft_norm, color='blue', label='Original')
    axes[1].plot(f, proc_fft_norm, color='red', label='Distorsionada')
    axes[1].set_title("Comparación en dominio de la frecuencia (normalizado)")
    axes[1].set_xlabel("Frecuencia (Hz)")
    axes[1].set_ylabel("Magnitud normalizada")
    axes[1].set_xlim(freq_xlim)
    axes[1].legend()
    
    plt.tight_layout()
    plt.show()

# Función interactiva utilizando la distorsión básica.
def interactive_basic_distortion(file_path, distortion, time_zoom, freq_zoom):
    sr = 44100
    signal, sr = load_audio(file_path, duration=3.0, sr=sr)
    processed = apply_basic_distortion(signal, distortion)
    
    # Graficar las señales.
    plot_signals(signal, processed, sr, time_zoom, freq_zoom)
    
    # Mostrar reproductores de audio para la señal original y la distorsionada.
    print("Señal Original:")
    display(Audio(signal, rate=sr))
    print("Señal Distorsionada:")
    display(Audio(processed, rate=sr))

# Creación de los widgets interactivos.
file_path_widget = widgets.Text(value='wp-clean.wav', description='Archivo:')
distortion_slider = widgets.FloatSlider(value=0.5, min=0, max=1, step=0.01, description='Distorsión:')

# Sliders para ajustar el zoom en tiempo y frecuencia.
time_zoom_slider = widgets.FloatRangeSlider(value=[0, 3], min=0, max=3, step=0.01, description='Zoom Tiempo:')
freq_zoom_slider = widgets.FloatRangeSlider(value=[0, 8000], min=20, max=8000, step=10, description='Zoom Frec:')

# Organizar los widgets en una caja vertical.
ui = widgets.VBox([file_path_widget, distortion_slider, time_zoom_slider, freq_zoom_slider])
out = widgets.interactive_output(interactive_basic_distortion, {
    'file_path': file_path_widget,
    'distortion': distortion_slider,
    'time_zoom': time_zoom_slider,
    'freq_zoom': freq_zoom_slider
})

# Mostrar la interfaz y la salida.
display(ui, out)




VBox(children=(Text(value='wp-clean.wav', description='Archivo:'), FloatSlider(value=0.5, description='Distors…

Output()