# Análisis de Señales - Transformada de Fourier

## 1. Identificación de Notas Musicales con Audio Real

* Cargaremos una grabación de audio .wav (Notas musicales de una guitarra RE, MI, SOL)
* Obtendremos la variación temporal de la señal de audio
* Encontraremos la frecuencia dominante y la compararemos con los rangos de frecuencias de las notas musicales

In [46]:
# Reproducimos el sonido que vamos a cargar

import winsound
filename='rec_RE.wav'                                
winsound.PlaySound(filename, winsound.SND_FILENAME)   

# Leemos el archivo digital de audio del directorio

import scipy.io.wavfile as waves
samplerate, data = waves.read(filename)                       
Audio_m = data[:,0]              

# Tomamos la longitud de la señal

L = len(Audio_m)                                      

# Definimos un vector de tiempo de la misma longitud de la señal

import numpy as np
n = np.arange(0,L)/samplerate

In [47]:
from matplotlib import pyplot as plt
plt.plot(n,Audio_m)
plt.xlabel("Time(s)")
plt.ylabel("Amplitude")
plt.show()

In [48]:
# Calculamos la Transformada de Fourier

#%matplotlib notebook

from scipy.fft import rfft, rfftfreq

yf = rfft(Audio_m)
xf = rfftfreq(L, 1 / samplerate)

# Dibujamos el espectro de frecuencia del archivo de audio

plt.plot(xf, np.abs(yf))
plt.xlabel("Frequency (Hz)")
plt.ylabel("Amplitud")
plt.show()

In [49]:
from scipy.fft import fft, fftfreq, rfft, rfftfreq, irfft

In [50]:
# Tarea 1: Grafique el espectro de frecuencia de 0 a 5000 Hz.
normalized_tone = np.int16((Audio_m/Audio_m.max())*32767)

plt.plot(normalized_tone[:1000])
plt.xlabel("Tiempo (s)")
plt.ylabel("Amplitude")
plt.show()

In [51]:
yf = fft(normalized_tone)
xf = fftfreq(L, 1 / samplerate)

In [52]:
plt.plot(xf, np.abs(yf))
plt.xlabel("Frecuencia (Hz)")
plt.show()

In [53]:
plt.plot(xf, np.abs(yf))
plt.xlabel("Frecuencia (Hz)")
plt.xlim([0, 5000])
plt.show()

In [54]:
# Tarea 2: Determine el espectro de frecuencia para la nota MI.

filename='rec_MI.wav'                                
winsound.PlaySound(filename, winsound.SND_FILENAME)   

# Leemos el archivo digital de audio del directorio

samplerate, data = waves.read(filename)                       
Audio_m = data[:,0]              

# Tomamos la longitud de la señal

L = len(Audio_m)                                      

# Definimos un vector de tiempo de la misma longitud de la señal

n = np.arange(0,L)/samplerate

In [55]:
plt.plot(n,Audio_m)
plt.xlabel("Time(s)")
plt.ylabel("Amplitude")
plt.show()

In [56]:
normalized_tone = np.int16((Audio_m/Audio_m.max())*32767)

plt.plot(normalized_tone[:1000])
plt.xlabel("Tiempo (s)")
plt.ylabel("Amplitude")
plt.show()

In [57]:
yf = fft(normalized_tone)
xf = fftfreq(L, 1 / samplerate)

In [58]:
plt.plot(xf, np.abs(yf))
plt.xlabel("Frecuencia (Hz)")
plt.show()

In [59]:
plt.plot(xf, np.abs(yf))
plt.xlabel("Frecuencia (Hz)")
plt.xlim([0, 5000])
plt.show()

In [60]:
# Tarea 3: Determine el espectro de frecuencia para la nota SOL.
filename='rec_SOL.wav'                                
winsound.PlaySound(filename, winsound.SND_FILENAME)   

# Leemos el archivo digital de audio del directorio

samplerate, data = waves.read(filename)                       
Audio_m = data[:,0]              

# Tomamos la longitud de la señal

L = len(Audio_m)                                      

# Definimos un vector de tiempo de la misma longitud de la señal

n = np.arange(0,L)/samplerate

In [61]:
plt.plot(n,Audio_m)
plt.xlabel("Time(s)")
plt.ylabel("Amplitude")
plt.show()

In [62]:
normalized_tone = np.int16((Audio_m/Audio_m.max())*32767)

plt.plot(normalized_tone[:1000])
plt.xlabel("Tiempo (s)")
plt.ylabel("Amplitude")
plt.show()

In [63]:
yf = fft(normalized_tone)
xf = fftfreq(L, 1 / samplerate)

In [64]:
plt.plot(xf, np.abs(yf))
plt.xlabel("Frecuencia (Hz)")
plt.show()

In [65]:
plt.plot(xf, np.abs(yf))
plt.xlabel("Frecuencia (Hz)")
plt.xlim([0, 5000])
plt.show()

## 2. Analisis Espectral en Tiempo Real Usando Entrada de Micrófono

* Instalaremos PyAudio para la adquicisión de audio en tiempo real
* Leemos la señal del micrófono en paquetes de tamaño especificado por el parámetro FRAMES y con frecuencia Fs
* Calculamos la FFT para cada paquete leido, mostramos la gráfica temporal y el espectro de la señal
* Calculamos la Frecuencia Dominante para cada paquete leido


In [66]:
%pip install PyAudio

Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 23.2.1 -> 23.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [67]:
import matplotlib
import pyaudio as pa 
import struct
from scipy.fft import fft

matplotlib.use('TkAgg')

FRAMES = 1024*8                                   # Tamaño del paquete a procesar
FORMAT = pa.paInt16                               # Formato de lectura INT 16 bits
CHANNELS = 1
Fs = 44100                                        # Frecuencia de muestreo típica para audio

p = pa.PyAudio()

stream = p.open(                                  # Abrimos el canal de audio con los parámeteros de configuración
    format = FORMAT,
    channels = CHANNELS,
    rate = Fs,
    input=True,
    output=True,
    frames_per_buffer=FRAMES
)

## Creamos una gráfica con 2 subplots y configuramos los ejes

fig, (ax,ax1) = plt.subplots(2)

x_audio = np.arange(0,FRAMES,1)
x_fft = np.linspace(0, Fs, FRAMES)

line, = ax.plot(x_audio, np.random.rand(FRAMES),'r')
line_fft, = ax1.semilogx(x_fft, np.random.rand(FRAMES), 'b')

ax.set_ylim(-32500,32500)
ax.ser_xlim = (0,FRAMES)

Fmin = 1
Fmax = 5000
ax1.set_xlim(Fmin,Fmax)

fig.show()


F = (Fs/FRAMES)*np.arange(0,FRAMES//2)                 # Creamos el vector de frecuencia para encontrar la frecuencia dominante

while True:
    
    data = stream.read(FRAMES)                         # Leemos paquetes de longitud FRAMES
    dataInt = struct.unpack(str(FRAMES) + 'h', data)   # Convertimos los datos que se encuentran empaquetados en bytes
    
    line.set_ydata(dataInt)                            # Asignamos los datos a la curva de la variación temporal
    
    M_gk = abs(fft(dataInt)/FRAMES)            # Calculamos la FFT y la Magnitud de la FFT del paqute de datos

    
    ax1.set_ylim(0,np.max(M_gk+10)) 
    line_fft.set_ydata(M_gk)                           # Asigmanos la Magnitud de la FFT a la curva del espectro 
    
    M_gk = M_gk[0:FRAMES//2]                           # Tomamos la mitad del espectro para encontrar la Frecuencia Dominante
    Posm = np.where(M_gk == np.max(M_gk))
    F_fund = F[Posm]                                   # Encontramos la frecuencia que corresponde con el máximo de M_gk
    
    print(int(F_fund))                                 # Imprimimos el valor de la frecuencia dominante

    fig.canvas.draw()
    fig.canvas.flush_events()

OSError: [Errno -9996] Invalid input device (no default output device)

## 3. Análisis espectral de la voz de una persona.


Grabe un audio con su voz pronunciando la siguiente frase: "Mi nombre es NOMBRE APELLIDO, tengo XX años, y estudio la carrera de Sistemas de Información". Con este archivo digital de su voz, determine el espectro de frecuencia de su registro de voz. Recomendación, grabe en formato .wav.

In [None]:
# Tarea 4: Escriba su código aquí.