In [1]:
import pyaudio
import os
import struct
import numpy as np
import matplotlib.pyplot as plt
from scipy.fftpack import fft
import time
from tkinter import TclError

import sys #Nuevo

In [2]:
# para mostrar en una ventana aparte
%matplotlib tk

# Constantes
CHUNK = 1024 * 2             # Numero de muestras
FORMAT = pyaudio.paInt16     # formato del audio Int 16
CHANNELS = 1                 # solo 1 canal de audio
RATE = 44100                 # muestras por segundo

In [None]:
# Crear multiples imagenes con sus ejes
fig, (ax1, ax2) = plt.subplots(2, figsize=(15, 7))

#Instancia pyaudio
p = pyaudio.PyAudio()

# stream object formado por la recoleccion del microfono
stream = p.open(
    format=FORMAT,
    channels=CHANNELS,
    rate=RATE,
    input=True,
    output=True,
    frames_per_buffer=CHUNK
)

# Variables para el ploteo
x = np.arange(0, 2 * CHUNK, 2)       # Muestras
xf = np.linspace(0, RATE, CHUNK)     # Frecuencias

# Inicia con una linea random
line, = ax1.plot(x, np.random.rand(CHUNK), '-', lw=2)

# Grafica semi logaritmica para visualizar mejor las frecuencias
line_fft, = ax2.semilogx(xf, np.random.rand(CHUNK), '-', lw=2)

# Rango de las senales -32k a 32k
# Amplitud limite +/- 4k
AMPLITUDE_LIMIT = 4096

# labels en la senal
ax1.set_title('AUDIO WAVEFORM')
ax1.set_xlabel('samples')
ax1.set_ylabel('volume')
ax1.set_ylim(-AMPLITUDE_LIMIT, AMPLITUDE_LIMIT)
ax1.set_xlim(0, 2 * CHUNK)
plt.setp(ax1, xticks=[0, CHUNK, 2 * CHUNK], yticks=[-AMPLITUDE_LIMIT, 0, AMPLITUDE_LIMIT])

# labels en el spectrograma
ax2.set_xlabel('Frecuencias')
ax2.set_ylabel('Amplitud')
ax2.set_xlim(20, RATE / 12) #cambio de 2

print('Recoleccion iniciada')

#Tiempo de recoleccion
frame_count = 0
start_time = time.time()


while True:
    # Captado de datos en binario
    data = stream.read(CHUNK)   
    
    #Conversion a enteros
    data_int=np.frombuffer(data, dtype='h')
    data_np = np.array(data_int, dtype='h')
    
    line.set_ydata(data_np)
    
    # Calculo del FFT
    yf = fft(data_np)
    line_fft.set_ydata(np.abs(yf[0:CHUNK])  / (512 * CHUNK))
    
    
    #Identificacion del pico mas grande del vector de FFT
    f_vec=RATE*np.arange(CHUNK/2)/(CHUNK) #vector de frecuencias
    mic_low_freq=40 #Sensibilidad minima del microfono
    low_freq_loc=np.argmin(np.abs(f_vec-mic_low_freq))
    fft_data=(np.abs(np.fft.fft(data_int))[0:int(np.floor(CHUNK/2))])/CHUNK
    
    max_loc=np.argmax(fft_data[low_freq_loc:])+low_freq_loc
    
    #Deteccion de la nota musical en un minimo de frecuencias
    if 980<=f_vec[max_loc] <=990:
        print("B5    SI")
    if 865<=f_vec[max_loc] <=895:
        print("A5    LA")
    if 775<=f_vec[max_loc] <=800:
        print("G5    SOL")
    if 690<=f_vec[max_loc] <=710:
        print("F5    FA")
    if 650<=f_vec[max_loc] <=670:
        print("E5    MI")
    if 585<=f_vec[max_loc] <=595:
        print("D5    RE")
    if 515<=f_vec[max_loc] <=550:
        print("C5    DO")
    if 490<=f_vec[max_loc] <=500:
        print("B4    SI")
    if 437<=f_vec[max_loc] <=447:
        print("A4    LA")
    if 390<=f_vec[max_loc] <=400:
        print("G4    SOL")
    if 345<=f_vec[max_loc] <=355:
        print("F4    FA")
    if 325<=f_vec[max_loc] <=335:
        print("E4    MI")
    if 290<=f_vec[max_loc] <=300:
        print("D4    RE")
    if 255<=f_vec[max_loc] <=280:
        print("C4    DO")
    if 243<=f_vec[max_loc] <=253:
        print("B3    SI")
    if 215<=f_vec[max_loc] <=225:
        print("A3    LA")
    if 192<=f_vec[max_loc] <=202:
        print("G3    SOL")
    if 172<=f_vec[max_loc] <=177:
        print("F3    FA")
    if 162<=f_vec[max_loc] <=167:
        print("E3    MI")
    if 144<=f_vec[max_loc] <=150:
        print("D3    RE")
    if 127<=f_vec[max_loc] <=133:
        print("C3    DO")
    
    #Actualizacion de graficas
    try:
        fig.canvas.draw()
        fig.canvas.flush_events()
        frame_count += 1
        
    except TclError:
        
        #Frecuencia promedio
        frame_rate = frame_count / (time.time() - start_time)
        
        print('Recoleccion final')
        print('Promedio de frame rate = {:.0f} FPS'.format(frame_rate))
        break

Recoleccion iniciada
C5    DO
C5    DO
C3    DO
C3    DO
C3    DO
C3    DO
C3    DO
C3    DO
C3    DO
C3    DO
C3    DO
E5    MI
C5    DO
C3    DO
C3    DO
A3    LA
G5    SOL
C3    DO
C3    DO
A3    LA
A3    LA
A3    LA
G5    SOL
E5    MI
E5    MI
E5    MI
G5    SOL
G5    SOL
G5    SOL
G5    SOL
G5    SOL
G5    SOL
G5    SOL
