In [8]:
import os
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np

# Directorio que contendrá los espectrogramas
directorio_espectrogramas = 'espectogramas'


# Directorio que contiene los archivos de audio
directorio_audio = '/Volumes/Nexus/Audio/Biblioteca Audio/pajaros/'

# Lista de archivos de audio en el directorio
archivos_audio = os.listdir(directorio_audio)

# Itera sobre cada archivo
for archivo in archivos_audio:
    # Carga el archivo de audio
    audio_path = os.path.join(directorio_audio, archivo)
    y, sr = librosa.load(audio_path)
    
    # Calcula el espectrograma de Mel
    S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128)
    log_S = librosa.power_to_db(S, ref=np.max)
    
    # Guarda el espectrograma en la carpeta
    nombre_espectrograma = f"{os.path.splitext(archivo)[0]}_espectrograma.png"
    ruta_espectrograma = os.path.join(directorio_espectrogramas, nombre_espectrograma)
    
    plt.figure(figsize=(12, 4))
    librosa.display.specshow(log_S, sr=sr, x_axis='time', y_axis='mel')
    plt.title(f'Espectrograma de Mel - {archivo}')
    plt.colorbar(format='%+02.0f dB')
    plt.savefig(ruta_espectrograma)  # Guarda el espectrograma como imagen
    plt.close()  # Cierra la figura para liberar memoria
    
print("Espectrogramas guardados en la carpeta especificada.")



Espectrogramas guardados en la carpeta especificada.


In [None]:
import librosa
import numpy as np

# Cargar el archivo de audio
audio_path = 'tu_archivo_de_audio.wav'
y, sr = librosa.load(audio_path)

# Generar el espectrograma de Mel
S = librosa.feature.melspectrogram(y, sr=sr, n_mels=128)
S_dB = librosa.power_to_db(S, ref=np.max)

# Definir el tamaño de la ventana en columnas (21 columnas para 1 segundo)
tamaño_ventana = 21

# Calcular el número de ventanas posibles en el espectrograma
num_ventanas = S_dB.shape[1] // tamaño_ventana

# Extraer las ventanas del espectrograma
ventanas = np.array([S_dB[:, i*tamaño_ventana:(i+1)*tamaño_ventana] for i in range(num_ventanas)])

# Ahora 'ventanas' contiene las secciones del espectrograma listas para ser usadas con una CNN


In [13]:
import os
import librosa
import numpy as np

# Directorio que contiene los archivos de audio
directorio_audio ='/Volumes/Nexus/Audio/Biblioteca Audio/pajaros/'
directorio_imagenes ='espectogramas/'
# Lista de archivos de audio en el directorio
archivos_audio = os.listdir(directorio_audio)

# Función para convertir audio a espectrograma de Mel
def audio_to_mel(audio_path):
    y, sr = librosa.load(audio_path)
    mel_spec = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128)
    log_S = librosa.power_to_db(mel_spec, ref=np.max)
    return log_S

# Crear ventanas de 21 columnas de ancho
tamaño_ventana = 21

# Iterar sobre cada archivo de audio
for archivo in archivos_audio:
    audio_path = os.path.join(directorio_audio, archivo)
    espectrograma = audio_to_mel(audio_path)
    
    # Calcular el número de ventanas posibles en el espectrograma
    num_ventanas = espectrograma.shape[1] // tamaño_ventana
    
    # Extraer las ventanas
    ventanas = np.array([espectrograma[:, i*tamaño_ventana:(i+1)*tamaño_ventana] for i in range(num_ventanas)])
    
    # Aquí puedes guardar o procesar las ventanas según tus necesidades
# Iterar sobre cada archivo de audio
for archivo in archivos_audio:
    audio_path = os.path.join(directorio_audio, archivo)
    espectrograma = audio_to_mel(audio_path)
    
    # Calcular el número de ventanas posibles en el espectrograma
    num_ventanas = espectrograma.shape[1] // tamaño_ventana
    
    # Extraer las ventanas
    ventanas = np.array([espectrograma[:, i*tamaño_ventana:(i+1)*tamaño_ventana] for i in range(num_ventanas)])
    
    # Guardar las ventanas en archivos (por ejemplo, en formato .npy)
    for i, ventana in enumerate(ventanas):
        nombre_archivo = f"ventana_{i}.npy"
        ruta_archivo = os.path.join(directorio_guardado, nombre_archivo)
        np.save(ruta_archivo, ventana)

    # Por ejemplo, entrenar una CNN con estas ventanas
    
print("Proceso de automatización completado.")


Proceso de automatización completado.


In [7]:
import librosa
import librosa.display
import matplotlib.pyplot as plt
import os

# Parámetros para la conversión a escala logarítmica
parametros = {
    'biotico': {'A': 0.001, 'B': 10.0},
    'antropogenico': {'A': 0.025, 'B': 2.0}
}

# Función para convertir audio a espectrograma Mel y aplicar escala logarítmica
def audio_a_espectrograma_mel(audio_path, tipo_sonido):
    # Cargar el archivo de audio
    y, sr = librosa.load(audio_path, sr=None)
    
    # Calcular el espectrograma Mel
    S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=32, hop_length=int(sr/21))
    
    # Aplicar la fórmula logarítmica con los parámetros correspondientes
    A = parametros[tipo_sonido]['A']
    B = parametros[tipo_sonido]['B']
    S_log = np.log(A + B * S)
    
    # Devolver tanto el espectrograma logarítmico como la tasa de muestreo
    return S_log, sr

# Directorio que contiene los archivos de audio
directorio_audio = 'audio/'

# Directorio donde se guardarán las imágenes de los espectrogramas
directorio_imagenes = 'imagenes/'

# Asegúrate de que el directorio de imágenes existe
os.makedirs(directorio_imagenes, exist_ok=True)

# Procesar cada archivo de audio y guardar los espectrogramas como imágenes
for archivo in archivos_audio:
    audio_path = os.path.join(directorio_audio, archivo)
    
    # Suponiendo que el tipo de sonido se puede determinar a partir del nombre del archivo
    tipo_sonido = 'biotico' if 'bio' in archivo else 'antropogenico'
    
    # Convertir a espectrograma Mel y obtener la tasa de muestreo
    S_log, sr = audio_a_espectrograma_mel(audio_path, tipo_sonido)
    
    # Guardar el espectrograma como imagen
    save_path = os.path.join(directorio_imagenes, f"{os.path.splitext(archivo)[0]}_espectrograma.png")
    plt.figure(figsize=(10, 4))
    librosa.display.specshow(S_log, sr=sr, x_axis='time', y_axis='mel')
    plt.colorbar(format='%+2.0f dB')
    plt.title(f"Espectrograma Mel - {archivo}")
    plt.tight_layout()
    plt.savefig(save_path)
    plt.close()

print("Todos los espectrogramas se han guardado como imágenes.")



Todos los espectrogramas se han guardado como imágenes.
