# Extaer características audios libreria SCIPY

SciPy es un paquete científico que nos permite hacer uso de funciones que usaremos en este caso para extraer las siguientes características de los audios:

- 1º y 2º derivada de la frecuencia fundamental.
- Jitter
- Shimmer
- APQ 
- PPQ
- Energía logaritmica
- Amplitud media del audio
- Duración del audio

Autor: Maider Murugarren Ilundain

Antes de empezar se instalará la librería

In [3]:
#!pip install scipy

In [1]:
# Importamos los paquetes necesarios para la ejecución completa.
import os
import numpy as np
import pandas as pd
import csv
from scipy.io import wavfile
from scipy.stats import skew, kurtosis
from scipy.signal import butter, lfilter, freqz

In [10]:
def extraer_caracteristicas_Spicy(ruta, nombre_csv):
    '''
    El código consistira en un bucle for que irá recorriendo todos los audios disponibles para extraer 
    de cada uno las características de nuestro interes, almacenarlas en un diccionario. Y finalmente 
    generar un archivo ".csv" donde se almacenarán las características de cada audio de forma ordenada.
    
    Parámetros:
    - ruta: directorio de la localización de los audios a analizar.
    - nombre_csv: nombre con el que se almacenarán los datos en el csv.
    
    '''
    
    archivos_audio = os.listdir(ruta)
    
    # Diccionario para meter als características
    caract_dict = {}
    
    for archivo in archivos_audio:
        
        # Obtener el ID y el tipo del archivo
        tipo = archivo[-5]
        ID = archivo[:5]
        
        ID_array = np.array([ID])
        tipo_array = np.array([tipo])

        # Cargar el archivo
        fs, audio = wavfile.read(os.path.join(ruta, archivo))
        
        # Extraer la duración 
        duracion = len(audio) / fs
        umbral_duracion = 1.0  
        
        # Umbral de duración en segundos, para asignar un valor nulo a lso audios vacios
        if duracion < umbral_duracion:
            caract_dict[archivo] = [None] * 9
            continue
        
        # Extraer la 1ª y 2ª derivada fundamental
        ff1 = np.gradient(audio)
        ff2 = np.gradient(ff1)
        
        # Extraer jitter
        jitter = np.mean(np.abs(np.diff(audio))) / np.mean(audio)
        
        # Extraer shimmer
        shimmer = np.mean(np.abs(np.diff(ff1))) / np.mean(np.abs(ff1))
        
        
        # Extraer APQ y PPQ
        apq = np.sum(np.square(np.abs(ff1))) / len(ff1)
        ppq = np.sum(np.square(np.abs(ff2))) / len(ff2)
        
        # Extraer la amplitud media del audio
        ama_mean = np.mean(np.abs(audio))
        
        # Extraer log-energy
        energy = np.sum(np.square(audio))
        log_energy = np.log(energy)
        
        # Almacenar las características en el diccionario
        caract_dict[archivo] = np.concatenate((ID_array, tipo_array, np.mean(ff1).reshape(-1,1)[0],
                                               np.mean(ff2).reshape(-1,1)[0], 
                                               jitter.reshape(-1,1)[0], 
                                               shimmer.reshape(-1,1)[0], 
                                               log_energy.reshape(-1,1)[0], 
                                               apq.reshape(-1,1)[0], 
                                               ppq.reshape(-1,1)[0], 
                                               ama_mean.reshape(-1,1)[0], 
                                               np.array([duracion]).reshape(-1,1)[0]), axis=0)
    
    
    carpeta_csv = "caracteríticas_Spicy"
    
    # Escribir el contenido del diccionario en un archivo CSV
    with open(carpeta_csv+"/"+nombre_csv, 'w', newline='') as archivo_csv:
        writer = csv.writer(archivo_csv, delimiter=';')
        
        # Determinar los valores de als columans
        writer.writerow(['archivo', 'ID','tipo', 'ff1', 'ff2', 'jitter', 'shimmer', 'log_energy', 'apq', 'ppq', 'Amplitud media', 'duracion'])
        
        # Introducir los valroes del directorio en el csv
        for archivo, caracteristicas in caract_dict.items():
            writer.writerow([archivo] + list(caracteristicas))


In [11]:
# Función para llamar a cada subconjunto de datos de forma automática
def carac_spicy(tipo):
    """
    Llamar a cada directorio para acceder a todos los audios, creando a la vez el nombre de los csv donde 
    se almacenan las características extraidas en cada caso..

    Parámetros:
    - tipo: El número para acceder a todos los tipos de audios.

    Retorna:
    - La extracción de las características por la función anterior.
    """
    
    # Indicamos la carpeta base donde están todos los audios.
    carpeta_base = "Tipos_audios"
    # Completamos las posibles rutas con el tipo de audios.
    if (tipo == '1'):
        carpeta_tipo = carpeta_base+"/vocal_A_1/"
    elif (tipo == '2'):
        carpeta_tipo = carpeta_base+"/vocal_I_2/"
    elif (tipo == '3'):
        carpeta_tipo = carpeta_base+"/vocal_U_3/"
    elif (tipo == '4'):
        carpeta_tipo = carpeta_base+"/palabra_campana_4/"
    elif (tipo == '5'):
        carpeta_tipo = carpeta_base+"/palabra_gato_5/"
    elif (tipo == '6'):
        carpeta_tipo = carpeta_base+"/palabra_petaca_6/"
    
    # Se crea el nombre del csv a almacenar
    nombre_csv = "caracteristicas_audios_Scipy_"+tipo+".csv"
    
    return extraer_caracteristicas_Spicy(carpeta_tipo, nombre_csv)

In [13]:
# Llamamos a todas las carpetas de los audios
carac_spicy('1')
carac_spicy('2')
carac_spicy('3')
carac_spicy('4')
carac_spicy('5')
carac_spicy('6')

  log_energy = np.log(energy)
