## Birdsongs 08.- Preprocesando Datos - Convirtiendo Datos a Imágenes


Convierte cada uno de los ficheros de datos en espectrogramas, para utilizarlas posteriormente en el entrenamiento del modelo.
Un espectrograma es un formato común de representación de audio, donde se muestra un gráfico de dos dimensiones, donde el eje X representa el tiempo, el eje Y representa las frecuencias y los colores representan una tercera dimensión correspondiente a la energía.

>El [**espectrograma**](https://es.wikipedia.org/wiki/Espectrograma) consiste en coger un determinado número de muestras por medio de una ventana temporal, con un tamaño concreto, según el tipo de análisis que se haga de la señal, armónico o resonante, la ventana deberá tener un tamaño determinado. A continuación se hace el cálculo del contenido frecuencial de las muestras puestas en ventana, y se representan en una gráfica en tres dimensiones.

![directorio](./resources/spectrogram.png)


Un tipo concreto de espectrograma es el de [**mel**](https://www.quora.com/How-do-I-use-mel-spectrogram-as-the-input-of-a-CNN), que ajusta los bines de frecuencias a aquellos que percibimos a través del oído. Se suele usar en la mayoría de casos de reconocimiento de voz, ya que se asemeja más a como realmente oímos los humanos. 


Al tratarse de imágenes, pueden ser utilizadas para el entrenamiento de modelos utilizando redes neuronales convolucionales. Se han dado buenos resultados en modelos de reconocimiento de audios y de voz en humanos, y también se ha utilizado para la identificación de audios de aves.

* https://stackoverflow.com/questions/22471072/convolutional-neural-network-cnn-for-audio
* https://spark-in.me/post/bird-voice-recognition-five
* https://www.kdnuggets.com/2017/12/audio-classifier-deep-neural-networks.html

El resultado de este notebook es un repositorio de destino con los datos convertidos en imágenes. Si se corta el proceso, se puede volver a lanzar y continua generando el resto de imagenes que le falten.

Pueden tratarse los espectrogramas en formato array numpy generados por los notebooks:
* Birdsongs_06_Preprocesando_Datos_Convirtiendo_Audio_a_Datos
* Birdsongs_07_Preprocesando_Datos_Cortando_Datos



## 1.- Librerías

Cargamos las librerías a utilizar en el notebook.

Para la generación de los espectrogramas vamos a utilizar [**libROsa**](http://librosa.github.io/librosa/). Es una librería que nos permite convertir los audios en datos, y a su vez, transformarlos en información útil en el campo de análisis de señales: oscilogramas, espectrogramas, MFCC,...

> LibROSA is a python package for music and audio analysis. It provides the building blocks necessary to create music information retrieval systems.

      conda install -c conda-forge librosa 

In [None]:
# importar librerías
import numpy as np
import librosa
import librosa.display
import os


## 2.- Funciones

Funciones comunes utilizadas en el notebook

### Recupera directorios

Los ficheros de datos se encuentran localizados en un directorio raíz, y dentro del correspondiente subdirectorio al que pertenece la especie. Realizando un dir de los directorios contenidos en el directorio raíz, tendremos una lista con todas las especies que forman parte del dataset


In [2]:
#----------------------------------------------------------------------------
# get_specie_names(path)
#  argumentos: 
#      path: directorio de datos
#----------------------------------------------------------------------------
def get_specie_names(path):  
    specie_names = os.listdir(path)
    return specie_names

### Procesa ficheros de datos

Va procesando los ficheros de datos que existen en cada subdirectorio y va generando imágenes de los espectrogramas, guardando estos en el un directorio local de destino


In [3]:
#----------------------------------------------------------------------------
# data_to_image(datapath, imagepath)
#  argumentos: 
#      datapath: repositorio de datos origen
#      imagepath: repositorio destino de imagenes
#----------------------------------------------------------------------------
def data_to_image(datapath, imagepath):
    # crea el directorio raiz de datos si no existe
    if not os.path.exists(imagepath):
        os.mkdir(imagepath)

    # recupera la lista de especies (directorios) a tratar
    specie_names = get_specie_names(datapath)
    number_species = len(specie_names)
   
    # itera sobre cada directorio y va generando una imagen por cada fichero
    for idx, specie_name in enumerate(specie_names):
        # crea directorio destino de la especie, si no existe
        imagedir = os.path.join(imagepath, specie_name)
        if not os.path.exists(imagedir):
            os.mkdir(imagedir)

        # recupera los ficheros de datos existentes para esta especie
        specie_dir = os.path.join(datapath, specie_name)
        specie_files = os.listdir(specie_dir)
        number_files = len(specie_files)
        number_load = number_files
        
        print(' Specie name = {:14s} - {:3d}'.format(specie_name,idx),
               ", ",number_files," files in this specie", sep=" ", end='\r', flush=True)

        # itera sobre la lista de ficheros de datos recuperados
        printevery = 20
        
        for idx2, infilename in enumerate(specie_files):
            # fichero datos origen
            file_path = specie_dir + '/' + infilename
            file = np.load(file_path)

            # si no se ha generado previamente, procedemos a generarlo    
            imagefile = imagedir + '/' + infilename[:infilename.find('.')] + '.png'
            
            if not os.path.isfile(imagefile):
                image = librosa.display.specshow(file)
                image.figure.savefig(imagefile)
                image.clear()
                
            # muestra avance
            if (0 == idx2 % printevery):
                print('\r Processing specie: {:14s} ({:2d} of {:2d} species)'.format(specie_name,idx+1,number_species),
                       ", file ",idx2+1," of ",number_load,": ",file_path, sep=" ", end='\r', flush=True)


## 3.- Genera imágenes

Convierte los archivos de datos de un directorio en imagenes con formato png y las guardamos en un directorio local de destino

In [None]:
# repositorio fuente de datos
datapath= './data/mels'

# repositorio destino de imágenes
imagepath = './image/mels'

# genera imágenes
data_to_image(datapath, imagepath)
    