# Formatear anotaciones y audio para reconocimiento de patrones

Este documento describe un paso a paso para usar anotaciones y registros sonoros para crear un set de datos fáciles de usar en un flujo de trabajo de Machine Learning. Las anotaciones siguen el formato Darwin Core de eventos de monitoreo y están alojados en la infraestructura de de datos.

## Dependencias
----

Paquetes necesarios para correr este script:
- Python >= 3.5
- Pandas >= 0.24
- Librosa >= 0.6

## Annotaciones manuales
----

Para acceder a estas noataciones es necesario pedir autorización a la I2D.
- http://i2d.humboldt.org.co/ceiba/resource.do?r=rbb_aves_cesar_2017
- http://i2d.humboldt.org.co/ceiba/resource.do?r=rbb_aves_guajira_2016
- http://i2d.humboldt.org.co/ceiba/resource.do?r=rbb_aves_bolivar_2017

## Registros sonoros
Los registros sonoros se encuentran alojados en la [colección de sonidos ambientales (CSA)](http://www.humboldt.org.co/es/noticias/actualidad/item/152-coleccion-de-sonidos-ambientales). Para acceder a estos es necesario pedir permiso escribiendo a coleccionesbiologicas@humboldt.org.co


## 1. Cargar librerías y funciones
----

In [None]:
import pandas as pd
import librosa
from os import path

def load_format_excel(fname):
    df = pd.read_excel(fname)
    
    cols_idx = ['genus','specificEpithet', 'infraspecificEpithet',
                'record number',
                'Valor de la medida (Calidad Corte)',
                'Valor de la medida (Duración en segundos)',
                'Valor de la medida (Tiempo Inicial en Segundosundos)',
                'Valor de la medida (Tiempo final en Segundosundos)',
                'Valor de la medida (Tipo de Canto)']
    
    
    df = df.loc[:,cols_idx]
    df['sp_name'] = df['genus'] + ' ' + df['specificEpithet']
    return df

## 2. Ajustar variables
----

In [None]:
path_annot = '../annotations/test.xlsx'
path_dir_save = '../audio_regions/'
path_audio = '../audio/'
path_metadata = '../audio_regions/audio_metadata.csv'
troom = 1 # room before and after audio region in seconds
fs =22050

## 3. Realizar cortes en cada archivo de audio
----

Dar nuevo formato al DataFrame según archivos de audio

In [None]:
df = load_format_excel(path_annot)
df = df.loc[df['record number'].notna(),:]
gpby = df.groupby('record number')

Ciclo recorriendo cada archivo y segmentando cada vocalización anotada

In [None]:
# For each group of annotations in an audio file
for fname, df_gp in gpby:
    audio_fname = path_audio + fname
    if path.exists(audio_fname):
        print('Loading file', audio_fname)
        s, fs = librosa.load(audio_fname, sr=fs)
        
    else:
        print('File not found, skipping:\n', audio_fname)
    # For each annotation
    for idx, row in df_gp.iterrows():
        fname_save = row['genus']+'_'+row['specificEpithet']+'_'+str(idx).zfill(3)+'.wav'
        print('Processing: ', fname_save)
        # segment and save audio
        tlims = [int(row['Valor de la medida (Tiempo Inicial en Segundosundos)']*fs), 
                 int(row['Valor de la medida (Tiempo final en Segundosundos)']*fs)]
        s_cut = s[tlims[0]-troom*fs:tlims[1]+troom*fs]
        librosa.output.write_wav(y=s_cut,
                                 path=path_dir_save+fname_save,
                                 sr=fs)