# Preparo da massa de áudios em formato WAV

### Referências

https://medium.com/@keur.plkar/audio-data-augmentation-in-python-a91600613e47

https://docs.python.org/3/library/argparse.html

https://www.w3schools.com/python/python_try_except.asp

In [1]:
import os
import sys
import numpy as np
import pandas as pd
import librosa
import librosa.display
import soundfile as sf
import matplotlib.pyplot as plt
import IPython.display as ipd

In [2]:
import warnings
warnings.filterwarnings('ignore')
#warnings.filterwarnings('ignore', category=DeprecationWarning)
#warnings.filterwarnings('ignore', category=FutureWarning)

In [3]:
# diretório de entrada
DIR_ENTRADA = 'mp3'

# diretório de saída
DIR_SAIDA = 'wavbal5'
DIR_SAIDA2 = 'wavbal5a'

# duração de cada trecho de áudio
DURACAO_TRECHO = 5 # segundos
SAMPLE_RATE = 16000 # 16 kHz

# calcular a quantidade de pontos na onda
PONTOS_ONDA = SAMPLE_RATE * DURACAO_TRECHO # 16 kHz * 5 s = 80000

## Verificar espécies disponíveis

In [4]:
ARQUIVO_ESPECIES = 'especies-oiapoque2.txt'

especies = []
with open(ARQUIVO_ESPECIES, 'r') as f:
    especies = [especie.rstrip().lower().replace(' ', '_') for especie in f.readlines()]
especies

['cacicus_cela',
 'pteroglossus_aracari',
 'tangara_episcopus',
 'dacnis_cayana',
 'ramphastos_tucanus',
 'tangara_palmarum',
 'pionus_fuscus',
 'trogon_melanurus',
 'glyphorynchus_spirurus',
 'cyclarhis_gujanensis',
 'lipaugus_vociferans',
 'pionites_melanocephalus',
 'aramides_cajaneus',
 'ramphastos_vitellinus',
 'cathartes_aura',
 'turdus_leucomelas',
 'amazona_farinosa',
 'thamnophilus_punctatus',
 'thamnomanes_ardesiacus',
 'euphonia_violacea',
 'pithys_albifrons',
 'tachycineta_albiventer',
 'mionectes_macconnelli',
 'hypocnemis_cantator',
 'leptotila_rufaxilla',
 'dacnis_lineata',
 'tyrannus_melancholicus',
 'trogon_viridis',
 'manacus_manacus',
 'geotrygon_montana',
 'piaya_cayana',
 'myiopagis_gaimardii',
 'chloroceryle_americana',
 'trogon_violaceus',
 'bucco_capensis',
 'myrmotherula_surinamensis',
 'myiarchus_ferox',
 'phaethornis_sp',
 'thamnophilus_murinus',
 'dryocopus_lineatus',
 'formicarius_colma',
 'micrastur_semitorquatus',
 'isleria_guttata',
 'selenidera_piperivo

In [20]:
arquivos = []
especies_disponiveis = []

for especie in especies:
    dir_especie = os.path.join(DIR_ENTRADA, especie)
    if os.path.isdir(dir_especie):
        arquivos.append(len(os.listdir(dir_especie)) - 1)
        especies_disponiveis.append(especie)

especies = especies_disponiveis

In [21]:
pd.set_option('display.max_rows', 100)

df = pd.DataFrame({
    'especie': especies,
    'arquivos_mp3': arquivos
})

df.sort_values('especie')

Unnamed: 0,especie,arquivos_mp3
16,amazona_farinosa,263
12,aramides_cajaneus,229
51,attila_spadiceus,418
59,automolus_infuscatus,121
34,bucco_capensis,52
0,cacicus_cela,295
66,campephilus_rubricollis,120
14,cathartes_aura,7
47,celeus_undatus,25
50,ceratopipra_erythrocephala,147


## Recriar diretórios de saída - Passo 1

## Processar arquivos de áudio - Passo 1

## Calcular quantidade de arquivos gerados

In [22]:
arquivos = []
for especie in especies:
    dir_especie = os.path.join(DIR_SAIDA, especie)
    arquivos.append(len(os.listdir(dir_especie)))
#arquivos

In [23]:
df['arquivos_wav'] = arquivos
#maior_qtde = max(df['arquivos_wav'])
#df['diferenca'] = maior_qtde - df['arquivos_wav']
#df['multiplicacao'] = df[['diferenca', 'arquivos_mp3']].apply(
#    lambda x: np.round(x[0] / x[1], 0), axis=1)
df['rendimento'] = df['arquivos_wav'] / df['arquivos_mp3']
#df['mp3_necessarios'] = df['diferenca'] / df['rendimento']
#df['variacoes_mp3'] = df['mp3_necessarios'] / df['arquivos_mp3']
df.sort_values('especie')

Unnamed: 0,especie,arquivos_mp3,arquivos_wav,rendimento
16,amazona_farinosa,263,2780,10.570342
12,aramides_cajaneus,229,2631,11.489083
51,attila_spadiceus,418,3590,8.588517
59,automolus_infuscatus,121,914,7.553719
34,bucco_capensis,52,485,9.326923
0,cacicus_cela,295,3936,13.342373
66,campephilus_rubricollis,120,772,6.433333
14,cathartes_aura,7,85,12.142857
47,celeus_undatus,25,123,4.92
50,ceratopipra_erythrocephala,147,1266,8.612245


In [24]:
df['arquivos_wav'].mean(), df['arquivos_wav'].std(), df['arquivos_wav'].median()

(1197.8358208955224, 1082.2124307935521, 914.0)

In [25]:
limiar = round(df['arquivos_wav'].median())
print("limiar:", limiar)

df['wav_faltantes'] = df['arquivos_wav'].apply(lambda x: limiar - x if limiar > x else 0)
df

limiar: 914


Unnamed: 0,especie,arquivos_mp3,arquivos_wav,rendimento,wav_faltantes
0,cacicus_cela,295,3936,13.342373,0
1,pteroglossus_aracari,60,382,6.366667,532
2,tangara_episcopus,0,0,,914
3,dacnis_cayana,76,444,5.842105,470
4,ramphastos_tucanus,228,2495,10.942982,0
5,tangara_palmarum,0,0,,914
6,pionus_fuscus,47,243,5.170213,671
7,trogon_melanurus,163,1525,9.355828,0
8,glyphorynchus_spirurus,204,1252,6.137255,0
9,cyclarhis_gujanensis,708,4073,5.752825,0


## Recriar diretórios de saída - Passo 2

## Gerar arquivos adicionais com deslocamento - Passo 2

## Calcular quantidade de arquivos gerados ao final

In [27]:
arquivos = []
for especie in especies:
    dir_especie2 = os.path.join(DIR_SAIDA2, especie)
    arquivos.append(len(os.listdir(dir_especie2)))
#arquivos

In [28]:
df['arquivos_wav2'] = arquivos
#maior_qtde2 = max(df['arquivos_wav2'])
#df['diferenca2'] = maior_qtde2 - df['arquivos_wav2']
df.sort_values('especie')

Unnamed: 0,especie,arquivos_mp3,arquivos_wav,rendimento,wav_faltantes,arquivos_wav2
16,amazona_farinosa,263,2780,10.570342,0,0
12,aramides_cajaneus,229,2631,11.489083,0,0
51,attila_spadiceus,418,3590,8.588517,0,0
59,automolus_infuscatus,121,914,7.553719,0,0
34,bucco_capensis,52,485,9.326923,429,0
0,cacicus_cela,295,3936,13.342373,0,0
66,campephilus_rubricollis,120,772,6.433333,142,0
14,cathartes_aura,7,85,12.142857,829,0
47,celeus_undatus,25,123,4.92,791,0
50,ceratopipra_erythrocephala,147,1266,8.612245,0,0


In [84]:
# remover diretórios de espécies que não possuírem arquivos
import shutil

for especie in especies:
    dir_especie = os.path.join(DIR_SAIDA, especie)
    dir_especie2 = os.path.join(DIR_SAIDA2, especie)
    qtde_arquivos = len(os.listdir(dir_especie))
    if qtde_arquivos == 0:
        print("Removendo diretório:", dir_especie)
        shutil.rmtree(dir_especie)
        shutil.rmtree(dir_especie2)

Removendo diretório: wavbal5/tangara_episcopus
Removendo diretório: wavbal5/tangara_palmarum
Removendo diretório: wavbal5/phaethornis_sp
Removendo diretório: wavbal5/dixiphia_pipra
Removendo diretório: wavbal5/turdus_sp


In [None]:
# TODO: criar doretório wavbal5f