# <img src="https://raw.githubusercontent.com/birdnet-team/BirdNET-Analyzer/refs/heads/main/docs/_static/birdnet_logo.png" width="50">**Inferencias con BirdNET-CLI sobre audios locales**
## **Inferencia con modelos personalizados  y caso Wildmon V3 y FLAT SIGMOIDS**
_versión 1.2 (2025-08-14)_



### *Ron A. Fernández-Gómez - EPM SECIHTI* 🤓
<img src="https://upload.wikimedia.org/wikipedia/commons/1/17/Logotipo_SECIHTI_2025-2030.svg" width="200">

Este es un flujo de trabajo en Google Colab escrito en Python para ejecutar clasificadores personalizados basados en Redes Neuronales Convolucionales (CNNs) para detección y clasificación de vocalizaciones de fauna utilizando la herramienta BirdNET Analyzer para uso con Interfaz de línea de comando (CLI) y accediendo a archivos de audio alojados en Google Drive, Unidades Compartidas para trabajo colaborativo, asi como a partir de audios de otras fuentes locales.
Para mayores detalles sobre BirdNET Analyzer y usos del proyecto BirdNET consultar: https://github.com/birdnet-team/BirdNET-Analyzer


##### **_Comentarios sobre clasificador personalizado Wildmon V3_**
La versión V3 del clasificador genera outputs que distribuyen los scores en un rango entre 0.5 y 0.7, para ampliar la distribución a toda la escala de los confidence scores, se evita la aplicación de la sigmoides sobre las predicciones. Para esto fue necesario modificar el codigo fuente por lo que el analizador utilizado es un repositorio clonado modificado.
El cambio especifico para saltar las sigmoides se hizo en el archivo config.py aplicando el operador booleano False en el argumento APPLY_SIGMOID (https://github.com/birdnet-team/BirdNET-Analyzer/blob/main/birdnet_analyzer/config.py#L85)

In [None]:
# paqueterias necesarias
!pip install ffmpeg
!pip install librosa
!pip install resampy
!pip install tensorflow==2.15.0
!pip install keras-tuner

In [None]:
#Rutas de entrada (directorio con tus audios) y salida (directorio de resultados)
audio_path = r'/ruta/a/la/carpeta/de/archivos' # definir la ruta al directorio con los archivos de audio
output_folder = r'/ruta/a/la/carpeta/donde/guardar/los/resultados' # definir la ruta al directorio donde se guardarán los resultados

# establecer el nombre del sitio y/o muestreo
site_name = 'nombre_del_sitio'  # <--- Cambia esto al nombre del sitio que estás analizando, por ejemplo, 'R405-202408'

In [None]:
# modelo personalizado, una copia del modelo de WildMon V3 en el Model Zoo de EchoSonR
my_model   = 'BirdNET_running/Model-Zoo/WildMon/Wildmon-V3/WildMon-20spp-V3.0_Model_FP32.tflite'  # <-- Ajustar según convenga

In [None]:
# Parámetros BirdNET-Analyzer
min_confidence   = 0.25   # <-- Ajustar según convenga
threads          = 6      # <-- Ajustar según computador
batch_size       = 4      # <-- Ajustar según computador

# para usar otros parametros, revisar USAGE en el repositorio de BirdNET-Analyzer
# https://birdnet-team.github.io/BirdNET-Analyzer/usage.html

In [None]:
# definir directorio de trabajo
# se direcciona al directorio donde se encuentra el repositorio de BirdNET-Analyzer modificado para WildMon V3
%cd BirdNET_running\BirdNET-repos\BirdNET-Analyzer_Mod_runWMV3

In [None]:
# Ejecutar la inferencia con BirdNET-Analyzer CLI modificado para WildMon V3
!python -m birdnet_analyzer.analyze \
        --output "{output_folder}" \
        --classifier "{my_model}" \
        --min_conf {min_confidence} \
        --threads {threads} \
        --b {batch_size} \
        --combine_results \
        "{audio_path}"

# Mostrar detalles de la corrida
import os

print("\n =======================================")
print(f"MODELO USADO: {os.path.basename(my_model)}")
print(f"Carpeta de resultados: {output_folder}")
print(f"Sitio analizado: {site_name}")
print(f"Valor de confianza mínimo: {min_confidence}")