# Clasificaci√≥n de Anfibios mediante Deep Learning 

Este proyecto tiene como objetivo desarrollar un modelo de aprendizaje profundo (Deep Learning) capaz de identificar especies de anfibios a partir de grabaciones de audio. El proceso abarca desde el preprocesamiento de se√±ales de audio hasta el entrenamiento y evaluaci√≥n de una Red Neuronal Convolucional (CNN).

## üìã Tabla de Contenidos
1. [Descripci√≥n del Proyecto](#descripci√≥n-del-proyecto)
2. [Estructura del Repositorio](#estructura-del-repositorio)
3. [Requisitos e Instalaci√≥n](#requisitos-e-instalaci√≥n)
4. [Hito 2: Procesamiento de Datos](#hito-2-procesamiento-de-datos)
5. [Hito 3: Entrenamiento del Modelo](#hito-3-entrenamiento-del-modelo)
6. [Resultados](#resultados)
7. [Autores](#autores)

## Estructura del Repositorio

```bash
.
‚îú‚îÄ‚îÄ data/
‚îÇ   ‚îú‚îÄ‚îÄ raw/                 # Audios originales en formato .wav
‚îÇ   ‚îî‚îÄ‚îÄ processed/           # Espectrogramas procesados (.npz) y metadata.csv
‚îú‚îÄ‚îÄ notebooks/
‚îÇ   ‚îú‚îÄ‚îÄ Hito_2_Procesamiento.ipynb   # Notebook del Hito 2
‚îÇ   ‚îî‚îÄ‚îÄ Hito_3_Entrenamiento.ipynb   # Notebook del Hito 3
‚îú‚îÄ‚îÄ README.md                # Este archivo
‚îî‚îÄ‚îÄ requirements.txt         # Librer√≠as necesarias

### Celda 4 (Markdown): Requisitos e Instalaci√≥n


Para ejecutar este proyecto, necesitas Python 3.8 o superior. Las principales librer√≠as utilizadas son:

* `numpy`
* `pandas`
* `librosa` (para procesamiento de audio)
* `matplotlib` / `seaborn` (para visualizaci√≥n)
* `tensorflow` (para el modelo de Deep Learning)
* `scikit-learn` (para m√©tricas y preprocesamiento)

**Instalaci√≥n r√°pida:**
```bash
pip install numpy pandas librosa matplotlib seaborn tensorflow scikit-learn

### Celda 5 (Markdown): Hito 2 - Procesamiento


En esta etapa, nos enfocamos en transformar los audios crudos en una representaci√≥n visual √∫til para el modelo.

**Actividades realizadas:**
1.  **Carga de Audios:** Lectura de archivos `.wav` usando `librosa`.
2.  **Extracci√≥n de Caracter√≠sticas:** Conversi√≥n de audio a **Espectrogramas de Mel** (representaci√≥n tiempo-frecuencia logar√≠tmica). 
3.  **Almacenamiento:** Los espectrogramas se guardaron como archivos comprimidos `.npz` para una carga eficiente.
4.  **Metadata:** Se gener√≥ un archivo `metadata.csv` que vincula cada archivo procesado con su etiqueta (especie).
5.  **Validaci√≥n:** Se visualiz√≥ una muestra de los espectrogramas para asegurar que la conversi√≥n fue correcta y se analiz√≥ el balance de clases.

**Script principal:** `Procesamiento de Se√±al y Extracci√≥n de Caracter√≠sticas.ipynb`

## Hito 3: Entrenamiento del Modelo üß†

En esta fase, dise√±amos y entrenamos una Red Neuronal Convolucional (CNN) utilizando los datos procesados. 

**Actividades realizadas:**
1.  **Preparaci√≥n del Dataset:**
    * Carga de espectrogramas desde archivos `.npz`.
    * Codificaci√≥n de etiquetas (`LabelEncoder` y `to_categorical`).
    * Normalizaci√≥n de los datos (Z-score).
    * Divisi√≥n en conjuntos de entrenamiento (Train) y prueba (Test).
2.  **Arquitectura CNN:**
    * Capas Convolucionales (`Conv2D`) para extracci√≥n de caracter√≠sticas.
    * Capas de Pooling (`MaxPooling2D`) para reducci√≥n de dimensionalidad.
    * Capas de Regularizaci√≥n (`Dropout`, `BatchNormalization`) para evitar sobreajuste.
    * Capa de Salida (`Softmax`) para clasificaci√≥n multiclase.
3.  **Entrenamiento Personalizado:**
    * Se implement√≥ un **Callback personalizado** (`LambdaCallback`) para visualizar el progreso del entrenamiento (p√©rdida y precisi√≥n) con etiquetas en espa√±ol, mejorando la legibilidad de los logs.
    * Optimizador: Adam.
    * Funci√≥n de p√©rdida: Categorical Crossentropy.

**Script principal:** `Hito 3 - Entrenamiento del Modelo.ipynb`

## Resultados üìä

El modelo fue evaluado utilizando el conjunto de prueba (datos que la red nunca vio durante el entrenamiento).

* **Exactitud Global (Accuracy):** [COMPLETAR CON TU % FINAL, ej: 85%]
* **Matriz de Confusi√≥n:** Muestra qu√© especies se confunden entre s√≠.
    * *(Ver gr√°fico generado en el notebook)*

**Conclusiones preliminares:**
El modelo logra distinguir eficazmente entre las especies, demostrando que el uso de espectrogramas de Mel es una estrategia efectiva para este problema de clasificaci√≥n de audio. La implementaci√≥n de callbacks personalizados permiti√≥ un seguimiento m√°s claro del proceso de aprendizaje.

---

## Autores ‚úíÔ∏è

* **[Matias Mu√±oz]** - *Desarrollo y Entrenamiento*
