# Descripción del Dataset ESC-50

El dataset **ESC-50** es un conjunto de datos de clasificación de sonidos ambientales que contiene 2,000 clips de audio de 5 segundos, organizados en 50 categorías balanceadas. Se usa comúnmente para tareas de clasificación de audio y reconocimiento de eventos sonoros.

## Tabla de Datos

| Columna   | Tipo de Dato | Descripción |
|-----------|-------------|-------------|
| `filename` | `object` | Nombre del archivo de sonido (formato .wav). |
| `fold` | `int64` | Número de fold asignado para validación cruzada (1-5). |
| `target` | `int64` | Etiqueta numérica de la categoría del sonido (0-49). |
| `category` | `object` | Nombre de la categoría de sonido (ej. "dog", "siren", "thunderstorm"). |
| `esc10` | `bool` | Indica si el sonido pertenece a la versión reducida ESC-10 (`True` o `False`). |
| `src_file` | `int64` | Identificador del archivo fuente original del sonido. |
| `take` | `object` | Versión de la grabación de un mismo sonido (ej. "A", "B"). |

## Observaciones Clave

- El dataset está balanceado con aproximadamente la misma cantidad de muestras por categoría.
- Se divide en **5 folds** para facilitar validación cruzada.
- Algunas categorías incluyen sonidos relevantes para el proyecto, como **bocinas, sirenas o ruidos de tráfico**.
- No hay una correlación fuerte entre las variables numéricas (`fold`, `target`, `src_file`).
- La distribución de sonidos por `fold` es uniforme, lo que evita sesgos en la validación del modelo.

Este dataset puede ser utilizado para entrenar un modelo de **detección de sonidos críticos para conductores con discapacidad auditiva** mediante técnicas de aprendizaje profundo, como redes neuronales convolucionales (CNNs) aplicadas a espectrogramas de audio.

---


In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os
import shutil

In [3]:
file_path = "datasets/ESC-50/meta/esc50.csv"
audio_folder = "datasets/ESC-50/audio"


df = pd.read_csv(file_path)
# Carpeta de salida donde se copiarán los audios organizados
output_folder = "datasets/ESC-50/extract"
os.makedirs(output_folder, exist_ok=True)

In [4]:
print("\nInformación General del Dataset")
print(df.info())


Información General del Dataset
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2000 entries, 0 to 1999
Data columns (total 7 columns):
 #   Column    Non-Null Count  Dtype 
---  ------    --------------  ----- 
 0   filename  2000 non-null   object
 1   fold      2000 non-null   int64 
 2   target    2000 non-null   int64 
 3   category  2000 non-null   object
 4   esc10     2000 non-null   bool  
 5   src_file  2000 non-null   int64 
 6   take      2000 non-null   object
dtypes: bool(1), int64(3), object(3)
memory usage: 95.8+ KB
None


In [6]:
print("\nPrimeras Filas del Dataset")
print(df.head())


Primeras Filas del Dataset
            filename  fold  target        category  esc10  src_file take
0   1-100032-A-0.wav     1       0             dog   True    100032    A
1  1-100038-A-14.wav     1      14  chirping_birds  False    100038    A
2  1-100210-A-36.wav     1      36  vacuum_cleaner  False    100210    A
3  1-100210-B-36.wav     1      36  vacuum_cleaner  False    100210    B
4  1-101296-A-19.wav     1      19    thunderstorm  False    101296    A


In [5]:
# Diccionario para contar archivos por categoría
category_counts = {}

# Recorrer cada fila del dataset
for index, row in df.iterrows():
    file_name = row["filename"]  # Nombre del archivo de audio
    class_label = row["category"]  # Categoría del sonido

    # Crear carpeta para la clase si no existe
    class_folder = os.path.join(output_folder, class_label)
    os.makedirs(class_folder, exist_ok=True)

    # Construir ruta origen y destino
    src_path = os.path.join(audio_folder, file_name)
    dest_path = os.path.join(class_folder, file_name)

    # Copiar el archivo si existe
    if os.path.exists(src_path):
        shutil.copy(src_path, dest_path)
        category_counts[class_label] = category_counts.get(class_label, 0) + 1

# Mostrar el resultado final
print("✅ Copia completada. Número de archivos por categoría:")
for category, count in category_counts.items():
    print(f"- {category}: {count} audios")

✅ Copia completada. Número de archivos por categoría:
- dog: 40 audios
- chirping_birds: 40 audios
- vacuum_cleaner: 40 audios
- thunderstorm: 40 audios
- door_wood_knock: 40 audios
- can_opening: 40 audios
- crow: 40 audios
- clapping: 40 audios
- fireworks: 40 audios
- chainsaw: 40 audios
- airplane: 40 audios
- mouse_click: 40 audios
- pouring_water: 40 audios
- train: 40 audios
- sheep: 40 audios
- water_drops: 40 audios
- church_bells: 40 audios
- clock_alarm: 40 audios
- keyboard_typing: 40 audios
- wind: 40 audios
- footsteps: 40 audios
- frog: 40 audios
- cow: 40 audios
- brushing_teeth: 40 audios
- car_horn: 40 audios
- crackling_fire: 40 audios
- helicopter: 40 audios
- drinking_sipping: 40 audios
- rain: 40 audios
- insects: 40 audios
- laughing: 40 audios
- hen: 40 audios
- engine: 40 audios
- breathing: 40 audios
- crying_baby: 40 audios
- hand_saw: 40 audios
- coughing: 40 audios
- glass_breaking: 40 audios
- snoring: 40 audios
- toilet_flush: 40 audios
- pig: 40 audios
-