# SafeDrive AI

# 📊 Análisis del Dataset UrbanSound8K

El dataset **UrbanSound8K** contiene metadatos de fragmentos de audio clasificados en diferentes categorías de sonidos urbanos.

## 📌 **Estructura del Dataset**
El dataset contiene las siguientes columnas:

| **Columna**        | **Descripción** |
|--------------------|---------------|
| `slice_file_name`  | Nombre del archivo de audio. |
| `fsID`            | ID del archivo original en Freesound. |
| `start` & `end`   | Tiempos de inicio y fin del fragmento dentro del audio original. |
| `salience`        | 1 = Sonido en primer plano, 2 = Sonido de fondo. |
| `fold`            | Número de "fold" para validación cruzada. |
| `classID`         | ID de la clase de sonido (0-9). |
| `class`           | Nombre de la clase de sonido (Ej: `siren`, `car_horn`). |

---

## 🎯 **Etiquetas de Clases en UrbanSound8K**
El dataset contiene **10 categorías de sonidos urbanos**:

| `classID` | **Clase de Sonido**       |
|-----------|--------------------------|
| 0         | air_conditioner          |
| 1         | car_horn                 |
| 2         | children_playing         |
| 3         | dog_bark                 |
| 4         | drilling                 |
| 5         | engine_idling            |
| 6         | gun_shot                 |
| 7         | jackhammer               |
| 8         | siren                    |
| 9         | street_music             |

📌 **Ejemplo de nombres de archivos en el dataset:**


In [1]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import os
import shutil

In [2]:
# Ruta del dataset
base_path = "datasets/UrbanSound8K/"
csv_path = os.path.join(base_path, "UrbanSound8K.csv")

# Leer el CSV
df = pd.read_csv(csv_path)

# Carpeta de salida donde se copiarán los audios organizados
output_folder = "datasets/UrbanSound8K/extract/"
os.makedirs(output_folder, exist_ok=True)

In [3]:
# Diccionario para contar archivos por categoría
category_counts = {}

# Recorrer cada fila del dataset
for index, row in df.iterrows():
    file_name = row["slice_file_name"]  # Nombre del archivo de audio
    folder_id = row["fold"]  # Número de carpeta original
    class_label = row["class"]  # Nombre de la categoría

    # Crear carpeta para la clase si no existe
    class_folder = os.path.join(output_folder, class_label)
    os.makedirs(class_folder, exist_ok=True)

    # Construir ruta origen y destino
    src_path = os.path.join(base_path, f"fold{folder_id}", file_name)
    dest_path = os.path.join(class_folder, file_name)

    # Copiar el archivo si existe
    if os.path.exists(src_path):
        shutil.copy(src_path, dest_path)
        category_counts[class_label] = category_counts.get(class_label, 0) + 1

# Mostrar el resultado final
print("✅ Copia completada. Número de archivos por categoría:")
for category, count in category_counts.items():
    print(f"- {category}: {count} audios")

✅ Copia completada. Número de archivos por categoría:
- dog_bark: 1000 audios
- children_playing: 1000 audios
- car_horn: 429 audios
- air_conditioner: 1000 audios
- street_music: 1000 audios
- gun_shot: 374 audios
- siren: 929 audios
- engine_idling: 1000 audios
- jackhammer: 1000 audios
- drilling: 1000 audios
