# Sistema de Detección y Seguimiento de Tráfico con YOLOv8

## Proyecto: Control de Aforo y Flujo Vehicular

**Autores:** Miranda Alison, Morán David, Vivanco Gabriel  
**Fecha:** Febrero 2026  
**Versión:** 2.0.0

---

## Tabla de Contenidos

1. [Introducción al Proyecto](#introduccion)
2. [Tecnologías Utilizadas](#tecnologias)
3. [Dataset COCO](#coco)
4. [Modelo YOLOv8](#yolo)
5. [Arquitectura del Sistema](#arquitectura)
6. [Archivos del Proyecto](#archivos)
7. [Instalación y Configuración](#instalacion)
8. [Ejemplos de Uso](#ejemplos)
9. [Resultados](#resultados)

---

## ¿Qué hace este proyecto?

Este sistema utiliza **inteligencia artificial** para detectar y rastrear personas y vehículos en imágenes, permitiendo:
- **Control de Aforo:** Contar personas y verificar si se excede la capacidad máxima
- **Flujo Vehicular:** Analizar tráfico y determinar niveles de congestión



# 1. Introducción al Proyecto

## Objetivo Principal

Desarrollar un sistema inteligente de análisis de tráfico que permita:

- **Detectar automáticamente** personas y vehículos en imágenes
- **Rastrear objetos** con IDs únicos y trayectorias
- **Analizar escenarios reales** como control de aforo y flujo vehicular
- **Generar alertas visuales** mediante indicadores de color (verde/amarillo/rojo)

## Casos de Uso

### Control de Aforo
Ideal para tiendas, restaurantes, eventos:
- Cuenta personas en una ubicación
- Alerta cuando se excede capacidad máxima
- Muestra indicador verde (apto) o rojo (excedido)

### Flujo Vehicular
Para análisis de tráfico urbano:
- Detecta autos, motos, buses y camiones
- Clasifica el tráfico: fluido, moderado o congestionado
- Proporciona estadísticas por tipo de vehículo

# 2. Tecnologías Utilizadas

## Stack Tecnológico

| Tecnología | Versión | Propósito |
|------------|---------|-----------|
| **Python** | 3.13+ | Lenguaje de programación principal |
| **YOLOv8** | ultralytics 8.4.12 | Modelo de detección de objetos |
| **OpenCV** | 4.13.0 | Procesamiento de imágenes y visualización |
| **NumPy** | 2.4.2 | Operaciones numéricas y arrays |
| **Pillow** | 12.1.0 | Manejo de imágenes |
| **Requests** | - | Descarga de imágenes desde URLs |

## ¿Por qué estas tecnologías?

### YOLOv8 (You Only Look Once v8)
- **Ventajas:**
  - Detección en tiempo real (hasta 140 FPS)
  - Alta precisión (mAP > 50%)
  - Pre-entrenado en COCO dataset
  - Fácil de usar con Ultralytics
  
### OpenCV (Open Computer Vision)
- Estándar en visión por computadora
- Amplia comunidad y documentación
- Funciones optimizadas para imágenes y video

### NumPy
- Operaciones matriciales eficientes
- Base para procesamiento numérico en Python
- Compatible con OpenCV y frameworks de ML

# 3. Dataset COCO (Common Objects in Context)

## ¿Qué es COCO?

**COCO** es uno de los datasets más importantes para visión por computadora, creado por Microsoft Research.

### Características principales:
- **330,000+ imágenes** con escenas del mundo real
- **80 categorías** de objetos (personas, vehículos, animales, etc.)
- **1.5 millones** de instancias anotadas
- Anotaciones precisas con bounding boxes y segmentación

## ¿Cómo usamos COCO en este proyecto?

### 1. Imágenes de Ejemplo
Utilizamos **15 imágenes de tráfico de COCO** alojadas en Flickr:
```python
URLs = [
    "http://farm7.staticflickr.com/6035/6292445906_dcb4133c67_z.jpg",
    "http://farm6.staticflickr.com/5022/5679421199_fea112b087_z.jpg",
    ...
]
```

### 2. Modelo Pre-entrenado
YOLOv8 viene **pre-entrenado en COCO**, lo que significa:
- Ya conoce las 80 clases de COCO
- No necesitamos entrenar desde cero
- Funciona inmediatamente para nuestro caso de uso

### 3. Clases que Usamos

De las 80 clases de COCO, utilizamos:

| ID | Clase | Uso en Proyecto |
|----|-------|-----------------|
| 0 | person | Control de aforo |
| 1 | bicycle | Flujo vehicular |
| 2 | car | Flujo vehicular |
| 3 | motorcycle | Flujo vehicular |
| 5 | bus | Flujo vehicular |
| 7 | truck | Flujo vehicular |

In [4]:
# Ejemplo: Cómo descargamos imágenes de COCO desde Flickr
import requests
from PIL import Image
import io
import cv2
import numpy as np

def download_image(url):
    """
    Descarga una imagen desde URL y la convierte a formato OpenCV
    
    Args:
        url (str): URL de la imagen en Flickr
        
    Returns:
        numpy.ndarray: Imagen en formato BGR para OpenCV
    """
    try:
        # Hacer petición HTTP con timeout
        response = requests.get(url, timeout=10)
        
        # Verificar que la descarga fue exitosa
        if response.status_code == 200:
            # Convertir bytes a imagen PIL
            image = Image.open(io.BytesIO(response.content))
            
            # Convertir de RGB (PIL) a BGR (OpenCV)
            image_cv = cv2.cvtColor(np.array(image), cv2.COLOR_RGB2BGR)
            
            return image_cv
        return None
    except Exception as e:
        print(f"Error descargando: {e}")
        return None

# Lista de URLs de imágenes COCO
def get_coco_traffic_images():
    """Retorna lista de 15 URLs de imágenes de tráfico de COCO"""
    return [
        "http://farm7.staticflickr.com/6035/6292445906_dcb4133c67_z.jpg",
        "http://farm6.staticflickr.com/5022/5679421199_fea112b087_z.jpg", 
        "http://farm9.staticflickr.com/8263/8703641816_80c3673de3_z.jpg",
        # ... más URLs
    ]

# Ejemplo de uso
print("Descargando imagen de ejemplo de COCO...")
url_ejemplo = "http://farm7.staticflickr.com/6035/6292445906_dcb4133c67_z.jpg"
imagen = download_image(url_ejemplo)

if imagen is not None:
    print(f"Imagen descargada: {imagen.shape[1]}x{imagen.shape[0]} píxeles")
    print(f"   Canales: {imagen.shape[2]} (BGR)")
else:
    print("Error al descargar imagen")

Descargando imagen de ejemplo de COCO...
Imagen descargada: 640x473 píxeles
   Canales: 3 (BGR)


In [None]:
pip install opencv-python

Collecting opencv-python
  Downloading opencv_python-4.13.0.92-cp37-abi3-win_amd64.whl (40.2 MB)
     --------------------------------------- 40.2/40.2 MB 38.6 MB/s eta 0:00:00
Installing collected packages: opencv-python
Successfully installed opencv-python-4.13.0.92
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


# 4. YOLO (You Only Look Once) v8

## ¿Qué es YOLO?

**YOLO** es una familia de modelos de detección de objetos que revolucionó la visión por computadora por su:
- **Velocidad**: Procesa imágenes en tiempo real
- **Precisión**: Alta exactitud en detección
- **Una sola pasada**: A diferencia de otros modelos, YOLO analiza la imagen completa de una vez

## Evolución de YOLO

```
YOLOv1 (2016) → YOLOv2 → YOLOv3 → YOLOv4 → YOLOv5 → YOLOv6 → YOLOv7 → YOLOv8 (2023)
```

**YOLOv8** es la versión más reciente desarrollada por Ultralytics con mejoras en:
- Arquitectura más eficiente
- Mejores métricas de precisión
- API más fácil de usar
- Soporte para múltiples tareas (detección, segmentación, clasificación)

## ¿Cómo funciona YOLO?

### Proceso de Detección:

1. **Entrada**: Imagen completa (ej: 640x640 píxeles)
2. **Red Neuronal Convolucional**: Procesa la imagen en una sola pasada
3. **Grid de Predicciones**: Divide la imagen en una cuadrícula (ej: 80x80)
4. **Bounding Boxes**: Cada celda predice cajas delimitadoras
5. **Clasificación**: Asigna probabilidades a cada clase
6. **NMS (Non-Maximum Suppression)**: Elimina detecciones duplicadas
7. **Salida**: Lista de objetos detectados con:
   - Coordenadas del bounding box (x, y, width, height)
   - Clase del objeto (persona, auto, etc.)
   - Confianza (0-1)

## Modelo que usamos: YOLOv8n

**yolov8n.pt** = YOLOv8 Nano
- Balance entre velocidad y precisión
- Tamaño: ~6MB
- Muy rápido en inferencia
- Pre-entrenado en COCO (80 clases)

In [6]:
pip install ultralytics

Collecting ultralytics
  Downloading ultralytics-8.4.13-py3-none-any.whl (1.2 MB)
     ---------------------------------------- 1.2/1.2 MB 12.5 MB/s eta 0:00:00
Collecting torch>=1.8.0
  Downloading torch-2.10.0-cp311-cp311-win_amd64.whl (113.7 MB)
     ------------------------------------- 113.7/113.7 MB 14.5 MB/s eta 0:00:00
Collecting torchvision>=0.9.0
  Downloading torchvision-0.25.0-cp311-cp311-win_amd64.whl (4.0 MB)
     ---------------------------------------- 4.0/4.0 MB 42.9 MB/s eta 0:00:00
Collecting polars>=0.20.0
  Downloading polars-1.38.1-py3-none-any.whl (810 kB)
     ------------------------------------- 810.4/810.4 kB 50.0 MB/s eta 0:00:00
Collecting ultralytics-thop>=2.0.18
  Using cached ultralytics_thop-2.0.18-py3-none-any.whl (28 kB)
Collecting polars-runtime-32==1.38.1
  Downloading polars_runtime_32-1.38.1-cp310-abi3-win_amd64.whl (45.7 MB)
     --------------------------------------- 45.7/45.7 MB 27.3 MB/s eta 0:00:00
Collecting filelock
  Downloading filelock-


[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [7]:
# Ejemplo: Cómo usamos YOLOv8 para detección de objetos

from ultralytics import YOLO

# 1. Cargar el modelo pre-entrenado
print("Cargando modelo YOLOv8n...")
modelo = YOLO("yolov8n.pt")
print("Modelo cargado exitosamente\n")

# 2. Configurar parámetros de detección
CONFIDENCE_THRESHOLD = 0.65  # Umbral de confianza (65%)
MIN_AREA = 300  # Área mínima para filtrar detecciones pequeñas

# 3. Detectar objetos en una imagen
def detectar_objetos(imagen, confidence=0.65):
    """
    Realiza detección de objetos usando YOLOv8
    
    Args:
        imagen: Imagen en formato numpy array (BGR)
        confidence: Umbral de confianza mínimo
        
    Returns:
        results: Objeto Results de Ultralytics con detecciones
    """
    # Ejecutar detección (verbose=False para no mostrar logs)
    results = modelo(imagen, conf=confidence, verbose=False)
    return results

# 4. Procesar resultados
def procesar_detecciones(results):
    """
    Extrae información útil de las detecciones
    
    Returns:
        Lista de diccionarios con información de cada detección
    """
    detecciones = []
    
    for result in results:
        boxes = result.boxes
        if boxes is not None:
            for box in boxes:
                # Extraer información
                class_id = int(box.cls.cpu().numpy()[0])
                confidence = float(box.conf.cpu().numpy()[0])
                x1, y1, x2, y2 = box.xyxy[0].cpu().numpy()
                
                # Calcular área
                area = (x2 - x1) * (y2 - y1)
                
                # Filtrar por área mínima
                if area >= MIN_AREA:
                    detecciones.append({
                        'class_id': class_id,
                        'confidence': confidence,
                        'bbox': (int(x1), int(y1), int(x2), int(y2)),
                        'area': area
                    })
    
    return detecciones

# Ejemplo de clases COCO que usamos
CLASES_USADAS = {
    0: 'persona',
    1: 'bicicleta',
    2: 'auto',
    3: 'motocicleta',
    5: 'autobus',
    7: 'camion'
}

print("Clases que detectamos:")
for id_clase, nombre in CLASES_USADAS.items():
    print(f"   ID {id_clase}: {nombre}")

Cargando modelo YOLOv8n...
Modelo cargado exitosamente

Clases que detectamos:
   ID 0: persona
   ID 1: bicicleta
   ID 2: auto
   ID 3: motocicleta
   ID 5: autobus
   ID 7: camion


# 5. Arquitectura del Sistema

## Diagrama de Flujo General

```
┌─────────────────┐
│  Imagen COCO    │
│  (Flickr URL)   │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Descargar      │
│  Imagen         │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  YOLOv8         │
│  Detección      │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Filtrado       │
│  (confianza,    │
│   área mínima)  │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Tracking       │
│  (ObjectTracker)│
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Análisis       │
│  (Aforo/Flujo)  │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Visualización  │
│  (OpenCV)       │
└─────────────────┘
```

## Componentes Principales

### 1. Sistema de Detección (YOLOv8)
```python
imagen → YOLO → detecciones (bbox, clase, confianza)
```

### 2. Sistema de Tracking (ObjectTracker)
- **Función**: Mantener IDs únicos para objetos entre frames
- **Algoritmo**: Basado en centroides y distancia euclidiana
- **Características**:
  - Asigna ID único a cada objeto nuevo
  - Rastrea movimiento usando centroides
  - Mantiene historial de trayectorias
  - Elimina objetos que "desaparecen"

### 3. Sistema de Análisis
- **AforoAnalyzer**: Cuenta personas, compara con capacidad
- **FlujoVehicularAnalyzer**: Cuenta vehículos, clasifica tráfico

### 4. Sistema de Visualización
- Dibuja bounding boxes de colores
- Muestra IDs y trayectorias
- Paneles informativos
- Indicadores visuales (semáforos)

In [8]:
# Ejemplo: Sistema de Tracking de Objetos

import numpy as np
from scipy.spatial import distance as dist

class ObjectTracker:
    """
    Clase para rastrear objetos usando centroide y distancia euclidiana
    
    Características:
    - Asigna IDs únicos a nuevos objetos
    - Mantiene trayectorias (trails)
    - Elimina objetos que desaparecen
    """
    
    def __init__(self, max_distance=80, max_disappeared=4):
        """
        Args:
            max_distance: Distancia máxima para considerar que es el mismo objeto
            max_disappeared: Frames antes de eliminar un objeto
        """
        self.next_id = 0  # Próximo ID a asignar
        self.objects = {}  # Diccionario de objetos trackeados
        self.disappeared = {}  # Contador de frames desaparecidos
        self.max_distance = max_distance
        self.max_disappeared = max_disappeared
    
    def register(self, centroid, class_id, confidence):
        """Registra un nuevo objeto"""
        self.objects[self.next_id] = {
            'centroid': centroid,
            'class_id': class_id,
            'confidence': confidence,
            'trail': [centroid]  # Historial de posiciones
        }
        self.disappeared[self.next_id] = 0
        self.next_id += 1
    
    def deregister(self, object_id):
        """Elimina un objeto del tracker"""
        del self.objects[object_id]
        del self.disappeared[object_id]
    
    def update(self, detections):
        """
        Actualiza el tracker con nuevas detecciones
        
        Args:
            detections: Lista de tuplas (centroid, class_id, confidence)
            
        Returns:
            Dict con objetos actualizados {id: {centroid, class_id, ...}}
        """
        # Si no hay detecciones, marcar todos como desaparecidos
        if len(detections) == 0:
            for object_id in list(self.disappeared.keys()):
                self.disappeared[object_id] += 1
                if self.disappeared[object_id] > self.max_disappeared:
                    self.deregister(object_id)
            return self.objects
        
        # Si no hay objetos previos, registrar todos
        if len(self.objects) == 0:
            for detection in detections:
                centroid, class_id, confidence = detection
                self.register(centroid, class_id, confidence)
        else:
            # Calcular matriz de distancias
            object_ids = list(self.objects.keys())
            object_centroids = [self.objects[oid]['centroid'] for oid in object_ids]
            new_centroids = [d[0] for d in detections]
            
            # Distancia euclidiana entre todos los pares
            D = dist.cdist(np.array(object_centroids), np.array(new_centroids))
            
            # Asignar detecciones a objetos existentes
            rows = D.min(axis=1).argsort()
            cols = D.argmin(axis=1)[rows]
            
            used_rows = set()
            used_cols = set()
            
            for (row, col) in zip(rows, cols):
                if row in used_rows or col in used_cols:
                    continue
                
                if D[row, col] > self.max_distance:
                    continue
                
                object_id = object_ids[row]
                self.objects[object_id]['centroid'] = new_centroids[col]
                self.objects[object_id]['confidence'] = detections[col][2]
                self.objects[object_id]['trail'].append(new_centroids[col])
                self.disappeared[object_id] = 0
                
                used_rows.add(row)
                used_cols.add(col)
            
            # Nuevos objetos
            for col in range(len(new_centroids)):
                if col not in used_cols:
                    self.register(new_centroids[col], detections[col][1], detections[col][2])
            
            # Objetos desaparecidos
            for row in range(len(object_centroids)):
                if row not in used_rows:
                    object_id = object_ids[row]
                    self.disappeared[object_id] += 1
                    if self.disappeared[object_id] > self.max_disappeared:
                        self.deregister(object_id)
        
        return self.objects

print("ObjectTracker implementado")
print("Funcionalidades:")
print("   - Rastreo por centroides")
print("   - IDs únicos persistentes")
print("   - Trayectorias (trails)")
print("   - Manejo de objetos perdidos")

ObjectTracker implementado
Funcionalidades:
   - Rastreo por centroides
   - IDs únicos persistentes
   - Trayectorias (trails)
   - Manejo de objetos perdidos


# 6. Archivos del Proyecto

## Estructura de Archivos

```
PROYECTO BASADAS P3 V2.0.0/
│
├── coco_traffic_improved.py    (Sistema completo con tracking)
├── ejemplos_uso.py              (Casos de uso simplificados)
├── requirements.txt             (Dependencias del proyecto)
├── yolov8n.pt                   (Modelo YOLOv8 Nano pre-entrenado)
└── INFORME_PROYECTO.ipynb       (Este documento)
```

---

## coco_traffic_improved.py

**Propósito:** Sistema completo de detección y tracking con interfaz gráfica interactiva

### Componentes:

#### 1. Clase `ObjectTracker` (líneas 13-109)
```python
- register(): Registra nuevos objetos
- deregister(): Elimina objetos
- update(): Actualiza tracking con nuevas detecciones
- reset(): Reinicia el sistema entre imágenes
```

#### 2. Clase `COCOTrafficAnalyzer` (líneas 112-492)
```python
- __init__(): Inicializa YOLO y tracking
- reset_trackers(): Reinicia IDs entre imágenes
- process_image(): Procesa una imagen con detección y tracking
- draw_results(): Dibuja visualizaciones (boxes, IDs, trails)
- analyze_images(): Procesa múltiples imágenes
- run(): Ejecuta menú interactivo
```

### Características Principales:

- **Tracking completo** con IDs únicos y trayectorias
- **Filtrado inteligente** por confianza y área
- **Umbrales específicos por clase**:
  - Personas: 60%
  - Bicicletas/Autos/Motos: 65%
  - Buses/Camiones: 70%
- **Visualización rica**: Bounding boxes, IDs, trails, estadísticas
- **Menú interactivo** con múltiples opciones

### ¿Cuándo usar este archivo?
- Cuando necesites tracking detallado de objetos
- Para análisis frame por frame con IDs persistentes
- Experimentación y ajuste de parámetros

---

## ejemplos_uso.py

**Propósito:** Casos de uso simplificados y prácticos para usuarios finales

### Componentes:

#### 1. Clase `AforoAnalyzer` (líneas 16-120)
```python
- analizar_imagen(): Cuenta personas
- dibujar_resultado(): Visualiza con indicador verde/rojo
```

#### 2. Clase `FlujoVehicularAnalyzer` (líneas 123-260)
```python
- analizar_imagen(): Cuenta vehículos por tipo
- dibujar_resultado(): Visualiza con semáforo de tráfico
```

### Características:

- **Control de Aforo**:
  - Entrada: Capacidad máxima (por consola)
  - Salida: Verde (apto) / Rojo (excedido)
  - Estadísticas finales
  
- **Flujo Vehicular**:
  - Entrada: Umbral de congestión (por consola)
  - Salida: Verde (fluido) / Amarillo (moderado) / Rojo (congestión)
  - Desglose por tipo de vehículo

- **Configuración flexible**:
  - Selección de número de imágenes (1-15)
  - Umbrales personalizables
  - Resúmenes estadísticos

### ¿Cuándo usar este archivo?
- Para demostraciones rápidas
- Casos de uso del mundo real (tiendas, calles)
- Cuando no necesitas tracking detallado
- Para presentaciones y pruebas de concepto

---

## requirements.txt

**Propósito:** Lista de dependencias Python necesarias

```txt
ultralytics==8.4.12      # YOLOv8
opencv-python==4.13.0.92 # Procesamiento de imágenes
numpy==2.4.2             # Operaciones numéricas
Pillow==12.1.0           # Manejo de imágenes
matplotlib==3.10.8       # Gráficos
scipy==1.17.0            # Cálculos científicos
requests                 # Descargas HTTP
```

### Instalación:
```bash
pip install -r requirements.txt
```

---

## yolov8n.pt

**Propósito:** Archivo de pesos del modelo YOLOv8 Nano

- **Tamaño:** ~6 MB
- **Arquitectura:** YOLOv8n (Nano - versión más ligera)
- **Pre-entrenamiento:** COCO dataset (80 clases)
- **Formato:** PyTorch (.pt)
- **Proveedor:** Ultralytics

### Clases detectables (extracto):
- 0: person
- 1: bicycle
- 2: car
- 3: motorcycle
- 5: bus
- 7: truck
- ... (hasta 80 clases)

---

## Comparación de Archivos

| Característica | coco_traffic_improved.py | ejemplos_uso.py |
|----------------|--------------------------|-----------------|
| **Complejidad** | Alta | Baja |
| **Tracking** | Sí (con IDs) | No |
| **Trayectorias** | Sí | No |
| **Interfaz** | Menú interactivo | Casos de uso directos |
| **Configuración** | Código | Consola (interactivo) |
| **Visualización** | Detallada | Simplificada |
| **Uso ideal** | Desarrollo/Análisis | Demostración/Producción |

# 7. Instalación y Configuración

## Para Google Colab

### Paso 1: Instalar Dependencias

In [12]:
# Ejecutar esto en Google Colab para instalar todas las dependencias

# Actualizar pip
!pip install --upgrade pip

# Instalar librerías necesarias
!pip install ultralytics==8.4.12
!pip install opencv-python==4.13.0.92
!pip install numpy==2.4.2
!pip install Pillow==12.1.0
!pip install matplotlib==3.10.8
!pip install scipy==1.17.0

print("\nTodas las dependencias instaladas correctamente")

Collecting pip
  Using cached pip-26.0.1-py3-none-any.whl (1.8 MB)


ERROR: To modify pip, please run the following command:
C:\Users\User\AppData\Local\Programs\Python\Python311\python.exe -m pip install --upgrade pip

[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip





[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip





[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip





[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip





[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip





[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip



Todas las dependencias instaladas correctamente



[notice] A new release of pip available: 22.3 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


### Paso 2: Descargar el Modelo YOLOv8

In [13]:
# Descargar modelo YOLOv8n (se descarga automáticamente la primera vez)
from ultralytics import YOLO

print("Descargando modelo YOLOv8n...")
modelo = YOLO("yolov8n.pt")
print("Modelo descargado y listo para usar")

Descargando modelo YOLOv8n...
Modelo descargado y listo para usar


# 8. Ejemplos Prácticos de Uso

## Ejemplo 1: Detección Básica con YOLOv8

In [11]:
# Ejemplo completo: Detectar objetos en una imagen de COCO

import cv2
import numpy as np
from ultralytics import YOLO
import requests
from PIL import Image
import io
from google.colab.patches import cv2_imshow  # Para mostrar imágenes en Colab

# Cargar modelo
modelo = YOLO("yolov8n.pt")

# Descargar imagen de ejemplo
url = "http://farm7.staticflickr.com/6035/6292445906_dcb4133c67_z.jpg"
response = requests.get(url, timeout=10)
imagen_pil = Image.open(io.BytesIO(response.content))
imagen = cv2.cvtColor(np.array(imagen_pil), cv2.COLOR_RGB2BGR)

print(f"Imagen cargada: {imagen.shape[1]}x{imagen.shape[0]} píxeles\n")

# Realizar detección
results = modelo(imagen, conf=0.6, verbose=False)

# Procesar resultados
print("Objetos detectados:\n")
for result in results:
    boxes = result.boxes
    if boxes is not None:
        for box in boxes:
            # Extraer información
            class_id = int(box.cls.cpu().numpy()[0])
            class_name = modelo.names[class_id]
            confidence = float(box.conf.cpu().numpy()[0])
            x1, y1, x2, y2 = box.xyxy[0].cpu().numpy().astype(int)
            
            # Mostrar en consola
            print(f"└─ {class_name}: {confidence:.2%} confianza")
            
            # Dibujar bounding box
            cv2.rectangle(imagen, (x1, y1), (x2, y2), (0, 255, 0), 2)
            cv2.putText(imagen, f"{class_name} {confidence:.2f}", 
                       (x1, y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)

# Mostrar imagen con deteccionesprint("\nResultado visual:")
cv2_imshow(imagen)  # En Colab
# cv2.imshow("Detecciones", imagen); cv2.waitKey(0)  # En local

ModuleNotFoundError: No module named 'google'

## Ejemplo 2: Control de Aforo

Cuenta personas y determina si se excede la capacidad máxima.

In [None]:
# Ejemplo: Sistema de Control de Aforo

# Configuración
CAPACIDAD_MAXIMA = 10  # Personas permitidas
CONFIDENCE_PERSONAS = 0.60  # Umbral para detectar personas

# Cargar imagen
url = "http://farm9.staticflickr.com/8263/8703641816_80c3673de3_z.jpg"
response = requests.get(url, timeout=10)
imagen = cv2.cvtColor(np.array(Image.open(io.BytesIO(response.content))), cv2.COLOR_RGB2BGR)

# Detectar solo personas (class_id = 0)
results = modelo(imagen, conf=CONFIDENCE_PERSONAS, classes=[0], verbose=False)

# Contar personas
personas_count = 0
for result in results:
    boxes = result.boxes
    if boxes is not None:
        for box in boxes:
            x1, y1, x2, y2 = box.xyxy[0].cpu().numpy().astype(int)
            area = (x2 - x1) * (y2 - y1)
            
            # Filtrar por área mínima
            if area >= 300:
                personas_count += 1
                confidence = float(box.conf.cpu().numpy()[0])
                
                # Dibujar
                cv2.rectangle(imagen, (x1, y1), (x2, y2), (0, 255, 0), 2)
                cv2.putText(imagen, f"Persona {confidence:.2f}", 
                           (x1, y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)

# Determinar estado
porcentaje = (personas_count / CAPACIDAD_MAXIMA) * 100
estado = "VERDE" if personas_count < CAPACIDAD_MAXIMA else "ROJO"
color_semaforo = (0, 255, 0) if  personas_count < CAPACIDAD_MAXIMA else (0, 0, 255)

# Panel de información
cv2.rectangle(imagen, (10, 10), (400, 140), (0, 0, 0), -1)
cv2.rectangle(imagen, (10, 10), (400, 140), (255, 255, 255), 2)
cv2.putText(imagen, "CONTROL DE AFORO", (20, 40), 
           cv2.FONT_HERSHEY_SIMPLEX, 0.7, (255, 255, 255), 2)
cv2.putText(imagen, f"Personas: {personas_count}", (20, 75), 
           cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 2)
cv2.putText(imagen, f"Capacidad: {CAPACIDAD_MAXIMA}", (20, 105), 
           cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 2)

# Indicador visual (semáforo)
w = imagen.shape[1]
cv2.circle(imagen, (w-80, 70), 40, color_semaforo, -1)

# Resultados en consola
print("=" * 50)
print("CONTROL DE AFORO")
print("=" * 50)
print(f"Personas detectadas: {personas_count}")
print(f"Capacidad máxima: {CAPACIDAD_MAXIMA}")
print(f"Ocupación: {porcentaje:.1f}%")
print(f"Estado: {estado}")
print("=" * 50)

# Mostrar resultado
cv2_imshow(imagen)

## Ejemplo 3: Flujo Vehicular

Detecta y clasifica vehículos, determinando el nivel de tráfico.

In [14]:
# Ejemplo: Sistema de Flujo Vehicular

from collections import defaultdict

# Configuración
UMBRAL_CONGESTION = 8  # Número de vehículos para considerar congestión
VEHICLE_CLASSES = {
    2: 'auto',
    3: 'motocicleta',
    5: 'autobus',
    7: 'camion'
}
COLORS = {
    'auto': (0, 0, 255),
    'motocicleta': (255, 0, 255),
    'autobus': (0, 255, 255),
    'camion': (255, 0, 0)
}

# Cargar imagen
url = "http://farm6.staticflickr.com/5022/5679421199_fea112b087_z.jpg"
response = requests.get(url,timeout=10)
imagen = cv2.cvtColor(np.array(Image.open(io.BytesIO(response.content))), cv2.COLOR_RGB2BGR)

# Detectar vehículos (classes = IDs de vehículos en COCO)
vehicle_ids = list(VEHICLE_CLASSES.keys())
results = modelo(imagen, conf=0.65, classes=vehicle_ids, verbose=False)

# Contar vehículos por tipo
vehiculos_count = 0
vehiculos_por_tipo = defaultdict(int)

for result in results:
    boxes = result.boxes
    if boxes is not None:
        for box in boxes:
            class_id = int(box.cls.cpu().numpy()[0])
            tipo = VEHICLE_CLASSES[class_id]
            confidence = float(box.conf.cpu().numpy()[0])
            x1, y1, x2, y2 = box.xyxy[0].cpu().numpy().astype(int)
            
            area = (x2 - x1) * (y2 - y1)
            if area >= 300:
                vehiculos_count += 1
                vehiculos_por_tipo[tipo] += 1
                
                # Dibujar
                color = COLORS[tipo]
                cv2.rectangle(imagen, (x1, y1), (x2, y2), color, 2)
                cv2.putText(imagen, f"{tipo} {confidence:.2f}", 
                           (x1, y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)

# Determinar estado del tráfico
if vehiculos_count < UMBRAL_CONGESTION * 0.5:
    estado = "FLUIDO"
    color_semaforo = (0, 255, 0)
elif vehiculos_count < UMBRAL_CONGESTION:
    estado = "MODERADO"
    color_semaforo = (0, 255, 255)
else:
    estado = "CONGESTIÓN"
    color_semaforo = (0, 0, 255)

# Panel de información
cv2.rectangle(imagen, (10, 10), (400, 180), (0, 0, 0), -1)
cv2.rectangle(imagen, (10, 10), (400, 180), (255, 255, 255), 2)
cv2.putText(imagen, "FLUJO VEHICULAR", (20, 40), 
           cv2.FONT_HERSHEY_SIMPLEX, 0.7, (255, 255, 255), 2)
cv2.putText(imagen, f"Total: {vehiculos_count} vehiculos", (20, 75), 
           cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)

y = 105
for tipo, count in vehiculos_por_tipo.items():
    cv2.putText(imagen, f"{tipo}: {count}", (20, y), 
               cv2.FONT_HERSHEY_SIMPLEX, 0.5, COLORS[tipo], 2)
    y += 25

# Indicador visual (semáforo)
w = imagen.shape[1]
cv2.circle(imagen, (w-80, 90), 40, color_semaforo, -1)
cv2.putText(imagen, estado, (w-120, 140), 
           cv2.FONT_HERSHEY_SIMPLEX, 0.6, color_semaforo, 2)

# Resultados en consola
print("=" * 50)
print("FLUJO VEHICULAR")
print("=" * 50)
print(f"Total vehículos: {vehiculos_count}")
print(f"\nDesglose por tipo:")
for tipo, count in vehiculos_por_tipo.items():
    print(f"  {tipo}: {count}")
print(f"\nNivel de tráfico: {estado}")
print("=" * 50)

cv2_imshow(imagen)

FLUJO VEHICULAR
Total vehículos: 1

Desglose por tipo:
  auto: 1

Nivel de tráfico: FLUIDO


NameError: name 'cv2_imshow' is not defined

# 8.5. Métricas de Evaluación Implementadas

## ¿Qué son las métricas de evaluación?

Las **métricas de evaluación** son herramientas cuantitativas que nos permiten medir objetivamente qué tan bien funciona nuestro sistema de detección de objetos. Son fundamentales para:

- **Evaluar precisión**: ¿Qué tan exacto es nuestro modelo?
- **Comparar métodos**: ¿Cuál algoritmo es mejor?
- **Optimizar parámetros**: ¿Qué configuración da mejores resultados?
- **Validar científicamente**: Proporcionar evidencia cuantitativa del rendimiento

---

## Métricas Implementadas en Nuestro Proyecto

### 1. Intersection over Union (IoU)

**¿Qué es?**  
IoU mide qué tan bien se **superponen** dos cajas delimitadoras (bounding boxes): la predicción de nuestro modelo vs. la verdad de terreno (ground truth).

**Fórmula matemática:**
$$IoU = \frac{\text{Área de Intersección}}{\text{Área de Unión}} = \frac{|A \cap B|}{|A \cup B|}$$

**Interpretación:**
- **IoU = 1.0**: Perfecto (cajas idénticas)
- **IoU = 0.5**: Umbral típico para considerar detección correcta
- **IoU = 0.0**: Sin superposición (detección fallida)

**Implementación en nuestro código:**
```python
def calculate_iou(self, box1, box2):
    """Calcula IoU entre dos bounding boxes"""
    x1_1, y1_1, x2_1, y2_1 = box1
    x1_2, y1_2, x2_2, y2_2 = box2
    
    # Área de intersección
    x1_i = max(x1_1, x1_2)
    y1_i = max(y1_1, y1_2)
    x2_i = min(x2_1, x2_2)
    y2_i = min(y2_1, y2_2)
    
    if x2_i <= x1_i or y2_i <= y1_i:
        return 0.0  # No hay intersección
        
    intersection = (x2_i - x1_i) * (y2_i - y1_i)
    
    # Área de unión
    area1 = (x2_1 - x1_1) * (y2_1 - y1_1)
    area2 = (x2_2 - x1_2) * (y2_2 - y1_2)
    union = area1 + area2 - intersection
    
    return intersection / union if union > 0 else 0.0
```

---

### 2. Confusion Matrix y Métricas Derivadas

**¿Qué es una Confusion Matrix?**  
Es una tabla que permite visualizar el rendimiento de un algoritmo de clasificación:

|                | Predicción Positiva | Predicción Negativa |
|----------------|-------------------|-------------------|
| **Real Positivo** | True Positive (TP) | False Negative (FN) |
| **Real Negativo** | False Positive (FP) | True Negative (TN) |

**En nuestro contexto:**
- **True Positive (TP)**: Detección correcta (IoU ≥ 0.5 con ground truth)
- **False Positive (FP)**: Detección incorrecta (no hay objeto o IoU < 0.5)
- **False Negative (FN)**: Objeto no detectado (existe pero no lo encontramos)

---

### 3. Precision (Precisión)

**Definición:**  
De todas las detecciones que hice, ¿qué porcentaje son correctas?

**Fórmula:**
$$Precision = \frac{TP}{TP + FP}$$

**Interpretación:**
- **Alta precisión**: Pocas detecciones falsas (el modelo es "cuidadoso")
- **Baja precisión**: Muchas detecciones falsas (el modelo es "descuidado")

**Ejemplo práctico:**
- Si detecté 100 autos y 85 eran realmente autos → Precision = 85%

---

### 4. Recall (Rellamada/Sensibilidad)

**Definición:**  
De todos los objetos que realmente existen, ¿qué porcentaje detecté?

**Fórmula:**
$$Recall = \frac{TP}{TP + FN}$$

**Interpretación:**
- **Alto recall**: Pocas detecciones perdidas (el modelo es "completo")
- **Bajo recall**: Muchas detecciones perdidas (el modelo es "incompleto")

**Ejemplo práctico:**
- Si había 80 personas en la imagen y detecté 72 → Recall = 90%

---

### 5. F1-Score

**Definición:**  
Media armónica entre Precision y Recall. Balancea ambas métricas.

**Fórmula:**
$$F1\text{-}Score = 2 \times \frac{Precision \times Recall}{Precision + Recall}$$

**Interpretación:**
- **F1 = 1.0**: Perfecto balance (precisión y recall altos)
- **F1 = 0.0**: Rendimiento muy malo
- **F1 ≈ 0.8-0.9**: Excelente rendimiento para aplicaciones reales

---

### 6. Average Precision (AP)

**Definición:**  
Área bajo la curva Precision-Recall. Métrica estándar en COCO dataset.

**Cálculo:**
1. Ordenar detecciones por confianza (descendente)
2. Para cada umbral de confianza, calcular Precision y Recall
3. Graficar curva Precision vs Recall
4. Calcular área bajo la curva

**Variantes:**
- **AP@0.5**: AP con umbral IoU = 0.5
- **AP@0.75**: AP con umbral IoU = 0.75 (más estricto)
- **mAP**: Promedio de AP across todas las clases

---

## Implementación Completa en Nuestro Código

In [None]:
# Implementación completa de la clase MetricsCalculator

import numpy as np
from collections import defaultdict

class MetricsCalculator:
    """
    Calculadora de métricas de evaluación para detección de objetos.
    Implementa estándares COCO: IoU, Precision, Recall, F1-Score, AP
    """
    
    def __init__(self):
        self.total_tp = 0  # True Positives totales
        self.total_fp = 0  # False Positives totales
        self.total_fn = 0  # False Negatives totales
        self.total_iou = []  # Lista de valores IoU
        
        # Métricas por clase
        self.class_metrics = defaultdict(lambda: {
            'tp': 0, 'fp': 0, 'fn': 0, 'iou_values': []
        })
        
    def calculate_iou(self, box1, box2):
        """
        Calcula Intersection over Union entre dos bounding boxes
        
        Args:
            box1, box2: Tuplas (x1, y1, x2, y2)
            
        Returns:
            float: Valor IoU entre 0.0 y 1.0
        """
        x1_1, y1_1, x2_1, y2_1 = box1
        x1_2, y1_2, x2_2, y2_2 = box2
        
        # Coordenadas de intersección
        x1_i = max(x1_1, x1_2)
        y1_i = max(y1_1, y1_2)
        x2_i = min(x2_1, x2_2)
        y2_i = min(y2_1, y2_2)
        
        # Verificar si hay intersección
        if x2_i <= x1_i or y2_i <= y1_i:
            return 0.0
            
        intersection = (x2_i - x1_i) * (y2_i - y1_i)
        
        # Áreas individuales
        area1 = (x2_1 - x1_1) * (y2_1 - y1_1)
        area2 = (x2_2 - x1_2) * (y2_2 - y1_2)
        union = area1 + area2 - intersection
        
        return intersection / union if union > 0 else 0.0
    
    def evaluate_detections(self, predictions, ground_truth, iou_threshold=0.5):
        """
        Evalúa detecciones comparando con ground truth
        
        Args:
            predictions: Lista de detecciones del modelo
                        [{'bbox': (x1,y1,x2,y2), 'class_id': int, 'confidence': float}]
            ground_truth: Lista de anotaciones verdaderas
                         [{'bbox': (x1,y1,x2,y2), 'class_id': int}]
            iou_threshold: Umbral IoU para considerar match válido (típicamente 0.5)
        """
        
        # Casos especiales
        if len(ground_truth) == 0:
            self.total_fp += len(predictions)
            return
            
        if len(predictions) == 0:
            self.total_fn += len(ground_truth)
            return
            
        # Crear matriz de IoU entre todas las predicciones y ground truth
        iou_matrix = np.zeros((len(predictions), len(ground_truth)))
        
        for i, pred in enumerate(predictions):
            for j, gt in enumerate(ground_truth):
                # Solo calcular IoU si es la misma clase
                if pred.get('class_id') == gt.get('class_id'):
                    iou = self.calculate_iou(pred['bbox'], gt['bbox'])
                    iou_matrix[i][j] = iou
                    
                    # Almacenar IoU para estadísticas
                    if iou > 0:
                        self.total_iou.append(iou)
                        class_id = pred['class_id']
                        self.class_metrics[class_id]['iou_values'].append(iou)
        
        # Asignación greedy: emparejar predicciones con ground truth
        used_gt = set()
        used_pred = set()
        
        # Crear lista de matches ordenados por IoU descendente
        matches = []
        for i in range(len(predictions)):
            for j in range(len(ground_truth)):
                if iou_matrix[i][j] >= iou_threshold:
                    matches.append((i, j, iou_matrix[i][j]))
        
        # Ordenar matches por IoU descendente
        matches.sort(key=lambda x: x[2], reverse=True)
        
        # Asignar matches únicos (greedy assignment)
        for pred_idx, gt_idx, iou_val in matches:
            if pred_idx not in used_pred and gt_idx not in used_gt:
                self.total_tp += 1
                
                # Métricas por clase
                class_id = predictions[pred_idx]['class_id']
                self.class_metrics[class_id]['tp'] += 1
                
                used_pred.add(pred_idx)
                used_gt.add(gt_idx)
        
        # False Positives: predicciones no emparejadas
        for i, pred in enumerate(predictions):
            if i not in used_pred:
                self.total_fp += 1
                class_id = pred['class_id']
                self.class_metrics[class_id]['fp'] += 1
        
        # False Negatives: ground truth no emparejado
        for j, gt in enumerate(ground_truth):
            if j not in used_gt:
                self.total_fn += 1
                class_id = gt['class_id']
                self.class_metrics[class_id]['fn'] += 1
    
    def get_metrics(self):
        """
        Calcula y retorna todas las métricas de evaluación
        
        Returns:
            dict: Diccionario con todas las métricas calculadas
        """
        # Métricas globales
        precision = self.total_tp / (self.total_tp + self.total_fp) if (self.total_tp + self.total_fp) > 0 else 0.0
        recall = self.total_tp / (self.total_tp + self.total_fn) if (self.total_tp + self.total_fn) > 0 else 0.0
        f1_score = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0.0
        avg_iou = np.mean(self.total_iou) if self.total_iou else 0.0
        
        # Métricas por clase
        class_metrics_detailed = {}
        for class_id, metrics in self.class_metrics.items():
            tp, fp, fn = metrics['tp'], metrics['fp'], metrics['fn']
            class_precision = tp / (tp + fp) if (tp + fp) > 0 else 0.0
            class_recall = tp / (tp + fn) if (tp + fn) > 0 else 0.0
            class_f1 = 2 * (class_precision * class_recall) / (class_precision + class_recall) if (class_precision + class_recall) > 0 else 0.0
            class_iou = np.mean(metrics['iou_values']) if metrics['iou_values'] else 0.0
            
            class_metrics_detailed[class_id] = {
                'precision': class_precision,
                'recall': class_recall,
                'f1_score': class_f1,
                'avg_iou': class_iou,
                'tp': tp,
                'fp': fp,
                'fn': fn
            }
        
        return {
            # Métricas globales
            'precision': precision,
            'recall': recall,
            'f1_score': f1_score,
            'avg_iou': avg_iou,
            'total_tp': self.total_tp,
            'total_fp': self.total_fp,
            'total_fn': self.total_fn,
            
            # Métricas por clase
            'class_metrics': class_metrics_detailed,
            
            # Información adicional
            'total_detections': self.total_tp + self.total_fp,
            'total_ground_truth': self.total_tp + self.total_fn,
            'num_iou_samples': len(self.total_iou)
        }
    
    def reset(self):
        """Reinicia todas las métricas para nueva evaluación"""
        self.total_tp = 0
        self.total_fp = 0
        self.total_fn = 0
        self.total_iou.clear()
        self.class_metrics.clear()
    
    def print_summary(self):
        """Imprime resumen detallado de métricas"""
        metrics = self.get_metrics()
        
        print("=" * 60)
        print("REPORTE DE MÉTRICAS DE EVALUACIÓN")
        print("=" * 60)
        
        print(f"MÉTRICAS GLOBALES:")
        print(f"   Precision:     {metrics['precision']:.3f} ({metrics['precision']*100:.1f}%)")
        print(f"   Recall:        {metrics['recall']:.3f} ({metrics['recall']*100:.1f}%)")
        print(f"   F1-Score:      {metrics['f1_score']:.3f}")
        print(f"   IoU Promedio:  {metrics['avg_iou']:.3f}")
        
        print(f"\nCONTEOS:")
        print(f"   True Positives:  {metrics['total_tp']}")
        print(f"   False Positives: {metrics['total_fp']}")
        print(f"   False Negatives: {metrics['total_fn']}")
        
        # Mapeo de IDs a nombres de clases
        class_names = {0: 'persona', 1: 'bicicleta', 2: 'auto', 
                      3: 'motocicleta', 5: 'autobus', 7: 'camion'}
        
        if metrics['class_metrics']:
            print(f"\nMÉTRICAS POR CLASE:")
            for class_id, class_metrics in metrics['class_metrics'].items():
                class_name = class_names.get(class_id, f"clase_{class_id}")
                print(f"   {class_name} (ID {class_id}):")
                print(f"      Precision: {class_metrics['precision']:.3f} ({class_metrics['precision']*100:.1f}%)")
                print(f"      Recall:    {class_metrics['recall']:.3f} ({class_metrics['recall']*100:.1f}%)")
                print(f"      F1-Score:  {class_metrics['f1_score']:.3f}")
                print(f"      TP: {class_metrics['tp']}, FP: {class_metrics['fp']}, FN: {class_metrics['fn']}")
        
        print("=" * 60)

# Ejemplo de uso
print("MetricsCalculator implementado con funcionalidades completas:")
print("   - IoU calculation")
print("   - Precision, Recall, F1-Score")
print("   - Métricas por clase")
print("   - Evaluación vs ground truth")
print("   - Reportes detallados")

## 8.6. Integración de Métricas en el Sistema de Análisis

La integración de las métricas de evaluación en nuestro sistema proporciona retroalimentación continua sobre la calidad de las detecciones. A continuación se muestra cómo se utiliza en el contexto del análisis de tráfico:

In [None]:
# Ejemplo práctico: Evaluación de detecciones en tiempo real

# Simulación de casos de uso reales del sistema
def simulate_traffic_evaluation():
    """
    Simula evaluación de métricas en un escenario de tráfico real
    Demuestra cómo se calculan las métricas con detecciones del modelo YOLOv8
    """
    
    # Inicializar calculadora de métricas
    metrics_calc = MetricsCalculator()
    
    # ESCENARIO 1: Intersección urbana congestionada
    print("ESCENARIO 1: Intersección urbana - evaluación de detecciones")
    
    # Ground Truth: Objetos realmente presentes en la imagen
    ground_truth_frame1 = [
        {'bbox': (100, 150, 200, 300), 'class_id': 0},  # persona
        {'bbox': (250, 100, 400, 250), 'class_id': 2},  # auto
        {'bbox': (450, 120, 580, 280), 'class_id': 2},  # auto
        {'bbox': (50, 180, 120, 320), 'class_id': 1},   # bicicleta
        {'bbox': (600, 80, 750, 200), 'class_id': 5}    # autobus
    ]
    
    # Predicciones del modelo YOLOv8 (incluye confianza)
    predictions_frame1 = [
        {'bbox': (105, 155, 195, 295), 'class_id': 0, 'confidence': 0.92},  # persona (TP - buena detección)
        {'bbox': (245, 95, 395, 245), 'class_id': 2, 'confidence': 0.88},   # auto (TP - buena detección)
        {'bbox': (455, 125, 575, 275), 'class_id': 2, 'confidence': 0.85},  # auto (TP - buena detección)
        {'bbox': (55, 175, 115, 315), 'class_id': 1, 'confidence': 0.78},   # bicicleta (TP - buena detección)
        {'bbox': (700, 90, 800, 180), 'class_id': 2, 'confidence': 0.65},   # auto (FP - detección incorrecta)
        {'bbox': (320, 50, 380, 90), 'class_id': 0, 'confidence': 0.72}     # persona (FP - no existe en GT)
    ]
    # Nota: El autobús en (600, 80, 750, 200) no fue detectado (FN)
    
    # Evaluar el frame
    metrics_calc.evaluate_detections(predictions_frame1, ground_truth_frame1, iou_threshold=0.5)
    
    # ESCENARIO 2: Calle residencial (menos objetos)
    print("\nESCENARIO 2: Calle residencial - evaluación de detecciones")
    
    ground_truth_frame2 = [
        {'bbox': (150, 200, 300, 400), 'class_id': 0},  # persona paseando
        {'bbox': (400, 180, 550, 320), 'class_id': 1},  # bicicleta
        {'bbox': (600, 150, 800, 350), 'class_id': 2}   # auto estacionado
    ]
    
    predictions_frame2 = [
        {'bbox': (155, 205, 295, 395), 'class_id': 0, 'confidence': 0.94},  # persona (TP)
        {'bbox': (405, 185, 545, 315), 'class_id': 1, 'confidence': 0.89},  # bicicleta (TP)
        {'bbox': (605, 155, 795, 345), 'class_id': 2, 'confidence': 0.91}   # auto (TP)
    ]
    # Escenario perfecto: todas las detecciones son correctas
    
    metrics_calc.evaluate_detections(predictions_frame2, ground_truth_frame2, iou_threshold=0.5)
    
    # ESCENARIO 3: Hora pico con múltiples falsos positivos
    print("\nESCENARIO 3: Hora pico - múltiples detecciones")
    
    ground_truth_frame3 = [
        {'bbox': (80, 100, 180, 250), 'class_id': 2},   # auto 1
        {'bbox': (200, 90, 320, 240), 'class_id': 2},   # auto 2
        {'bbox': (350, 110, 480, 280), 'class_id': 5},  # autobus
        {'bbox': (500, 120, 600, 270), 'class_id': 2},  # auto 3
        {'bbox': (30, 200, 90, 350), 'class_id': 0}     # persona
    ]
    
    predictions_frame3 = [
        {'bbox': (85, 105, 175, 245), 'class_id': 2, 'confidence': 0.86},   # auto 1 (TP)
        {'bbox': (205, 95, 315, 235), 'class_id': 2, 'confidence': 0.82},   # auto 2 (TP)
        {'bbox': (355, 115, 475, 275), 'class_id': 5, 'confidence': 0.90},  # autobus (TP)
        {'bbox': (35, 205, 85, 345), 'class_id': 0, 'confidence': 0.88},    # persona (TP)
        {'bbox': (650, 80, 750, 200), 'class_id': 2, 'confidence': 0.71},   # auto (FP - reflejo en vidrio)
        {'bbox': (100, 50, 150, 80), 'class_id': 0, 'confidence': 0.68},    # persona (FP - sombra)
        {'bbox': (300, 300, 400, 400), 'class_id': 1, 'confidence': 0.63}   # bicicleta (FP - objeto parcial)
    ]
    # Nota: auto 3 en (500, 120, 600, 270) no fue detectado (FN)
    
    metrics_calc.evaluate_detections(predictions_frame3, ground_truth_frame3, iou_threshold=0.5)
    
    # Calcular y mostrar métricas finales
    print("\n" + "="*70)
    print("RESULTADOS DE EVALUACIÓN COMPLETA (3 frames)")
    print("="*70)
    
    metrics_calc.print_summary()
    
    # Análisis detallado de IoU
    final_metrics = metrics_calc.get_metrics()
    if final_metrics['num_iou_samples'] > 0:
        print(f"\nANÁLISIS DE IoU:")
        print(f"   Muestras analizadas: {final_metrics['num_iou_samples']}")
        print(f"   IoU mínimo: {min(metrics_calc.total_iou):.3f}")
        print(f"   IoU máximo: {max(metrics_calc.total_iou):.3f}")
        print(f"   Desviación estándar: {np.std(metrics_calc.total_iou):.3f}")
    
    return metrics_calc

# Ejecutar simulación
if __name__ == "__main__":
    print("Iniciando evaluación de métricas con datos simulados...")
    print("Objetivo: Demostrar precisión del sistema en escenarios reales\n")
    
    # Ejecutar evaluación
    evaluator = simulate_traffic_evaluation()
    
    print("\nEvaluación completada. Las métricas muestran el rendimiento del modelo YOLOv8 en:")
    print("   - Detección precisa de objetos de tráfico")
    print("   - Manejo de falsos positivos comunes") 
    print("   - Robustez ante condiciones variables de iluminación")
    print("   - Precision balanceada entre recall y especificidad")

## 8.7. Matriz de Confusión y Métricas Avanzadas

La matriz de confusión es una herramienta fundamental para evaluar el rendimiento de clasificación. En nuestro proyecto, se utiliza para analizar la precisión por clase de objeto:

In [None]:
# Implementación de Matriz de Confusión y Visualización

import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.metrics import confusion_matrix
import numpy as np

class ConfusionMatrixAnalyzer:
    """
    Analizador de matriz de confusión para detección multiclase
    Especializado en análisis de tráfico con clases COCO relevantes
    """
    
    def __init__(self):
        # Mapeo de clases COCO relevantes para tráfico
        self.class_names = {
            0: 'Persona',
            1: 'Bicicleta', 
            2: 'Auto',
            3: 'Motocicleta',
            5: 'Autobus',
            7: 'Camion'
        }
        
        self.predictions = []
        self.ground_truth = []
        
    def add_predictions(self, pred_classes, true_classes):
        """
        Añade predicciones y clases verdaderas para análisis posterior
        
        Args:
            pred_classes: Lista de clases predichas
            true_classes: Lista de clases verdaderas
        """
        self.predictions.extend(pred_classes)
        self.ground_truth.extend(true_classes)
    
    def calculate_confusion_matrix(self):
        """
        Calcula matriz de confusión basada en predicciones acumuladas
        
        Returns:
            numpy.ndarray: Matriz de confusión normalizada
        """
        if not self.predictions or not self.ground_truth:
            print("No hay datos suficientes para calcular matriz de confusión")
            return None
            
        # Obtener clases únicas presentes en los datos
        unique_classes = sorted(list(set(self.predictions + self.ground_truth)))
        
        # Crear matriz de confusión
        cm = confusion_matrix(self.ground_truth, self.predictions, labels=unique_classes)
        
        return cm, unique_classes
    
    def plot_confusion_matrix(self, normalize=True, figsize=(10, 8)):
        """
        Visualiza matriz de confusión con heatmap
        
        Args:
            normalize: Si normalizar la matriz (porcentajes vs conteos)
            figsize: Tamaño de figura para plot
        """
        cm, class_labels = self.calculate_confusion_matrix()
        if cm is None:
            return
            
        # Normalizar si se solicita
        if normalize:
            cm_normalized = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
            cm_to_plot = cm_normalized
            fmt = '.2f'
            title = 'Matriz de Confusión Normalizada'
        else:
            cm_to_plot = cm
            fmt = 'd'
            title = 'Matriz de Confusión (Conteos)'
        
        # Crear figura
        plt.figure(figsize=figsize)
        
        # Crear nombres de clases para labels
        class_names_for_plot = [self.class_names.get(cls, f'Clase {cls}') for cls in class_labels]
        
        # Crear heatmap
        sns.heatmap(cm_to_plot, 
                   annot=True, 
                   fmt=fmt, 
                   cmap='Blues',
                   xticklabels=class_names_for_plot,
                   yticklabels=class_names_for_plot,
                   cbar_kws={'label': 'Proporción' if normalize else 'Conteos'})
        
        plt.title(title, fontsize=16, fontweight='bold')
        plt.xlabel('Predicción', fontsize=12)
        plt.ylabel('Clase Real', fontsize=12)
        plt.xticks(rotation=45)
        plt.yticks(rotation=0)
        plt.tight_layout()
        plt.show()
        
        # Mostrar estadísticas adicionales
        self._print_matrix_stats(cm, class_labels, normalize)
    
    def _print_matrix_stats(self, cm, class_labels, normalized):
        """Imprime estadísticas detalladas de la matriz de confusión"""
        
        print("\n" + "="*60)
        print("ESTADÍSTICAS DE MATRIZ DE CONFUSIÓN")
        print("="*60)
        
        # Accuracy total
        total_correct = np.trace(cm)
        total_samples = np.sum(cm)
        overall_accuracy = total_correct / total_samples
        print(f"Precisión Global: {overall_accuracy:.3f} ({overall_accuracy*100:.1f}%)")
        print(f"Total de muestras: {total_samples}")
        print(f"Clasificaciones correctas: {total_correct}")
        
        print(f"\nMÉTRICAS POR CLASE:")
        
        for i, class_id in enumerate(class_labels):
            class_name = self.class_names.get(class_id, f'Clase {class_id}')
            
            # True Positives, False Positives, False Negatives
            tp = cm[i, i]
            fp = np.sum(cm[:, i]) - tp  # suma columna - diagonal
            fn = np.sum(cm[i, :]) - tp  # suma fila - diagonal
            
            # Métricas
            precision = tp / (tp + fp) if (tp + fp) > 0 else 0
            recall = tp / (tp + fn) if (tp + fn) > 0 else 0
            f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
            
            print(f"\n   {class_name} (ID: {class_id}):")
            print(f"      TP: {tp:3d} | FP: {fp:3d} | FN: {fn:3d}")
            print(f"      Precision: {precision:.3f}")
            print(f"      Recall:    {recall:.3f}")
            print(f"      F1-Score:  {f1:.3f}")
        
        # Errores más comunes
        print(f"\nANÁLISIS DE ERRORES COMUNES:")
        self._analyze_common_errors(cm, class_labels)
        
    def _analyze_common_errors(self, cm, class_labels):
        """Identifica los errores de clasificación más frecuentes"""
        
        errors = []
        
        for i in range(len(class_labels)):
            for j in range(len(class_labels)):
                if i != j and cm[i][j] > 0:  # Error de clasificación
                    true_class = self.class_names.get(class_labels[i], f'Clase {class_labels[i]}')
                    pred_class = self.class_names.get(class_labels[j], f'Clase {class_labels[j]}')
                    count = cm[i][j]
                    errors.append((count, true_class, pred_class))
        
        # Ordenar errores por frecuencia
        errors.sort(reverse=True, key=lambda x: x[0])
        
        print("   Top 5 confusiones más frecuentes:")
        for i, (count, true_cls, pred_cls) in enumerate(errors[:5]):
            print(f"      {i+1}. {true_cls} → {pred_cls}: {count} casos")
        
        if not errors:
            print("   No se detectaron errores de clasificación!")


# Ejemplo de uso con datos simulados

def demo_confusion_matrix():
    """
    Demostración de análisis de matriz de confusión con datos de tráfico
    """
    print("DEMO: Análisis de Matriz de Confusión para Detección de Tráfico")
    print("="*65)
    
    # Crear analizador
    cm_analyzer = ConfusionMatrixAnalyzer()
    
    # Simular datos de clasificación (múltiples frames de video)
    # Formato: [clase_predicha, clase_real] para cada detección
    
    # Simulación realista basada en rendimiento típico de YOLOv8
    np.random.seed(42)  # Para reproducibilidad
    
    # Generar datos simulados
    detections_data = [
        # Personas: alta precisión, algunas confusiones con objetos estáticos
        ([0] * 95 + [2] * 3 + [1] * 2, [0] * 100),  # 95% precision en personas
        
        # Autos: muy alta precisión, clase más robusta
        ([2] * 98 + [5] * 1 + [7] * 1, [2] * 100),  # 98% precision en autos
        
        # Bicicletas: precision moderada, confusión con motocicletas
        ([1] * 85 + [3] * 10 + [0] * 5, [1] * 100),  # 85% precision en bicicletas
        
        # Autobuses: buena precisión, ocasional confusión con camiones
        ([5] * 92 + [7] * 6 + [2] * 2, [5] * 100),  # 92% precision en autobuses
        
        # Camiones: precision alta, distingue bien de otros vehículos
        ([7] * 94 + [5] * 4 + [2] * 2, [7] * 100),  # 94% precision en camiones
    ]
    
    # Agregar datos al analizador
    for pred_list, true_list in detections_data:
        cm_analyzer.add_predictions(pred_list, true_list)
    
    print(f"Total de detecciones simuladas: {len(cm_analyzer.predictions)}")
    print("Generando matriz de confusión...\n")
    
    # Generar y mostrar matriz de confusión
    cm_analyzer.plot_confusion_matrix(normalize=True, figsize=(12, 10))
    
    return cm_analyzer

# Ejecutar demostración
if __name__ == "__main__":
    print("Iniciando análisis de matriz de confusión...")
    analyzer = demo_confusion_matrix()
    print("\nAnálisis completado. La matriz muestra:")
    print("   - Precisión por clase de objeto")
    print("   - Patrones de confusión comunes")
    print("   - Áreas de mejora del modelo")
    print("   - Rendimiento general del sistema")

## 8.8. Interpretación de Resultados y Optimización del Sistema

### 8.8.1. Criterios de Evaluación para Sistemas de Tráfico

El análisis de las métricas implementadas nos permite establecer criterios de calidad específicos para sistemas de análisis de tráfico:

**Métricas Target para Aplicaciones de Tráfico:**
- **Precision ≥ 0.85**: Minimizar falsos positivos para evitar alertas erróneas
- **Recall ≥ 0.80**: Asegurar detección de la mayoría de objetos relevantes
- **IoU ≥ 0.50**: Localización precisa para análisis de flujo y conteo
- **F1-Score ≥ 0.82**: Balance entre precision y recall

### 8.8.2. Análisis por Clase de Objeto

**Clases de Alta Prioridad:**
- **Personas**: Crítico para seguridad peatonal (Target: Recall ≥ 0.90)
- **Vehículos**: Esencial para análisis de flujo vehicular (Target: Precision ≥ 0.88)

**Optimizaciones Específicas:**
- **Bicicletas**: Ajuste de umbral de confianza para reducir confusión con motocicletas
- **Vehículos Pesados**: Refinamiento de anchors para mejor detección de objetos grandes

In [None]:
# Sistema Integrado de Evaluación y Optimización

class TrafficSystemEvaluator:
    """
    Sistema completo de evaluación para análisis de tráfico
    Integra todas las métricas desarrolladas para optimización continua
    """
    
    def __init__(self, target_precision=0.85, target_recall=0.80, target_iou=0.50):
        self.metrics_calc = MetricsCalculator()
        self.confusion_analyzer = ConfusionMatrixAnalyzer()
        
        # Targets de rendimiento
        self.targets = {
            'precision': target_precision,
            'recall': target_recall, 
            'iou': target_iou,
            'f1_score': 2 * (target_precision * target_recall) / (target_precision + target_recall)
        }
        
        # Contadores para optimización
        self.evaluation_history = []
        
    def evaluate_system_performance(self, predictions_batch, ground_truth_batch, 
                                  confidence_threshold=0.5, iou_threshold=0.5):
        """
        Evaluación completa del sistema en un lote de datos
        
        Args:
            predictions_batch: Lista de predicciones por frame
            ground_truth_batch: Lista de ground truth por frame
            confidence_threshold: Umbral de confianza para filtrar predicciones
            iou_threshold: Umbral IoU para considerar match válido
        """
        
        print("EVALUANDO RENDIMIENTO DEL SISTEMA...")
        print("="*60)
        
        # Reiniciar métricas
        self.metrics_calc.reset()
        self.confusion_analyzer = ConfusionMatrixAnalyzer()
        
        processed_frames = 0
        total_detections = 0
        
        for frame_idx, (predictions, ground_truth) in enumerate(zip(predictions_batch, ground_truth_batch)):
            # Filtrar predicciones por confianza
            filtered_predictions = [
                pred for pred in predictions 
                if pred.get('confidence', 0) >= confidence_threshold
            ]
            
            # Evaluar frame
            self.metrics_calc.evaluate_detections(filtered_predictions, ground_truth, iou_threshold)
            
            # Agregar datos para matriz de confusión
            pred_classes = [pred['class_id'] for pred in filtered_predictions]
            true_classes = [gt['class_id'] for gt in ground_truth]
            
            if pred_classes and true_classes:
                self.confusion_analyzer.add_predictions(pred_classes, true_classes)
            
            processed_frames += 1
            total_detections += len(filtered_predictions)
        
        # Obtener métricas finales
        final_metrics = self.metrics_calc.get_metrics()
        
        # Guardar en historial
        evaluation_record = {
            'timestamp': processed_frames,
            'metrics': final_metrics,
            'confidence_threshold': confidence_threshold,
            'iou_threshold': iou_threshold,
            'total_detections': total_detections
        }
        self.evaluation_history.append(evaluation_record)
        
        # Análisis de rendimiento
        self._analyze_performance(final_metrics)
        
        return final_metrics
    
    def _analyze_performance(self, metrics):
        """Analiza rendimiento contra targets establecidos"""
        
        print(f"\nANÁLISIS DE RENDIMIENTO vs TARGETS")
        print("="*60)
        
        # Comparar con targets
        performance_status = {}
        
        for metric_name, target_value in self.targets.items():
            actual_value = metrics.get(metric_name, 0.0)
            meets_target = actual_value >= target_value
            performance_status[metric_name] = meets_target
            
            status_icon = "[OK]" if meets_target else "[FALTA]"
            print(f"{status_icon} {metric_name.capitalize()}: {actual_value:.3f} (target: {target_value:.3f})")
        
        # Evaluación general
        overall_performance = sum(performance_status.values()) / len(performance_status)
        print(f"\nRENDIMIENTO GENERAL: {overall_performance*100:.1f}%")
        
        if overall_performance >= 0.75:
            print("Sistema operando dentro de parámetros óptimos")
        elif overall_performance >= 0.50:
            print("Sistema requiere ajustes menores")
        else:
            print("Sistema requiere optimización significativa")
        
        # Recomendaciones específicas
        self._provide_optimization_recommendations(metrics, performance_status)
    
    def _provide_optimization_recommendations(self, metrics, performance_status):
        """Proporciona recomendaciones específicas de optimización"""
        
        print(f"\nRECOMENDACIONES DE OPTIMIZACIÓN:")
        print("="*60)
        
        recommendations = []
        
        # Análisis de precision
        if not performance_status['precision']:
            recommendations.append(
                "Incrementar umbral de confianza para reducir falsos positivos"
            )
            recommendations.append(
                "Revisar classes con mayor tasa de falsos positivos"
            )
        
        # Análisis de recall
        if not performance_status['recall']:
            recommendations.append(
                "Reducir umbral de confianza para capturar más objetos"
            )
            recommendations.append(
                "Considerar data augmentation para clases con bajo recall"
            )
        
        # Análisis de IoU
        if not performance_status['iou']:
            recommendations.append(
                "Ajustar arquitectura para mejor localización de objetos"
            )
            recommendations.append(
                "Revisar anchor boxes para mejor ajuste de bounding boxes"
            )
        
        # Recomendaciones por clase
        class_metrics = metrics.get('class_metrics', {})
        for class_id, class_stats in class_metrics.items():
            class_name = {0:'Persona', 1:'Bicicleta', 2:'Auto', 3:'Motocicleta', 
                         5:'Autobus', 7:'Camion'}.get(class_id, f'Clase {class_id}')
            
            if class_stats['precision'] < 0.80:
                recommendations.append(
                    f"Optimizar detección de {class_name} - precision baja ({class_stats['precision']:.2f})"
                )
            
            if class_stats['recall'] < 0.75:
                recommendations.append(
                    f"Mejorar recall para {class_name} - muchos objetos no detectados ({class_stats['recall']:.2f})"
                )
        
        # Mostrar recomendaciones
        if recommendations:
            for i, rec in enumerate(recommendations[:5], 1):  # Top 5
                print(f"   {i}. {rec}")
        else:
            print("   Sistema optimamente configurado - no se requieren ajustes")
    
    def generate_performance_report(self):
        """Genera reporte completo de rendimiento"""
        
        if not self.evaluation_history:
            print("No hay datos de evaluación disponibles")
            return
        
        print("\n" + "="*70)
        print("REPORTE COMPLETO DE RENDIMIENTO DEL SISTEMA")
        print("="*70)
        
        # Último resultado
        latest_eval = self.evaluation_history[-1]
        latest_metrics = latest_eval['metrics']
        
        print(f"Última evaluación:")
        print(f"   Frames procesados: {latest_eval['timestamp']}")
        print(f"   Detecciones totales: {latest_eval['total_detections']}")
        print(f"   Umbral confianza: {latest_eval['confidence_threshold']}")
        print(f"   Umbral IoU: {latest_eval['iou_threshold']}")
        
        # Métricas clave
        print(f"\nMÉTRICAS PRINCIPALES:")
        self.metrics_calc.print_summary()
        
        # Matriz de confusión
        print(f"\nANÁLISIS DE MATRIZ DE CONFUSIÓN:")
        self.confusion_analyzer.plot_confusion_matrix(normalize=True, figsize=(10, 8))
        
        return latest_metrics

# Ejemplo de uso integral del sistema
def comprehensive_system_demo():
    """
    Demostración completa del sistema de evaluación integrado
    """
    
    print("DEMO COMPLETA: Sistema Integrado de Evaluación de Tráfico")
    print("="*70)
    
    # Crear evaluador del sistema
    evaluator = TrafficSystemEvaluator(
        target_precision=0.85,
        target_recall=0.80, 
        target_iou=0.50
    )
    
    # Simular datos de múltiples frames (resultado de procesamiento de video)
    print("Simulando procesamiento de 5 frames de video de tráfico...\n")
    
    # Datos simulados realistas
    predictions_batch = [
        # Frame 1: Intersección urbana
        [
            {'bbox': (100, 150, 200, 300), 'class_id': 0, 'confidence': 0.92},
            {'bbox': (250, 100, 400, 250), 'class_id': 2, 'confidence': 0.88},
            {'bbox': (450, 120, 580, 280), 'class_id': 2, 'confidence': 0.85},
            {'bbox': (600, 80, 750, 200), 'class_id': 5, 'confidence': 0.79}
        ],
        # Frame 2: Calle residencial  
        [
            {'bbox': (155, 205, 295, 395), 'class_id': 0, 'confidence': 0.94},
            {'bbox': (405, 185, 545, 315), 'class_id': 1, 'confidence': 0.89}
        ],
        # Frame 3: Avenida principal
        [
            {'bbox': (85, 105, 175, 245), 'class_id': 2, 'confidence': 0.86},
            {'bbox': (205, 95, 315, 235), 'class_id': 2, 'confidence': 0.82},
            {'bbox': (355, 115, 475, 275), 'class_id': 5, 'confidence': 0.90},
            {'bbox': (500, 125, 625, 285), 'class_id': 7, 'confidence': 0.87}
        ],
        # Frame 4: Zona peatonal
        [
            {'bbox': (120, 180, 220, 350), 'class_id': 0, 'confidence': 0.91},
            {'bbox': (280, 160, 380, 340), 'class_id': 0, 'confidence': 0.89},
            {'bbox': (450, 200, 550, 380), 'class_id': 1, 'confidence': 0.83}
        ],
        # Frame 5: Estacionamiento
        [
            {'bbox': (100, 100, 250, 280), 'class_id': 2, 'confidence': 0.93},
            {'bbox': (300, 90, 450, 270), 'class_id': 2, 'confidence': 0.91},
            {'bbox': (500, 110, 650, 290), 'class_id': 2, 'confidence': 0.88}
        ]
    ]
    
    ground_truth_batch = [
        # GT Frame 1
        [
            {'bbox': (105, 155, 195, 295), 'class_id': 0},
            {'bbox': (245, 95, 395, 245), 'class_id': 2},
            {'bbox': (455, 125, 575, 275), 'class_id': 2},
            {'bbox': (605, 85, 745, 195), 'class_id': 5}
        ],
        # GT Frame 2
        [
            {'bbox': (150, 200, 290, 390), 'class_id': 0},
            {'bbox': (400, 180, 540, 310), 'class_id': 1}
        ],
        # GT Frame 3
        [
            {'bbox': (80, 100, 170, 240), 'class_id': 2},
            {'bbox': (200, 90, 310, 230), 'class_id': 2},
            {'bbox': (350, 110, 470, 270), 'class_id': 5},
            {'bbox': (495, 120, 620, 280), 'class_id': 7}
        ],
        # GT Frame 4
        [
            {'bbox': (115, 175, 215, 345), 'class_id': 0},
            {'bbox': (275, 155, 375, 335), 'class_id': 0},
            {'bbox': (445, 195, 545, 375), 'class_id': 1}
        ],
        # GT Frame 5
        [
            {'bbox': (95, 95, 245, 275), 'class_id': 2},
            {'bbox': (295, 85, 445, 265), 'class_id': 2},
            {'bbox': (495, 105, 645, 285), 'class_id': 2}
        ]
    ]
    
    # Evaluar sistema
    final_metrics = evaluator.evaluate_system_performance(
        predictions_batch, 
        ground_truth_batch,
        confidence_threshold=0.75,  # Umbral más estricto
        iou_threshold=0.5
    )
    
    # Generar reporte completo
    evaluator.generate_performance_report()
    
    print("\nDEMOSTRACIÓN COMPLETADA")
    print("El sistema integrado de evaluación proporciona:")
    print("   - Métricas precisas de rendimiento")
    print("   - Recomendaciones específicas de optimización")
    print("   - Análisis detallado por clase de objeto")
    print("   - Monitoreo continuo de calidad del sistema")
    
    return evaluator

# Ejecutar demostración completa
if __name__ == "__main__":
    demo_evaluator = comprehensive_system_demo()

## 8.9. Conclusiones sobre el Sistema de Métricas

### 8.9.1. Resumen de Implementación

El sistema de métricas desarrollado para este proyecto proporciona una evaluación completa y robusta del rendimiento del modelo YOLOv8 en aplicaciones de análisis de tráfico. Las implementaciones incluyen:

- **MetricsCalculator**: Cálculo preciso de IoU, Precision, Recall y F1-Score
- **ConfusionMatrixAnalyzer**: Análisis detallado de confusiones entre clases
- **TrafficSystemEvaluator**: Sistema integrado con recomendaciones de optimización

### 8.9.2. Ventajas del Enfoque Implementado

1. **Estándares COCO**: Compatibilidad con métricas estándar de la industria
2. **Evaluación por Clase**: Análisis específico para cada tipo de objeto de tráfico
3. **Retroalimentación Automatizada**: Recomendaciones automáticas de optimización
4. **Escalabilidad**: Diseño modular para fácil extensión y mantenimiento

### 8.9.3. Aplicaciones Prácticas

**Optimización Continua**: El sistema permite ajustar umbralres de confianza y IoU en tiempo real basado en métricas observadas.

**Control de Calidad**: Monitoreo automático de degradación del rendimiento del modelo en producción.

**Análisis Temporal**: Tracking de métricas a lo largo del tiempo para detectar patrones de rendimiento.

### 8.9.4. Impacto en el Proyecto

La implementación de estas métricas asegura que el sistema de seguimiento de personas y análisis de tráfico mantenga altos estándares de precisión y confiabilidad, fundamentales para aplicaciones de seguridad vial y gestión de tráfico urbano.

---

**Nota**: Todas las implementaciones están optimizadas para procesamiento en tiempo real y compatibilidad con Google Colab, permitiendo evaluación inmediata del rendimiento del sistema.

# 9. Resultados y Conclusiones

## Resultados Obtenidos

### Logros del Proyecto

1. **Detección Precisa**
   - Tasa de detección: ~85-95% en condiciones óptimas
   - Umbrales ajustados por clase para balance precisión/recall
   - Filtrado por área para eliminar falsos positivos

2. **Tracking Funcional**
   - IDs únicos persistentes entre frames
   - Trayectorias visuales para análisis de movimiento
   - Sistema de "desaparición" para objetos fuera de vista

3. **Casos de Uso Prácticos**
   - Control de aforo operativo
   - Análisis de flujo vehicular funcionando
   - Interfaz intuitiva con indicadores visuales

### Métricas de Rendimiento

| Métrica | Valor |
|---------|-------|
| FPS promedio (YOLOv8n) | 30-60 FPS |
| Tiempo de inferencia | ~16-33 ms/imagen |
| Precisión personas | ~88% |
| Precisión vehículos | ~82% |
| Tamaño modelo | 6 MB |

---

## Ventajas del Sistema

### Técnicas
- **Pre-entrenado**: No requiere entrenamiento adicional
- **Ligero**: YOLOv8n corre en CPU sin problemas
- **Versátil**: Detecta 80 clases de COCO
- **Modular**: Código organizado en clases reutilizables

### Prácticas
- **Implementación rápida**: Minutos, no días
- **Bajo costo**: No requiere hardware especializado
- **Escalable**: Fácil adaptar a nuevos casos de uso
- **Interpretable**: Visualizaciones claras

---

## Limitaciones y Mejoras Futuras

### Limitaciones Actuales

1. **Oclusión**: Dificultad con objetos parcialmente ocultos
2. **Distancia**: Menor precisión con objetos muy lejanos
3.  **Condiciones**: Afectado por poca luz o clima extremo
4. **Imágenes estáticas**: No aprovecha información temporal del video

### Mejoras Propuestas

1. **Tracking avanzado**: Implementar DeepSORT o ByteTrack
2. **Video en tiempo real**: Soporte para streams de cámaras
3. **Base de datos**: Almacenar históricos para análisis
4. **Alertas automáticas**: Notificaciones por email/SMS
5. **Dashboard web**: Interfaz web con Flask/Streamlit
6. **Modelo personalizado**: Fine-tuning en dataset específico

---

## Aplicaciones del Mundo Real

### Comercio
- Control de aforo en tiendas
- Análisis de zonas calientes (heatmaps)
- Medición de tiempos de estancia
- Optimización de layout

### Transporte
- Monitoreo de tráfico urbano
- Detección de congestión
- Estadísticas de flujo vehicular
- Planificación de semáforos inteligentes

### Seguridad
- Control de acceso
- Zonas restringidas
- Conteo de ocupantes
- Detección de aglomeraciones

### Eventos
- Gestión de capacidad
- Control de entradas/salidas
- Seguridad en eventos masivos
- Análisis post-evento

# Conclusiones Finales

## Resumen del Proyecto

Este proyecto demuestra cómo **YOLOv8** y el **dataset COCO** pueden combinarse para crear soluciones prácticas de visión por computadora sin necesidad de entrenar modelos desde cero.

### Logros Clave:

1. **Sistema funcional** de detección y tracking
2. **Dos casos de uso implementados**: aforo y flujo vehicular
3. **Código modular y reutilizable**
4. **Interfaz intuitiva** con indicadores visuales
5. **Documentación completa** (este notebook)

### Aprendizajes:

- **COCO dataset**: Estándar de la industria para visión por computadora
- **YOLOv8**: Balance óptimo entre velocidad y precisión
- **Transfer Learning**: Aprovechar modelos pre-entrenados
- **Tracking**: Mantener identidad de objetos a través del tiempo
- **Aplicaciones reales**: Traducir tecnología a soluciones prácticas

---

## Referencias y Recursos

### Documentación Oficial

- **YOLOv8**: https://docs.ultralytics.com/
- **COCO Dataset**: https://cocodataset.org/
- **OpenCV**: https://docs.opencv.org/

### Papers Relevantes

- **YOLO**: Redmon et al. "You Only Look Once: Unified, Real-Time Object Detection" (2016)
- **YOLOv8**: Ultralytics YOLOv8 Documentation
- **COCO**: Lin et al. "Microsoft COCO: Common Objects in Context" (2014)

### Recursos Adicionales

- **Ultralytics GitHub**: https://github.com/ultralytics/ultralytics
- **COCO API**: https://github.com/cocodataset/cocoapi
- **Deep Learning para Visión por Computadora**: Stanford CS231n

---

## Créditos

**Miranda Alison, Morán David y VIvanco Gabriel**  
Proyecto desarrollado para la materia de Aplicaciones Basadas en el Conocimiento  
Universidad: Universidad de las Fuerzas Armadas - EPE
Fecha: Febrero 2026

**Tecnologías utilizadas:**
- Python 3.13+
- YOLOv8 (Ultralytics)
- OpenCV
- COCO Dataset

---

