In [1]:
# %% [markdown]
# # Detección de Robos con YOLO
# Este notebook se enfoca en detectar si una persona está robando en un video utilizando un modelo YOLO preentrenado.

# %%
# Instalación de dependencias (si es necesario)
#!pip install ultralytics opencv-python imutils

# %%
# Importación de bibliotecas
from ultralytics import YOLO
import cv2
import numpy as np
import imutils
import os

# %%
# Configuración de parámetros
WIDTH = 800  # Ancho del frame para redimensionar
shoplifting_status = "Robando"
not_shoplifting_status = "No robando"
ROBBERY_COLOR = (0, 0, 255)  # Rojo para personas robando
NORMAL_COLOR = (0, 255, 0)    # Verde para personas normales
confidence_threshold = 0.8    # Umbral de confianza para detección

# Ruta del video de entrada
input_path = "../data/robo1.mp4"

# %%
# Cargar el modelo de detección de robo
model = YOLO("../src/models/shoplifting_wights.pt")

# %%
# Función para detectar robos
def detect_shoplifting(frame, model, confidence_threshold=0.8):
    """
    Detecta si una persona está robando en el frame utilizando el modelo YOLO.
    Cambia el color del cuadro existente si la persona está robando.
    
    Args:
        frame (numpy.ndarray): El frame de video.
        model (YOLO): El modelo YOLO para detección de robo.
        confidence_threshold (float): Umbral de confianza para considerar una detección válida.
    
    Returns:
        numpy.ndarray: El frame con las anotaciones de detección de robo.
    """
    result = model.predict(frame)
    cc_data = np.array(result[0].boxes.data)

    if len(cc_data) != 0:
        xyxy = np.array(result[0].boxes.xyxy).astype("int32")
        
        for (x1, y1, x2, y2), (_, _, _, _, conf, clas) in zip(xyxy, cc_data):
            if conf >= confidence_threshold:  # Solo considerar detecciones con alta confianza
                if clas == 1:  # Clase 1: Robo
                    color = ROBBERY_COLOR  # Rojo para personas robando
                    status = shoplifting_status
                else:  # Clase 0: No robo
                    color = NORMAL_COLOR  # Verde para personas normales
                    status = not_shoplifting_status

                # Dibujar el cuadro alrededor de la persona
                cv2.rectangle(frame, (x1, y1), (x2, y2), color, 2)

                # Mostrar la confianza como texto
                text = f"{status} {conf * 100:.2f}%"
                cv2.putText(frame, text, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)
    
    return frame

# %%
# Abrir el video de entrada
cap = cv2.VideoCapture(input_path)

# %%
# Procesar el video frame por frame
while True:
    ret, frame = cap.read()
    if not ret:
        print("Fin del video.")
        break

    # Redimensionar el frame
    frame = imutils.resize(frame, width=WIDTH)

    # Detectar robos en el frame
    frame = detect_shoplifting(frame, model, confidence_threshold)

    # Mostrar el frame procesado
    cv2.imshow("Detección de Robos", frame)

    # Salir si se presiona la tecla 'q'
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

# Liberar recursos
cap.release()
cv2.destroyAllWindows()


0: 384x640 1 not_shoplifting, 89.4ms
Speed: 4.0ms preprocess, 89.4ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 not_shoplifting, 76.8ms
Speed: 2.0ms preprocess, 76.8ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 not_shoplifting, 81.1ms
Speed: 3.0ms preprocess, 81.1ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 not_shoplifting, 79.0ms
Speed: 3.0ms preprocess, 79.0ms inference, 0.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 not_shoplifting, 67.7ms
Speed: 2.0ms preprocess, 67.7ms inference, 2.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 not_shoplifting, 70.6ms
Speed: 2.0ms preprocess, 70.6ms inference, 2.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 not_shoplifting, 67.2ms
Speed: 2.0ms preprocess, 67.2ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 not_shoplifting, 67.7ms
Speed: 3.0ms prep