#### Documentacion YOLO 11 https://docs.ultralytics.com/es/tasks/detect/#models 

In [None]:
import cv2
import time
import numpy as np
from ultralytics import YOLO

# Cargar el modelo YOLOv11 (para detección de objetos)
model = YOLO("yolo11n.pt")

# Definir la fuente de video 
cap = cv2.VideoCapture(0) # En directo
# video_path = './rutadelvideo'
# cap = cv2.VideoCapture(video_path) # De un archivo 

cap.set(cv2.CAP_PROP_FRAME_WIDTH, 1920)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 1080)

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # Medir el tiempo de procesamiento para calcular la latencia
    start_time = time.time()
    
    # Realizar la detección (el modelo de segmentación también hace detección)
    results = model(
        frame, 
        conf=0.7, # solo muestra lo que esta seguro al 70%
        # classes=[0] # Si solo quieres detectar ciertas clases, por ejemplo, 'persona' (clase 0)
    )
    latency = (time.time() - start_time) * 1000  # Latencia en milisegundos

    # Acceder a las detecciones (bounding boxes)
    boxes_obj = results[0].boxes
    if boxes_obj is not None and len(boxes_obj) > 0:
        bboxes = boxes_obj.xyxy.cpu().numpy()    # Coordenadas [x1, y1, x2, y2]
        confs = boxes_obj.conf.cpu().numpy()      # Puntajes de confianza
        classes = boxes_obj.cls.cpu().numpy()     # Índices de clase
        
        # Iterar sobre cada detección y dibujar el bounding box y la etiqueta
        for i, box in enumerate(bboxes):
            x1, y1, x2, y2 = map(int, box)
            
            # Obtener el nombre de la clase
            class_name = model.names[int(classes[i])] if hasattr(model, 'names') else str(int(classes[i]))
            
            # Crear la etiqueta con el nombre de la clase y la confianza
            label = f'{class_name} {confs[i]:.2f}'
            
            # Dibujar el bounding box
            cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 0, 255), 2) # Rojo, grosor 2
            
            # Dibujar la etiqueta encima del bounding box
            cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)

    # Mostrar la latencia en el frame
    cv2.putText(frame, f'Latency: {latency:.1f}ms', (10, 30),
                cv2.FONT_HERSHEY_SIMPLEX, 0.7, (255, 0, 0), 2)

    # Mostrar el frame procesado en tiempo real
    cv2.imshow("YOLOv11 - Detección de Objetos", frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()


0: 384x640 1 person, 177.3ms
Speed: 1.1ms preprocess, 177.3ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 person, 193.2ms
Speed: 2.0ms preprocess, 193.2ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 person, 180.7ms
Speed: 1.1ms preprocess, 180.7ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 person, 186.4ms
Speed: 1.1ms preprocess, 186.4ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 person, 182.5ms
Speed: 1.3ms preprocess, 182.5ms inference, 0.9ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 person, 177.5ms
Speed: 1.3ms preprocess, 177.5ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 person, 182.5ms
Speed: 1.4ms preprocess, 182.5ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 person, 171.0ms
Speed: 1.2ms preprocess, 171.0ms inference, 0.8ms postprocess per image at

# Classes
names:  
  0: person  
  1: bicycle  
  2: car  
  3: motorcycle  
  4: airplane  
  5: bus  
  6: train  
  7: truck  
  8: boat  
  9: traffic light  
  10: fire hydrant  
  11: stop sign  
  12: parking meter  
  13: bench  
  14: bird  
  15: cat  
  16: dog  
  17: horse  
  18: sheep  
  19: cow  
  20: elephant  
  21: bear  
  22: zebra  
  23: giraffe  
  24: backpack  
  25: umbrella  
  26: handbag  
  27: tie  
  28: suitcase  
  29: frisbee  
  30: skis  
  31: snowboard  
  32: sports ball  
  33: kite  
  34: baseball bat  
  35: baseball glove  
  36: skateboard  
  37: surfboard  
  38: tennis racket  
  39: bottle  
  40: wine glass  
  41: cup  
  42: fork  
  43: knife  
  44: spoon  
  45: bowl  
  46: banana  
  47: apple  
  48: sandwich  
  49: orange  
  50: broccoli  
  51: carrot  
  52: hot dog  
  53: pizza  
  54: donut  
  55: cake  
  56: chair  
  57: couch  
  58: potted plant  
  59: bed  
  60: dining table  
  61: toilet  
  62: tv  
  63: laptop  
  64: mouse  
  65: remote  
  66: keyboard  
  67: cell phone  
  68: microwave  
  69: oven  
  70: toaster  
  71: sink  
  72: refrigerator  
  73: book  
  74: clock  
  75: vase  
  76: scissors  
  77: teddy bear  
  78: hair drier  
  79: toothbrush  