Comprobación de PyTorch y uso de la GPU

In [None]:
import torch

print(f"Versión de PyTorch: {torch.__version__}")
print(f"Versión de CUDA en PyTorch: {torch.version.cuda}")
print(f"¿CUDA está disponible?: {torch.cuda.is_available()}")
print(torch.cuda.get_device_name(0))

Entrenamiento de las redes

In [None]:
from ultralytics import YOLO

model = YOLO("yolo11n.pt")

results = model.train(data="./datasets/rim_detection/data.yaml", imgsz=640, batch=16, device=0, epochs=60, task="detect")

Librerías, paquetes y funciones importadas

In [None]:
def drawBBox(frame, x1, y1, x2, y2, label):
    cv2.rectangle(frame, (int(x1), int(y1)), (int(x2), int(y2)), (255, 0, 0), 2)
    cv2.putText(frame, label, (int(x1), int(y1) - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (100, 200, 100), 2)

def drawPosition(frame, position, position_label):
    cv2.ellipse(frame, (int(position[0]), int(position[1])), (9, 3), 0, 0, 360, (0, 0, 255), -1)
    cv2.putText(frame, position_label, (int(position[0]) - 50, int(position[1]) + 25), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)

In [None]:
import cv2
from ultralytics import YOLO

object_detector = YOLO("./runs/detect/object_detection_v2/weights/best.pt")
ball_detector = YOLO("./runs/detect/ball_detection/weights/best.pt")
rim_detector = YOLO("./runs/detect/rim_detection/weights/best.pt")

video_path = "../clips/Clip1LF.mp4"
output_path = "../output/Clip1LF_output.mp4"

cap = cv2.VideoCapture(video_path)
fourcc = cv2.VideoWriter_fourcc(*"avc1")
fps = int(cap.get(cv2.CAP_PROP_FPS))
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

out = cv2.VideoWriter(output_path, fourcc, fps, (width, height))

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    object_detection_results = object_detector(frame)
    ball_detection_results = ball_detector(frame)
    rim_detection_results = rim_detector(frame)

    # Análisis de las detecciones de jugadores
    for result in object_detection_results[0].boxes.data.tolist():  # Obtener los resultados como lista
        x1, y1, x2, y2, conf, cls = result  # Coordenadas, confianza y clase
        cls = int(cls)

        # Filtrar solo por las clases deseadas
        if object_detector.names[cls] in ['player'] and conf > 0.5:

            # Calcular la posición como el punto medio del borde inferior de la bbox
            position = (int((x1 + x2) / 2), y2)
            position_label = f"x:{int(position[0])} y:{int(position[1])}"

            label = f"{object_detector.names[cls]} {conf:.2f}"

            # Si la clase es 'player', clasificar el equipo y dibujar la bbox en el frame
            if object_detector.names[cls] == 'player':
                drawBBox(frame, x1, y1, x2, y2, label)

            """ 
            # Si la clase es 'referee', dibujar la bbox en el frame
            if object_detector.names[cls] == 'referee':
                drawBBox(frame, x1, y1, x2, y2, label) 
            """

            # Dibujar la posición en el frame
            drawPosition(frame, position, position_label)


    # Mostrar el frame procesado en pantalla
    cv2.imshow('Resultados', frame)

    # Escribir el frame procesado en el video de salida
    out.write(frame)

    # Esperar por una tecla: espacio para avanzar, 'q' para salir
    key = cv2.waitKey(0) & 0xFF  # Espera indefinidamente hasta que se presione una tecla
    if key == ord('q'):
        break
    elif key == ord(' '):  # Espacio para continuar
        # Escribir el frame procesado en el video de salida
        out.write(frame)


# Liberar recursos
cap.release()
out.release()
cv2.destroyAllWindows()

print(f"Video procesado guardado en {output_path}")
