In [4]:
import sys
import cv2
from ultralytics import YOLO
import numpy as np

# Cargamos el modelo preentrenado YOLO (versión pequeña para rapidez)
model = YOLO("yolov8n.pt")  # Archivo .pt contiene los pesos del modelo preentrenado

# Restauramos el archivo original de clases (COCO dataset)
classesFile = "coco.names"  # Asegúrate de que el archivo coco.names tenga todas las clases
with open(classesFile, 'rt') as f:
    classes = f.read().rstrip('\n').split('\n')  # Cargamos todas las clases en una lista
    COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Iniciamos la captura de video desde un archivo
video_path = 'video3.mp4'  # Cambia esto por la ruta de tu archivo de video
cap = cv2.VideoCapture(video_path)

# Verificamos si el video se ha cargado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir el archivo de video.")

print("Archivo de video cargado con éxito")

# Función para dibujar las cajas solo para personas (clase 0) e identificarlas como Persona 1, Persona 2, etc.
def draw_boxes(frame, boxes, labels, colors):
    person_id = 1  # Inicializamos el identificador para cada persona
    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)

        # Solo dibujamos cajas si la clase detectada es 'person' (clase 0 en COCO)
        if c == 0:  # Clase 0 corresponde a 'person'
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 2)

            # Etiquetamos a la persona como Persona 1, Persona 2, etc.
            label = f"Persona {person_id}"
            person_id += 1  # Incrementamos el contador para la siguiente persona

            # Ponemos el texto con la identificación de la persona en la caja detectada
            cv2.putText(frame, label, (r[0], r[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, color, 2)

# Bucle principal para capturar frames del video y procesar las detecciones
while cap.isOpened():
    # Leemos un frame del video
    ret, frame = cap.read()

    if not ret:
        print("Final del video.")
        break

    # Realizamos la predicción con el modelo YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de Personas en Video', frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos el video y cerramos todas las ventanas
cap.release()
cv2.destroyAllWindows()


Archivo de video cargado con éxito
Final del video.


In [5]:
import sys
import cv2
from ultralytics import YOLO
import numpy as np

# Cargamos el modelo preentrenado YOLO (versión pequeña para rapidez)
model = YOLO("yolov8n.pt")  # Archivo .pt contiene los pesos del modelo preentrenado

# Restauramos el archivo original de clases (COCO dataset)
classesFile = "coco.names"  # Asegúrate de que el archivo coco.names tenga todas las clases
with open(classesFile, 'rt') as f:
    classes = f.read().rstrip('\n').split('\n')  # Cargamos todas las clases en una lista
    COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Iniciamos la captura de video desde la cámara (índice 1 para la cámara predeterminada)
cap = cv2.VideoCapture(1)

# Verificamos si la cámara se ha iniciado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir la cámara.")

print("Cámara iniciada con éxito")

# Función para dibujar las cajas solo para personas (clase 0) e identificarlas como Persona 1, Persona 2, etc.
def draw_boxes(frame, boxes, labels, colors):
    person_id = 1  # Inicializamos el identificador para cada persona
    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)

        # Solo dibujamos cajas si la clase detectada es 'person' (clase 0 en COCO)
        if c == 0:  # Clase 0 corresponde a 'person'
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 2)

            # Etiquetamos a la persona como Persona 1, Persona 2, etc.
            label = f"Persona {person_id}"
            person_id += 1  # Incrementamos el contador para la siguiente persona

            # Ponemos el texto con la identificación de la persona en la caja detectada
            cv2.putText(frame, label, (r[0], r[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, color, 2)

# Bucle principal para capturar frames de la cámara y procesar las detecciones
while cap.isOpened():
    # Leemos un frame de la cámara
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame de la cámara.")
        break

    # Invertimos el frame horizontalmente
    frame = cv2.flip(frame, 1)

    # Realizamos la predicción con el modelo YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de Personas - Cámara', frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos la cámara y cerramos todas las ventanas
cap.release()
cv2.destroyAllWindows()


Cámara iniciada con éxito


In [None]:
#Etiquetas si cuenta con la deteccion o no con colores 

In [5]:
import sys
import cv2
from ultralytics import YOLO
import numpy as np

# Cargamos el modelo preentrenado YOLO (versión pequeña para rapidez)
model = YOLO("yolov8n.pt")  # Archivo .pt contiene los pesos del modelo preentrenado

# Restauramos el archivo original de clases (COCO dataset)
classesFile = "coco.names"  # Asegúrate de que el archivo coco.names tenga todas las clases
with open(classesFile, 'rt') as f:
    classes = f.read().rstrip('\n').split('\n')  # Cargamos todas las clases en una lista
    COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Iniciamos la captura de video desde la cámara (índice 1 para la cámara predeterminada)
cap = cv2.VideoCapture(1)

# Verificamos si la cámara se ha iniciado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir la cámara.")

print("Cámara iniciada con éxito")

# Función para dibujar las cajas y verificar si se detectan casco, gafas y chaleco
def draw_boxes(frame, boxes, labels, colors):
    person_id = 1  # Inicializamos el identificador para cada persona
    helmet_detected = False
    glasses_detected = False
    vest_detected = False

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)

        # Solo dibujamos cajas si la clase detectada es 'person' (clase 0 en COCO)
        if c == 0:  # Clase 0 corresponde a 'person'
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 2)

            # Etiquetamos a la persona como Persona 1, Persona 2, etc.
            label = f"Persona {person_id}"
            person_id += 1  # Incrementamos el contador para la siguiente persona

            # Ponemos el texto de "Persona: Sí" en verde
            cv2.putText(frame, "Persona: Si", (r[0], r[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

            # Verificamos si hay casco, gafas y chaleco (suponiendo clases correspondientes)
            for sub_box in boxes:
                if int(sub_box.cls) == 1:  # Clase 1 corresponde a 'casco'
                    helmet_detected = True
                elif int(sub_box.cls) == 2:  # Clase 2 corresponde a 'gafas'
                    glasses_detected = True
                elif int(sub_box.cls) == 3:  # Clase 3 corresponde a 'chaleco'
                    vest_detected = True

            # Mostrar el estado del casco
            if helmet_detected:
                cv2.putText(frame, "Casco: Si", (r[0], r[1] + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
            else:
                cv2.putText(frame, "Casco: No", (r[0], r[1] + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

            # Mostrar el estado de las gafas
            if glasses_detected:
                cv2.putText(frame, "Gafas: Si", (r[0], r[1] + 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
            else:
                cv2.putText(frame, "Gafas: No", (r[0], r[1] + 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

            # Mostrar el estado del chaleco
            if vest_detected:
                cv2.putText(frame, "Chaleco: Si", (r[0], r[1] + 90), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
            else:
                cv2.putText(frame, "Chaleco: No", (r[0], r[1] + 90), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

# Bucle principal para capturar frames de la cámara y procesar las detecciones
while cap.isOpened():
    # Leemos un frame de la cámara
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame de la cámara.")
        break

    # Invertimos el frame horizontalmente (opcional)
    frame = cv2.flip(frame, 1)

    # Realizamos la predicción con el modelo YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de Personas - Cámara', frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos la cámara y cerramos todas las ventanas
cap.release()
cv2.destroyAllWindows()


Cámara iniciada con éxito


In [46]:
from tkinter import Tk, Label
from PIL import Image, ImageTk


def Scanning():

    #leer Video
    if cap is not None:
        ret, frame = cap.read()
        if ret == True:


            #Resize
            frame = imutils.resize(frame, width=640)

            #Convertir video
            im = Image.fromarray(frame)
            img = ImageTk.PhotoImage(img=im)

            #Mostrar
            LblVideo.configure(image=img)
            lblVideo.image = img
            lblVideo.after(10, Scanning)

        else:
            cap.release()
    
#main
def ventana_principal():
    global img_si_casco, img_si_gafas, img_si_chaleco, lblVideo
    global img_no_casco, img_no_gafas, img_no_chaleco

    # Ventana principal
    pantalla = Tk()
    pantalla.title("DETECCIÓN DE EPP EN EL ÁREA DE CONSTRUCCIÓN")
    pantalla.geometry("1280x720")

    # Background usando PIL
    imageF = Image.open("Canva.png")
    imageF = imageF.resize((1280, 720), Image.ANTIALIAS)  # Redimensionar la imagen si es necesario
    imageF = ImageTk.PhotoImage(imageF)
    background = Label(pantalla, image=imageF)
    background.place(x=0, y=0, relwidth=1, relheight=1)

    #model

    #clases

    #Img
    img_si_casco = cv2.imread("Images/si_casco.png")
    img_si_gafas = cv2.imread("Images/si_gafas.png")
    img_si_chaleco = cv2.imread("Images/si_chaleco.png")
    img_no_casco = cv2.imread("Images/no_casco.png")
    img_no_gafas = cv2.imread("Images/no_gafas.png")
    img_no_chaleco = cv2.imread("Images/no_chaleco.png")

    # Mantener la referencia de la imagen para evitar que sea recolectada por el garbage collector
    background.image = imageF

    #label 
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=180)

    #cam
    cap = cv2.VideoCapture(0, cv2.CAP_DSHOW)
    cap.set(3, 640)
    cap.set(4, 480)

    #Scannig
    Scanning()


    # Loop
    pantalla.mainloop()

if __name__ == '__main__':
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)  # Redimensionar la imagen si es necesario


In [6]:
import sys
import cv2
from ultralytics import YOLO
import numpy as np

# Cargar tu modelo YOLO personalizado (reemplaza la ruta con la de tu modelo)
model = YOLO("best.pt")  # Carga tu modelo entrenado

# Definir las clases que entrenaste en tu modelo (por ejemplo: casco, gafas, chaleco)
classes = ["Persona", "Casco", "Gafas", "Chaleco"]  # Asegúrate de que coincidan con tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Iniciamos la captura de video desde la cámara (índice 1 para la cámara predeterminada)
cap = cv2.VideoCapture(1)

# Verificamos si la cámara se ha iniciado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir la cámara.")

print("Cámara iniciada con éxito")

# Función para dibujar las cajas y verificar si se detectan casco, gafas y chaleco
def draw_boxes(frame, boxes, labels, colors):
    person_id = 1  # Inicializamos el identificador para cada persona
    helmet_detected = False
    glasses_detected = False
    vest_detected = False

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)

        # Solo dibujamos cajas si la clase detectada es 'person' (clase 0 en tu dataset)
        if c == 0:  # Clase 0 corresponde a 'persona'
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 2)

            # Etiquetamos a la persona como Persona 1, Persona 2, etc.
            label = f"Persona {person_id}"
            person_id += 1  # Incrementamos el contador para la siguiente persona

            # Ponemos el texto de "Persona: Sí" en verde
            cv2.putText(frame, "Persona: Si", (r[0], r[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

            # Verificamos si hay casco, gafas y chaleco (suponiendo clases 1, 2, 3 en tu modelo)
            for sub_box in boxes:
                if int(sub_box.cls) == 1:  # Clase 1 corresponde a 'casco'
                    helmet_detected = True
                elif int(sub_box.cls) == 2:  # Clase 2 corresponde a 'gafas'
                    glasses_detected = True
                elif int(sub_box.cls) == 3:  # Clase 3 corresponde a 'chaleco'
                    vest_detected = True

            # Mostrar el estado del casco
            if helmet_detected:
                cv2.putText(frame, "Casco: Si", (r[0], r[1] + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
            else:
                cv2.putText(frame, "Casco: No", (r[0], r[1] + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

            # Mostrar el estado de las gafas
            if glasses_detected:
                cv2.putText(frame, "Gafas: Si", (r[0], r[1] + 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
            else:
                cv2.putText(frame, "Gafas: No", (r[0], r[1] + 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

            # Mostrar el estado del chaleco
            if vest_detected:
                cv2.putText(frame, "Chaleco: Si", (r[0], r[1] + 90), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
            else:
                cv2.putText(frame, "Chaleco: No", (r[0], r[1] + 90), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

# Bucle principal para capturar frames de la cámara y procesar las detecciones
while cap.isOpened():
    # Leemos un frame de la cámara
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame de la cámara.")
        break

    # Invertimos el frame horizontalmente (opcional)
    frame = cv2.flip(frame, 1)

    # Realizamos la predicción con tu modelo entrenado YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de EPP - Cámara', frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos la cámara y cerramos todas las ventanas
cap.release()
cv2.destroyAllWindows()


Cámara iniciada con éxito


In [15]:
pip install ultralytics




In [2]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np

# Cargar tu modelo YOLO personalizado
model = YOLO("best.pt")  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ["Persona", "Casco", "Gafas", "Chaleco"]  # Asegúrate de que coincidan con tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Iniciamos la captura de video desde la cámara (índice 1 para la cámara predeterminada)
cap = cv2.VideoCapture(1)

# Verificamos si la cámara se ha iniciado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir la cámara.")

print("Cámara iniciada con éxito")

# Función para dibujar las cajas y verificar si se detectan diferentes equipos de protección personal
def draw_boxes(frame, boxes, labels, colors):
    person_id = 1  # Inicializamos el identificador para cada persona

    # Crear un diccionario para almacenar los EPP detectados por persona
    persons_epp = {}

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)

        # Verificar si la clase detectada está dentro del rango de clases definidas
        if c >= len(labels):
            # Si la clase detectada no está dentro de la lista, la ignoramos
            continue

        # Extraemos las coordenadas de la caja
        r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
        r = [int(coord) for coord in r]  # Convertimos a enteros
        color = colors[c]

        if labels[c] == "Persona":  # Detectamos la persona
            person_id_str = f"Persona {person_id}"
            persons_epp[person_id_str] = {"casco": False, "gafas": False, "chaleco": False}
            # Dibujar el rectángulo y la etiqueta para la persona
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 2)
            cv2.putText(frame, person_id_str, (r[0], r[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, color, 2)
            person_id += 1

        # Identificar los EPP en relación con la persona detectada
        elif labels[c] in ["Casco", "Gafas", "Chaleco"]:
            # Buscamos la persona más cercana al EPP detectado
            for person_label, epp_status in persons_epp.items():
                # Comprobar si el EPP se encuentra en la misma área que la persona
                # Nota: Esta comprobación es muy simple y puede ser mejorada
                if r[0] >= 0 and r[1] >= 0:  # Si el EPP está dentro del área visible
                    if labels[c] == "Casco":
                        epp_status["casco"] = True
                    elif labels[c] == "Gafas":
                        epp_status["gafas"] = True
                    elif labels[c] == "Chaleco":
                        epp_status["chaleco"] = True

            # Dibujar el rectángulo y la etiqueta para el EPP
            label = f"{labels[c]} {box.conf[0]:.2f}"
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 2)
            cv2.putText(frame, label, (r[0], r[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

    # Mostrar el estado de los EPP para cada persona
    for person_label, epp_status in persons_epp.items():
        y_offset = 30
        for epp, detected in epp_status.items():
            color = (0, 255, 0) if detected else (0, 0, 255)
            cv2.putText(frame, f"{person_label} - {epp.capitalize()}: {'Si' if detected else 'No'}", (10, y_offset), cv2.FONT_HERSHEY_SIMPLEX, 0.6, color, 2)
            y_offset += 30

# Bucle principal para capturar frames de la cámara y procesar las detecciones
while cap.isOpened():
    # Leemos un frame de la cámara
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame de la cámara.")
        break

    # Invertimos el frame horizontalmente (opcional)
    frame = cv2.flip(frame, 1)

    # Realizamos la predicción con tu modelo entrenado YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de EPP - Cámara', frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos la cámara y cerramos todas las ventanas
cap.release()
cv2.destroyAllWindows()


Cámara iniciada con éxito


In [1]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np

# Cargar tu modelo YOLO personalizado
model = YOLO("best.pt")  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ["arnes", "botas", "casco", "chalecos", "guantes", "lentes", "persona"]  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Iniciamos la captura de video desde la cámara (índice 1 para la cámara predeterminada)
cap = cv2.VideoCapture(1)

# Verificamos si la cámara se ha iniciado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir la cámara.")

print("Cámara iniciada con éxito")

# Función para dibujar las cajas y verificar si se detectan diferentes equipos de protección personal
def draw_boxes(frame, boxes, labels, colors):
    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Extraemos las coordenadas de la caja
        r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
        r = [int(coord) for coord in r]  # Convertimos a enteros

        # Dibujamos la caja sobre el frame con un borde grueso (4 píxeles)
        color = colors[c]
        cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 4)

        # Etiqueta con el nombre de la clase y el puntaje
        label = f"{classes[c]} {box.conf[0]:.2f}"

        # Definir el tamaño del texto y la ubicación
        (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.6, 1)
        
        # Crear un fondo sólido para la etiqueta
        cv2.rectangle(frame, (r[0], r[1] - h - 10), (r[0] + w, r[1]), color, -1)

        # Colocar el texto sobre el fondo
        cv2.putText(frame, label, (r[0], r[1] - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

# Bucle principal para capturar frames de la cámara y procesar las detecciones
while cap.isOpened():
    # Leemos un frame de la cámara
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame de la cámara.")
        break

    # Invertimos el frame horizontalmente (opcional)
    frame = cv2.flip(frame, 1)

    # Realizamos la predicción con tu modelo entrenado YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de EPP - Cámara', frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos la cámara y cerramos todas las ventanas
cap.release()
cv2.destroyAllWindows()


Cámara iniciada con éxito


In [3]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np

# Cargar tu modelo YOLO personalizado
model = YOLO("best.pt")  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ["arnes", "botas", "casco", "chalecos", "guantes", "lentes", "persona"]  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Cargar el video en lugar de usar la cámara
video_path = "ppe-1.mp4"
cap = cv2.VideoCapture(video_path)

# Verificamos si el video se ha cargado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir el archivo de video.")

# Obtener la información del video (ancho, alto, FPS)
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

# (Opcional) Guardar el video procesado
output_video_path = "ppe-1_output.mp4"
fourcc = cv2.VideoWriter_fourcc(*"mp4v")  # Codec para el video
out = cv2.VideoWriter(output_video_path, fourcc, fps, (width, height))

print(f"Procesando video {video_path}...")

# Función para dibujar las cajas y verificar si se detectan diferentes equipos de protección personal
def draw_boxes(frame, boxes, labels, colors):
    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Extraemos las coordenadas de la caja
        r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
        r = [int(coord) for coord in r]  # Convertimos a enteros

        # Dibujamos la caja sobre el frame con un borde grueso (4 píxeles)
        color = colors[c]
        cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 4)

        # Etiqueta con el nombre de la clase y el puntaje
        label = f"{classes[c]} {box.conf[0]:.2f}"

        # Definir el tamaño del texto y la ubicación
        (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.6, 1)
        
        # Crear un fondo sólido para la etiqueta
        cv2.rectangle(frame, (r[0], r[1] - h - 10), (r[0] + w, r[1]), color, -1)

        # Colocar el texto sobre el fondo
        cv2.putText(frame, label, (r[0], r[1] - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

# Bucle principal para capturar frames del video y procesar las detecciones
while cap.isOpened():
    # Leemos un frame del video
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame o se ha terminado el video.")
        break

    # Realizamos la predicción con tu modelo entrenado YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de EPP - Video', frame)

    # (Opcional) Guardamos el frame procesado en el video de salida
    out.write(frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos el video y cerramos todas las ventanas
cap.release()
out.release()  # Liberamos el video de salida
cv2.destroyAllWindows()


Procesando video ppe-1.mp4...


In [6]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np

# Cargar tu modelo YOLO personalizado
model = YOLO("best.pt")  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ["arnes", "botas", "casco", "chalecos", "guantes", "lentes", "persona"]  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Cargar el video en lugar de usar la cámara
video_path = "video.mp4"
cap = cv2.VideoCapture(video_path)

# Verificamos si el video se ha cargado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir el archivo de video.")

# Obtener la información del video (ancho, alto, FPS)
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

# (Opcional) Guardar el video procesado
output_video_path = "video_f.mp4"
fourcc = cv2.VideoWriter_fourcc(*"mp4v")  # Codec para el video
out = cv2.VideoWriter(output_video_path, fourcc, fps, (width, height))

print(f"Procesando video {video_path}...")

# Función para dibujar las cajas y verificar si se detectan diferentes equipos de protección personal
def draw_boxes(frame, boxes, labels, colors):
    people_boxes = []
    epp_detections = {"chaleco": [], "casco": [], "lentes": [], "botas": [], "arnes": []}

    # Primer paso: detectar personas y guardar sus coordenadas
    for box in boxes:
        c = int(box.cls)
        if c == 6:  # Clase 6 corresponde a 'persona'
            people_boxes.append(box.xyxy[0].cpu().numpy())  # Guardamos las coordenadas de la persona
        elif c == 3:  # Clase 3 corresponde a 'chalecos'
            epp_detections["chaleco"].append(box.xyxy[0].cpu().numpy())
        elif c == 2:  # Clase 2 corresponde a 'casco'
            epp_detections["casco"].append(box.xyxy[0].cpu().numpy())
        elif c == 5:  # Clase 5 corresponde a 'lentes'
            epp_detections["lentes"].append(box.xyxy[0].cpu().numpy())
        elif c == 1:  # Clase 1 corresponde a 'botas'
            epp_detections["botas"].append(box.xyxy[0].cpu().numpy())
        elif c == 0:  # Clase 0 corresponde a 'arnes'
            epp_detections["arnes"].append(box.xyxy[0].cpu().numpy())

    # Segundo paso: para cada persona detectada, buscamos el EPP más cercano
    for person_box in people_boxes:
        r = [int(coord) for coord in person_box]  # Convertimos a enteros
        color = COLORS[6]  # Color para 'persona'
        cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 4)  # Dibujamos la caja

        # Etiqueta para la persona
        label = "Persona"
        cv2.putText(frame, label, (r[0], r[1] - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

        # Buscar EPPs asociados a esta persona
        # Asignamos el EPP más cercano basado en la distancia al centro de la caja de la persona
        centro_persona = np.array([(r[0] + r[2]) / 2, (r[1] + r[3]) / 2])

        def find_closest_epp(epp_list):
            """ Encuentra el EPP más cercano a la persona """
            if not epp_list:
                return False
            closest_epp = min(epp_list, key=lambda epp: np.linalg.norm(centro_persona - [(epp[0] + epp[2]) / 2, (epp[1] + epp[3]) / 2]))
            epp_distance = np.linalg.norm(centro_persona - [(closest_epp[0] + closest_epp[2]) / 2, (closest_epp[1] + closest_epp[3]) / 2])
            # Consideramos una distancia límite para asociar el EPP con la persona
            if epp_distance < 150:  # Puedes ajustar este valor según tu video
                return True
            return False

        # Verificamos si la persona tiene chaleco, casco, lentes, botas, arnés
        chaleco = find_closest_epp(epp_detections["chaleco"])
        casco = find_closest_epp(epp_detections["casco"])
        lentes = find_closest_epp(epp_detections["lentes"])
        botas = find_closest_epp(epp_detections["botas"])
        arnes = find_closest_epp(epp_detections["arnes"])

        # Mostrar el estado del EPP
        cv2.putText(frame, f"Chaleco: {'Si' if chaleco else 'No'}", (r[0], r[1] + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if chaleco else (0, 0, 255), 2)
        cv2.putText(frame, f"Casco: {'Si' if casco else 'No'}", (r[0], r[1] + 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if casco else (0, 0, 255), 2)
        cv2.putText(frame, f"Lentes: {'Si' if lentes else 'No'}", (r[0], r[1] + 90), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if lentes else (0, 0, 255), 2)
        cv2.putText(frame, f"Botas: {'Si' if botas else 'No'}", (r[0], r[1] + 120), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if botas else (0, 0, 255), 2)
        cv2.putText(frame, f"Arnes: {'Si' if arnes else 'No'}", (r[0], r[1] + 150), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if arnes else (0, 0, 255), 2)

# Bucle principal para capturar frames del video y procesar las detecciones
while cap.isOpened():
    # Leemos un frame del video
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame o se ha terminado el video.")
        break

    # Realizamos la predicción con tu modelo entrenado YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de EPP - Video', frame)

    # (Opcional) Guardamos el frame procesado en el video de salida
    out.write(frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos el video y cerramos todas las ventanas
cap.release()
out.release()  # Liberamos el video de salida
cv2.destroyAllWindows()


Procesando video video.mp4...


In [5]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np

# Cargar tu modelo YOLO personalizado
model = YOLO("best1.pt")  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ["arnes", "botas", "casco", "chalecos", "guantes", "lentes", "persona"]  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Cargar el video en lugar de usar la cámara
video_path = "ppe-1.mp4"  # Ruta de tu video
cap = cv2.VideoCapture(video_path)

# Verificamos si el video se ha cargado correctamente
if not cap.isOpened():
    sys.exit("No se pudo abrir el archivo de video.")

# Obtener la información del video (ancho, alto, FPS)
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

# (Opcional) Guardar el video procesado
output_video_path = "ppe-1_output.mp4"
fourcc = cv2.VideoWriter_fourcc(*"mp4v")  # Codec para el video
out = cv2.VideoWriter(output_video_path, fourcc, fps, (width, height))

print("Video cargado con éxito, procesando...")

# Función para dibujar las cajas y verificar si se detectan diferentes equipos de protección personal
def draw_boxes(frame, boxes, labels, colors):
    person_id = 1  # Inicializamos el identificador para cada persona
    helmet_detected = False
    vest_detected = False
    gloves_detected = False
    harness_detected = False
    boots_detected = False
    glasses_detected = False

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)

        # Solo dibujamos cajas si la clase detectada es 'persona' (clase 6 en tu dataset)
        if c == 6:  # Clase 6 corresponde a 'persona'
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame
            color = COLORS[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 2)

            # Etiquetamos a la persona como Persona 1, Persona 2, etc.
            label = f"Persona {person_id}"
            person_id += 1  # Incrementamos el contador para la siguiente persona

            # Ponemos el texto de "Persona: Sí" en verde
            cv2.putText(frame, "Persona: Si", (r[0], r[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

            # Verificamos si se detectan los EPPs: arnes, botas, casco, chalecos, guantes, lentes
            for sub_box in boxes:
                if int(sub_box.cls) == 0:  # Clase 0 corresponde a 'arnes'
                    harness_detected = True
                elif int(sub_box.cls) == 1:  # Clase 1 corresponde a 'botas'
                    boots_detected = True
                elif int(sub_box.cls) == 2:  # Clase 2 corresponde a 'casco'
                    helmet_detected = True
                elif int(sub_box.cls) == 3:  # Clase 3 corresponde a 'chalecos'
                    vest_detected = True
                elif int(sub_box.cls) == 4:  # Clase 4 corresponde a 'guantes'
                    gloves_detected = True
                elif int(sub_box.cls) == 5:  # Clase 5 corresponde a 'lentes'
                    glasses_detected = True

            # Mostrar el estado de cada EPP
            cv2.putText(frame, f"Arnes: {'Si' if harness_detected else 'No'}", (r[0], r[1] + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if harness_detected else (0, 0, 255), 2)
            cv2.putText(frame, f"Botas: {'Si' if boots_detected else 'No'}", (r[0], r[1] + 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if boots_detected else (0, 0, 255), 2)
            cv2.putText(frame, f"Casco: {'Si' if helmet_detected else 'No'}", (r[0], r[1] + 90), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if helmet_detected else (0, 0, 255), 2)
            cv2.putText(frame, f"Chaleco: {'Si' if vest_detected else 'No'}", (r[0], r[1] + 120), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if vest_detected else (0, 0, 255), 2)
            cv2.putText(frame, f"Guantes: {'Si' if gloves_detected else 'No'}", (r[0], r[1] + 150), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if gloves_detected else (0, 0, 255), 2)
            cv2.putText(frame, f"Lentes: {'Si' if glasses_detected else 'No'}", (r[0], r[1] + 180), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0) if glasses_detected else (0, 0, 255), 2)

# Bucle principal para capturar frames del video y procesar las detecciones
while cap.isOpened():
    # Leemos un frame del video
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame o se ha terminado el video.")
        break

    # Realizamos la predicción con tu modelo entrenado YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de EPP - Video', frame)

    # (Opcional) Guardamos el frame procesado en el video de salida
    out.write(frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos el video y cerramos todas las ventanas
cap.release()
out.release()  # Liberamos el video de salida
cv2.destroyAllWindows()


Video cargado con éxito, procesando...
No se pudo leer el frame o se ha terminado el video.


In [10]:
from tkinter import Tk, Label
from PIL import Image, ImageTk
import cv2
import imutils

# Definir la cámara fuera de las funciones para que sea accesible en todo el código
cap = None

def Scanning():
    global cap, lblVideo

    # Leer el video de la cámara
    if cap is not None:
        ret, frame = cap.read()
        if ret:
            # Invertir la imagen horizontalmente (efecto espejo)
            frame = cv2.flip(frame, 1)

            # Redimensionar el frame de video
            frame = imutils.resize(frame, width=640)

            # Convertir el frame de BGR (OpenCV) a RGB (PIL)
            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            im = Image.fromarray(frame_rgb)
            img = ImageTk.PhotoImage(im)

            # Mostrar la imagen en el label
            lblVideo.configure(image=img)
            lblVideo.image = img

            # Llamar a la función de nuevo después de 10ms para crear el efecto de video
            lblVideo.after(10, Scanning)
        else:
            cap.release()

# Función principal para crear la ventana de Tkinter
def ventana_principal():
    global cap, lblVideo

    # Crear la ventana principal
    pantalla = Tk()
    pantalla.title("DETECCIÓN DE EPP EN EL ÁREA DE CONSTRUCCIÓN")
    pantalla.geometry("1280x720")

    # Background usando PIL
    imageF = Image.open("Canva.png")
    imageF = imageF.resize((1280, 720), Image.ANTIALIAS)  # Redimensionar la imagen si es necesario
    imageF = ImageTk.PhotoImage(imageF)
    background = Label(pantalla, image=imageF)
    background.place(x=0, y=0, relwidth=1, relheight=1)

    # Mantener la referencia de la imagen para evitar que sea recolectada por el garbage collector
    background.image = imageF

    # Label para mostrar el video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1, cv2.CAP_DSHOW)
    cap.set(3, 640)  # Ancho de la cámara
    cap.set(4, 480)  # Alto de la cámara

    # Iniciar la función de escaneo de la cámara
    Scanning()

    # Iniciar el loop principal de la ventana de Tkinter
    pantalla.mainloop()

if __name__ == '__main__':
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)  # Redimensionar la imagen si es necesario


In [3]:
from tkinter import Tk, Label
from PIL import Image, ImageTk
import cv2
import numpy as np
from ultralytics import YOLO
import os

# Definir el modelo YOLO como global
model = YOLO('best.pt')  # Cambia 'best.pt' por la ruta a tu modelo si está en otro lugar
clsName = ["casco", "gafas", "chaleco"]
COLORS = np.random.uniform(0, 255, size=(len(clsName), 3))

# Definir la cámara fuera de las funciones para acceso global
cap = None

def update_epp_status(casco_detected, gafas_detected, chaleco_detected):
    # Actualiza las imágenes según las detecciones
    if casco_detected:
        lbl_casco.config(image=img_si_casco)
        lbl_casco.image = img_si_casco
    else:
        lbl_casco.config(image=img_no_casco)
        lbl_casco.image = img_no_casco

    if gafas_detected:
        lbl_gafas.config(image=img_si_gafas)
        lbl_gafas.image = img_si_gafas
    else:
        lbl_gafas.config(image=img_no_gafas)
        lbl_gafas.image = img_no_gafas

    if chaleco_detected:
        lbl_chaleco.config(image=img_si_chaleco)
        lbl_chaleco.image = img_si_chaleco
    else:
        lbl_chaleco.config(image=img_no_chaleco)
        lbl_chaleco.image = img_no_chaleco

def draw_boxes(frame, boxes):
    casco_detected = gafas_detected = chaleco_detected = False

    for box in boxes:
        x1, y1, x2, y2 = map(int, box.xyxy[0].cpu().numpy())
        cls = int(box.cls[0])
        conf = box.conf[0]

        # Verificar si la clase detectada está dentro de los índices válidos
        if cls < len(clsName):
            # Determinar si se detectó cada EPP
            if cls == 0:  # Casco
                casco_detected = True
            elif cls == 1:  # Gafas
                gafas_detected = True
            elif cls == 2:  # Chaleco
                chaleco_detected = True

            # Dibujar el rectángulo y el texto
            color = COLORS[cls]
            label = f"{clsName[cls]} {conf:.2f}"
            cv2.rectangle(frame, (x1, y1), (x2, y2), color, 2)
            cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, color, 2)

    # Actualizar la interfaz con el estado de los EPP detectados
    update_epp_status(casco_detected, gafas_detected, chaleco_detected)

def Scanning():
    global cap  # Declarar cap como global para asegurarnos de tener acceso a la cámara

    if cap.isOpened():
        ret, frame = cap.read()
        if ret:
            frame = cv2.flip(frame, 1)
            results = model.predict(frame, stream=True, verbose=False)

            for result in results:
                draw_boxes(frame, result.boxes)

            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            img = ImageTk.PhotoImage(image=Image.fromarray(frame_rgb))
            lblVideo.configure(image=img)
            lblVideo.image = img

        lblVideo.after(10, Scanning)

def ventana_principal():
    global cap, lblVideo, lbl_casco, lbl_gafas, lbl_chaleco
    global img_no_casco, img_no_gafas, img_no_chaleco
    global img_si_casco, img_si_gafas, img_si_chaleco

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Cargar la imagen de fondo
    try:
        imageF = Image.open("Canva.png")
        imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
        imageF = ImageTk.PhotoImage(imageF)
        background = Label(pantalla, image=imageF)
        background.place(x=0, y=0, relwidth=1, relheight=1)
        background.image = imageF
    except FileNotFoundError:
        print("Error: No se pudo cargar 'Canva.png'. Asegúrate de que la imagen esté en la misma carpeta.")

    # Configurar las rutas de las imágenes
    base_path = os.path.abspath("Images")

    img_no_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_casco - copia.png")))
    img_no_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_gafas - copia.png")))
    img_no_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_chaleco - copia.png")))
    img_si_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_casco - copia.png")))
    img_si_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_gafas - copia.png")))
    img_si_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_chaleco - copia.png")))

    # Etiquetas para mostrar las imágenes de estado de EPP en la interfaz
    lbl_casco = Label(pantalla, image=img_no_casco, bg='#d9d9d9')  # Fondo gris claro para que destaque
    lbl_casco.place(x=75, y=110)  # Ajustar hacia abajo (y+10)
    lbl_gafas = Label(pantalla, image=img_no_gafas, bg='#d9d9d9')
    lbl_gafas.place(x=75, y=260)  # Ajustar hacia abajo (y+10)
    lbl_chaleco = Label(pantalla, image=img_no_chaleco, bg='#d9d9d9')
    lbl_chaleco.place(x=75, y=410)  # Ajustar hacia abajo (y+10)

    # Configuración del video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1, cv2.CAP_DSHOW)
    if not cap.isOpened():
        cap = cv2.VideoCapture(0, cv2.CAP_DSHOW)  # Intentar con la cámara 0 si la 1 no funciona
    cap.set(3, 640)
    cap.set(4, 480)

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)


In [4]:
from tkinter import Tk, Label
from PIL import Image, ImageTk
import cv2
import numpy as np
from ultralytics import YOLO
import os

# Definir el modelo YOLO como global
model = YOLO('best.pt')  # Cambia 'best.pt' por la ruta a tu modelo si está en otro lugar
clsName = ["casco", "gafas", "chaleco", "persona"]  # Se agregó la clase "persona"
COLORS = np.random.uniform(0, 255, size=(len(clsName), 3))

# Definir la cámara fuera de las funciones para acceso global
cap = None

def update_epp_status(casco_detected, gafas_detected, chaleco_detected):
    # Actualiza las imágenes según las detecciones de EPP
    if casco_detected:
        lbl_casco.config(image=img_si_casco)
        lbl_casco.image = img_si_casco
    else:
        lbl_casco.config(image=img_no_casco)
        lbl_casco.image = img_no_casco

    if gafas_detected:
        lbl_gafas.config(image=img_si_gafas)
        lbl_gafas.image = img_si_gafas
    else:
        lbl_gafas.config(image=img_no_gafas)
        lbl_gafas.image = img_no_gafas

    if chaleco_detected:
        lbl_chaleco.config(image=img_si_chaleco)
        lbl_chaleco.image = img_si_chaleco
    else:
        lbl_chaleco.config(image=img_no_chaleco)
        lbl_chaleco.image = img_no_chaleco

def draw_boxes(frame, boxes):
    casco_detected = gafas_detected = chaleco_detected = persona_detected = False

    for box in boxes:
        x1, y1, x2, y2 = map(int, box.xyxy[0].cpu().numpy())
        cls = int(box.cls[0])
        conf = box.conf[0]

        # Verificar si la clase detectada está dentro de los índices válidos
        if cls < len(clsName):
            # Determinar si se detectó cada clase
            if cls == 0:  # Casco
                casco_detected = True
            elif cls == 1:  # Gafas
                gafas_detected = True
            elif cls == 2:  # Chaleco
                chaleco_detected = True
            elif cls == 3:  # Persona
                persona_detected = True  # Se detectó una persona

            # Dibujar el rectángulo y el texto para cada detección
            color = COLORS[cls]
            label = f"{clsName[cls]} {conf:.2f}"
            cv2.rectangle(frame, (x1, y1), (x2, y2), color, 2)
            cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, color, 2)

    # Actualizar la interfaz con el estado de los EPP detectados
    update_epp_status(casco_detected, gafas_detected, chaleco_detected)

def Scanning():
    global cap  # Declarar cap como global para asegurarnos de tener acceso a la cámara

    if cap.isOpened():
        ret, frame = cap.read()
        if ret:
            frame = cv2.flip(frame, 1)
            results = model.predict(frame, stream=True, verbose=False)

            for result in results:
                draw_boxes(frame, result.boxes)

            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            img = ImageTk.PhotoImage(image=Image.fromarray(frame_rgb))
            lblVideo.configure(image=img)
            lblVideo.image = img

        lblVideo.after(10, Scanning)

def ventana_principal():
    global cap, lblVideo, lbl_casco, lbl_gafas, lbl_chaleco
    global img_no_casco, img_no_gafas, img_no_chaleco
    global img_si_casco, img_si_gafas, img_si_chaleco

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Cargar la imagen de fondo
    try:
        imageF = Image.open("Canva.png")
        imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
        imageF = ImageTk.PhotoImage(imageF)
        background = Label(pantalla, image=imageF)
        background.place(x=0, y=0, relwidth=1, relheight=1)
        background.image = imageF
    except FileNotFoundError:
        print("Error: No se pudo cargar 'Canva.png'. Asegúrate de que la imagen esté en la misma carpeta.")

    # Configurar las rutas de las imágenes de EPP
    base_path = os.path.abspath("Images")

    img_no_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_casco.png")))
    img_no_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_gafas.png")))
    img_no_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_chaleco.png")))
    img_si_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_casco.png")))
    img_si_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_gafas.png")))
    img_si_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_chaleco.png")))

    # Etiquetas para mostrar las imágenes de estado de EPP en la interfaz
    lbl_casco = Label(pantalla, image=img_no_casco, bg='#d9d9d9')  # Fondo gris claro para que destaque
    lbl_casco.place(x=75, y=150)
    lbl_gafas = Label(pantalla, image=img_no_gafas, bg='#d9d9d9')
    lbl_gafas.place(x=75, y=300)
    lbl_chaleco = Label(pantalla, image=img_no_chaleco, bg='#d9d9d9')
    lbl_chaleco.place(x=75, y=450)

    # Configuración del video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1, cv2.CAP_DSHOW)
    if not cap.isOpened():
        cap = cv2.VideoCapture(0, cv2.CAP_DSHOW)  # Intentar con la cámara 0 si la 1 no funciona
    cap.set(3, 640)
    cap.set(4, 480)

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)


In [8]:
from tkinter import Tk, Label
from PIL import Image, ImageTk
import cv2
import numpy as np
from ultralytics import YOLO
import os

# Definir el modelo YOLO como global
model = YOLO('best.pt')  # Cambia 'best.pt' por la ruta a tu modelo si está en otro lugar
clsName = ["casco", "gafas", "chaleco", "persona"]  # Asegúrate de incluir "persona" si el modelo fue entrenado con esta clase
COLORS = np.random.uniform(0, 255, size=(len(clsName), 3))

# Definir la cámara fuera de las funciones para acceso global
cap = None

def update_epp_status(casco_detected, gafas_detected, chaleco_detected):
    # Actualiza las imágenes según las detecciones
    if casco_detected:
        lbl_casco.config(image=img_si_casco)
        lbl_casco.image = img_si_casco
    else:
        lbl_casco.config(image=img_no_casco)
        lbl_casco.image = img_no_casco

    if gafas_detected:
        lbl_gafas.config(image=img_si_gafas)
        lbl_gafas.image = img_si_gafas
    else:
        lbl_gafas.config(image=img_no_gafas)
        lbl_gafas.image = img_no_gafas

    if chaleco_detected:
        lbl_chaleco.config(image=img_si_chaleco)
        lbl_chaleco.image = img_si_chaleco
    else:
        lbl_chaleco.config(image=img_no_chaleco)
        lbl_chaleco.image = img_no_chaleco

def draw_boxes(frame, boxes):
    casco_detected = gafas_detected = chaleco_detected = False

    for box in boxes:
        x1, y1, x2, y2 = map(int, box.xyxy[0].cpu().numpy())
        cls = int(box.cls[0])
        conf = box.conf[0]

        # Agregar una verificación de confianza mínima
        if conf >= 0.3:  # Ajustar el umbral de confianza según la calidad del modelo
            # Verificar si la clase detectada está dentro de los índices válidos
            if cls < len(clsName):
                # Determinar si se detectó cada EPP
                if cls == 0:  # Casco
                    casco_detected = True
                elif cls == 1:  # Gafas
                    gafas_detected = True
                elif cls == 2:  # Chaleco
                    chaleco_detected = True
                elif cls == 3:  # Persona
                    # La clase "persona" solo se dibuja, no tiene una imagen específica
                    pass

                # Dibujar el rectángulo y el texto para todas las detecciones
                color = COLORS[cls]
                label = f"{clsName[cls]} {conf:.2f}"
                cv2.rectangle(frame, (x1, y1), (x2, y2), color, 2)
                cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, color, 2)

    # Actualizar la interfaz con el estado de los EPP detectados
    update_epp_status(casco_detected, gafas_detected, chaleco_detected)

def Scanning():
    global cap  # Declarar cap como global para asegurarnos de tener acceso a la cámara

    if cap.isOpened():
        ret, frame = cap.read()
        if ret:
            frame = cv2.flip(frame, 1)
            results = model.predict(frame, stream=True, verbose=False)

            for result in results:
                draw_boxes(frame, result.boxes)

            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            img = ImageTk.PhotoImage(image=Image.fromarray(frame_rgb))
            lblVideo.configure(image=img)
            lblVideo.image = img

        lblVideo.after(10, Scanning)

def ventana_principal():
    global cap, lblVideo, lbl_casco, lbl_gafas, lbl_chaleco
    global img_no_casco, img_no_gafas, img_no_chaleco
    global img_si_casco, img_si_gafas, img_si_chaleco

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Cargar la imagen de fondo
    try:
        imageF = Image.open("Canva.png")
        imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
        imageF = ImageTk.PhotoImage(imageF)
        background = Label(pantalla, image=imageF)
        background.place(x=0, y=0, relwidth=1, relheight=1)
        background.image = imageF
    except FileNotFoundError:
        print("Error: No se pudo cargar 'Canva.png'. Asegúrate de que la imagen esté en la misma carpeta.")

    # Configurar las rutas de las imágenes (utilizando nombres más simples)
    base_path = os.path.abspath("Images")

    img_no_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_casco - copia.png")))
    img_no_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_gafas - copia.png")))
    img_no_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_chaleco - copia.png")))
    img_si_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_casco - copia.png")))
    img_si_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_gafas - copia.png")))
    img_si_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_chaleco - copia.png")))

    # Etiquetas para mostrar las imágenes de estado de EPP en la interfaz
    lbl_casco = Label(pantalla, image=img_no_casco, bg='#d9d9d9')  # Fondo gris claro para que destaque
    lbl_casco.place(x=75, y=110)
    lbl_gafas = Label(pantalla, image=img_no_gafas, bg='#d9d9d9')
    lbl_gafas.place(x=75, y=260)
    lbl_chaleco = Label(pantalla, image=img_no_chaleco, bg='#d9d9d9')
    lbl_chaleco.place(x=75, y=410)

    # Configuración del video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1, cv2.CAP_DSHOW)
    if not cap.isOpened():
        cap = cv2.VideoCapture(0, cv2.CAP_DSHOW)  # Intentar con la cámara 0 si la 1 no funciona
    cap.set(3, 640)
    cap.set(4, 480)

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)


In [None]:
@@@@@ CAMARA DETECTANDO TODO SIN INTERFAZ @@@@

In [7]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np

# Cargar tu modelo YOLO personalizado
model = YOLO("best.pt")  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ["arnes", "botas", "casco", "chalecos", "guantes", "lentes", "persona"]  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Utilizar la cámara para capturar el video
cap = cv2.VideoCapture(1)  # 0 indica la cámara por defecto del sistema

# Verificamos si la cámara se ha abierto correctamente
if not cap.isOpened():
    sys.exit("No se pudo acceder a la cámara.")

# Obtener la información de la cámara (ancho, alto, FPS)
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

# (Opcional) Guardar el video procesado
output_video_path = "ppe_camera_output.mp4"
fourcc = cv2.VideoWriter_fourcc(*"mp4v")  # Codec para el video
out = cv2.VideoWriter(output_video_path, fourcc, fps, (width, height))

print(f"Procesando video desde la cámara...")

# Función para dibujar las cajas y verificar si se detectan diferentes equipos de protección personal
def draw_boxes(frame, boxes, labels, colors):
    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Solo dibujar la caja si la confianza es mayor o igual a 0.5
        if box.conf[0] >= 0.5:
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame con un borde grueso (4 píxeles)
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 4)

            # Etiqueta con el nombre de la clase
            label = f"{classes[c]}"

            # Definir el tamaño del texto y la ubicación
            (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.6, 1)
            
            # Crear un fondo sólido para la etiqueta
            cv2.rectangle(frame, (r[0], r[1] - h - 10), (r[0] + w, r[1]), color, -1)

            # Colocar el texto sobre el fondo
            cv2.putText(frame, label, (r[0], r[1] - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

# Bucle principal para capturar frames de la cámara y procesar las detecciones
while cap.isOpened():
    # Leemos un frame de la cámara
    ret, frame = cap.read()

    if not ret:
        print("No se pudo leer el frame o se ha perdido la conexión con la cámara.")
        break

    # Realizamos la predicción con tu modelo entrenado YOLO
    results = model.predict(frame, stream=True, verbose=False)

    # Procesamos cada resultado detectado
    for result in results:
        draw_boxes(frame, result.boxes, classes, COLORS)

    # Mostramos el frame con las detecciones en una ventana de OpenCV
    cv2.imshow('Detección de EPP - Cámara', frame)

    # (Opcional) Guardamos el frame procesado en el video de salida
    out.write(frame)

    # Verificamos si se presiona la tecla 'q' para salir
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberamos la cámara y cerramos todas las ventanas
cap.release()
out.release()  # Liberamos el video de salida
cv2.destroyAllWindows()


Procesando video desde la cámara...


In [None]:
### Interfaz 

In [9]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np
from tkinter import Tk, Label
from PIL import Image, ImageTk
import os

# Definir el modelo YOLO como global
model = YOLO('best.pt')  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ["arnes", "botas", "casco", "chalecos", "guantes", "lentes", "persona"]  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Definir la cámara fuera de las funciones para acceso global
cap = None

# Definir las etiquetas de estado de EPP
lbl_casco = None
lbl_gafas = None
lbl_chaleco = None

# Cargar las imágenes de estado de EPP cuando la ventana ya esté creada
def cargar_imagenes():
    base_path = os.path.abspath("Images")

    global img_no_casco, img_no_gafas, img_no_chaleco
    global img_si_casco, img_si_gafas, img_si_chaleco

    img_no_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_casco - copia.png")))
    img_no_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_gafas - copia.png")))
    img_no_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_chaleco - copia.png")))
    img_si_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_casco - copia.png")))
    img_si_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_gafas - copia.png")))
    img_si_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_chaleco - copia.png")))


def update_epp_status(casco_detected, gafas_detected, chaleco_detected):
    # Actualiza las imágenes según las detecciones
    if casco_detected:
        lbl_casco.config(image=img_si_casco)
        lbl_casco.image = img_si_casco
    else:
        lbl_casco.config(image=img_no_casco)
        lbl_casco.image = img_no_casco

    if gafas_detected:
        lbl_gafas.config(image=img_si_gafas)
        lbl_gafas.image = img_si_gafas
    else:
        lbl_gafas.config(image=img_no_gafas)
        lbl_gafas.image = img_no_gafas

    if chaleco_detected:
        lbl_chaleco.config(image=img_si_chaleco)
        lbl_chaleco.image = img_si_chaleco
    else:
        lbl_chaleco.config(image=img_no_chaleco)
        lbl_chaleco.image = img_no_chaleco


def draw_boxes(frame, boxes, labels, colors):
    casco_detected = gafas_detected = chaleco_detected = False

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Solo dibujar la caja si la confianza es mayor o igual a 0.5
        if box.conf[0] >= 0.5:
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame con un borde grueso (4 píxeles)
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 4)

            # Etiqueta con el nombre de la clase
            label = f"{labels[c]}"

            # Definir el tamaño del texto y la ubicación
            (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.6, 1)
            
            # Crear un fondo sólido para la etiqueta
            cv2.rectangle(frame, (r[0], r[1] - h - 10), (r[0] + w, r[1]), color, -1)

            # Colocar el texto sobre el fondo
            cv2.putText(frame, label, (r[0], r[1] - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

            # Actualizar estado de EPP detectado
            if labels[c] == "casco":
                casco_detected = True
            elif labels[c] == "lentes":  # Cambié "gafas" por "lentes" para que coincida con la clase definida
                gafas_detected = True
            elif labels[c] == "chalecos":
                chaleco_detected = True

    # Actualizar la interfaz con el estado de los EPP detectados
    update_epp_status(casco_detected, gafas_detected, chaleco_detected)


def Scanning():
    global cap  # Declarar cap como global para asegurarnos de tener acceso a la cámara

    if cap.isOpened():
        ret, frame = cap.read()
        if ret:
            frame = cv2.flip(frame, 1)
            results = model.predict(frame, stream=True, verbose=False)

            for result in results:
                draw_boxes(frame, result.boxes, classes, COLORS)

            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            img = ImageTk.PhotoImage(image=Image.fromarray(frame_rgb))
            lblVideo.configure(image=img)
            lblVideo.image = img

        lblVideo.after(10, Scanning)


def ventana_principal():
    global cap, lblVideo, lbl_casco, lbl_gafas, lbl_chaleco

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Cargar la imagen de fondo
    try:
        imageF = Image.open("Canva.png")
        imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
        imageF = ImageTk.PhotoImage(imageF)
        background = Label(pantalla, image=imageF)
        background.place(x=0, y=0, relwidth=1, relheight=1)
        background.image = imageF
    except FileNotFoundError:
        print("Error: No se pudo cargar 'Canva.png'. Asegúrate de que la imagen esté en la misma carpeta.")

    # Cargar las imágenes una vez que la ventana se haya creado
    cargar_imagenes()

    # Configurar las etiquetas para mostrar las imágenes de estado de EPP en la interfaz
    lbl_casco = Label(pantalla, image=img_no_casco, bg='#d9d9d9')  # Fondo gris claro para que destaque
    lbl_casco.place(x=75, y=110)
    lbl_gafas = Label(pantalla, image=img_no_gafas, bg='#d9d9d9')
    lbl_gafas.place(x=75, y=260)
    lbl_chaleco = Label(pantalla, image=img_no_chaleco, bg='#d9d9d9')
    lbl_chaleco.place(x=75, y=410)

    # Configuración del video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1)  # 0 indica la cámara por defecto del sistema
    if not cap.isOpened():
        sys.exit("No se pudo acceder a la cámara.")

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)


In [None]:
### codigo funcional - mas entrenamiento para mayor presicion 

In [3]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np
from tkinter import Tk, Label
from PIL import Image, ImageTk
import os

# Definir el modelo YOLO como global
model = YOLO('best-3.pt')  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ['Gafas', 'Casco', 'Persona', 'Chaleco']  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Definir la cámara fuera de las funciones para acceso global
cap = None

# Definir las etiquetas de estado de EPP
lbl_casco = None
lbl_gafas = None
lbl_chaleco = None

# Cargar las imágenes de estado de EPP cuando la ventana ya esté creada
def cargar_imagenes():
    base_path = os.path.abspath("Images")

    global img_no_casco, img_no_gafas, img_no_chaleco
    global img_si_casco, img_si_gafas, img_si_chaleco

    img_no_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_casco - copia.png")))
    img_no_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_gafas - copia.png")))
    img_no_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_chaleco - copia.png")))
    img_si_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_casco - copia.png")))
    img_si_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_gafas - copia.png")))
    img_si_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_chaleco - copia.png")))


def update_epp_status(casco_detected, gafas_detected, chaleco_detected):
    # Actualiza las imágenes según las detecciones
    if casco_detected:
        lbl_casco.config(image=img_si_casco)
        lbl_casco.image = img_si_casco
    else:
        lbl_casco.config(image=img_no_casco)
        lbl_casco.image = img_no_casco

    if gafas_detected:
        lbl_gafas.config(image=img_si_gafas)
        lbl_gafas.image = img_si_gafas
    else:
        lbl_gafas.config(image=img_no_gafas)
        lbl_gafas.image = img_no_gafas

    if chaleco_detected:
        lbl_chaleco.config(image=img_si_chaleco)
        lbl_chaleco.image = img_si_chaleco
    else:
        lbl_chaleco.config(image=img_no_chaleco)
        lbl_chaleco.image = img_no_chaleco


def draw_boxes(frame, boxes, labels, colors):
    casco_detected = gafas_detected = chaleco_detected = False

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Solo dibujar la caja si la confianza es mayor o igual a 0.5
        if box.conf[0] >= 0.5:
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame con un borde grueso (4 píxeles)
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 4)

            # Etiqueta con el nombre de la clase
            label = f"{labels[c]}"

            # Definir el tamaño del texto y la ubicación
            (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.6, 1)
            
            # Crear un fondo sólido para la etiqueta
            cv2.rectangle(frame, (r[0], r[1] - h - 10), (r[0] + w, r[1]), color, -1)

            # Colocar el texto sobre el fondo
            cv2.putText(frame, label, (r[0], r[1] - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

            # Actualizar estado de EPP detectado
            if labels[c] == "Casco":
                casco_detected = True
            elif labels[c] == "Gafas":
                gafas_detected = True
            elif labels[c] == "Chaleco":
                chaleco_detected = True

    # Actualizar la interfaz con el estado de los EPP detectados
    update_epp_status(casco_detected, gafas_detected, chaleco_detected)


def Scanning():
    global cap  # Declarar cap como global para asegurarnos de tener acceso a la cámara

    if cap.isOpened():
        ret, frame = cap.read()
        if ret:
            frame = cv2.flip(frame, 1)
            results = model.predict(frame, stream=True, verbose=False)

            for result in results:
                draw_boxes(frame, result.boxes, classes, COLORS)

            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            img = ImageTk.PhotoImage(image=Image.fromarray(frame_rgb))
            lblVideo.configure(image=img)
            lblVideo.image = img

        lblVideo.after(10, Scanning)


def ventana_principal():
    global cap, lblVideo, lbl_casco, lbl_gafas, lbl_chaleco

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Cargar la imagen de fondo
    try:
        imageF = Image.open("Canva.png")
        imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
        imageF = ImageTk.PhotoImage(imageF)
        background = Label(pantalla, image=imageF)
        background.place(x=0, y=0, relwidth=1, relheight=1)
        background.image = imageF
    except FileNotFoundError:
        print("Error: No se pudo cargar 'Canva.png'. Asegúrate de que la imagen esté en la misma carpeta.")

    # Cargar las imágenes una vez que la ventana se haya creado
    cargar_imagenes()

    # Configurar las etiquetas para mostrar las imágenes de estado de EPP en la interfaz
    lbl_casco = Label(pantalla, image=img_no_casco, bg='#d9d9d9')  # Fondo gris claro para que destaque
    lbl_casco.place(x=75, y=110)
    lbl_gafas = Label(pantalla, image=img_no_gafas, bg='#d9d9d9')
    lbl_gafas.place(x=75, y=260)
    lbl_chaleco = Label(pantalla, image=img_no_chaleco, bg='#d9d9d9')
    lbl_chaleco.place(x=75, y=410)

    # Configuración del video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1)  # 0 indica la cámara por defecto del sistema
    if not cap.isOpened():
        sys.exit("No se pudo acceder a la cámara.")

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)


In [3]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np
from tkinter import Tk, Label
from PIL import Image, ImageTk
import os

# Definir el modelo YOLO como global
model = YOLO('best-3.pt')  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ['Gafas', 'Casco', 'Persona', 'Chaleco']  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Definir la cámara fuera de las funciones para acceso global
cap = None

# Definir las etiquetas de estado de EPP
lbl_casco = None
lbl_gafas = None
lbl_chaleco = None

# Crear directorio para almacenar los recortes de detecciones
output_dir = "Resultados"
os.makedirs(output_dir, exist_ok=True)

# Cargar las imágenes de estado de EPP cuando la ventana ya esté creada
def cargar_imagenes():
    base_path = os.path.abspath("Images")

    global img_no_casco, img_no_gafas, img_no_chaleco
    global img_si_casco, img_si_gafas, img_si_chaleco

    img_no_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_casco - copia.png")))
    img_no_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_gafas - copia.png")))
    img_no_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_chaleco - copia.png")))
    img_si_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_casco - copia.png")))
    img_si_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_gafas - copia.png")))
    img_si_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_chaleco - copia.png")))


def update_epp_status(casco_detected, gafas_detected, chaleco_detected):
    # Actualiza las imágenes según las detecciones
    if casco_detected:
        lbl_casco.config(image=img_si_casco)
        lbl_casco.image = img_si_casco
    else:
        lbl_casco.config(image=img_no_casco)
        lbl_casco.image = img_no_casco

    if gafas_detected:
        lbl_gafas.config(image=img_si_gafas)
        lbl_gafas.image = img_si_gafas
    else:
        lbl_gafas.config(image=img_no_gafas)
        lbl_gafas.image = img_no_gafas

    if chaleco_detected:
        lbl_chaleco.config(image=img_si_chaleco)
        lbl_chaleco.image = img_si_chaleco
    else:
        lbl_chaleco.config(image=img_no_chaleco)
        lbl_chaleco.image = img_no_chaleco


def draw_boxes(frame, boxes, labels, colors):
    casco_detected = gafas_detected = chaleco_detected = False
    persona_detected = False

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Solo dibujar la caja si la confianza es mayor o igual a 0.5
        if box.conf[0] >= 0.5:
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros

            # Dibujamos la caja sobre el frame con un borde grueso (4 píxeles)
            color = colors[c]
            cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), color, 4)

            # Etiqueta con el nombre de la clase
            label = f"{labels[c]}"

            # Definir el tamaño del texto y la ubicación
            (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.6, 1)
            
            # Crear un fondo sólido para la etiqueta
            cv2.rectangle(frame, (r[0], r[1] - h - 10), (r[0] + w, r[1]), color, -1)

            # Colocar el texto sobre el fondo
            cv2.putText(frame, label, (r[0], r[1] - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

            # Si se detecta una persona, establecer el flag para captura de pantalla
            if labels[c] == "Persona":
                persona_detected = True

            # Actualizar estado de EPP detectado
            if labels[c] == "Casco":
                casco_detected = True
            elif labels[c] == "Gafas":
                gafas_detected = True
            elif labels[c] == "Chaleco":
                chaleco_detected = True

    # Si se detecta una persona, guardar captura de pantalla
    if persona_detected:
        filename = os.path.join(output_dir, f"captura_persona_{len(os.listdir(output_dir))}.png")
        cv2.imwrite(filename, frame)

    # Actualizar la interfaz con el estado de los EPP detectados
    update_epp_status(casco_detected, gafas_detected, chaleco_detected)


def Scanning():
    global cap  # Declarar cap como global para asegurarnos de tener acceso a la cámara

    if cap.isOpened():
        ret, frame = cap.read()
        if ret:
            frame = cv2.flip(frame, 1)
            results = model.predict(frame, stream=True, verbose=False)

            for result in results:
                draw_boxes(frame, result.boxes, classes, COLORS)

            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            img = ImageTk.PhotoImage(image=Image.fromarray(frame_rgb))
            lblVideo.configure(image=img)
            lblVideo.image = img

        lblVideo.after(10, Scanning)


def ventana_principal():
    global cap, lblVideo, lbl_casco, lbl_gafas, lbl_chaleco

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Cargar la imagen de fondo
    try:
        imageF = Image.open("Canva.png")
        imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
        imageF = ImageTk.PhotoImage(imageF)
        background = Label(pantalla, image=imageF)
        background.place(x=0, y=0, relwidth=1, relheight=1)
        background.image = imageF
    except FileNotFoundError:
        print("Error: No se pudo cargar 'Canva.png'. Asegúrate de que la imagen esté en la misma carpeta.")

    # Cargar las imágenes una vez que la ventana se haya creado
    cargar_imagenes()

    # Configurar las etiquetas para mostrar las imágenes de estado de EPP en la interfaz
    lbl_casco = Label(pantalla, image=img_no_casco, bg='#d9d9d9')  # Fondo gris claro para que destaque
    lbl_casco.place(x=75, y=110)
    lbl_gafas = Label(pantalla, image=img_no_gafas, bg='#d9d9d9')
    lbl_gafas.place(x=75, y=260)
    lbl_chaleco = Label(pantalla, image=img_no_chaleco, bg='#d9d9d9')
    lbl_chaleco.place(x=75, y=410)

    # Configuración del video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1)  # 0 indica la cámara por defecto del sistema
    if not cap.isOpened():
        sys.exit("No se pudo acceder a la cámara.")

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)


In [None]:
## DETECCION SOLO EN VIDEO y CAMARA CON CROPS 

In [1]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np
from tkinter import Tk, Label
from PIL import Image, ImageTk
import os

# Definir el modelo YOLO como global
model = YOLO('best-3.pt')  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ['Gafas', 'Casco', 'Persona', 'Chaleco']  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Definir el video fuera de las funciones para acceso global
video_path = "video.mp4"  # Cambia a la ruta del video que deseas procesar
cap_video = None

# Crear directorio para almacenar las capturas
output_dir = "Resultados"
os.makedirs(output_dir, exist_ok=True)

# Crear directorios para cumplir y no cumplir
output_dir_compliance = os.path.join(output_dir, "Cumple")
output_dir_non_compliance = os.path.join(output_dir, "NoCumple")
os.makedirs(output_dir_compliance, exist_ok=True)
os.makedirs(output_dir_non_compliance, exist_ok=True)

def draw_boxes(frame, boxes, labels, colors):
    # Variables para verificar cumplimiento de EPP
    detected_person = None
    detected_items = set()
    crop_margin = 50  # Aumentar el margen adicional para el cuadro
    crop_margin_large = 70  # Margen mayor para el crop específico

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Solo dibujar la caja si la confianza es mayor o igual a 0.5
        if box.conf[0] >= 0.5:
            # Extraemos las coordenadas de la caja y agregamos margen para el cuadro de detección
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros
            x1 = max(0, r[0] - crop_margin)
            y1 = max(0, r[1] - crop_margin)
            x2 = min(frame.shape[1], r[2] + crop_margin)
            y2 = min(frame.shape[0], r[3] + crop_margin)

            # Dibujamos una región transparente alrededor del objeto detectado
            overlay = frame.copy()
            color = colors[c]
            alpha = 0.3  # Nivel de transparencia
            cv2.rectangle(overlay, (x1, y1), (x2, y2), color, -1)
            # Aplicar el overlay con transparencia
            cv2.addWeighted(overlay, alpha, frame, 1 - alpha, 0, frame)

            # Dibujamos la caja de contorno sobre el frame
            thickness = 2
            cv2.rectangle(frame, (x1, y1), (x2, y2), color, thickness, lineType=cv2.LINE_AA)

            # Etiqueta con el nombre de la clase
            label = f"{labels[c]}"

            # Definir el tamaño del texto y la ubicación
            (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.7, 2)
            
            # Crear un fondo sólido para la etiqueta
            cv2.rectangle(frame, (x1, y1 - h - 10), (x1 + w, y1), color, -1, lineType=cv2.LINE_AA)

            # Colocar el texto sobre el fondo
            cv2.putText(frame, label, (x1, y1 - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (255, 255, 255), 2, lineType=cv2.LINE_AA)

            # Realizar un crop de la persona detectada con mayor margen para obtener una imagen más amplia
            if labels[c] == "Persona":
                detected_person = frame[max(0, r[1] - crop_margin_large):min(frame.shape[0], r[3] + crop_margin_large),
                                        max(0, r[0] - crop_margin_large):min(frame.shape[1], r[2] + crop_margin_large)]
            elif labels[c] in {"Gafas", "Casco", "Chaleco"}:
                detected_items.add(labels[c])

    # Guardar el recorte de la persona si fue detectada
    if detected_person is not None and detected_person.size > 0:  # Asegurarse de que el recorte no esté vacío
        # Verificar si la persona cumple con todos los EPP
        required_items = {"Gafas", "Casco", "Chaleco"}
        cumple = required_items.issubset(detected_items)
        if cumple:
            filename = os.path.join(output_dir_compliance, f"cumple_persona_{len(os.listdir(output_dir_compliance))}.png")
        else:
            filename = os.path.join(output_dir_non_compliance, f"nocumple_persona_{len(os.listdir(output_dir_non_compliance))}.png")
        # Ajustar el tamaño del crop para ser aproximadamente 550x735 píxeles
        detected_person_resized = cv2.resize(detected_person, (550, 735))
        cv2.imwrite(filename, detected_person_resized)


def Scanning():
    global cap_video  # Declarar cap_video como global para asegurarnos de tener acceso al video

    if cap_video.isOpened():
        ret_video, frame_video = cap_video.read()

        if ret_video:
            # Procesar el frame del video original (sin detecciones)
            frame_video_rgb = cv2.cvtColor(frame_video, cv2.COLOR_BGR2RGB)
            img_video_original = ImageTk.PhotoImage(image=Image.fromarray(frame_video_rgb))
            lblVideoOriginal.configure(image=img_video_original)
            lblVideoOriginal.image = img_video_original

            # Procesar el frame del video con detecciones
            results_video = model.predict(frame_video, stream=True, verbose=False)

            for result in results_video:
                draw_boxes(frame_video, result.boxes, classes, COLORS)

            frame_video_rgb_detected = cv2.cvtColor(frame_video, cv2.COLOR_BGR2RGB)
            img_video_detected = ImageTk.PhotoImage(image=Image.fromarray(frame_video_rgb_detected))
            lblVideoDetected.configure(image=img_video_detected)
            lblVideoDetected.image = img_video_detected

        lblVideoOriginal.after(10, Scanning)


def ventana_principal():
    global cap_video, lblVideoOriginal, lblVideoDetected

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Configuración del video (video original y video con detección)
    lblVideoOriginal = Label(pantalla)
    lblVideoOriginal.place(x=10, y=10)
    lblVideoDetected = Label(pantalla)
    lblVideoDetected.place(x=650, y=10)

    # Configurar el video
    cap_video = cv2.VideoCapture(video_path)
    if not cap_video.isOpened():
        sys.exit(f"No se pudo abrir el archivo de video: {video_path}")

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


In [10]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np
from tkinter import Tk, Label
from PIL import Image, ImageTk
import os

# Definir el modelo YOLO como global
model = YOLO('best-3.pt')  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ['Gafas', 'Casco', 'Persona', 'Chaleco']  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Definir el video fuera de las funciones para acceso global
video_path = "video Construction Site.mp4"  # Cambia a la ruta del video que deseas procesar
cap_video = None

# Crear directorio para almacenar las capturas
output_dir = "Resultados"
os.makedirs(output_dir, exist_ok=True)

# Crear directorios para cumplir y no cumplir
output_dir_compliance = os.path.join(output_dir, "Cumple")
output_dir_non_compliance = os.path.join(output_dir, "NoCumple")
os.makedirs(output_dir_compliance, exist_ok=True)
os.makedirs(output_dir_non_compliance, exist_ok=True)

def draw_dashed_rectangle(frame, pt1, pt2, color, thickness=2, dash_length=10):
    # Dibuja un rectángulo con líneas discontinuas usando dash_length en cada lado
    x1, y1 = pt1
    x2, y2 = pt2
    
    # Lado superior
    for i in range(x1, x2, dash_length * 2):
        start = (i, y1)
        end = (min(i + dash_length, x2), y1)
        cv2.line(frame, start, end, color, thickness)
    
    # Lado inferior
    for i in range(x1, x2, dash_length * 2):
        start = (i, y2)
        end = (min(i + dash_length, x2), y2)
        cv2.line(frame, start, end, color, thickness)
    
    # Lado izquierdo
    for i in range(y1, y2, dash_length * 2):
        start = (x1, i)
        end = (x1, min(i + dash_length, y2))
        cv2.line(frame, start, end, color, thickness)
    
    # Lado derecho
    for i in range(y1, y2, dash_length * 2):
        start = (x2, i)
        end = (x2, min(i + dash_length, y2))
        cv2.line(frame, start, end, color, thickness)

def draw_boxes(frame, boxes, labels, colors):
    # Variables para verificar cumplimiento de EPP
    detected_person = None
    detected_items = set()
    crop_margin = 50  # Aumentar el margen adicional para el cuadro
    crop_margin_large = 70  # Margen mayor para el crop específico

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Solo dibujar la caja si la confianza es mayor o igual a 0.5
        if box.conf[0] >= 0.5:
            # Extraemos las coordenadas de la caja y agregamos margen para el cuadro de detección
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros
            x1 = max(0, r[0] - crop_margin)
            y1 = max(0, r[1] - crop_margin)
            x2 = min(frame.shape[1], r[2] + crop_margin)
            y2 = min(frame.shape[0], r[3] + crop_margin)

            # Dibujamos un cuadro discontínuo alrededor del objeto detectado
            color = colors[c]
            draw_dashed_rectangle(frame, (x1, y1), (x2, y2), color, thickness=2, dash_length=10)

            # Etiqueta con el nombre de la clase
            label = f"{labels[c]}"

            # Definir el tamaño del texto y la ubicación
            (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.7, 2)
            
            # Crear un fondo sólido para la etiqueta
            cv2.rectangle(frame, (x1, y1 - h - 10), (x1 + w, y1), color, -1, lineType=cv2.LINE_AA)

            # Colocar el texto sobre el fondo
            cv2.putText(frame, label, (x1, y1 - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (255, 255, 255), 2, lineType=cv2.LINE_AA)

            # Realizar un crop de la persona detectada con mayor margen para obtener una imagen más amplia
            if labels[c] == "Persona":
                detected_person = frame[max(0, r[1] - crop_margin_large):min(frame.shape[0], r[3] + crop_margin_large),
                                        max(0, r[0] - crop_margin_large):min(frame.shape[1], r[2] + crop_margin_large)]
            elif labels[c] in {"Gafas", "Casco", "Chaleco"}:
                detected_items.add(labels[c])

    # Guardar el recorte de la persona si fue detectada
    if detected_person is not None and detected_person.size > 0:  # Asegurarse de que el recorte no esté vacío
        # Verificar si la persona cumple con todos los EPP
        required_items = {"Gafas", "Casco", "Chaleco"}
        cumple = required_items.issubset(detected_items)
        if cumple:
            filename = os.path.join(output_dir_compliance, f"cumple_persona_{len(os.listdir(output_dir_compliance))}.png")
        else:
            filename = os.path.join(output_dir_non_compliance, f"nocumple_persona_{len(os.listdir(output_dir_non_compliance))}.png")
        # Ajustar el tamaño del crop para ser aproximadamente 550x735 píxeles
        detected_person_resized = cv2.resize(detected_person, (550, 735))
        cv2.imwrite(filename, detected_person_resized)

def Scanning():
    global cap_video  # Declarar cap_video como global para asegurarnos de tener acceso al video

    if cap_video.isOpened():
        ret_video, frame_video = cap_video.read()

        if ret_video:
            # Procesar el frame del video con detecciones
            results_video = model.predict(frame_video, stream=True, verbose=False)

            for result in results_video:
                draw_boxes(frame_video, result.boxes, classes, COLORS)

            # Convertir el frame a RGB y mostrar en la interfaz
            frame_video_rgb_detected = cv2.cvtColor(frame_video, cv2.COLOR_BGR2RGB)
            img_video_detected = ImageTk.PhotoImage(image=Image.fromarray(frame_video_rgb_detected))
            lblVideoDetected.configure(image=img_video_detected)
            lblVideoDetected.image = img_video_detected

        lblVideoDetected.after(10, Scanning)

def ventana_principal():
    global cap_video, lblVideoDetected

    # Configurar el video
    cap_video = cv2.VideoCapture(video_path)
    if not cap_video.isOpened():
        sys.exit(f"No se pudo abrir el archivo de video: {video_path}")

    # Obtener el tamaño del video
    video_width = int(cap_video.get(cv2.CAP_PROP_FRAME_WIDTH))
    video_height = int(cap_video.get(cv2.CAP_PROP_FRAME_HEIGHT))

    # Crear la ventana principal con el tamaño del video y deshabilitar el redimensionado
    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry(f"{video_width}x{video_height}")
    pantalla.resizable(False, False)  # Deshabilitar el redimensionado

    # Configuración del video (video con detección)
    lblVideoDetected = Label(pantalla)
    lblVideoDetected.place(x=0, y=0)

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


SystemExit: No se pudo abrir el archivo de video: video Construction Site.mp4

In [None]:
--------------------------------------------------------------------------------------------------------------------------------------------------------------------

In [1]:
import sys
import cv2
from ultralytics import YOLO  # Importa la clase YOLO correctamente
import numpy as np
from tkinter import Tk, Label
from PIL import Image, ImageTk
import os

# Definir el modelo YOLO como global
model = YOLO('best-3.pt')  # Asegúrate de usar la clase/método correcto para YOLO

# Definir las clases de tu modelo entrenado
classes = ['Gafas', 'Casco', 'Persona', 'Chaleco']  # Clases de tu modelo
COLORS = np.random.uniform(0, 255, size=(len(classes), 3))  # Colores aleatorios para cada clase

# Definir la cámara fuera de las funciones para acceso global
cap = None

# Definir las etiquetas de estado de EPP
lbl_casco = None
lbl_gafas = None
lbl_chaleco = None

# Crear directorio para almacenar los recortes de detecciones
output_dir = "Resultados_Camara"
os.makedirs(output_dir, exist_ok=True)

# Crear directorios para cumplir y no cumplir
output_dir_compliance = os.path.join(output_dir, "Cumple")
output_dir_non_compliance = os.path.join(output_dir, "NoCumple")
os.makedirs(output_dir_compliance, exist_ok=True)
os.makedirs(output_dir_non_compliance, exist_ok=True)

# Cargar las imágenes de estado de EPP cuando la ventana ya esté creada
def cargar_imagenes():
    base_path = os.path.abspath("Images")

    global img_no_casco, img_no_gafas, img_no_chaleco
    global img_si_casco, img_si_gafas, img_si_chaleco

    img_no_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_casco - copia.png")))
    img_no_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_gafas - copia.png")))
    img_no_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "no_chaleco - copia.png")))
    img_si_casco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_casco - copia.png")))
    img_si_gafas = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_gafas - copia.png")))
    img_si_chaleco = ImageTk.PhotoImage(Image.open(os.path.join(base_path, "si_chaleco - copia.png")))


def update_epp_status(casco_detected, gafas_detected, chaleco_detected):
    # Actualiza las imágenes según las detecciones
    if casco_detected:
        lbl_casco.config(image=img_si_casco)
        lbl_casco.image = img_si_casco
    else:
        lbl_casco.config(image=img_no_casco)
        lbl_casco.image = img_no_casco

    if gafas_detected:
        lbl_gafas.config(image=img_si_gafas)
        lbl_gafas.image = img_si_gafas
    else:
        lbl_gafas.config(image=img_no_gafas)
        lbl_gafas.image = img_no_gafas

    if chaleco_detected:
        lbl_chaleco.config(image=img_si_chaleco)
        lbl_chaleco.image = img_si_chaleco
    else:
        lbl_chaleco.config(image=img_no_chaleco)
        lbl_chaleco.image = img_no_chaleco


def draw_boxes(frame, boxes, labels, colors):
    casco_detected = gafas_detected = chaleco_detected = False
    detected_person = None
    detected_items = set()
    casco_detected = gafas_detected = chaleco_detected = False
    detected_person = None
    detected_items = set()
    crop_margin_large = 70  # Margen mayor para el crop específico

    for box in boxes:
        # Obtenemos la clase del objeto detectado
        c = int(box.cls)
        
        # Solo dibujar la caja si la confianza es mayor o igual a 0.5
        if box.conf[0] >= 0.5:
            # Extraemos las coordenadas de la caja
            r = box.xyxy[0].cpu().numpy()  # Convertimos a numpy
            r = [int(coord) for coord in r]  # Convertimos a enteros
            x1 = max(0, r[0])
            y1 = max(0, r[1])
            x2 = min(frame.shape[1], r[2])
            y2 = min(frame.shape[0], r[3])

            # Dibujamos la caja sobre el frame con un borde grueso (4 píxeles)
            color = colors[c]
            cv2.rectangle(frame, (x1, y1), (x2, y2), color, 4)

            # Etiqueta con el nombre de la clase
            label = f"{labels[c]}"

            # Definir el tamaño del texto y la ubicación
            (w, h), _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.6, 1)
            
            # Crear un fondo sólido para la etiqueta
            cv2.rectangle(frame, (x1, y1 - h - 10), (x1 + w, y1), color, -1)

            # Colocar el texto sobre el fondo
            cv2.putText(frame, label, (x1, y1 - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1)

            # Realizar un crop de la persona detectada con mayor margen para obtener una imagen más amplia
            if labels[c] == "Persona":
                detected_person = frame[max(0, y1 - crop_margin_large):min(frame.shape[0], y2 + crop_margin_large),
                                        max(0, x1 - crop_margin_large):min(frame.shape[1], x2 + crop_margin_large)]
            elif labels[c] == "Gafas":
                gafas_detected = True
            elif labels[c] == "Casco":
                casco_detected = True
            elif labels[c] == "Chaleco":
                chaleco_detected = True
                detected_items.add(labels[c])

    # Guardar el recorte de la persona si fue detectada
    if detected_person is not None and detected_person.size > 0:  # Asegurarse de que el recorte no esté vacío
        # Verificar si la persona cumple con todos los EPP
        required_items = {"Gafas", "Casco", "Chaleco"}
        cumple = required_items.issubset(detected_items)
        if cumple:
            filename = os.path.join(output_dir_compliance, f"cumple_persona_{len([f for f in os.listdir(output_dir_compliance) if f.endswith('.png')])}.png")
        else:
            filename = os.path.join(output_dir_non_compliance, f"nocumple_persona_{len([f for f in os.listdir(output_dir_non_compliance) if f.endswith('.png')])}.png")
        # Ajustar el tamaño del crop para ser aproximadamente 550x735 píxeles
        detected_person_resized = cv2.resize(detected_person, (550, 735))
        cv2.imwrite(filename, detected_person_resized)

    # Actualizar la interfaz con el estado de los EPP detectados
    update_epp_status(casco_detected, gafas_detected, chaleco_detected)


def Scanning():
    global cap  # Declarar cap como global para asegurarnos de tener acceso a la cámara

    if cap.isOpened():
        ret, frame = cap.read()
        if ret:
            frame = cv2.flip(frame, 1)
            results = model.predict(frame, stream=True, verbose=False)

            for result in results:
                draw_boxes(frame, result.boxes, classes, COLORS)

            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            img = ImageTk.PhotoImage(image=Image.fromarray(frame_rgb))
            lblVideo.configure(image=img)
            lblVideo.image = img

        lblVideo.after(10, Scanning)


def ventana_principal():
    global cap, lblVideo, lbl_casco, lbl_gafas, lbl_chaleco

    pantalla = Tk()
    pantalla.title("Detección de EPP")
    pantalla.geometry("1280x720")

    # Cargar la imagen de fondo
    try:
        imageF = Image.open("canva.jpg")
        imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
        imageF = ImageTk.PhotoImage(imageF)
        background = Label(pantalla, image=imageF)
        background.place(x=0, y=0, relwidth=1, relheight=1)
        background.image = imageF
    except FileNotFoundError:
        print("Error: No se pudo cargar 'Canva.png'. Asegúrate de que la imagen esté en la misma carpeta.")

    # Cargar las imágenes una vez que la ventana se haya creado
    cargar_imagenes()

    # Configurar las etiquetas para mostrar las imágenes de estado de EPP en la interfaz
    lbl_casco = Label(pantalla, image=img_no_casco, bg='#d9d9d9')  # Fondo gris claro para que destaque
    lbl_casco.place(x=75, y=110)
    lbl_gafas = Label(pantalla, image=img_no_gafas, bg='#d9d9d9')
    lbl_gafas.place(x=75, y=260)
    lbl_chaleco = Label(pantalla, image=img_no_chaleco, bg='#d9d9d9')
    lbl_chaleco.place(x=75, y=410)

    # Configuración del video
    lblVideo = Label(pantalla)
    lblVideo.place(x=320, y=120)

    # Configurar la cámara
    cap = cv2.VideoCapture(1)  # 0 indica la cámara por defecto del sistema
    if not cap.isOpened():
        sys.exit("No se pudo acceder a la cámara.")

    # Iniciar la detección
    Scanning()
    pantalla.mainloop()

if __name__ == "__main__":
    ventana_principal()


  imageF = imageF.resize((1280, 720), Image.ANTIALIAS)
