## Importar dependencias

In [1]:
import cv2
import numpy as np
from ultralytics import YOLO

In [2]:
def main():
    # Inicializa o modelo YOLO pré-treinado
    model = YOLO('yolov8n.pt')
    
    # Inicializa a captura de vídeo (0 é geralmente a webcam padrão)
    cap = cv2.VideoCapture(0)
    
    # Verifica se a câmera foi aberta corretamente
    if not cap.isOpened():
        print("Erro ao abrir a webcam")
        return
    
    print("Pressione 'q' para sair")
    
    while True:
        # Captura frame por frame
        ret, frame = cap.read()
        
        if not ret:
            print("Erro ao capturar o frame")
            break
            
        # Executa a detecção no frame atual
        results = model(frame, conf=0.5)  # conf é o threshold de confiança
        
        # Processa os resultados
        for result in results:
            boxes = result.boxes.cpu().numpy()
            for box in boxes:
                # Verifica se a detecção é uma pessoa (classe 0 no COCO dataset)
                if box.cls[0] == 0:  # classe 0 = pessoa
                    # Extrai as coordenadas do bbox
                    x1, y1, x2, y2 = map(int, box.xyxy[0])
                    confidence = float(box.conf[0]) if isinstance(box.conf, np.ndarray) else float(box.conf)
                    
                    # Ajusta a região para focar mais no rosto (parte superior do bbox)
                    face_height = int((y2 - y1) * 0.4)  # Usa 40% superior do bbox
                    y2 = y1 + face_height
                    
                    # Desenha o retângulo ao redor do rosto
                    cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 2)
                    
                    # Adiciona o texto de confiança
                    text = f'Face: {confidence:.0%}'
                    cv2.putText(frame, text, (x1, y1-10), 
                              cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
        
        # Mostra o frame resultante
        cv2.imshow('Face Detection', frame)
        
        # Verifica se o usuário pressionou 'q' para sair
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    
    # Libera os recursos
    cap.release()
    cv2.destroyAllWindows()

In [3]:
if __name__ == "__main__":
    main()

Pressione 'q' para sair

0: 480x640 1 person, 236.6ms
Speed: 17.7ms preprocess, 236.6ms inference, 24.9ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 93.3ms
Speed: 4.2ms preprocess, 93.3ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 98.9ms
Speed: 3.8ms preprocess, 98.9ms inference, 0.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 91.5ms
Speed: 2.0ms preprocess, 91.5ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 93.4ms
Speed: 0.0ms preprocess, 93.4ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 88.1ms
Speed: 0.0ms preprocess, 88.1ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 92.3ms
Speed: 0.0ms preprocess, 92.3ms inference, 0.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 84.9ms
Speed: 3.2ms preprocess, 84.9ms inference, 1.0ms postprocess 