# 라이브러리

In [None]:
from deepface import DeepFace
from deepface.basemodels import VGGFace, OpenFace, Facenet, FbDeepFace

import matplotlib.pyplot as plt
import numpy as np
import cv2
import os
import pymsgbox
import glob
import time

# Deepface를 통한 본인인증

# 얼굴 등록

In [None]:
folder_path = './data/Mini_Project/Face'  # 폴더 경로 설정
file_list = glob.glob(folder_path + '/*')  # 폴더 내의 파일 목록 얻기
file_count = len(file_list)  # 파일 개수 계산
print(f"폴더 내 파일 개수: {file_count}")

webcam = cv2.VideoCapture(0)
if not webcam.isOpened():
    print('웹캠을 찾을 수 없습니다.')
    exit()

while True:
    status, frame = webcam.read()
    if status:
        cv2.imshow('test', frame)
    
    key = cv2.waitKey(1)
    
    # c 키 누르면 사진 저장
    if key == ord('c'):
        username = file_count+1
        img_captured = cv2.imwrite(f'./data/Mini_Project/Face/face_00{username}.jpg', frame)
        pymsgbox.alert('등록완료', '알림')
        break
    
    # esc 혹은 창닫기 버튼 누르면 종료
    if key == 27 or cv2.getWindowProperty('test', cv2.WND_PROP_VISIBLE) < 1:
        break

webcam.release()
cv2.destroyAllWindows()

# c키 눌러서 인증

In [None]:
model = VGGFace.loadModel()

count = 0
value = 0.25
distance_list = []
input_size = model.layers[0].input_shape[1:3]

backends = ['opencv', 'ssd', 'dlib', 'mtcnn']

webcam = cv2.VideoCapture(0)
if not webcam.isOpened():
    print('웹캠을 찾을 수 없습니다.')
    exit()

while True:
    status, frame = webcam.read()
    if status:
        cv2.imshow('test', frame)
    
    Face_Images = os.path.join(os.getcwd(), './data/Mini_Project/Face') # 등록된 얼굴 이미지 폴더 지정
    Face_Images_List = []
    for root, dir, files in os.walk(Face_Images): # 파일 목록 가져오기
        for file in files:
            if file.endswith('jpeg') or file.endswith('jpg') or file.endswith('png'): # 이미지 파일 필터링
                image_path = os.path.join(Face_Images, file)
                # print(image_path)
                Face_Images_List.append(cv2.imread(image_path))
    
    key = cv2.waitKey(1)
    
    # c 키 누르면 사진 저장
    if key == ord('c'):
        
        # 프레임을 변수에 저장 및 예측
        # img_captured = frame
        img2 = DeepFace.detectFace(frame, detector_backend=backends[3])
        img2 = np.expand_dims(img2, axis=0)
        img2_representation = model.predict(img2)[0,:]
        
        # 등록되어있던 이미지들 불러오기
        for idx in range(len(Face_Images_List)):
    
            img1 = DeepFace.detectFace(Face_Images_List[idx], detector_backend=backends[3])
            img1 = np.expand_dims(img1, axis=0)
            img1_representation = model.predict(img1)[0,:]

            distance_vector = np.square(img1_representation - img2_representation)
            distance = np.sqrt(distance_vector.sum())
            distance_list.append(distance)
            # print('Euclidean distance : ', distance)

        if any(item <= value for item in distance_list):
            pymsgbox.alert('인증 되셨습니다', '알림')
        else:
            pymsgbox.alert(f'다시 시도해주세요. {4-count}회 남음', '알림')
            count += 1
            if count == 5:
                pymsgbox.alert(f'{count}회 시도했습니다. 30초후 다시 시도해주세요', '알림')
                count = 0
                cv2.destroyAllWindows()
                break
    
    # esc 혹은 창닫기 버튼 누르면 종료
    if key == 27 or cv2.getWindowProperty('test', cv2.WND_PROP_VISIBLE) < 1:
        break

webcam.release()
cv2.destroyAllWindows()

# c키 없이 자동 인증

In [None]:
model = VGGFace.loadModel()

count = 0
value = 0.25
distance_list = []
input_size = model.layers[0].input_shape[1:3]

backends = ['opencv', 'ssd', 'dlib', 'mtcnn']

webcam = cv2.VideoCapture(0)
if not webcam.isOpened():
    print('웹캠을 찾을 수 없습니다.')
    exit()

capture_interval = 7  # 캡처 간격(초)
last_capture_time = time.time() - capture_interval  # 이전 캡처 시간

while True:
    current_time = time.time()
    elapsed_time = current_time - last_capture_time

    status, frame = webcam.read()
    if status:
        cv2.imshow('test', frame)
        

    key = cv2.waitKey(1)
    
    # 지정된 시간 간격마다 자동으로 캡처
    
    if elapsed_time >= capture_interval:
        img2 = DeepFace.detectFace(frame, detector_backend=backends[3])
        img2 = np.expand_dims(img2, axis=0)
        img2_representation = model.predict(img2)[0, :]

        Face_Images = os.path.join(os.getcwd(), './data/Mini_Project/Face')  # 등록된 얼굴 이미지 폴더 지정
        Face_Images_List = []
        for root, dir, files in os.walk(Face_Images):  # 파일 목록 가져오기
            for file in files:
                if file.endswith(('jpeg', 'jpg', 'png')):  # 이미지 파일 필터링
                    image_path = os.path.join(Face_Images, file)
                    Face_Images_List.append(cv2.imread(image_path))

        for idx in range(len(Face_Images_List)):
            img1 = DeepFace.detectFace(Face_Images_List[idx], detector_backend=backends[3])
            img1 = np.expand_dims(img1, axis=0)
            img1_representation = model.predict(img1)[0, :]

            distance_vector = np.square(img1_representation - img2_representation)
            distance = np.sqrt(distance_vector.sum())
            distance_list.append(distance)

        if any(item <= value for item in distance_list):
            pymsgbox.alert('인증 되셨습니다', '알림')
            
            cv2.destroyAllWindows()
            break
        else:
            pymsgbox.alert(f'다시 시도해주세요. {4 - count}회 남음', '알림')
            count += 1
            if count == 5:
                pymsgbox.alert(f'{count}회 시도했습니다. 30초 후 다시 시도해주세요', '알림')
                count = 0
                cv2.destroyAllWindows()
                break

        last_capture_time = current_time  # 캡처 시간 업데이트

    # c 키 누르면 사진 저장
    if key == ord('c'):
        img2 = DeepFace.detectFace(frame, detector_backend=backends[3])
        img2 = np.expand_dims(img2, axis=0)
        img2_representation = model.predict(img2)[0, :]
        break

webcam.release()
cv2.destroyAllWindows()

# har 방법

In [None]:
import cv2
import os

# 얼굴 인식용 xml 파일
face_classifier = cv2.CascadeClassifier('./data/haarcascade_frontalface_default.xml')

# 전체 사진에서 얼굴 부위만 잘라내어 리턴
def face_extractor(img):
    # 흑백처리
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 얼굴 찾기
    faces = face_classifier.detectMultiScale(gray, scaleFactor=1.3, minNeighbors=5)
    # 찾은 얼굴이 없으면 None으로 리턴
    if len(faces) == 0:
        return None
    # 모든 얼굴 잘라내기
    cropped_faces = []
    for (x, y, w, h) in faces:
        cropped_face = img[y:y+h, x:x+w]
        cropped_faces.append(cropped_face)
    # cropped_faces 리턴
    return cropped_faces

# 카메라 실행
cap = cv2.VideoCapture(0)
# 저장할 이미지 카운트 변수
count = 0

while True:
    # 카메라로부터 사진 1장 얻기
    ret, frame = cap.read()
    # 얼굴 감지하여 얼굴들만 가져오기
    faces = face_extractor(frame)
    
    if faces is not None:
        # 얼굴 개수만큼 반복
        for face in faces:
            count += 1
            # 얼굴 이미지 크기를 200x200으로 조정
            face_resized = cv2.resize(face, (200, 200))
            # 조정된 이미지를 흑백으로 변환
            face_gray = cv2.cvtColor(face_resized, cv2.COLOR_BGR2GRAY)
            # faces 폴더에 jpg 파일로 저장
            file_name_path = './data/Mini_Project/naver/' + str(count) + '.jpg'
            cv2.imwrite(file_name_path, face_gray)
            # 화면에 얼굴과 현재 저장 개수 표시
            cv2.putText(face_resized, str(count), (50, 50), cv2.FONT_HERSHEY_COMPLEX, 1, (0, 255, 0), 2)
            cv2.imshow('Face Cropper', face_resized)
    
    else:
        print("Face not Found")
    
    if cv2.waitKey(1) == 13 or count == 100:
        break

cap.release()
cv2.destroyAllWindows()
print('Collecting Samples Complete!!!')

## 모델 학습

In [None]:
import cv2
import numpy as np
from os import listdir
from os.path import isfile, join
data_path = './data/Mini_Project/naver/'
#faces폴더에 있는 파일 리스트 얻기 
onlyfiles = [f for f in listdir(data_path) if isfile(join(data_path,f))]
#데이터와 매칭될 라벨 변수 
Training_Data, Labels = [], []
#파일 개수 만큼 루프 
for i, files in enumerate(onlyfiles):    
    image_path = data_path + onlyfiles[i]
    #이미지 불러오기 
    images = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    #이미지 파일이 아니거나 못 읽어 왔다면 무시
    if images is None:
        continue    
    #Training_Data 리스트에 이미지를 바이트 배열로 추가 
    Training_Data.append(np.asarray(images, dtype=np.uint8))
    #Labels 리스트엔 카운트 번호 추가 
    Labels.append(i)

#훈련할 데이터가 없다면 종료.
if len(Labels) == 0:
    print("There is no data to train.")
    exit()

#Labels를 32비트 정수로 변환
Labels = np.asarray(Labels, dtype=np.int32)
#모델 생성 
model = cv2.face.LBPHFaceRecognizer_create()
#학습 시작 
model.train(np.asarray(Training_Data), np.asarray(Labels))
print("Model Training Complete!!!!!")

In [None]:
import cv2
import numpy as np
from os import listdir
from os.path import isfile, join

data_path = './data/Mini_Project/naver/'
onlyfiles = [f for f in listdir(data_path) if isfile(join(data_path,f))]
Training_Data, Labels = [], []
for i, files in enumerate(onlyfiles):
    image_path = data_path + onlyfiles[i]
    images = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    if images is None:
        continue    
    Training_Data.append(np.asarray(images, dtype=np.uint8))
    Labels.append(i)
if len(Labels) == 0:
    print("There is no data to train.")
    exit()
Labels = np.asarray(Labels, dtype=np.int32)
model = cv2.face.LBPHFaceRecognizer_create()
model.train(np.asarray(Training_Data), np.asarray(Labels))
print("Model Training Complete!!!!!")


face_classifier = cv2.CascadeClassifier('./data/haarcascade_frontalface_default.xml')

def face_detector(img, size=0.5):
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    faces = face_classifier.detectMultiScale(gray, scaleFactor=1.3, minNeighbors=3)
    if len(faces) == 0:
        return img, None
    for (x, y, w, h) in faces:
        cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 255), 2)
        roi = img[y:y + h, x:x + w]
        roi = cv2.resize(roi, (200, 200))
    return img, roi



#카메라 열기 
cap = cv2.VideoCapture(0)

while True:
    #카메라로 부터 사진 한장 읽기 
    ret, frame = cap.read()
    # 얼굴 검출 시도 
    image, face = face_detector(frame)
    try:
        #검출된 사진을 흑백으로 변환 
        face = cv2.cvtColor(face, cv2.COLOR_BGR2GRAY)
        #위에서 학습한 모델로 예측시도
        result = model.predict(face)
        #result[1]은 신뢰도이고 0에 가까울수록 자신과 같다는 뜻이다. 
        if result[1] < 500:
            #????? 어쨋든 0~100표시하려고 한듯 
            confidence = int(100*(1-(result[1])/300))
            # 유사도 화면에 표시 
            display_string = str(confidence)+'% 사용자와 일치'
        cv2.putText(image,display_string,(100,120), cv2.FONT_HERSHEY_COMPLEX,1,(250,120,255),2)
        #75 보다 크면 동일 인물로 간주해 UnLocked! 
        if confidence > 50:
            font = cv2.FONT_HERSHEY_SIMPLEX # 폰트 지정
            cv2.putText(image, "잠금 해제", (250, 450), font, 1, (0, 255, 0), 2)
            cv2.imshow('Face Cropper', image)
        else:
           #75 이하면 타인.. Locked!!! 
            font = cv2.FONT_HERSHEY_SIMPLEX # 폰트 지정
            cv2.putText(image, "잠금", (250, 450), font, 1, (0, 0, 255), 2)
            cv2.imshow('Face Cropper', image)
    except:
        #얼굴 검출 안됨
        font = cv2.FONT_HERSHEY_SIMPLEX # 폰트 지정
        cv2.putText(image, "Face Not Found", (250, 450), font, 1, (255, 0, 0), 2)
        cv2.imshow('Face Cropper', image)
        pass
    if cv2.waitKey(1)==13:
        break
cap.release()
cv2.destroyAllWindows()

# yolo v8을 통한 segmantation

In [14]:
import cv2
from ultralytics import YOLO

# Load the YOLOv8 model
model = YOLO('yolov8n-seg.pt')

# Open the video file
cap = cv2.VideoCapture(0)

# Loop through the video frames
while cap.isOpened():
    # Read a frame from the video
    success, frame = cap.read()

    if success:
        # Run YOLOv8 inference on the frame
        results = model(frame)
        # for result in results:
        #     masks = results[0].masks  # Masks object
        #     masks.xy  # x, y segments (pixels), List[segment] * N
        #     masks.xyn  # x, y segments (normalized), List[segment] * N
        #     masks.data  # raw masks tensor, (N, H, W) or masks.masks 
        #     print(masks.xy)
        # Visualize the results on the frame
        annotated_frame = results[0].plot(boxes=False)
        # masks = result[0].masks
        # print(masks.xy)
        # print(masks.xyn)
        # print(masks.data)
        # print(result)
        # Display the annotated frame
        cv2.imshow("YOLOv8 Inference", annotated_frame)

        # Break the loop if 'q' is pressed
        if cv2.waitKey(1) & 0xFF == ord("q"):
            break
    else:
        # Break the loop if the end of the video is reached
        break

# Release the video capture object and close the display window
cap.release()
cv2.destroyAllWindows()



0: 480x640 1 person, 1 book, 6.5ms
Speed: 1.0ms preprocess, 6.5ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 5.6ms
Speed: 1.4ms preprocess, 5.6ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 6.0ms
Speed: 1.4ms preprocess, 6.0ms inference, 2.3ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 6.4ms
Speed: 1.0ms preprocess, 6.4ms inference, 2.3ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 7.4ms
Speed: 1.0ms preprocess, 7.4ms inference, 2.4ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 5.3ms
Speed: 1.1ms preprocess, 5.3ms inference, 2.3ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 5.8ms
Speed: 2.6ms preprocess, 5.8ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 7.0ms
Speed: 1.1ms preprocess, 7.0ms inference, 1.0ms postprocess per image

In [6]:
from ultralytics import YOLO
import cv2
import torch
import numpy as np

model = YOLO('yolov8n-seg.pt')
results = model('https://ultralytics.com/images/bus.jpg', imgsz=640)
img = cv2.imread('bus.jpg')
img = cv2.resize(img, (480, 640))

for result in results:
    for mask in result.masks:
        m = torch.squeeze(mask.data)
        composite = torch.stack((m, m, m), 2)
        tmp = img * composite.cpu().numpy().astype(np.uint8)
        cv2.imshow("result", tmp)
        cv2.waitKey(0)


Found https:\ultralytics.com\images\bus.jpg locally at bus.jpg
image 1/1 c:\AISW\video\bus.jpg: 640x480 4 persons, 1 bus, 1 skateboard, 7.0ms
Speed: 1.0ms preprocess, 7.0ms inference, 3.0ms postprocess per image at shape (1, 3, 640, 480)


In [7]:
from ultralytics import YOLO
import cv2
import torch
import numpy as np

model = YOLO('yolov8n-seg.pt')
results = model('https://ultralytics.com/images/bus.jpg', imgsz=640)
img = cv2.imread('bus.jpg')
img = cv2.resize(img, (480, 640))

# Create a black background image
background = np.zeros(img.shape, dtype=np.uint8)

for result in results:
    for mask in result.masks:
        m = torch.squeeze(mask.data)
        composite = torch.stack((m, m, m), 2)
        tmp = img * composite.cpu().numpy().astype(np.uint8)
        background += tmp

# Display the masked image
cv2.imshow("Masked Image", background)
cv2.waitKey(0)
cv2.destroyAllWindows()



Found https:\ultralytics.com\images\bus.jpg locally at bus.jpg
image 1/1 c:\AISW\video\bus.jpg: 640x480 4 persons, 1 bus, 1 skateboard, 6.0ms
Speed: 1.0ms preprocess, 6.0ms inference, 2.0ms postprocess per image at shape (1, 3, 640, 480)


In [38]:
import cv2
from ultralytics import YOLO
import torch
import numpy as np

# YOLOv8 모델 로드
model = YOLO('yolov8n-seg.pt')

# 웹캠을 위한 비디오 캡처 객체 열기
cap = cv2.VideoCapture(0)

# 적용할 배경
bgimg = cv2.imread('./yolobg.jpg')

# 비디오 프레임을 반복하여 처리
while cap.isOpened():
    # 비디오에서 프레임 읽기
    success, frame = cap.read()

    if success:
        # YOLOv8를 사용하여 프레임에 대한 추론 실행
        results = model(frame)

        # 검정색 배경 이미지 생성
        background = np.zeros(frame.shape, dtype=np.uint8)

        for result in results:
            for mask in result.masks:
                # 마스크 데이터에서 차원 축소
                m = torch.squeeze(mask.data)
                # 마스크를 RGB 형식으로 변환하여 컴포지트(composite) 텐서 생성
                composite = torch.stack((m, m, m), 2)
                # 프레임과 컴포지트를 곱하여 마스크 영역 추출
                tmp = frame * composite.cpu().numpy().astype(np.uint8)
                # 추출된 마스크 영역을 배경에 누적
                background += tmp
                

        # 마스킹된 이미지 출력
        cv2.imshow("마스킹된 이미지", background)

        # 'q' 키가 눌리면 루프 종료
        if cv2.waitKey(1) & 0xFF == ord("q"):
            break
    else:
        # 비디오의 끝에 도달하면 루프 종료
        break

# 비디오 캡처 객체 해제 및 화면 창 닫기
cap.release()
cv2.destroyAllWindows()



0: 480x640 1 person, 1 chair, 8.1ms
Speed: 1.1ms preprocess, 8.1ms inference, 2.2ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 7.2ms
Speed: 1.1ms preprocess, 7.2ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 5.7ms
Speed: 1.5ms preprocess, 5.7ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 7.3ms
Speed: 1.4ms preprocess, 7.3ms inference, 1.1ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 11.8ms
Speed: 1.1ms preprocess, 11.8ms inference, 3.4ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 6.5ms
Speed: 1.0ms preprocess, 6.5ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 9.7ms
Speed: 2.1ms preprocess, 9.7ms inference, 2.5ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 7.7ms
Speed: 1.1ms preprocess, 7.7ms inferenc

# yolov8 세그먼트를 이용한 화상회의 배경 변경

In [4]:
import cv2
from ultralytics import YOLO
import torch
import numpy as np

# YOLOv8 모델 로드
model = YOLO('yolov8n-seg.pt')

# 웹캠을 위한 비디오 캡처 객체 열기
cap = cv2.VideoCapture(0)

# 적용할 배경
bgimg = cv2.imread('./yolobg.jpg')

# 비디오 프레임을 반복하여 처리
while cap.isOpened():
    # 비디오에서 프레임 읽기
    success, frame = cap.read()

    if success:
        # YOLOv8를 사용하여 프레임에 대한 추론 실행
        results = model(frame)

        # 검정색 배경 이미지 생성
        background = np.zeros(frame.shape, dtype=np.uint8)

        for result in results:
            for mask in result.masks:
                # 마스크 데이터에서 차원 축소
                m = torch.squeeze(mask.data)
                # 마스크를 RGB 형식으로 변환하여 컴포지트(composite) 텐서 생성
                composite = torch.stack((m, m, m), 2)
                # 프레임과 컴포지트를 곱하여 마스크 영역 추출
                tmp = frame * composite.cpu().numpy().astype(np.uint8)
                # 추출된 마스크 영역을 배경에 누적
                background += tmp

        # 배경 이미지를 원하는 배경으로 마스킹
        bgimg_resized = cv2.resize(bgimg, (frame.shape[1], frame.shape[0]))
        background = np.where(background == 0, bgimg_resized, background)

        # 마스킹된 이미지 출력
        cv2.imshow("마스킹된 이미지", background)

        # 'q' 키가 눌리면 루프 종료
        if cv2.waitKey(1) & 0xFF == ord("q"):
            break
    else:
        # 비디오의 끝에 도달하면 루프 종료
        break

# 비디오 캡처 객체 해제 및 화면 창 닫기
cap.release()
cv2.destroyAllWindows()



0: 480x640 1 person, 2 chairs, 99.1ms
Speed: 2.0ms preprocess, 99.1ms inference, 3.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 5.0ms
Speed: 1.0ms preprocess, 5.0ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 6.0ms
Speed: 1.0ms preprocess, 6.0ms inference, 3.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 7.0ms
Speed: 1.0ms preprocess, 7.0ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 6.0ms
Speed: 1.0ms preprocess, 6.0ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 6.0ms
Speed: 1.0ms preprocess, 6.0ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 2 chairs, 7.0ms
Speed: 1.0ms preprocess, 7.0ms inference, 2.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 1 chair, 9.0ms
Speed: 1.2ms preprocess, 9.0ms inference, 4.0m

In [43]:
import cv2
from ultralytics import YOLO

ip_address = "rtsp://admin:admin123@192.168.1.2:554/cam/realmonitor?channel=1&subtype=0&unicast=true&proto=Onvif"
cap = cv2.VideoCapture(ip_address)
model = YOLO('yolov8n-seg.pt')
fps = int(cap.get(cv2.CAP_PROP_FPS))

fourcc = cv2.VideoWriter_fourcc('m','p','4','v')
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

show_boxes = False

out = cv2.VideoWriter('output.mp4', fourcc, fps,(frame_width,frame_height),True )
while(cap.isOpened()):
    ret,frame = cap.read()
    if ret == True:
        person_found = False
        results = model(frame, imgsz=640, stream=True, verbose=False)
        for result in results:
            for box in result.boxes.cpu().numpy():
                if show_boxes:
                    r = box.xyxy[0].astype(int)
                    cv2.rectangle(frame, r[:2], r[2:], (255, 255, 255), 2)
                cls = int(box.cls[0])
                if cls == 0:
                    person_found = True

        if person_found:
            out.write(frame)
        
        cv2.imshow('Frame', frame)
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

cap.release()
out.release()

cv2.destroyAllWindows()