In [6]:
import cv2
import numpy as np
import time
import base64
import socketio

In [21]:
def GetPerson(frame, size, score_threshold, nms_threshold):
    # 이미지의 높이, 너비, 채널 받아오기
    height, width, channels = frame.shape

    # 네트워크에 넣기 위한 전처리
    blob = cv2.dnn.blobFromImage(frame, 0.00392, (size, size), (0, 0, 0), True, crop=False)

    # 전처리된 blob 네트워크에 입력
    net.setInput(blob)

    # 결과 받아오기
    outs = net.forward(output_layers)

    # 각각의 데이터를 저장할 빈 리스트
    class_ids = []
    confidences = []
    boxes = []
    
    iCntPerson = 0

    for out in outs:
        for detection in out:
            scores = detection[5:]
            class_id = np.argmax(scores)
            
            #사람일 경우만 객체에 담기
            if class_id == 0:
                confidence = scores[class_id]

                if confidence > 0.7:
                    # 탐지된 객체의 너비, 높이 및 중앙 좌표값 찾기
                    center_x = int(detection[0] * width)
                    center_y = int(detection[1] * height)
                    w = int(detection[2] * width)
                    h = int(detection[3] * height)

                    # 객체의 사각형 테두리 중 좌상단 좌표값 찾기
                    x = int(center_x - w / 2)
                    y = int(center_y - h / 2)

                    boxes.append([x, y, w, h])
                    confidences.append(float(confidence))
                    class_ids.append(class_id)
                    
                    iCntPerson = iCntPerson + 1

    # Non Maximum Suppression (겹쳐있는 박스 중 confidence 가 가장 높은 박스를 선택)
    indexes = cv2.dnn.NMSBoxes(boxes, confidences, score_threshold=score_threshold, nms_threshold=nms_threshold)
    
    for i in range(len(boxes)):
        if i in indexes:
            x, y, w, h = boxes[i]
            class_name = classes[class_ids[i]]
            
            label = f"{class_name} {confidences[i]:.2f}"            
            color = [2, 173, 255]
            # 사각형 테두리 그리기 및 텍스트 쓰기
            cv2.rectangle(frame, (x, y), (x + w, y + h), color, 2)
            cv2.rectangle(frame, (x - 1, y), (x + len(class_name) * 13 + 65, y - 25), color, -1)
            cv2.putText(frame, label, (x, y - 8), cv2.FONT_HERSHEY_COMPLEX_SMALL, 1, (0, 0, 0), 2)
    return frame, iCntPerson

In [23]:
#Yolo 학습결과 레이어 불러오기
net = cv2.dnn.readNet(f"./Yolo/yolov3_320.weights", "./Yolo/yolov3.cfg")
layer_names = net.getLayerNames()
output_layers = [layer_names[i[0] - 1] for i in net.getUnconnectedOutLayers()]

# 클래스 리스트
classes = []
with open("./Yolo/yolo.names", "r") as f:
    classes = [line.strip() for line in f.readlines()]
    
# 입력 사이즈 리스트 (Yolo 에서 사용되는 네크워크 입력 이미지 사이즈)
size_list = [320, 416, 608]
#카메라 열기 
cap = cv2.VideoCapture(0)

#카메라 Width Height 설정
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)

#인코딩용 전송 파라미터 설정
encode_param = [int(cv2.IMWRITE_JPEG_QUALITY), 90]

#소켓통신을 위한 준비
isSocket = True

#소켓 호출 에러시 처리하기 위한 부분
try:
    sio = socketio.Client()
    sio.connect('http://localhost:746')
except:
    isSocket = False

if isSocket == True:
    while True:
        time.sleep(0.2)
        #카메라로 부터 사진 한장 읽기 
        ret, frame = cap.read()

        frame = cv2.flip(frame, 1)

        frame, iCntPerson = GetPerson(frame=frame, size=size_list[0], score_threshold=0.4, nms_threshold=0.4)

        if iCntPerson > 0:
            scResult, scFrame = cv2.imencode('.jpg', frame, encode_param)
            scData = base64.b64encode(scFrame)

            #소켓으로 이미지 전송
            sio.emit('streaming', scData)

        cv2.imshow('Person Detection', frame)

        if cv2.waitKey(1) == 13:
            break

    cap.release()
    cv2.destroyAllWindows()
else:
    print("소켓접속 불량")