In [1]:
import cv2
import numpy as np
min_confidence = 0.5

In [2]:
# 모델 로딩
net = cv2.dnn.readNet("yolo/yolov3.weights", "yolo/yolov3.cfg")

In [3]:
# 화면에 표시될 사물의 이름들을 기록한 파일을 열어서 로딩저장해둡니다
with open("yolo/coco.names", "r") as f:
    classes = [line.strip() for line in f.readlines()]
    print(classes)

['person', 'bicycle', 'car', 'motorbike', 'aeroplane', 'bus', 'train', 'truck', 'boat', 'traffic light', 'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard', 'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple', 'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'sofa', 'pottedplant', 'bed', 'diningtable', 'toilet', 'tvmonitor', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone', 'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear', 'hair drier', 'toothbrush']


In [4]:
#  랜덤 색 설정
colors = np.random.uniform(0, 255, size=(len(classes), 3))
# print(colors)

In [5]:
# net 변수에 로딩된 모델에서 출력양식(인식된 사물의 추가 정보) 설정 내용을 추출합니다
layer_names = net.getLayerNames()
output_layers = [layer_names[i[0] - 1] for i in net.getUnconnectedOutLayers()]

In [6]:
# 이미지 로딩 & 크기 추출
img = cv2.imread("image/soccer_01.jpg")
height, width, channels = img.shape

AttributeError: 'NoneType' object has no attribute 'shape'

In [None]:
#  이미지 형식 변환
blob = cv2.dnn.blobFromImage(img, 0.00392, (416, 416), (0, 0, 0), True, crop=False)
# 모델에 이미지 세트
net.setInput(blob)
#  이미지 내부에 있는 사물 인식 실행
outs = net.forward(output_layers)
#  표시할 사물의 사각형 및 확율 등을 저장할 리스트 생성
class_ids = []
confidences = []
boxes = []

In [None]:
print(outs[0].shape)

In [None]:
# 인식된 사물의 갯수 만큼 반복 실행
for out in outs:
    # 인식된 사물의 판별 장보 별로 반복실행
    for detection in out:
        # 인식 가능한 사물일 가능성이 담긴 확율들을 먼저 추출
        scores = detection[5:]
        # 확율들을 정렬하고 가장 높은 확율의 인덱스 추출
        class_id = np.argmax(scores)
        # 해당 인덱스의 확율 추출
        confidence = scores[class_id]
        # 추출한 확율이 50%(0.5 이상인 경우)
        if confidence > min_confidence:
            # 해당 사물의 중점 좌표 계산
            center_x = int(detection[0] * width)
            center_y = int(detection[1] * height)
            # 가로세로길이 및 시작 좌표 계산
            w = int(detection[2] * width)
            h = int(detection[3] * height)
            x = int(center_x - w / 2)
            y = int(center_y - h / 2)
            # 계산된 좌표 정보 및 확율 그리고 사물 이름(class_id)정보를 각리스트에
            # 저장합니다
            boxes.append([x, y, w, h])
            confidences.append(float(confidence))
            class_ids.append(class_id)

In [None]:
#class_ids

In [None]:
# 작성할 텍스트의 포트 설정
font = cv2.FONT_HERSHEY_PLAIN

# 인식된 사물에 대한 노이즈 제거작업(중복 박스 제거)
indexes = cv2.dnn.NMSBoxes(boxes, confidences, min_confidence, 0.4)
# boxes : 사각형 정보들
# confidences : 모든 박스들의 확율값들
# min_confidence : 1 차 임계 값
# 0.4 : 동일 박스들에서 실제 사물에 해당되는 것을 제외한 나머지를 제거할 2차 임계값
# (표시할   box 의 내용이 담긴 인덱스만 추출)

for i in range(len(boxes)):
    if i in indexes:
        x, y, w, h = boxes[i]
        label = str(classes[class_ids[i]])
        print(i, label)
        color = colors[i]
        cv2.rectangle(img, (x, y), (x + w, y + h), color, 2)
        cv2.putText(img, label, (x, y + 30), font, 2, (0, 255, 0), 1)
cv2.imshow("YOLO Image", img)
cv2.waitKey(0)
cv2.destroyAllWindows()