In [1]:
import cv2
import numpy as np
import sys
import os

## googlenet 영상 인식

In [None]:
model_name = './googlenet-12.onnx'
config_name = ''

file_name = './fig/airplane1.jpg'
img = cv2.imread(file_name)

net = cv2.dnn.readNet(model_name, config_name)
if net.empty():  # False가 나오면 모델 읽기 성공, True가 나오면 모델 읽기 실패
    print('model read failed')
    sys.exit()
    
classNames = []
with open('./classification_classes_ILSVRC2012.txt', 'r') as f:
    # file 전체가 하나로 묶여서 출력되어 있어서 빈칸으로 split 해줘야 함
    classNames = f.read().rstrip('\n').rsplit('\n')  # 맨 끝줄이 빈칸이므로 rstrip('\n')으로 없애주고 split 실행
# print(classNames)

# blobFromImage(image, scalefactor(입력 영상 픽셀 값에 곱할 값 - 선택적으로 특정 요소만큼 크기를 줄이거나 늘릴 수 있음), 
# size(신경망이 예상하는 이미지 크기), mean(각 채널에서 빼야하는 R,G,B 값), swapRB(R과 B 채널을 서로 바꿀 것인지를 결정하는 플래그. 기본값은 False), crop[, ddepth]]]]]])
blob = cv2.dnn.blobFromImage(img, 1, (224, 224), (104, 117, 123), swapRB = False)

net.setInput(blob)
prob = net.forward()
print(prob.shape)

out = prob.flatten()
classid = np.argmax(out) # 가장 큰 값의 인덱스 반환
confidence = out[classid]

text = f'{classNames[classid]} : ({confidence * 100:.2f}%)'
cv2.putText(img, text, (10,30), cv2.FONT_HERSHEY_COMPLEX, 1, (255, 255, 0), 2, cv2.LINE_AA)

cv2.imshow('image', img)
cv2.waitKey()
cv2.destroyAllWindows()

## 응용 - 크기 변환 및 여러 이미지 불러오기

In [7]:
model_name = './googlenet-12.onnx'
config_name = ''

dst = cv2.imread('./fig/airplane1.jpg')
h, w = dst.shape[:2]

img_lists = os.listdir('./fig/')
img_files = []

for i in img_lists :
    img_file = './fig/' + i
    img_files.append(img_file)
    
cv2.namedWindow('image', cv2.WINDOW_NORMAL)
cv2.setWindowProperty('image', cv2.WND_PROP_FULLSCREEN, cv2.WINDOW_FULLSCREEN)

idx = 0
while True :
    img = cv2.imread(img_files[idx])
    img2 = img.copy()
    img2 = cv2.resize(img2, (w, h), interpolation = cv2.INTER_LINEAR)
    
    if img2 is None :
        print('image read failed')
        break

    net = cv2.dnn.readNet(model_name, config_name)
    if net.empty():  # False가 나오면 모델 읽기 성공, True가 나오면 모델 읽기 실패
        print('model read failed')
        sys.exit()

    classNames = []
    with open('./classification_classes_ILSVRC2012.txt', 'r') as f:
        classNames = f.read().rstrip('\n').rsplit('\n')  

    blob = cv2.dnn.blobFromImage(img2, 1, (224, 224), (104, 117, 123), swapRB = False)

    net.setInput(blob)
    prob = net.forward()

    out = prob.flatten()
    classid = np.argmax(out)
    confidence = out[classid]

    text = f'{classNames[classid]} : ({confidence * 100:.2f}%)'
    cv2.putText(img2, text, (10,30), cv2.FONT_HERSHEY_COMPLEX, 1, (255, 255, 0), 2, cv2.LINE_AA)

    cv2.imshow('image', img2)
    
    if cv2.waitKey(1000) == 27 :
        break
        
    idx += 1
    
    if idx >= len(img_files) :
        idx = 0

cv2.destroyAllWindows()