# 11. YOLO
- You Only Look Detection
- 딥러닝을 활용한 객체 탐지 알고리즘 중 하나
- 이미지나 동영상에서 여러 객체를 빠르고 정확하게 탐지하는데 사용
- YOLO는 이미지를 한 번만 처리하여 객체를 탐지

## 특징
- 실시간 처리
- 단일 신경망 구조 : 이미지 전체를 한 번에 처리하여 객체를 탐지하는 단일 신경망 구조를 사용함
- 높은 정확도 : YOLO는 빠른 속도뿐만 아니라 높은 정확도로 객체를 탐지할 수 있음

In [None]:
from ultralytics import YOLO
import cv2 as cv
import numpy as np
WOMEN = "../images/women.jpg"

## model = YOLO('yolo11n.pt')의미
- 사전 학습된 YOLO 모델 파일
- `yolo11` : YOLO v11 버전
- `n` : nano 버전(가장 작은 모델, 속도 빠름, 정확도 낮음)
- `.pt` : PyTorch 형식의 모델 가중치 파일

In [None]:
# YOLO 모델 불러오기
# conf : 신뢰도
model = YOLO('yolo11n.pt')
img = cv.imread("../images/person_dog.jpg")

# 객체 인식, 신뢰도 0.5
results = model.predict(source=img, conf=0.5)

# print(results)

# 탐지 결과를 이미지 위에 그려줌
annotated_frame = results[0].plot()
# print(annotated_frame) # 사람과 강아지를 인식한 결과를 볼 수 있음

cv.imshow("img", annotated_frame)
cv.waitKey(0)
cv.destroyAllWindows()

# YOLO.predict()는 입력 이미지가 여러장 일 수 있기 때문에 항상 여러 개의 결과를담은 리스트를 돌려줌
# 따라서 result[0]는 첫 번째 이미지의 탐지 결과를 의미

In [None]:
# 다른 사진 연습
# YOLO 모델 불러오기
model = YOLO('yolo11n.pt')
img = cv.imread("../images/friends.jpg")
resized = cv.resize(img, None, fx=0.3, fy=0.3, interpolation= cv.INTER_NEAREST)

# 객체 인식, 신뢰도 0.5
results = model.predict(source=resized, conf=0.5)

# print(results)

# 탐지 결과를 이미지 위에 그려줌
annotated_frame = results[0].plot()
# print(annotated_frame) # 사람과 강아지를 인식한 결과를 볼 수 있음

cv.imshow("img", annotated_frame)
cv.waitKey(0)
cv.destroyAllWindows()

In [None]:
# 영상 인식
# 영상은 기본적으로 사진의 연속임으로 각 프레임마다 별도로 추론을 수행함
# 따라서 영상일때는 1frame당 실시간보다 느려 보이게 됨
cap = cv.VideoCapture("../videos/cars.mp4")
model = YOLO("yolo11n.pt")
fps = cap.get(cv.CAP_PROP_FPS)

while cap.isOpened():
    ret, frame = cap.read()

    if not ret:
        break

    result = model.predict(frame, conf=0.5)
    annotated_frame = result[0].plot()
    cv.imshow("cars", annotated_frame)

    if cv.waitKey(int(1000/fps)) == ord("q"):
        break

cap.release()
cv.destroyAllWindows()

In [None]:
# 실습3. 캠화면에 적용
# YOLO 모델의 객체 감지를 캠화면에 적용하여 출력
model = YOLO("yolo11n.pt")
cap = cv.VideoCapture(0)

while True:
    ret, frame = cap.read()
    if not ret:
        break

    results = model.predict(source=frame, conf=0.5)

    annotated_frame = results[0].plot()

    cv.imshow("Practice YOLO", annotated_frame)

    if cv.waitKey(1) == ord("q"):
        break

cap.release()
cv.destroyAllWindows()
