## YOLO

In [1]:
from ultralytics import YOLO
import cv2
import numpy as np

## 사진에 YOLO 적용

In [9]:
# YOLO 모델 불러오기
model = YOLO("yolo11n.pt")

img = cv2.imread("images/person_dog.jpg")

# 객체 인식
results = model.predict(img, conf=0.5)

annotated_frame = results[0].plot()

cv2.imshow("img",annotated_frame)
cv2.waitKey(0)
cv2.destroyAllWindows()


0: 448x640 2 persons, 1 dog, 116.0ms
Speed: 4.0ms preprocess, 116.0ms inference, 1.0ms postprocess per image at shape (1, 3, 448, 640)


## 실시간 영상 YOLO 불러오기

In [12]:
import cv2
from ultralytics import YOLO  # YOLO 라이브러리

# YOLO 모델 로드
model = YOLO("yolo11n.pt")  # YOLO 모델 경로

# 카메라 초기화 (기본 웹캠 사용)
cap = cv2.VideoCapture(0)

# 카메라가 열리지 않을 경우 에러 처리
if not cap.isOpened():
    print("Error: Could not open camera.")
    exit()

# 실시간 스트리밍
while True:
    # 프레임 읽기
    ret, frame = cap.read()
    if not ret:
        print("Error: Could not read frame.")
        break

    # YOLO 모델을 이용한 객체 감지
    results = model.predict(frame, conf=0.4)

    # 결과를 프레임에 표시
    annotated_frame = results[0].plot()

    # 결과 표시
    cv2.imshow("Real-time Object Detection", annotated_frame)

    # 'q' 키를 누르거나 창 닫기 버튼을 누르면 종료
    if cv2.waitKey(1) == ord('q') or cv2.getWindowProperty("Real-time Object Detection", cv2.WND_PROP_VISIBLE) < 1:
        break

# 자원 해제 및 창 닫기
cap.release()
cv2.destroyAllWindows()




0: 480x640 1 person, 127.0ms
Speed: 13.0ms preprocess, 127.0ms inference, 13.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 74.0ms
Speed: 5.0ms preprocess, 74.0ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 59.0ms
Speed: 1.0ms preprocess, 59.0ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 62.0ms
Speed: 1.0ms preprocess, 62.0ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 57.0ms
Speed: 1.0ms preprocess, 57.0ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 114.0ms
Speed: 1.0ms preprocess, 114.0ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 52.0ms
Speed: 2.0ms preprocess, 52.0ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 1 person, 51.0ms
Speed: 1.0ms preprocess, 51.0ms inference, 1.0ms postprocess per image at shape (1,

## 영상에 YOLO 적용

In [13]:
import cv2
from ultralytics import YOLO

# YOLO 모델 로드
model = YOLO("yolo11n.pt")  # YOLO 모델 파일 경로

# 동영상 파일 열기
cap = cv2.VideoCapture("images/cars.mp4")

# 동영상 저장 설정 (감지 결과를 새 동영상으로 저장하려는 경우)
fourcc = cv2.VideoWriter_fourcc(*"mp4v")
output_fps = int(cap.get(cv2.CAP_PROP_FPS))  # 원본 영상의 FPS
frame_width = 640  # 리사이즈할 프레임 폭
frame_height = 360  # 리사이즈할 프레임 높이
out = cv2.VideoWriter("output.mp4", fourcc, output_fps, (frame_width, frame_height))

# 동영상이 열리지 않으면 에러 처리
if not cap.isOpened():
    print("Error: Could not open video.")
    exit()

while True:
    # 프레임 읽기
    ret, frame = cap.read()
    if not ret:
        break  # 더 이상 읽을 프레임이 없으면 종료

    # 프레임 크기 리사이즈 (640x360)
    resized_frame = cv2.resize(frame, (frame_width, frame_height))

    # YOLO 모델로 객체 감지
    results = model.predict(resized_frame, conf=0.5)

    # 감지 결과를 프레임에 표시
    annotated_frame = results[0].plot()

    # 결과 프레임을 동영상으로 저장
    out.write(annotated_frame)

    # 감지 결과를 실시간으로 화면에 표시
    cv2.imshow("Object Detection", annotated_frame)

    # 'q' 키를 누르면 종료
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 자원 해제 및 창 닫기
cap.release()
out.release()
cv2.destroyAllWindows()



0: 384x640 8 cars, 1 truck, 95.0ms
Speed: 2.0ms preprocess, 95.0ms inference, 2.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 8 cars, 1 truck, 52.0ms
Speed: 2.0ms preprocess, 52.0ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 8 cars, 1 truck, 47.0ms
Speed: 2.0ms preprocess, 47.0ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 9 cars, 1 truck, 43.0ms
Speed: 1.0ms preprocess, 43.0ms inference, 2.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 8 cars, 51.0ms
Speed: 2.0ms preprocess, 51.0ms inference, 2.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 7 cars, 1 truck, 49.0ms
Speed: 1.0ms preprocess, 49.0ms inference, 0.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 7 cars, 1 truck, 46.0ms
Speed: 2.0ms preprocess, 46.0ms inference, 0.0ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 7 cars, 1 truck, 43.0ms
Speed: 2.0ms preprocess, 43.0ms inference,

In [10]:
from pytesseract import pytesseract as pyt

ModuleNotFoundError: No module named 'pytesseract'