In [4]:
import cv2
from ultralytics import YOLO

# YOLO 모델 로드
model = YOLO('/home/kjj73/dev_ws/Project/final_project/best.pt')  # YOLO 가중치 파일 경로

# 카메라 초기화
cap = cv2.VideoCapture(0)
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)

# 탁구공 실제 지름 (단위: mm)
REAL_DIAMETER = 40

# 초점 거리 (실험적으로 계산된 값)
FOCAL_LENGTH = 687.5  # 초기값

while True:
    ret, frame = cap.read()
    if not ret:
        print("프레임을 가져올 수 없습니다.")
        break

    # YOLO 모델로 객체 감지
    results = model(frame)

    # 프레임에 감지 결과 시각화
    annotated_frame = results[0].plot()

    for result in results[0].boxes:  # 감지된 객체 반복
        box = result.xyxy[0]  # 경계 상자 좌표
        x1, y1, x2, y2 = map(int, box[:4])

        # 중심 좌표 계산
        x_center = int((x1 + x2) / 2)
        y_center = int((y1 + y2) / 2)

        # 픽셀 너비 계산
        pixel_width = x2 - x1

        # 거리 계산
        if pixel_width > 0:
            distance = (FOCAL_LENGTH * REAL_DIAMETER) / pixel_width
        else:
            distance = -1  # 유효하지 않은 경우

        # 좌표, 픽셀 너비 및 거리 출력
        label1 = f"Coord: ({x_center}, {y_center})"
        label2 = f"Width: {pixel_width}px"
        label3 = f"Dist: {distance:.2f}mm"
        cv2.circle(annotated_frame, (x_center, y_center), 5, (0, 0, 255), -1)  # 중심점 표시

        cv2.putText(annotated_frame, label3, (x1+5, y1 + 35), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 2)
        cv2.putText(annotated_frame, label1, (x1+5, y1 + 15), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 2)
        cv2.putText(annotated_frame, label2, (x1+5, y1 + 55), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 2)
        
        cv2.rectangle(annotated_frame, (x1, y1), (x2, y2), (0, 255, 0), 2)  # 경계 상자 표시

    # 결과 표시
    cv2.imshow("Ping Pong Ball Detection", annotated_frame)

    # 'q' 키를 누르면 종료
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 자원 해제
cap.release()
cv2.destroyAllWindows()



0: 480x640 (no detections), 3.7ms
Speed: 1.4ms preprocess, 3.7ms inference, 0.3ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 5.2ms
Speed: 2.4ms preprocess, 5.2ms inference, 0.6ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 6.0ms
Speed: 2.0ms preprocess, 6.0ms inference, 0.7ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 4.6ms
Speed: 4.3ms preprocess, 4.6ms inference, 0.4ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 5.2ms
Speed: 1.5ms preprocess, 5.2ms inference, 0.6ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 3.6ms
Speed: 1.3ms preprocess, 3.6ms inference, 0.3ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 4.1ms
Speed: 1.4ms preprocess, 4.1ms inference, 0.4ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 3.9ms
Speed: 1.3ms preprocess, 3.9ms inference, 0.4ms 