In [None]:
# main.py
import cv2  # OpenCV 라이브러리를 불러옵니다.

# 1. 영상 소스 연결 (수도관 연결)
# 웹캠인 경우 0, RTSP 주소인 경우 "rtsp://admin:1234@192.168.0.5..." 처럼 문자열로 입력
video_source = 0
cap = cv2.VideoCapture(video_source)

if not cap.isOpened():
    print("카메라를 열 수 없습니다. 연결을 확인해주세요!")
    exit()

print("영상 스트리밍 시작... (종료하려면 'q'를 누르세요)")

# 2. 무한 반복문을 통해 프레임 단위로 읽어오기
while True:
    # ret: 성공 여부(True/False), frame: 이미지 데이터
    ret, frame = cap.read()

    if not ret:
        print("더 이상 프레임을 가져올 수 없습니다.")
        break

    # (여기서 나중에 AI 분석 코드가 들어갈 예정입니다!)

    # 3. 화면에 보여주기 (Window 창 띄우기)
    cv2.imshow('CCTV Monitor', frame)

    # 'q' 키를 누르면 반복문 탈출 (종료)
    if cv2.waitKey(1) == ord('q'):
        break

# 4. 자원 해제 (수도관 잠그기)
cap.release()
cv2.destroyAllWindows()

In [4]:
# CUDA 12.2 버전 기준.
# cuDNN 8.9.7
# 환경변수 추가 되었는지 확인해야함
# 환경변수 PATH 하위에 두줄 있는지 확인.
# C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2\libnvvp
# C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2\bin


# pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# pip install onnxruntime-gpu inference-gpu supervision
# nvidia-smi



# 설치 확인용 코드
import torch

print("Torch version :", torch.__version__)
print("CUDA available:", torch.cuda.is_available())

if torch.cuda.is_available():
    print("CUDA device count:", torch.cuda.device_count())
    print("Current CUDA device:", torch.cuda.current_device())
    print("Device name:", torch.cuda.get_device_name(torch.cuda.current_device()))
else:
    print("CUDA is NOT available. Check driver, toolkit, or torch installation.")

# 밑에 사진처럼 나오면 설치 잘된거.

Torch version : 2.9.1+cpu
CUDA available: False
CUDA is NOT available. Check driver, toolkit, or torch installation.


In [None]:

# roboflow 에서 모델id, 프로젝트 API 가져와서 넣고
# 기업에서 받은 test_yolo.mp4 영상 테스트


import os
os.add_dll_directory(r"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2\bin")

import supervision as sv
from inference import get_roboflow_model
import numpy as np
import cv2
from tqdm import tqdm

try:
    import onnxruntime as ort
    print("ONNXRuntime providers:", ort.get_available_providers())
except Exception as e:
    print("ONNXRuntime import error:", e)

MODEL_ID = "[MODEL_ID]"
API_KEY = "[APIKEY]"
VIDEO_PATH = "test_yolo.mp4"
OUTPUT_VIDEO_PATH = "save/output_video.mp4"

cap = cv2.VideoCapture(VIDEO_PATH)
frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
cap.release()
print("총 프레임 수:", frame_count)

progress = tqdm(total=frame_count, desc="Processing")
model = get_roboflow_model(model_id=MODEL_ID, api_key=API_KEY)

box_annotator = sv.BoxAnnotator()
label_annotator = sv.LabelAnnotator()

def callback(frame: np.ndarray, frame_idx: int) -> np.ndarray:
    progress.update(1)
    results = model.infer(frame)[0]
    detections = sv.Detections.from_inference(results)
    annotated_image = box_annotator.annotate(scene=frame.copy(), detections=detections)
    annotated_image = label_annotator.annotate(scene = annotated_image, detections=detections)
    return annotated_image

sv.process_video(
    source_path=VIDEO_PATH,
    target_path=OUTPUT_VIDEO_PATH,
    callback=callback
)

progress.close()
print("처리 완료")

In [None]:
# 2중 카메라 + 메디파이프

import cv2
import threading
import time
import numpy as np

import mediapipe as mp
from mediapipe.framework.formats import landmark_pb2
from mediapipe.tasks import python
from mediapipe.tasks.python import vision

# =========================
# 1. 듀얼 카메라용 쓰레드 캡처 클래스
# =========================

class WebcamStream:
    def __init__(self, src=0, width=640, height=480, name="WebcamStream"):
        self.src = src
        self.width = width
        self.height = height
        self.name = name

        # 윈도우에서는 CAP_DSHOW 백엔드 권장
        self.cap = cv2.VideoCapture(self.src, cv2.CAP_DSHOW)
        self.cap.set(cv2.CAP_PROP_FRAME_WIDTH, self.width)
        self.cap.set(cv2.CAP_PROP_FRAME_HEIGHT, self.height)

        if not self.cap.isOpened():
            raise RuntimeError(f"카메라 {self.src} 를 열 수 없습니다.")

        self.grabbed, self.frame = self.cap.read()
        self.stopped = False

        self.lock = threading.Lock()

    def start(self):
        t = threading.Thread(target=self.update, name=self.name, daemon=True)
        t.start()
        return self

    def update(self):
        while not self.stopped:
            grabbed, frame = self.cap.read()
            if not grabbed:
                time.sleep(0.01)
                continue
            with self.lock:
                self.grabbed = grabbed
                self.frame = frame

    def read(self):
        with self.lock:
            if not self.grabbed or self.frame is None:
                return False, None
            return True, self.frame.copy()

    def stop(self):
        self.stopped = True
        time.sleep(0.05)
        self.cap.release()


# =========================
# 2. MediaPipe Hands (Tasks API) 설정
# =========================

BaseOptions = mp.tasks.BaseOptions
HandLandmarker = mp.tasks.vision.HandLandmarker
HandLandmarkerOptions = mp.tasks.vision.HandLandmarkerOptions
VisionRunningMode = mp.tasks.vision.RunningMode

mp_drawing = mp.solutions.drawing_utils
mp_drawing_styles = mp.solutions.drawing_styles
mp_hands = mp.solutions.hands


def draw_hand_landmarks_on_image(rgb_image, detection_result):
    """손 랜드마크를 RGB 이미지 위에 그려서 반환"""
    hand_landmarks_list = detection_result.hand_landmarks
    annotated_image = np.copy(rgb_image)

    if hand_landmarks_list:
        for hand_landmarks in hand_landmarks_list:
            hand_landmarks_proto = landmark_pb2.NormalizedLandmarkList()
            hand_landmarks_proto.landmark.extend(
                [
                    landmark_pb2.NormalizedLandmark(
                        x=lm.x,
                        y=lm.y,
                        z=lm.z
                    ) for lm in hand_landmarks
                ]
            )
            mp_drawing.draw_landmarks(
                annotated_image,
                hand_landmarks_proto,
                mp_hands.HAND_CONNECTIONS,
                mp_drawing_styles.get_default_hand_landmarks_style(),
                mp_drawing_styles.get_default_hand_connections_style(),
            )
    return annotated_image


# =========================
# 3. 메인 루프 (VIDEO 모드)
# =========================

def main():
    # ---- 3-1. 듀얼 카메라 쓰레드 시작 ----
    # 0: 정면, 1: 탑뷰 (인덱스는 환경에 맞게)
    front_stream = WebcamStream(src=0, width=640, height=480, name="FrontCam").start()
    top_stream   = WebcamStream(src=1, width=640, height=480, name="TopCam").start()

    # ---- 3-2. MediaPipe HandLandmarker 두 개 생성 (카메라별) ----
    model_path = "hand_landmarker.task"  # 같은 폴더

    front_options = HandLandmarkerOptions(
        base_options=BaseOptions(model_asset_path=model_path),
        running_mode=VisionRunningMode.VIDEO,   # VIDEO 모드 (동기)
        num_hands=2,
    )
    top_options = HandLandmarkerOptions(
        base_options=BaseOptions(model_asset_path=model_path),
        running_mode=VisionRunningMode.VIDEO,
        num_hands=2,
    )

    front_detector = HandLandmarker.create_from_options(front_options)
    top_detector   = HandLandmarker.create_from_options(top_options)

    print("듀얼 카메라 + MediaPipe Hands (VIDEO 모드) 시작... (종료: q)")

    ts_front = 0
    ts_top = 0
    dt_ms = 33  # 대략 30 FPS 기준 (원하시면 16/33/40 등으로 조정 가능)

    frame_idx = 0
    TOP_INTERVAL = -1  # 탑뷰프레임

    while True:
        ret_f, frame_f = front_stream.read()
        ret_t, frame_t = top_stream.read()

        if not ret_f and not ret_t:
            print("두 카메라 모두 프레임을 읽지 못했습니다. 종료합니다.")
            break

        if ret_f and frame_f is not None:
            frame_f = cv2.flip(frame_f, 1)
        if ret_t and frame_t is not None:
            frame_t = cv2.flip(frame_t, 1)

        show_front = None
        show_top = None

        # ---- 3-3. 정면 카메라: 매 프레임 손검출 ----
        if ret_f and frame_f is not None:
            ts_front += dt_ms

            rgb_f = cv2.cvtColor(frame_f, cv2.COLOR_BGR2RGB)
            mp_image_front = mp.Image(
                image_format=mp.ImageFormat.SRGB,
                data=rgb_f
            )

            front_result = front_detector.detect_for_video(mp_image_front, ts_front)
            annotated_front = draw_hand_landmarks_on_image(rgb_f, front_result)
            show_front = cv2.cvtColor(annotated_front, cv2.COLOR_RGB2BGR)

        # ---- 3-4. 탑뷰 카메라: TOP_INTERVAL마다 한 번씩만 손검출 ----
        if ret_t and frame_t is not None:
            if frame_idx % TOP_INTERVAL == 0:
                ts_top += dt_ms

                rgb_t = cv2.cvtColor(frame_t, cv2.COLOR_BGR2RGB)
                mp_image_top = mp.Image(
                    image_format=mp.ImageFormat.SRGB,
                    data=rgb_t
                )

                top_result = top_detector.detect_for_video(mp_image_top, ts_top)
                annotated_top = draw_hand_landmarks_on_image(rgb_t, top_result)
                show_top = cv2.cvtColor(annotated_top, cv2.COLOR_RGB2BGR)
            else:
                # 이번 프레임은 이전 프레임 그대로 사용 (혹은 원본)
                show_top = frame_t

        frame_idx += 1

        # ---- 3-5. 화면 붙여서 표시 ----
        frames_to_show = []
        if show_front is not None:
            frames_to_show.append(show_front)
        if show_top is not None:
            # 크기 맞추기
            if show_front is not None and show_top is not None:
                h1, w1 = show_front.shape[:2]
                h2, w2 = show_top.shape[:2]
                if (h1, w1) != (h2, w2):
                    show_top = cv2.resize(show_top, (w1, h1))
            frames_to_show.append(show_top)

        if len(frames_to_show) == 0:
            continue
        elif len(frames_to_show) == 1:
            combined = frames_to_show[0]
        else:
            combined = np.hstack(frames_to_show)

        cv2.imshow("Dual View (Left: Front, Right: Top)", combined)

        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

    # ---- 3-6. 정리 ----
    front_stream.stop()
    top_stream.stop()
    cv2.destroyAllWindows()


if __name__ == "__main__":
    main()

In [3]:
import cv2
import time
import os

cap = cv2.VideoCapture(0)
if not cap.isOpened():
    raise IOError("Connetcion error")

save_interval_sec = 1  # n초마다 저장
last_save_time = 0

if not os.path.exists('records'):
    os.makedirs('records')


while True:
    ret, frame = cap.read()
    if not ret:
        break

    cv2.imshow("Camera", frame)

    current_time = time.time()
    if current_time - last_save_time > save_interval_sec:
        filename = f"records/auto_frame_{int(current_time)}.jpg"
        cv2.imwrite(filename, frame)
        print(f"자동 저장 완료 → {filename}")
        last_save_time = current_time

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

자동 저장 완료 → records/auto_frame_1764301841.jpg
자동 저장 완료 → records/auto_frame_1764301842.jpg
자동 저장 완료 → records/auto_frame_1764301843.jpg
자동 저장 완료 → records/auto_frame_1764301844.jpg
자동 저장 완료 → records/auto_frame_1764301845.jpg
자동 저장 완료 → records/auto_frame_1764301846.jpg
자동 저장 완료 → records/auto_frame_1764301847.jpg
자동 저장 완료 → records/auto_frame_1764301848.jpg
자동 저장 완료 → records/auto_frame_1764301849.jpg
자동 저장 완료 → records/auto_frame_1764301850.jpg
자동 저장 완료 → records/auto_frame_1764301851.jpg
자동 저장 완료 → records/auto_frame_1764301852.jpg
자동 저장 완료 → records/auto_frame_1764301853.jpg
자동 저장 완료 → records/auto_frame_1764301854.jpg
자동 저장 완료 → records/auto_frame_1764301855.jpg


In [4]:
import cv2
import mediapipe as mp
import time
import os

# 저장 주기
save_interval_sec = 5
last_save_time = 0

# 저장 폴더 구성
image_dir = 'fingercapture/image'
label_dir = 'fingercapture/label'
result_dir = 'fingercapture/labeledimage'
os.makedirs(image_dir, exist_ok=True)
os.makedirs(label_dir, exist_ok=True)
os.makedirs(result_dir, exist_ok=True)

# Mediapipe
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=False, max_num_hands=2, min_detection_confidence=0.5)
mp_drawing = mp.solutions.drawing_utils

# 카메라 연결
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    raise IOError("카메라를 열 수 없습니다. 연결 상태 확인하세요.")

print("s 키 누르면 수동 저장 가능, q로 종료")

while True:
    ret, orig_frame = cap.read()
    if not ret:
        break

    frame_rgb = cv2.cvtColor(orig_frame, cv2.COLOR_BGR2RGB)
    results = hands.process(frame_rgb)
    h, w, _ = orig_frame.shape

    vis_frame = orig_frame.copy()

    if results.multi_hand_landmarks:
        for hand_landmarks in results.multi_hand_landmarks:
            # 4번 엄지, 나머지 손가락
            for idx in [4,8,12,16,20]:
                lm = hand_landmarks.landmark[idx]
                cx, cy = int(lm.x * w), int(lm.y * h)



                ################################################
                # bbox margin 설정
                # 카메라 높이에 따라서 손가락 사이즈 달라짐,
                # 손가락 (손톱 포함?) 끝 마디가 반이상 들어오도록 조정
                ################################################

                bbox_size = 40  # 박스 사이즈 px 단위
                x1 = max(cx - bbox_size // 2, 0)
                y1 = max(cy - bbox_size // 2, 0)
                x2 = min(cx + bbox_size // 2, w)
                y2 = min(cy + bbox_size // 2, h)

                # 시각화
                if idx in [8,12,16,20]:
                    cv2.rectangle(vis_frame, (x1, y1), (x2, y2), (255, 255, 0), 1)
                    cv2.putText(vis_frame, "tip", (cx, cy - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.4, (255, 255, 0), 1)
                else:
                    cv2.rectangle(vis_frame, (x1, y1), (x2, y2), (0, 255, 255), 1)
                    cv2.putText(vis_frame, "thumb", (cx, cy - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.4, (0, 255, 255  ), 1)


    # 화면으로 보이는 것
    cv2.imshow("Camera", vis_frame)

    current_time = time.time()
    key = cv2.waitKey(1) & 0xFF

    # 자동 저장 & 수동 저장
    # s 로 현재 저장
    if current_time - last_save_time > save_interval_sec or key == ord('s'):

        #################################
        # 저장되는 파일 이름, 취향껏 수정
        #################################
        filename = f"khs_{int(current_time)}.jpg"
        img_path = os.path.join(image_dir, filename)
        label_path = os.path.join(label_dir, filename.replace(".jpg", ".txt"))
        result_path = os.path.join(result_dir, filename)

        # YOLO 포맷 라벨 생성
        with open(label_path, "w") as f:
            if results.multi_hand_landmarks:
                for hand_landmarks in results.multi_hand_landmarks:
                    for idx in [4, 8, 12, 16, 20]:
                        lm = hand_landmarks.landmark[idx]
                        cx, cy = lm.x, lm.y  # 이미 정규화 되어 있음 (0~1)

                        # 정규화 박스 크기 (40px 상대 비율)
                        bbox_w = bbox_size / w
                        bbox_h = bbox_size / h

                        # YOLO format: class cx cy w h
                        # 라벨링 저장
                        if idx in [8, 12, 16, 20]:
                            f.write(f"0 {cx:.6f} {cy:.6f} {bbox_w:.6f} {bbox_h:.6f}\n") # 나머지 손가락 0번
                        else:
                            f.write(f"1 {cx:.6f} {cy:.6f} {bbox_w:.6f} {bbox_h:.6f}\n") # 엄지 1번

        # 이미지 저장
        cv2.imwrite(result_path, vis_frame)
        cv2.imwrite(img_path, orig_frame)
        print(f"[+] 저장 완료 → {img_path}")
        print(f"    라벨   → {label_path}")
        last_save_time = current_time

    # 종료는 q 키
    if key == ord('q'):
        print("종료합니다.")
        break

cap.release()
cv2.destroyAllWindows()



s 키 누르면 수동 저장 가능, q로 종료
[+] 저장 완료 → fingercapture/image\khs_1764301877.jpg
    라벨   → fingercapture/label\khs_1764301877.txt
[+] 저장 완료 → fingercapture/image\khs_1764301882.jpg
    라벨   → fingercapture/label\khs_1764301882.txt
[+] 저장 완료 → fingercapture/image\khs_1764301887.jpg
    라벨   → fingercapture/label\khs_1764301887.txt
[+] 저장 완료 → fingercapture/image\khs_1764301892.jpg
    라벨   → fingercapture/label\khs_1764301892.txt
[+] 저장 완료 → fingercapture/image\khs_1764301897.jpg
    라벨   → fingercapture/label\khs_1764301897.txt
[+] 저장 완료 → fingercapture/image\khs_1764301902.jpg
    라벨   → fingercapture/label\khs_1764301902.txt
[+] 저장 완료 → fingercapture/image\khs_1764301907.jpg
    라벨   → fingercapture/label\khs_1764301907.txt
[+] 저장 완료 → fingercapture/image\khs_1764301912.jpg
    라벨   → fingercapture/label\khs_1764301912.txt
[+] 저장 완료 → fingercapture/image\khs_1764301917.jpg
    라벨   → fingercapture/label\khs_1764301917.txt
[+] 저장 완료 → fingercapture/image\khs_1764301922.jpg
    라벨   → finge