In [None]:
from ultralytics import YOLO

# YOLOv8 모델 초기화
model = YOLO('yolov8n.pt')  # Nano 모델 사용

# 데이터셋 설정 파일 경로
data_path = r'C:\Users\kj100\OneDrive\바탕 화면\greetings\data.yaml'  # data.yaml 파일 경로 (YOLO 형식)

# 모델 학습
model.train(
    data=data_path,    # 데이터셋 경로
    epochs=10,         # 학습 반복 횟수
    imgsz=640,         # 입력 이미지 크기
    batch=16,          # 배치 크기
    name='greeting'  # 저장 디렉토리 이름
)

# 학습된 모델 저장
model.save('greeting.pt')
print("YOLOv8 모델 학습 완료")


In [2]:
from ultralytics import YOLO
# YOLOv8 모델 로드
model = YOLO('greeting_new.pt')  # 학습된 YOLOv8 모델 경로

# 라벨 확인
labels = model.names  # 모델에 저장된 클래스 이름들
print("모델 라벨:", labels)


모델 라벨: {0: 'Hello', 1: 'Home', 2: 'IloveYou', 3: 'No', 4: 'Please', 5: 'Thanks', 6: 'Yes', 7: 'all is well', 8: 'break', 9: 'help', 10: 'here', 11: 'how are you', 12: 'peace', 13: 'smile', 14: 'time'}


In [None]:
# 학습된 모델 로드
model = YOLO('greeting2.pt')  # 학습된 YOLOv8 모델 경로

# 테스트 데이터 예측
results = model.predict(
    source=r'C:\Users\kj100\OneDrive\바탕 화면\greetings\test\images',  # 테스트 이미지 경로
    conf=0.25,  # 신뢰도 임계값
    save=True   # 탐지 결과 저장
)

# 탐지 결과 저장 경로 출력
print("탐지 결과가 저장되었습니다:", results)


In [3]:
import os
import cv2
from ultralytics import YOLO

# YOLOv8 모델 로드
model = YOLO('greeting_new.pt')  # 학습된 YOLOv8 모델 경로

# 테스트할 이미지 폴더 경로
image_folder = r'C:\Users\kj100\OneDrive\바탕 화면\greeting2\valid\images'

# 폴더 내 모든 이미지 파일 처리
for filename in os.listdir(image_folder):
    # 이미지 파일 경로 생성
    image_path = os.path.join(image_folder, filename)

    # 파일이 이미지인지 확인
    if filename.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp', '.tif', '.tiff')):
        print(f"현재 처리 중: {filename}")

        # YOLOv8 예측
        results = model.predict(source=image_path, conf=0.1, show=False, verbose=False)

        # 탐지 결과 분석 및 출력
        if results[0].boxes:  # 탐지된 객체가 있을 경우
            print(f"탐지 결과 ({filename}):")
            for detection in results[0].boxes:
                # 탐지된 객체 정보
                class_id = int(detection.cls[0].item())  # 클래스 ID
                conf = detection.conf[0].item()  # 신뢰도
                coords = detection.xyxy[0].tolist()  # 바운딩 박스 좌표
                label = model.names[class_id]  # 라벨 이름

                # 탐지 결과 출력
                print(f" - 라벨: {label}, 신뢰도: {conf:.2f}, 바운딩 박스 좌표: {coords}")
        else:
            print(f"탐지된 객체 없음 ({filename})")


현재 처리 중: all-is-well-003d0018-102a-11ee-843f-d4cc4ef98a10_jpg.rf.3b89cd7e70a6e826a9b5fab9c5c38e43.jpg
탐지 결과 (all-is-well-003d0018-102a-11ee-843f-d4cc4ef98a10_jpg.rf.3b89cd7e70a6e826a9b5fab9c5c38e43.jpg):
 - 라벨: all is well, 신뢰도: 0.99, 바운딩 박스 좌표: [167.224365234375, 101.392822265625, 453.30279541015625, 424.2760009765625]
현재 처리 중: all-is-well-064b92cd-102a-11ee-a02b-d4cc4ef98a10_jpg.rf.760e07e2f40bd3a6613133473e01a0e3.jpg
탐지 결과 (all-is-well-064b92cd-102a-11ee-a02b-d4cc4ef98a10_jpg.rf.760e07e2f40bd3a6613133473e01a0e3.jpg):
 - 라벨: all is well, 신뢰도: 0.98, 바운딩 박스 좌표: [162.047607421875, 86.68893432617188, 463.841552734375, 416.5122375488281]
현재 처리 중: all-is-well-0d8fe633-102a-11ee-9bf9-d4cc4ef98a10_jpg.rf.e167df11595d23fc6c8c13702139b2d1.jpg
탐지 결과 (all-is-well-0d8fe633-102a-11ee-9bf9-d4cc4ef98a10_jpg.rf.e167df11595d23fc6c8c13702139b2d1.jpg):
 - 라벨: all is well, 신뢰도: 0.99, 바운딩 박스 좌표: [143.081298828125, 96.32781982421875, 454.7847900390625, 414.34210205078125]
현재 처리 중: all-is-well-1266d734-102a

In [None]:
import cv2
from ultralytics import YOLO
import mediapipe as mp

# YOLOv8 모델 로드
model = YOLO('greeting_new.pt')  # 학습된 YOLOv8 모델 경로

# MediaPipe Hands 초기화
mp_hands = mp.solutions.hands
mp_drawing = mp.solutions.drawing_utils
hands = mp_hands.Hands(
    max_num_hands=2,
    min_detection_confidence=0.5,
    min_tracking_confidence=0.5
)

# 카메라 열기
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    print("카메라를 열 수 없습니다.")
    exit()

print("카메라가 실행되었습니다. 'q'를 눌러 종료하세요.")

while True:
    ret, frame = cap.read()
    if not ret:
        print("프레임을 가져올 수 없습니다.")
        break

    # 화면 좌우 반전 (거울 효과)
    frame = cv2.flip(frame, 1)

    # YOLOv8 예측 (verbose=False로 로그 비활성화)
    results = model.predict(source=frame, conf=0.1, show=False, verbose=False)
    detections = results[0].boxes if results[0].boxes else []  # 탐지 결과

    # MediaPipe 손 랜드마크 감지
    rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    hand_results = hands.process(rgb_frame)

    # MediaPipe 랜드마크 표시
    if hand_results.multi_hand_landmarks:
        for hand_landmarks in hand_results.multi_hand_landmarks:
            mp_drawing.draw_landmarks(
                frame,
                hand_landmarks,
                mp_hands.HAND_CONNECTIONS,
                mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=4),
                mp_drawing.DrawingSpec(color=(255, 0, 0), thickness=2)
            )

    # YOLO 탐지 결과 표시 및 수화 동작 출력
    detected_gesture = None  # 탐지된 수화 초기화
    for detection in detections:
        coords = detection.xyxy[0].tolist()  # 바운딩 박스 좌표
        x1, y1, x2, y2 = map(int, coords[:4])
        conf = detection.conf[0].item()  # 신뢰도
        class_id = int(detection.cls[0].item())  # 클래스 ID

        # 신뢰도 기준 추가
        if conf >= 0.4:  # 신뢰도 기준을 적절히 설정
            detected_gesture = model.names[class_id]
            label = f"{detected_gesture} ({conf:.2f})"

            # 바운딩 박스 및 라벨 표시
            cv2.rectangle(frame, (x1, y1), (x2, y2), (255, 0, 0), 2)  # 초록색 바운딩 박스
            cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 0, 0), 2)  # 초록색 텍스트

    # 탐지된 동작 출력2
    if detected_gesture:
        print(f"탐지된 동작: {detected_gesture}")


    # 화면 출력
    cv2.imshow("YOLOv8 + MediaPipe", frame)

    # 'q' 키를 누르면 종료
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 자원 해제
cap.release()
cv2.destroyAllWindows()
hands.close()
