## 알파벳 오답노트

In [None]:
import cv2
import mediapipe as mp
from ultralytics import YOLO
import time

# YOLOv8 모델 로드
# 사전에 학습시킨 모델에 ASL 데이터 추가
model = YOLO('asl_yolov8_model.pt') 

# MediaPipe Hands 초기화
mp_hands = mp.solutions.hands
mp_drawing = mp.solutions.drawing_utils
hands = mp_hands.Hands(
    max_num_hands=1,  # 인식할 수 있는 손은 1개로 초기화
    min_detection_confidence=0.5,
    min_tracking_confidence=0.5
)

# 유저로부터 원하는 알파벳 입력받기
target_alphabet = input("원하는 알파벳을 입력하세요: ").upper()  # 대문자 처리
print(f"원하는 알파벳: {target_alphabet}")

# 카메라 열기
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    print("카메라를 열 수 없습니다.")
    exit()

print("카메라가 실행되었습니다. 'q'를 눌러 종료하세요.")

# 탐지 상태 추적 변수
no_detection_message_shown = False
last_wrong_time = 0  # 틀렸을 때의 타임스탬프
wrong_display_duration = 2  # 틀렸을 때 빨간색 상자를 표시할 시간(초)

while True:
    ret, frame = cap.read()
    if not ret:
        print("프레임을 가져올 수 없습니다.")
        break

    # 화면 좌우 반전 (거울 효과)
    frame = cv2.flip(frame, 1)

    # YOLOv8 예측
    results = model.predict(source=frame, conf=0.5, show=False, verbose=False)  # YOLOv8 예측 (로그 숨김)
    detections = results[0].boxes if results[0].boxes else []  # YOLOv8 탐지 결과

    if not detections:  # 탐지된 물체가 없을 경우
        if not no_detection_message_shown:  # 메시지가 출력되지 않은 경우
            print("탐지된 물체가 없습니다.")
            no_detection_message_shown = True  # 메시지 출력 상태로 변경
    else:
        # 탐지된 물체가 있으면 메시지 상태 초기화
        no_detection_message_shown = False

        detected_alphabet = None
        for detection in detections:
            coords = detection.xyxy[0].tolist()  # 바운딩 박스 좌표
            x1, y1, x2, y2 = map(int, coords[:4])
            conf = detection.conf[0].item()
            if conf >= 0.6:  # 신뢰도 기준 추가
                class_id = int(detection.cls[0].item())  # 클래스 ID
                detected_alphabet = model.names[class_id].upper()

                # 알파벳 비교 및 처리
                if detected_alphabet == target_alphabet:
                    # 동일한 알파벳: 파란색 상자
                    cv2.rectangle(frame, (x1, y1), (x2, y2), (255, 0, 0), 2)
                    label = f"Correct: {detected_alphabet} {conf:.2f}"
                    cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
                    # 확인 메시지 출력
                    print(f"정답입니다! 목표 알파벳: {target_alphabet}, 감지된 알파벳: {detected_alphabet}")
                else:
                    # 다른 알파벳: 빨간색 상자
                    cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 0, 255), 2)
                    label = f"Wrong: {detected_alphabet}"
                    cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)
                    last_wrong_time = time.time()  # 틀린 시간 기록

                    # 오답 메시지 출력
                    print(f"틀렸습니다! 목표 알파벳: {target_alphabet}, 감지된 알파벳: {detected_alphabet}")

    # MediaPipe 손 랜드마크 감지
    rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    hand_results = hands.process(rgb_frame)

    # MediaPipe 랜드마크 표시
    if hand_results.multi_hand_landmarks:
        for hand_landmarks in hand_results.multi_hand_landmarks:
            mp_drawing.draw_landmarks(
                frame,
                hand_landmarks,
                mp_hands.HAND_CONNECTIONS,
                mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=4),
                mp_drawing.DrawingSpec(color=(255, 0, 0), thickness=2)
            )

    # 화면 출력
    cv2.imshow("YOLOv8 + Find_Wrong_Input", frame)

    # 'q' 키를 누르면 종료
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 자원 해제
cap.release()
cv2.destroyAllWindows()
hands.close()


## 퀴즈

In [None]:
import cv2
import mediapipe as mp
from ultralytics import YOLO
import time
import random

# YOLOv8 모델 로드
model = YOLO('asl_yolov8_model.pt')

# MediaPipe Hands 초기화
mp_hands = mp.solutions.hands
mp_drawing = mp.solutions.drawing_utils
hands = mp_hands.Hands(
    max_num_hands=1,
    min_detection_confidence=0.5,
    min_tracking_confidence=0.5
)

# 알파벳 리스트 및 점수 초기화
alphabets = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
score = 0  # 점수
wrong_attempts = []  # 오답 기록
target_alphabet = random.choice(alphabets)  # 첫 랜덤 알파벳 선택
total_questions = 10  # 총 문제 수
current_question = 1  # 현재 문제 번호

print(f"퀴즈 시작! 총 {total_questions}문제입니다.")
print(f"첫 번째 문제! 목표 알파벳: {target_alphabet}")

# 카메라 열기
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    print("카메라를 열 수 없습니다.")
    exit()

print("카메라가 실행되었습니다. 'q'를 눌러 종료하세요. 'n'을 누르면 다음 문제로 넘어갑니다.")

while current_question <= total_questions:
    ret, frame = cap.read()
    if not ret:
        print("프레임을 가져올 수 없습니다.")
        break

    # 화면 좌우 반전 (거울 효과)
    frame = cv2.flip(frame, 1)

    # YOLOv8 예측
    results = model.predict(source=frame, conf=0.5, show=False, verbose=False)
    detections = results[0].boxes if results[0].boxes else []  # YOLOv8 탐지 결과

    detected_alphabet = None
    if detections:
        for detection in detections:
            coords = detection.xyxy[0].tolist()  # 바운딩 박스 좌표
            x1, y1, x2, y2 = map(int, coords[:4])
            conf = detection.conf[0].item()
            if conf >= 0.6:
                class_id = int(detection.cls[0].item())  # 클래스 ID
                detected_alphabet = model.names[class_id].upper()

                # 알파벳 비교 및 처리
                if detected_alphabet == target_alphabet:
                    # 정답 처리
                    cv2.rectangle(frame, (x1, y1), (x2, y2), (255, 0, 0), 2)
                    label = f"Correct: {detected_alphabet} {conf:.2f}"
                    cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
                    
                    # 점수 증가 및 다음 알파벳
                    score += 1
                    print(f"정답입니다! 점수: {score}")
                    current_question += 1
                    if current_question > total_questions:
                        break
                    target_alphabet = random.choice(alphabets)
                    print(f"다음 문제 ({current_question}/{total_questions})! 목표 알파벳: {target_alphabet}")
                else:
                    # 오답 처리
                    cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 0, 255), 2)
                    label = f"Wrong: {detected_alphabet}"
                    cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)
                    wrong_attempts.append((target_alphabet, detected_alphabet))
                    print(f"틀렸습니다! 목표 알파벳: {target_alphabet}, 감지된 알파벳: {detected_alphabet}")

    # MediaPipe 손 랜드마크 감지
    rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    hand_results = hands.process(rgb_frame)

    # MediaPipe 랜드마크 표시
    if hand_results.multi_hand_landmarks:
        for hand_landmarks in hand_results.multi_hand_landmarks:
            mp_drawing.draw_landmarks(
                frame,
                hand_landmarks,
                mp_hands.HAND_CONNECTIONS,
                mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=4),
                mp_drawing.DrawingSpec(color=(255, 0, 0), thickness=2)
            )

    # 화면 출력
    cv2.putText(frame, f"Score: {score}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 2)  # 점수 표시
    cv2.putText(frame, f"Target: {target_alphabet}", (10, 70), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2)  # 목표 알파벳 표시
    cv2.putText(frame, f"Question: {current_question}/{total_questions}", (10, 110), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 255, 255), 2)  # 현재 문제 표시
    cv2.putText(frame, "'N' to Skip", (10, 150), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 255, 255), 2)  # 안내 표시
    cv2.imshow("ASL Quiz", frame)

    # 키 입력 감지
    key = cv2.waitKey(1) & 0xFF
    if key == ord('q'):  # 종료
        break
    elif key == ord('n'):  # 다음 알파벳으로 넘어가기
        print(f"문제를 건너뜁니다. 목표 알파벳: {target_alphabet}")
        # wrong_attempts.append((target_alphabet, "Skipped"))  # 오답으로 기록
        current_question += 1
        if current_question > total_questions:
            break
        target_alphabet = random.choice(alphabets)
        print(f"다음 문제 ({current_question}/{total_questions}), 목표 알파벳: {target_alphabet}")

# 결과 출력
print("\n퀴즈 종료!")
print(f"최종 점수: {score}")


# 자원 해제
cap.release()
cv2.destroyAllWindows()
hands.close()


## 제미나이 API(사전) - 동기방식

In [43]:
import cv2
import mediapipe as mp
from ultralytics import YOLO
import random
import time
import requests
import json

# YOLOv8 모델 로드
model = YOLO('asl_yolov8_model.pt')

# MediaPipe Hands 초기화
mp_hands = mp.solutions.hands
mp_drawing = mp.solutions.drawing_utils
hands = mp_hands.Hands(max_num_hands=1, min_detection_confidence=0.5, min_tracking_confidence=0.5)

# 알파벳 랜덤 선택
alphabets = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
target_alphabet = random.choice(alphabets)
print(f"목표 알파벳: {target_alphabet}")

# 카메라 열기
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    print("카메라를 열 수 없습니다.")
    exit()

print("카메라가 실행되었습니다. 'q'를 눌러 종료하세요.")

# 탐지 상태 추적 변수
no_detection_message_shown = False
last_wrong_time = 0  # 틀렸을 때의 타임스탬프
wrong_display_duration = 2  # 틀렸을 때 빨간색 상자를 표시할 시간(초)

def get_alphabet_description(alphabet):
    api_key = "AIzaSyDaU67xjmxRCO-kc8niC3Reb5OprzOlUJk"  # 구글 Gemini API 키 입력
    url = "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key=" + api_key
    headers = {'Content-Type': 'application/json'}
    data = {
        "contents": [{"parts": [{"text": f"알파벳 {alphabet}에 대해 설명해 주세요."}]}]
    }

    response = requests.post(url, headers=headers, json=data)
    if response.status_code == 200:
        content = response.json()
        explanation = content['candidates'][0]['content']['parts'][0]['text']
        return explanation  # 설명을 그대로 반환
    else:
        return "Sorry, I couldn't fetch the explanation."

# 탐지 루프
while True:
    ret, frame = cap.read()
    if not ret:
        print("프레임을 가져올 수 없습니다.")
        break

    # 화면 좌우 반전 (거울 효과)
    frame = cv2.flip(frame, 1)

    # YOLOv8 예측
    results = model.predict(source=frame, conf=0.5, show=False, verbose=False)  # YOLOv8 예측
    detections = results[0].boxes if results[0].boxes else []  # YOLOv8 탐지 결과

    if not detections:
        if not no_detection_message_shown:
            print("탐지된 물체가 없습니다.")
            no_detection_message_shown = True
    else:
        no_detection_message_shown = False
        detected_alphabet = None

        for detection in detections:
            coords = detection.xyxy[0].tolist()  # 바운딩 박스 좌표
            x1, y1, x2, y2 = map(int, coords[:4])
            conf = detection.conf[0].item()
            if conf >= 0.6:
                class_id = int(detection.cls[0].item())  # 클래스 ID
                detected_alphabet = model.names[class_id].upper()

                if detected_alphabet == target_alphabet:
                    # 맞은 알파벳
                    cv2.rectangle(frame, (x1, y1), (x2, y2), (255, 0, 0), 2)
                    label = f"Correct: {detected_alphabet} {conf:.2f}"
                    cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)

                    # 구글 Gemini API를 통해 설명 가져오기
                    explanation = get_alphabet_description(target_alphabet)
                    print(f"정답입니다! {target_alphabet}에 대한 설명: {explanation}")
                else:
                    # 틀린 알파벳
                    cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 0, 255), 2)
                    label = f"Wrong: {detected_alphabet}"
                    cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)

    # MediaPipe 손 랜드마크 감지
    rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    hand_results = hands.process(rgb_frame)

    # MediaPipe 랜드마크 표시
    if hand_results.multi_hand_landmarks:
        for hand_landmarks in hand_results.multi_hand_landmarks:
            mp_drawing.draw_landmarks(frame, hand_landmarks, mp_hands.HAND_CONNECTIONS, mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=4), mp_drawing.DrawingSpec(color=(255, 0, 0), thickness=2))

    # 화면 출력
    cv2.imshow("YOLOv8 + Alphabet Recognition", frame)

    # 'q' 키를 누르면 종료
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 자원 해제
cap.release()
cv2.destroyAllWindows()
hands.close()


목표 알파벳: W
카메라가 실행되었습니다. 'q'를 눌러 종료하세요.
탐지된 물체가 없습니다.
탐지된 물체가 없습니다.
정답입니다! W에 대한 설명: 알파벳 W는 23번째 알파벳입니다.  다음과 같은 특징을 가지고 있습니다.

* **모양:** 두 개의 V를 서로 겹쳐 놓은 형태입니다.  대문자 W는 각이 진 두 개의 V이고, 소문자 w는 곡선을 가집니다.

* **발음:** 영어에서는 "더블유"라고 발음되지만, 다른 언어에서는 다양하게 발음됩니다.  예를 들어, 스페인어에서는 "우"에 가까운 발음을 합니다.

* **어원:**  W는 옛 게르만어에서 기원한 것으로, 두 개의 V가 합쳐진 글자입니다.  V는 로마자의 U로부터 유래했으며, U는 그리스어의 V(upsilon)에서 유래합니다.  W가 독립적인 알파벳으로 자리잡은 것은 비교적 늦은 시기입니다.

* **사용:**  W는 많은 단어의 첫 글자 또는 중간 글자로 사용됩니다. 예를 들어, "water", "world", "window" 등이 있습니다.

* **다른 의미:**  W는 때로는 다른 의미로 사용될 수도 있습니다.  예를 들어, 와트(Watt, 전력의 단위)의 약어로 사용되거나, 서양(West)을 나타내는 약어로도 사용됩니다.

* **이니셜:**  W는 많은 사람들의 이름의 이니셜로 사용되며, 이니셜의 경우 여러 가지 의미를 가질 수 있습니다.

요약하자면, W는 영어 알파벳의 중요한 구성 요소이며, 그 기원과 모양, 발음 등을 살펴보면 알파벳의 역사와 언어의 발전을 이해하는 데 도움이 됩니다.

탐지된 물체가 없습니다.
