In [1]:
# !pip install mediapipe

In [3]:
import cv2
import mediapipe as mp
import pandas as pd
import time

# Khởi tạo thư viện MediaPipe
mp_pose = mp.solutions.pose
pose = mp_pose.Pose()
mp_draw = mp.solutions.drawing_utils

# Mở webcam
cap = cv2.VideoCapture(0)

# Danh sách hành động cần thu thập
actions = ["dung_yen","chay", "di_bo", "ngoi", "nam", "dam", "vay_tay"]
data = {action: [] for action in actions}
current_label = actions[0]  # Mặc định là "đứng yên"

# Số khung hình cần thu thập mỗi hành động
no_of_frames = 600
fps_limit = 30  # Giới hạn FPS
prev_time = 0

def extract_landmarks(results):
    """Trích xuất thông số khung xương từ MediaPipe."""
    if results.pose_landmarks:
        return [coord for lm in results.pose_landmarks.landmark for coord in (lm.x, lm.y, lm.z, lm.visibility)]
    return []

print("Nhấn 1: Đứng yên | 2: Chạy | 3: Đi bộ | 4: Ngồi | 5: Nằm | 6: Đấm | 7: Vẫy tay | Q: Thoát ")

while True:
    ret, frame = cap.read()
    if not ret:
        break

    # Giới hạn tốc độ FPS
    curr_time = time.time()
    if curr_time - prev_time < 1 / fps_limit:
        continue
    prev_time = curr_time

    # Xử lý ảnh với MediaPipe
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    results = pose.process(frame_rgb)

    # Nếu phát hiện pose, trích xuất dữ liệu
    lm = extract_landmarks(results)
    if lm:
        data[current_label].append(lm)
        mp_draw.draw_landmarks(frame, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                               mp_draw.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=4),
                               mp_draw.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=4))

    # Hiển thị thông tin trên màn hình
    cv2.putText(frame, f"Label: {current_label.upper()}", (10, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 2)
    cv2.imshow("Pose Detection", frame)

    # Chuyển đổi hành động khi nhấn phím
    key = cv2.waitKey(1) & 0xFF
    if key == ord('0'):
        current_label = "dung_yen"
    elif key == ord('2'):
        current_label = "chay"
    elif key == ord('3'):
        current_label = "di_bo"
    elif key == ord('4'):
        current_label = "ngoi"
    elif key == ord('5'):
        current_label = "nam"
    elif key == ord('6'):
        current_label = "dam"
    elif key == ord('7'):
        current_label = "vay_tay"
    elif key == ord('q'):
        break

# Lưu dữ liệu thành file csv
for action, lm_list in data.items():
    df = pd.DataFrame(lm_list)
    df.to_csv(f"{action}.csv", index=False)

print("Dữ liệu đã lưu thành công!")
cap.release()
cv2.destroyAllWindows()


Nhấn 1: Đứng yên | 2: Chạy | 3: Đi bộ | 4: Ngồi | 5: Nằm | 6: Đấm | 7: Vẫy tay | Q: Thoát 
Dữ liệu đã lưu thành công!


In [3]:
import cv2
import mediapipe as mp
import pandas as pd
import time
import os

# Khởi tạo thư viện MediaPipe
mp_pose = mp.solutions.pose
pose = mp_pose.Pose()
mp_draw = mp.solutions.drawing_utils

# Mở webcam
cap = cv2.VideoCapture(0)

# Danh sách hành động cần thu thập
actions = ["dung_yen", "chay", "di_bo", "ngoi", "nam", "dam", "vay_tay"]
data = {action: [] for action in actions}
current_label = None  # Mặc định là không ghi dữ liệu
recording = False  # Cờ để kiểm soát việc ghi dữ liệu

# Số khung hình cần thu thập mỗi hành động
no_of_frames = 600
frame_count = {action: 0 for action in actions}  # Đếm số frame của mỗi hành động
fps_limit = 30  # Giới hạn FPS
prev_time = 0

def extract_landmarks(results):
    """Trích xuất thông số khung xương từ MediaPipe."""
    if results.pose_landmarks:
        return [coord for lm in results.pose_landmarks.landmark for coord in (lm.x, lm.y, lm.z, lm.visibility)]
    return []

print("Nhấn số để bắt đầu ghi hành động:")
print("1: Đứng yên | 2: Chạy | 3: Đi bộ | 4: Ngồi | 5: Nằm | 6: Đấm | 7: Vẫy tay | SPACE: Dừng ghi | Q: Thoát ")

while True:
    ret, frame = cap.read()
    if not ret:
        break

    # Giới hạn tốc độ FPS
    curr_time = time.time()
    if curr_time - prev_time < 1 / fps_limit:
        continue
    prev_time = curr_time

    # Xử lý ảnh với MediaPipe
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    results = pose.process(frame_rgb)

    # Nếu đang ghi, trích xuất dữ liệu
    if recording and current_label is not None:
        lm = extract_landmarks(results)
        if lm:
            data[current_label].append(lm)
            frame_count[current_label] += 1  # Tăng số frame đã thu thập
            print(f"Đang ghi '{current_label.upper()}': {frame_count[current_label]}/{no_of_frames} frames")

            # Hiển thị trạng thái ghi dữ liệu trên màn hình
            cv2.putText(frame, f"Recording: {current_label.upper()} ({frame_count[current_label]}/{no_of_frames})",
                        (10, 90), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)

            # Nếu đủ 600 frames thì tự động dừng ghi
            if frame_count[current_label] >= no_of_frames:
                print(f"✅ Đã thu thập đủ {no_of_frames} frames cho '{current_label.upper()}'!")
                recording = False

    # Vẽ khung xương lên ảnh
    if results.pose_landmarks:
        mp_draw.draw_landmarks(frame, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                               mp_draw.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=4),
                               mp_draw.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=4))

    # Hiển thị thông tin hành động hiện tại
    if current_label:
        cv2.putText(frame, f"Label: {current_label.upper()}", (10, 50),
                    cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 2)

    # Hiển thị hình ảnh
    cv2.imshow("Pose Detection", frame)

    # Chuyển đổi hành động khi nhấn phím
    key = cv2.waitKey(1) & 0xFF
    if key == ord('1'):
        current_label = "dung_yen"
        recording = True
    elif key == ord('2'):
        current_label = "chay"
        recording = True
    elif key == ord('3'):
        current_label = "di_bo"
        recording = True
    elif key == ord('4'):
        current_label = "ngoi"
        recording = True
    elif key == ord('5'):
        current_label = "nam"
        recording = True
    elif key == ord('6'):
        current_label = "dam"
        recording = True
    elif key == ord('7'):
        current_label = "vay_tay"
        recording = True
    elif key == ord(' '):  # Nhấn SPACE để dừng ghi
        recording = False
        print(f"⏸ Dừng ghi hành động '{current_label.upper()}'")
    elif key == ord('q'):
        break

# Lưu dữ liệu vào file CSV (chế độ append)
for action, lm_list in data.items():
    if lm_list:Q
        filename = f"{action}.csv"
        df = pd.DataFrame(lm_list)

        # Nếu file đã tồn tại, append dữ liệu vào
        if os.path.exists(filename):
            df.to_csv(filename, mode='a', header=False, index=False)
        else:
            df.to_csv(filename, index=False)

print("✅ Dữ liệu đã lưu thành công!")
cap.release()
cv2.destroyAllWindows()


IndentationError: unexpected indent (1503804185.py, line 114)