In [1]:
import os
import glob
import json
import warnings

# --- (QUAN TRỌNG) HÃY SỬA ĐƯỜNG DẪN NÀY ---
# Trỏ đến thư mục chứa 3590 file .npy của bạn
KEYPOINT_DIR = "Data/Keypoint_Dataset_HF"

# Tên file JSON bạn muốn tạo
OUTPUT_JSON_FILE = "label_map.json"

def generate_label_map(keypoint_dir, output_file):
    """
    Quét thư mục keypoint, tạo bản đồ nhãn, và lưu ra file JSON.
    """
    print(f"Đang quét thư mục: {keypoint_dir}")

    # Quét tất cả các file .npy
    all_files = glob.glob(os.path.join(keypoint_dir, "*.npy"))

    if not all_files:
        print(f"LỖI: Không tìm thấy file .npy nào trong '{keypoint_dir}'")
        print("Hãy kiểm tra lại đường dẫn KEYPOINT_DIR.")
        return

    # Tạo label_map từ tên file
    label_set = set()
    for f in all_files:
        # Ví dụ: "milk_1607.npy" -> "milk"
        label_str = os.path.basename(f).split('_')[0]
        label_set.add(label_str)

    # Sắp xếp theo alphabet để đảm bảo thứ tự luôn cố định
    sorted_labels = sorted(list(label_set))

    # Tạo bản đồ: {'A': 0, 'B': 1, ...}
    label_map = {label: idx for idx, label in enumerate(sorted_labels)}

    num_classes = len(label_map)
    print(f"Tìm thấy {len(all_files)} file, {num_classes} nhãn độc nhất.")

    # Lưu file JSON
    try:
        with open(output_file, 'w', encoding='utf-8') as f:
            # indent=4 để file JSON đẹp, dễ đọc
            json.dump(label_map, f, ensure_ascii=False, indent=4)
        print(f"\n--- THÀNH CÔNG! ---")
        print(f"Đã lưu bản đồ nhãn vào file: {output_file}")
    except Exception as e:
        print(f"\nLỖI: Không thể ghi file JSON. Lỗi: {e}")

if __name__ == "__main__":
    warnings.filterwarnings("ignore", category=UserWarning)
    generate_label_map(KEYPOINT_DIR, OUTPUT_JSON_FILE)

Đang quét thư mục: Data/Keypoint_Dataset_HF
Tìm thấy 3590 file, 47 nhãn độc nhất.

--- THÀNH CÔNG! ---
Đã lưu bản đồ nhãn vào file: label_map.json
