In [2]:
import os

# 📂 Path to your ISL-CSLTR root directory
dataset_root = '/Volumes/My Passport/ISL_CSLRT_Corpus'  # Change this to your actual path

# 📁 Subfolders to scan
subfolders = [
    "Frames_Word_Level",
    "Frames_Sentence_Level",
    "Videos_Sentence_Level"
]

# 📋 Collect folder names in each subdirectory
for folder in subfolders:
    full_path = os.path.join(dataset_root, folder)
    if not os.path.exists(full_path):
        print(f"❌ Folder not found: {full_path}")
        continue

    print(f"\n📁 Contents of '{folder}':")
    entries = sorted(os.listdir(full_path))
    only_dirs = [entry for entry in entries if os.path.isdir(os.path.join(full_path, entry))]
    
    for dir_name in only_dirs:
        print(f"🔹 {dir_name}")



📁 Contents of 'Frames_Word_Level':
🔹 A LOT
🔹 ABUSE
🔹 AFRAID
🔹 AGREE
🔹 ALL
🔹 ANGRY
🔹 ANY
🔹 ANYTHING
🔹 APPRECIATE
🔹 BAD
🔹 BEAUTIFUL
🔹 BECOME
🔹 BED
🔹 BORED
🔹 BRING
🔹 CHAT
🔹 CLASS
🔹 COLD
🔹 COLLEGE_SCHOOL
🔹 COMB
🔹 COME
🔹 CONGRATULATIONS
🔹 CRYING
🔹 DARE
🔹 DIFFERENCE
🔹 DILEMMA
🔹 DISAPPOINTED
🔹 DO
🔹 DON'T CARE
🔹 ENJOY
🔹 FAVOUR
🔹 FEVER
🔹 FINE
🔹 FOOD
🔹 FREE
🔹 FRIEND
🔹 FROM
🔹 GLASS
🔹 GO
🔹 GOOD
🔹 GOT
🔹 GRATEFUL
🔹 HAD
🔹 HAPPENED
🔹 HAPPY
🔹 HEAR
🔹 HEART
🔹 HELLO_HI
🔹 HELP
🔹 HIDING
🔹 HOW
🔹 HUNGRY
🔹 HURT
🔹 I_ME_MINE_MY
🔹 KIND
🔹 KNOW
🔹 LEAVE
🔹 LIGHT
🔹 LIKE
🔹 LIKE_LOVE
🔹 MAKE
🔹 MEAN IT
🔹 MEDICINE
🔹 MEET
🔹 NAME
🔹 NEED
🔹 NEVER
🔹 NICE
🔹 NOT
🔹 NOW
🔹 NUMBER
🔹 New folder
🔹 OLD_AGE
🔹 ON THE WAY
🔹 ONWARDS
🔹 OUTSIDE
🔹 PHONE
🔹 PLACE
🔹 PLANNED
🔹 PLEASE
🔹 POUR
🔹 PREPARE
🔹 PROMISE
🔹 REALLY
🔹 REPEAT
🔹 ROOM
🔹 SERVE
🔹 SHIRT
🔹 SITTING
🔹 SLEEP
🔹 SLOWER
🔹 SO MUCH
🔹 SOFTLY
🔹 SOME HOW
🔹 SOME MORE
🔹 SOME ONE
🔹 SOMETHING
🔹 SORRY
🔹 SPEAK
🔹 STOP
🔹 STUBBORN
🔹 SURE
🔹 TAKE CARE
🔹 TAKE TIME
🔹 TALK
🔹 TELL
🔹 THANK
🔹 THAT
🔹 THERE
🔹 THI

In [1]:
#extracting the dataset using mediapipe, for 2 hands

import os
import cv2
import mediapipe as mp
import numpy as np
from tqdm import tqdm
import pandas as pd

# Paths
dataset_dir = "/Volumes/My Passport/ISL_CSLRT_Corpus/Frames_Word_Level"  # CHANGE THIS
output_csv = "basic_gesture_landmarks_two_hands.csv"

# Mediapipe setup
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(
    static_image_mode=True,   # Static image mode (you can change it to False if working with video)
    max_num_hands=2,         # Max number of hands to detect
    model_complexity=0,      # Lower complexity for faster processing (0: Lite model)
    min_detection_confidence=0.5  # Minimum confidence for hand detection
)
mp_drawing = mp.solutions.drawing_utils

# Init
X_data = []
y_labels = []

# Loop through each class folder (each gesture)
for gesture in sorted(os.listdir(dataset_dir)):
    gesture_path = os.path.join(dataset_dir, gesture)
    if not os.path.isdir(gesture_path):
        continue

    print(f"🔍 Processing: {gesture}")
    
    for img_file in tqdm(os.listdir(gesture_path)):
        if not img_file.lower().endswith(('.jpg', '.png')):
            continue
        
        img_path = os.path.join(gesture_path, img_file)
        image = cv2.imread(img_path)
        if image is None:
            continue

        # Flip the image horizontally for better left-right orientation
        image = cv2.flip(image, 1)

        # Convert image to RGB as MediaPipe expects RGB images
        image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        result = hands.process(image_rgb)

        # If two hands are detected, process both
        if result.multi_hand_landmarks:
            all_landmarks = []
            
            # Loop through detected hands (we want two)
            for hand_landmarks in result.multi_hand_landmarks:
                coords = []
                for lm in hand_landmarks.landmark:
                    # Store x and y coordinates for each landmark
                    coords.extend([lm.x, lm.y])  # 42 values for one hand (21 landmarks * 2 for x, y)
                all_landmarks.extend(coords)  # Flatten the landmarks for both hands

            if len(all_landmarks) == 84:  # Make sure we have 84 landmarks (42 for each hand)
                X_data.append(all_landmarks)
                y_labels.append(gesture)

hands.close()

# Convert to DataFrame
df = pd.DataFrame(X_data)
df.insert(0, "gesture", y_labels)

# Save to CSV
df.to_csv(output_csv, index=False)
print(f"✅ Saved landmark dataset with two hands to: {output_csv}")


I0000 00:00:1743005610.045314  197472 gl_context.cc:369] GL version: 2.1 (2.1 Metal - 89.3), renderer: Apple M1
INFO: Created TensorFlow Lite XNNPACK delegate for CPU.
W0000 00:00:1743005610.064376  200220 inference_feedback_manager.cc:114] Feedback manager requires a model with a single signature inference. Disabling support for feedback tensors.
W0000 00:00:1743005610.070435  200220 inference_feedback_manager.cc:114] Feedback manager requires a model with a single signature inference. Disabling support for feedback tensors.


🔍 Processing: A LOT


  0%|                                                     | 0/4 [00:00<?, ?it/s]W0000 00:00:1743005610.531323  200223 landmark_projection_calculator.cc:186] Using NORM_RECT without IMAGE_DIMENSIONS is only supported for the square ROI. Provide IMAGE_DIMENSIONS or use PROJECTION_MATRIX.
100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 16.61it/s]


🔍 Processing: ABUSE


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 23.89it/s]


🔍 Processing: AFRAID


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 21.71it/s]


🔍 Processing: AGREE


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 22.35it/s]


🔍 Processing: ALL


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 21.76it/s]


🔍 Processing: ANGRY


100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 23.82it/s]


🔍 Processing: ANY


0it [00:00, ?it/s]


🔍 Processing: ANYTHING


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 24.67it/s]


🔍 Processing: APPRECIATE


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 23.97it/s]


🔍 Processing: BAD


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 24.42it/s]


🔍 Processing: BEAUTIFUL


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 24.66it/s]


🔍 Processing: BECOME


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 23.32it/s]


🔍 Processing: BED


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.99it/s]


🔍 Processing: BORED


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 17.39it/s]


🔍 Processing: BRING


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 21.81it/s]


🔍 Processing: CHAT


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 23.24it/s]


🔍 Processing: CLASS


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 21.70it/s]


🔍 Processing: COLD


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.40it/s]


🔍 Processing: COLLEGE_SCHOOL


100%|███████████████████████████████████████████| 18/18 [00:00<00:00, 22.34it/s]


🔍 Processing: COMB


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 22.42it/s]


🔍 Processing: COME


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 23.46it/s]


🔍 Processing: CONGRATULATIONS


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.56it/s]


🔍 Processing: CRYING


100%|███████████████████████████████████████████| 13/13 [00:00<00:00, 24.59it/s]


🔍 Processing: DARE


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 21.57it/s]


🔍 Processing: DIFFERENCE


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 22.60it/s]


🔍 Processing: DILEMMA


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 21.88it/s]


🔍 Processing: DISAPPOINTED


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 23.25it/s]


🔍 Processing: DO


100%|███████████████████████████████████████████| 12/12 [00:00<00:00, 24.70it/s]


🔍 Processing: DON'T CARE


100%|█████████████████████████████████████████████| 3/3 [00:00<00:00, 20.77it/s]


🔍 Processing: ENJOY


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 22.71it/s]


🔍 Processing: FAVOUR


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 22.48it/s]


🔍 Processing: FEVER


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.72it/s]


🔍 Processing: FINE


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 21.72it/s]


🔍 Processing: FOOD


100%|███████████████████████████████████████████| 23/23 [00:00<00:00, 24.71it/s]


🔍 Processing: FREE


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 21.73it/s]


🔍 Processing: FRIEND


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 24.65it/s]


🔍 Processing: FROM


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.14it/s]


🔍 Processing: GLASS


0it [00:00, ?it/s]


🔍 Processing: GO


100%|█████████████████████████████████████████████| 9/9 [00:00<00:00, 22.98it/s]


🔍 Processing: GOOD


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.20it/s]


🔍 Processing: GOT


0it [00:00, ?it/s]


🔍 Processing: GRATEFUL


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 22.76it/s]


🔍 Processing: HAD


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 25.75it/s]


🔍 Processing: HAPPENED


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 23.29it/s]


🔍 Processing: HAPPY


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 21.77it/s]


🔍 Processing: HEAR


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 25.16it/s]


🔍 Processing: HEART


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 24.04it/s]


🔍 Processing: HELLO_HI


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 29.01it/s]


🔍 Processing: HELP


100%|███████████████████████████████████████████| 26/26 [00:01<00:00, 25.77it/s]


🔍 Processing: HIDING


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 21.31it/s]


🔍 Processing: HOW


100%|███████████████████████████████████████████| 20/20 [00:00<00:00, 23.49it/s]


🔍 Processing: HUNGRY


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 26.66it/s]


🔍 Processing: HURT


100%|███████████████████████████████████████████| 14/14 [00:00<00:00, 24.32it/s]


🔍 Processing: I_ME_MINE_MY


100%|███████████████████████████████████████████| 97/97 [00:03<00:00, 24.89it/s]


🔍 Processing: KIND


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.29it/s]


🔍 Processing: KNOW


0it [00:00, ?it/s]


🔍 Processing: LEAVE


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 24.39it/s]


🔍 Processing: LIGHT


0it [00:00, ?it/s]


🔍 Processing: LIKE


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 23.01it/s]


🔍 Processing: LIKE_LOVE


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 22.52it/s]


🔍 Processing: MAKE


0it [00:00, ?it/s]


🔍 Processing: MEAN IT


100%|█████████████████████████████████████████████| 3/3 [00:00<00:00, 21.06it/s]


🔍 Processing: MEDICINE


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 22.54it/s]


🔍 Processing: MEET


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 27.52it/s]


🔍 Processing: NAME


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.49it/s]


🔍 Processing: NEED


0it [00:00, ?it/s]


🔍 Processing: NEVER


0it [00:00, ?it/s]


🔍 Processing: NICE


100%|███████████████████████████████████████████| 15/15 [00:00<00:00, 23.07it/s]


🔍 Processing: NOT


100%|███████████████████████████████████████████| 16/16 [00:00<00:00, 23.84it/s]


🔍 Processing: NOW


0it [00:00, ?it/s]


🔍 Processing: NUMBER


100%|█████████████████████████████████████████████| 8/8 [00:00<00:00, 24.57it/s]


🔍 Processing: New folder


0it [00:00, ?it/s]


🔍 Processing: OLD_AGE


100%|███████████████████████████████████████████| 12/12 [00:00<00:00, 24.54it/s]


🔍 Processing: ON THE WAY


100%|█████████████████████████████████████████████| 3/3 [00:00<00:00, 22.98it/s]


🔍 Processing: ONWARDS


0it [00:00, ?it/s]


🔍 Processing: OUTSIDE


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 23.95it/s]


🔍 Processing: PHONE


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.95it/s]


🔍 Processing: PLACE


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 22.92it/s]


🔍 Processing: PLANNED


0it [00:00, ?it/s]


🔍 Processing: PLEASE


100%|█████████████████████████████████████████████| 2/2 [00:00<00:00, 26.88it/s]


🔍 Processing: POUR


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.77it/s]


🔍 Processing: PREPARE


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 22.40it/s]


🔍 Processing: PROMISE


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 22.18it/s]


🔍 Processing: REALLY


100%|███████████████████████████████████████████| 12/12 [00:00<00:00, 23.56it/s]


🔍 Processing: REPEAT


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 25.50it/s]


🔍 Processing: ROOM


100%|█████████████████████████████████████████████| 8/8 [00:00<00:00, 21.98it/s]


🔍 Processing: SERVE


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.43it/s]


🔍 Processing: SHIRT


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.63it/s]


🔍 Processing: SITTING


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 20.98it/s]


🔍 Processing: SLEEP


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 23.41it/s]


🔍 Processing: SLOWER


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 26.18it/s]


🔍 Processing: SO MUCH


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.92it/s]


🔍 Processing: SOFTLY


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 24.38it/s]


🔍 Processing: SOME HOW


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.52it/s]


🔍 Processing: SOME MORE


0it [00:00, ?it/s]


🔍 Processing: SOME ONE


100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 20.95it/s]


🔍 Processing: SOMETHING


100%|█████████████████████████████████████████████| 3/3 [00:00<00:00, 20.52it/s]


🔍 Processing: SORRY


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 23.91it/s]


🔍 Processing: SPEAK


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 23.50it/s]


🔍 Processing: STOP


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 22.44it/s]


🔍 Processing: STUBBORN


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 24.70it/s]


🔍 Processing: SURE


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 22.56it/s]


🔍 Processing: TAKE CARE


100%|█████████████████████████████████████████████| 8/8 [00:00<00:00, 25.01it/s]


🔍 Processing: TAKE TIME


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 22.52it/s]


🔍 Processing: TALK


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 23.34it/s]


🔍 Processing: TELL


100%|█████████████████████████████████████████████| 9/9 [00:00<00:00, 22.24it/s]


🔍 Processing: THANK


100%|███████████████████████████████████████████| 14/14 [00:00<00:00, 24.23it/s]


🔍 Processing: THAT


100%|███████████████████████████████████████████| 12/12 [00:00<00:00, 24.52it/s]


🔍 Processing: THERE


0it [00:00, ?it/s]


🔍 Processing: THINGS


100%|█████████████████████████████████████████████| 3/3 [00:00<00:00, 20.49it/s]


🔍 Processing: THINK


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.81it/s]


🔍 Processing: THIRSTY


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 27.34it/s]


🔍 Processing: THIS ONE


0it [00:00, ?it/s]


🔍 Processing: TIRED


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 22.40it/s]


🔍 Processing: TODAY


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 21.72it/s]


🔍 Processing: TRAIN


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 21.25it/s]


🔍 Processing: TRUST


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 22.93it/s]


🔍 Processing: TRUTH


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 20.80it/s]


🔍 Processing: TURN ON


100%|█████████████████████████████████████████████| 6/6 [00:00<00:00, 24.55it/s]


🔍 Processing: UNDERSTAND


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 21.03it/s]


🔍 Processing: VERY


0it [00:00, ?it/s]


🔍 Processing: WANT


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 25.06it/s]


🔍 Processing: WATER


100%|███████████████████████████████████████████| 21/21 [00:00<00:00, 24.46it/s]


🔍 Processing: WEAR


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 22.41it/s]


🔍 Processing: WELCOME


100%|█████████████████████████████████████████████| 5/5 [00:00<00:00, 23.74it/s]


🔍 Processing: WHAT


100%|███████████████████████████████████████████| 31/31 [00:01<00:00, 25.49it/s]


🔍 Processing: WHEN


0it [00:00, ?it/s]


🔍 Processing: WHERE


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.17it/s]


🔍 Processing: WHO


100%|█████████████████████████████████████████████| 7/7 [00:00<00:00, 24.08it/s]


🔍 Processing: WORRY


100%|█████████████████████████████████████████████| 4/4 [00:00<00:00, 20.12it/s]


🔍 Processing: YOU


100%|█████████████████████████████████████████| 110/110 [00:04<00:00, 24.29it/s]


✅ Saved landmark dataset with two hands to: basic_gesture_landmarks_two_hands.csv


In [4]:
#label encoder
from sklearn.preprocessing import LabelEncoder
import joblib

# Train new label encoder on your gestures
label_encoder = LabelEncoder()
label_encoder.fit(y_labels)

# Save encoder to use during inference
joblib.dump(label_encoder, "label_encoder.pkl")
print("✅ Saved label encoder as label_encoder.pkl")


✅ Saved label encoder as label_encoder.pkl
