In [None]:

!pip install opencv-contrib-python


## **<font style="color:rgb(134,19,348)"> Import the Libraries</font>**

We will start by installing and importing the required libraries.

In [None]:
# Import the required libraries.
import os
import cv2 as cv
import math
import random
import numpy as np


## **<font style="color:rgb(134,19,348)"> UCF101 extract</font>**

In [None]:
# folder input dataset directory 
root_dir = '/kaggle/input/ucf101/UCF101/UCF-101/'
classesIdx_txt = '/kaggle/input/ucf101/UCF101TrainTestSplits-RecognitionTask/ucfTrainTestlist/classInd.txt'

# output directory video list file
txt_file_path = '/kaggle/working/videolist.txt'

# Tạo một từ điển ánh xạ từ tên lớp sang nhãn số
label_dict = {}
with open(classesIdx_txt, 'r') as f:
    for line in f:
        # Split dòng để lấy tên lớp và nhãn số
        label, class_name = line.strip().split()
        # Lưu vào từ điển
        label_dict[class_name] = int(label)
print("Từ điển ánh xạ từ tên lớp sang nhãn số:")
print(label_dict)

In [None]:
def check_video_length(video_path, threshold_seconds=1.5):
    # Đọc video
    cap = cv.VideoCapture(video_path)
    
    # Kiểm tra xem video có mở thành công hay không
    if not cap.isOpened():
        print("Không thể mở video.")
        return False
    
    # Tính tổng số khung hình trong video
    total_frames = int(cap.get(cv.CAP_PROP_FRAME_COUNT))
    
    # Tính tỉ lệ khung hình mỗi giây (FPS)
    fps = int(cap.get(cv.CAP_PROP_FPS))
    
    # Tính toán độ dài của video (tính theo giây)
    video_length_seconds = total_frames / fps
    
    # Đóng video
    cap.release()
    
    # Kiểm tra xem độ dài của video có lớn hơn ngưỡng không
    if video_length_seconds > threshold_seconds:
        return True
    else:
        return False

# Kiểm tra nếu file tồn tại, thì xóa nó
if os.path.exists(txt_file_path):
    os.remove(txt_file_path)
    print("File đã tồn tại và đã được xóa thành công!")
with open(txt_file_path, 'w') as f:
    # Duyệt qua tất cả các thư mục action
    for action_dir in os.listdir(root_dir):
        action_path = os.path.join(root_dir, action_dir)
        # Nếu là thư mục
        if os.path.isdir(action_path):
            # Duyệt qua tất cả các video trong thư mục action
            for video_name in os.listdir(action_path):
                # Lấy đường dẫn tuyệt đối đến video
                video_path = os.path.join(action_path, video_name)
                if check_video_length(video_path):
                        # Ghi thông tin vào file txt, cách nhau bằng dấu 
                    label = label_dict[action_dir]
                    f.write(f"{action_dir}/{video_name} {label}\n")

print("File txt đã được tạo hoặc cập nhật thành công!")
# Đọc dữ liệu từ file và lưu vào danh sách
with open(txt_file_path, 'r') as f:
    data = f.readlines()

# Sắp xếp danh sách theo label
data_sorted = sorted(data, key=lambda x: int(x.split(' ')[1]))

# Ghi dữ liệu đã sắp xếp vào file
with open(txt_file_path, 'w') as f:
    f.writelines(data_sorted)

print("Dữ liệu đã được sắp xếp theo label và ghi vào file thành công!")

## **<font style="color:rgb(134,19,348)"> HMDB51 extract</font>**

In [None]:
# input dataset directory
root_dir = '/kaggle/input/hmdb51full/hmdb51/hmdb51/'
classesIdx_txt = '/kaggle/input/hmdb51full/hmdb51all_label/hmdb_labels.txt'

#output file video directory
txt_file_path = '/kaggle/working/videolist.txt'
# Tạo một từ điển ánh xạ từ tên lớp sang nhãn số
label_dict = {}
with open(classesIdx_txt, 'r') as f:
    for line in f:
        # Split dòng để lấy tên lớp và nhãn số
        label, class_name = line.strip().split()
        # Lưu vào từ điển
        label_dict[class_name] = int(label)
print("Từ điển ánh xạ từ tên lớp sang nhãn số:")
print(label_dict)

In [None]:
def check_video_length(video_path, threshold_seconds=1.5):
    # Đọc video
    cap = cv.VideoCapture(video_path)
    
    # Kiểm tra xem video có mở thành công hay không
    if not cap.isOpened():
        print("Không thể mở video.")
        return False
    
    # Tính tổng số khung hình trong video
    total_frames = int(cap.get(cv.CAP_PROP_FRAME_COUNT))
    
    # Tính tỉ lệ khung hình mỗi giây (FPS)
    fps = int(cap.get(cv.CAP_PROP_FPS))
    
    # Tính toán độ dài của video (tính theo giây)
    video_length_seconds = total_frames / fps
    
    # Đóng video
    cap.release()
    
    # Kiểm tra xem độ dài của video có lớn hơn ngưỡng không
    if video_length_seconds > threshold_seconds:
        return True
    else:
        return False

# Kiểm tra nếu file tồn tại, thì xóa nó
if os.path.exists(txt_file_path):
    os.remove(txt_file_path)
    print("File đã tồn tại và đã được xóa thành công!")
with open(txt_file_path, 'w') as f:
    # Duyệt qua tất cả các thư mục action
    for action_dir in os.listdir(root_dir):
        action_path = os.path.join(root_dir, action_dir)
        # Nếu là thư mục
        if os.path.isdir(action_path):
            # Duyệt qua tất cả các video trong thư mục action
            for video_name in os.listdir(action_path):
                # Lấy đường dẫn tuyệt đối đến video
                video_path = os.path.join(action_path, video_name)
                if check_video_length(video_path):
                        # Ghi thông tin vào file txt, cách nhau bằng dấu 
                    label = label_dict[action_dir]
                    f.write(f"{action_dir}/{video_name} {label}\n")

print("File txt đã được tạo hoặc cập nhật thành công!")
# Đọc dữ liệu từ file và lưu vào danh sách
with open(txt_file_path, 'r') as f:
    data = f.readlines()

# Sắp xếp danh sách theo label
data_sorted = sorted(data, key=lambda x: int(x.split(' ')[1]))

# Ghi dữ liệu đã sắp xếp vào file
with open(txt_file_path, 'w') as f:
    f.writelines(data_sorted)

print("Dữ liệu đã được sắp xếp theo label và ghi vào file thành công!")