In [4]:
import os
import shutil

# --- Cấu hình ---
BASE_VIDEO_PATH = "DATA/RawVideo"
CLIP_OUTPUT_PATH = "DATA/data_clips/train" # <-- Thư mục đầu ra là TRAIN
TRAIN_SPLIT_FILE = "train_data.txt" # <-- File chứa danh sách video huấn luyện



In [5]:
# --- Hàm sao chép video ---
def copy_video_to_train(video_relative_path):
    """
    Tìm video gốc và sao chép nó vào thư mục train.
    """
    
    # video_relative_path có dạng "Arson/Arson001_x264.mp4"
    # Cần xử lý để lấy đúng tên file và nhãn
    try:
        label, video_name = video_relative_path.strip().split('/')
    except ValueError:
        print(f"Bỏ qua dòng không đúng định dạng: {video_relative_path}")
        return

    # Đặc biệt: Xử lý cho "Normal" nếu nó nằm trong thư mục con khác
    if label == "Normal_Videos_event":
        label = "Normal"
        # Xây dựng đường dẫn gốc đặc biệt cho Normal
        source_video_full_path = os.path.join(BASE_VIDEO_PATH, "Normal", "Normal_Videos_event", video_name)
    else:
        # Đường dẫn video gốc
        source_video_full_path = os.path.join(BASE_VIDEO_PATH, label, video_name)


    # Tạo thư mục cho nhãn (ví dụ: data_clips/train/Arson)
    label_dir = os.path.join(CLIP_OUTPUT_PATH, label)
    if not os.path.exists(label_dir):
        os.makedirs(label_dir)
        
    output_video_full_path = os.path.join(label_dir, video_name)

    # Kiểm tra xem file gốc có tồn tại không
    if not os.path.exists(source_video_full_path):
        print(f"CẢNH BÁO: Không tìm thấy video huấn luyện: {source_video_full_path}")
        return

    # Sao chép file
    print(f"Đang sao chép: {source_video_full_path} -> {output_video_full_path}")
    shutil.copyfile(source_video_full_path, output_video_full_path)



In [6]:
# --- Vòng lặp chính ---
print("Bắt đầu chuẩn bị dữ liệu Train...")

try:
    with open(TRAIN_SPLIT_FILE, 'r') as f:
        train_videos_list = f.readlines()
except FileNotFoundError:
    print(f"LỖI: Không tìm thấy file split huấn luyện '{TRAIN_SPLIT_FILE}'.")
    print("Vui lòng tải file đó từ 'UCF_Crimes-Train-Test-Split.zip' và đặt tên đúng.")
    exit()

for video_path in train_videos_list:
    if video_path.strip(): # Bỏ qua dòng trống
        copy_video_to_train(video_path.strip())

print(f"Hoàn thành chuẩn bị dữ liệu Train! Dữ liệu đã được lưu tại: {CLIP_OUTPUT_PATH}")

Bắt đầu chuẩn bị dữ liệu Train...
Đang sao chép: DATA/RawVideo\Abuse\Abuse013_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse013_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse014_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse014_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse015_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse015_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse016_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse016_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse017_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse017_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse018_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse018_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse019_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse019_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse020_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse020_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse021_x264.mp4 -> DATA/data_clips/train\Abuse\Abuse021_x264.mp4
Đang sao chép: DATA/RawVideo\Abuse\Abuse022_x264