In [1]:
import pandas as pd
import os

annotation_file = 'Temporal_Anomaly_Annotation_for_Testing_Videos.txt'

# Đọc file bằng pandas, sử dụng khoảng trắng làm dấu phân tách
try:
    df = pd.read_csv(
        annotation_file, 
        delim_whitespace=True,  # Sử dụng khoảng trắng làm dấu tách
        header=None,            # Không có dòng tiêu đề
        names=['video_name', 'label', 'start1', 'end1', 'start2', 'end2'] # Đặt tên cột
    )
    
    print("Đọc file thành công! 5 dòng đầu tiên:")
    print(df.head())
    print("\n" + "="*30 + "\n")

    # Danh sách các clip cần tạo
    clips_to_generate = []

    for index, row in df.iterrows():
        video_name = row['video_name']
        label = row['label']
        
        # Xử lý clip 1
        if row['start1'] != -1:
            clip_info = {
                'source_video': video_name,
                'output_name': f"{video_name.split('.')[0]}_clip1.mp4",
                'label': label,
                'start_frame': row['start1'],
                'end_frame': row['end1']
            }
            clips_to_generate.append(clip_info)
            
        # Xử lý clip 2 (nếu có)
        if row['start2'] != -1:
            clip_info = {
                'source_video': video_name,
                'output_name': f"{video_name.split('.')[0]}_clip2.mp4",
                'label': label,
                'start_frame': row['start2'],
                'end_frame': row['end2']
            }
            clips_to_generate.append(clip_info)
            
        # Xử lý video Normal (không có frame bất thường)
        if row['start1'] == -1 and label == 'Normal':
            clip_info = {
                'source_video': video_name,
                'output_name': video_name, # Giữ nguyên tên
                'label': 'Normal',
                'start_frame': -1, # -1 nghĩa là lấy cả video
                'end_frame': -1
            }
            clips_to_generate.append(clip_info)

    # In ra kế hoạch 10 clip đầu tiên sẽ được tạo
    print("Kế hoạch tạo video clip:")
    for clip in clips_to_generate[:10]:
        print(f"  - Từ video: {clip['source_video']}, Cắt frame: {clip['start_frame']}-{clip['end_frame']}, Nhãn: {clip['label']}, Tên mới: {clip['output_name']}")

    # Bạn có thể lưu 'clips_to_generate' thành 1 file CSV mới sạch sẽ hơn
    clips_df = pd.DataFrame(clips_to_generate)
    clips_df.to_csv('DATA/cleaned_annotations.csv', index=False)
    print(f"\nĐã lưu kế hoạch chi tiết vào 'DATA/cleaned_annotations.csv'")


except FileNotFoundError:
    print(f"Lỗi: Không tìm thấy file '{annotation_file}'. Hãy đảm bảo file này ở cùng thư mục.")
except Exception as e:
    print(f"Đã xảy ra lỗi: {e}")

Đọc file thành công! 5 dòng đầu tiên:
           video_name   label  start1  end1  start2  end2
0   Abuse028_x264.mp4   Abuse     165   240      -1    -1
1   Abuse030_x264.mp4   Abuse    1275  1360      -1    -1
2  Arrest001_x264.mp4  Arrest    1185  1485      -1    -1
3  Arrest007_x264.mp4  Arrest    1530  2160      -1    -1
4  Arrest024_x264.mp4  Arrest    1005  3105      -1    -1


Kế hoạch tạo video clip:
  - Từ video: Abuse028_x264.mp4, Cắt frame: 165-240, Nhãn: Abuse, Tên mới: Abuse028_x264_clip1.mp4
  - Từ video: Abuse030_x264.mp4, Cắt frame: 1275-1360, Nhãn: Abuse, Tên mới: Abuse030_x264_clip1.mp4
  - Từ video: Arrest001_x264.mp4, Cắt frame: 1185-1485, Nhãn: Arrest, Tên mới: Arrest001_x264_clip1.mp4
  - Từ video: Arrest007_x264.mp4, Cắt frame: 1530-2160, Nhãn: Arrest, Tên mới: Arrest007_x264_clip1.mp4
  - Từ video: Arrest024_x264.mp4, Cắt frame: 1005-3105, Nhãn: Arrest, Tên mới: Arrest024_x264_clip1.mp4
  - Từ video: Arrest030_x264.mp4, Cắt frame: 5535-7200, Nhãn: Arrest, Tên m

  df = pd.read_csv(
