In [1]:
import os

def check_label(label_file):
  """
  Kiểm tra xem file label .txt có chứa dữ liệu nhãn hay không.
  """
  with open(label_file, 'r') as f:
    lines = f.readlines()
    if lines:  # Kiểm tra xem danh sách lines có rỗng hay không
      return True  # File label có chứa dữ liệu
    else:
      return False  # File label trống

In [4]:
import os

def delete_unwanted_files(label_dir, image_dir):
  """
  Xóa các file label và ảnh không chứa lửa hoặc khói.
  """
  for filename in os.listdir(label_dir):
    if filename.endswith(".txt"):
      label_file = os.path.join(label_dir, filename)
      if not check_label(label_file):
        # Xóa file label
        os.remove(label_file)
        # Xóa ảnh tương ứng
        image_file = os.path.join(image_dir, filename[:-4] + ".jpg")  # Thay đổi đuôi file nếu cần
        os.remove(image_file)

# Sử dụng hàm
label_dir = "E:/AI_Projects/Fire_Detection/train - Copy - Copy/labels"
image_dir = "E:/AI_Projects/Fire_Detection/train - Copy - Copy/images"
delete_unwanted_files(label_dir, image_dir)

In [21]:
import os
import shutil
import random

def split_data(data_dir, train_ratio=0.8, seed = 42):
  """
  Chia tập dữ liệu thành tập huấn luyện và tập xác thực.

  Args:
      data_dir: Đường dẫn đến thư mục chứa dữ liệu.
      train_ratio: Tỷ lệ dữ liệu được dùng cho tập huấn luyện (ví dụ: 0.8 cho 80%).

  Returns:
      None.
  """

  # Tạo thư mục cho tập huấn luyện và tập xác thực
  train_dir = os.path.join(data_dir, 'train_4')
  valid_dir = os.path.join(data_dir, 'valid_4')
  os.makedirs(train_dir, exist_ok=True)
  os.makedirs(valid_dir, exist_ok=True)

  # Lấy danh sách các file ảnh
  image_files = [f for f in os.listdir(data_dir) if f.endswith('.jpg')]
  label_files = [f for f in os.listdir(data_dir) if f.endswith('.txt')]

  # Xáo trộn danh sách file ảnh
  random.seed(seed)
  random.shuffle(image_files)
  random.shuffle(label_files)

  # Chia danh sách file ảnh thành tập huấn luyện và tập xác thực
  train_count = int(len(image_files) * train_ratio)
  train_image_files = image_files[:train_count]
  valid_image_files = image_files[train_count:]
  train_count = int(len(label_files) * train_ratio)
  train_labels = label_files[:train_count]
  valid_labels = label_files[train_count:]

  # Di chuyển file ảnh vào thư mục tương ứng
  for image_file in train_image_files:
    shutil.move(os.path.join(data_dir, image_file), os.path.join(train_dir, image_file))

  for image_file in valid_image_files:
    shutil.move(os.path.join(data_dir, image_file), os.path.join(valid_dir, image_file))
  
  for image_file in train_labels:
    shutil.move(os.path.join(data_dir, image_file), os.path.join(train_dir, image_file))

  for image_file in valid_labels:
    shutil.move(os.path.join(data_dir, image_file), os.path.join(valid_dir, image_file))

# Ví dụ sử dụng
data_dir = "E:/AI_Projects/Fire_Detection/train - Copy - Copy/images"
split_data(data_dir)

In [23]:
import os
import shutil
import random

def split_data(data_dir, train_ratio=0.8, seed=42):
  """
  Chia tập dữ liệu thành tập huấn luyện và tập xác thực.

  Args:
      data_dir: Đường dẫn đến thư mục chứa dữ liệu.
      train_ratio: Tỷ lệ dữ liệu được dùng cho tập huấn luyện (ví dụ: 0.8 cho 80%).
      seed: Số hạt giống để xáo trộn dữ liệu ngẫu nhiên.

  Returns:
      None.
  """

  # Tạo thư mục cho tập huấn luyện và tập xác thực
  train_dir = os.path.join(data_dir, 'train_4')
  valid_dir = os.path.join(data_dir, 'valid_4')
  os.makedirs(train_dir, exist_ok=True)
  os.makedirs(valid_dir, exist_ok=True)

  # Lấy danh sách các file ảnh
  image_files = [f for f in os.listdir(data_dir) if f.endswith('.jpg')]
  label_files = [f for f in os.listdir(data_dir) if f.endswith('.txt')]

  # Xáo trộn danh sách file ảnh
  random.seed(seed)
  random.shuffle(image_files)
  random.shuffle(label_files)

  # Chia danh sách file ảnh thành tập huấn luyện và tập xác thực
  train_count = int(len(image_files) * train_ratio)
  train_image_files = image_files[:train_count]
  valid_image_files = image_files[train_count:]

  # Di chuyển file ảnh vào thư mục tương ứng
  for image_file in train_image_files:
    # Tìm tên file label tương ứng
    label_file = image_file[:-4] + '.txt' 
    if label_file in label_files:
      shutil.move(os.path.join(data_dir, image_file), os.path.join(train_dir, image_file))
      shutil.move(os.path.join(data_dir, label_file), os.path.join(train_dir, label_file))

  for image_file in valid_image_files:
    # Tìm tên file label tương ứng
    label_file = image_file[:-4] + '.txt' 
    if label_file in label_files:
      shutil.move(os.path.join(data_dir, image_file), os.path.join(valid_dir, image_file))
      shutil.move(os.path.join(data_dir, label_file), os.path.join(valid_dir, label_file))

# Ví dụ sử dụng
data_dir = "E:/AI_Projects/Fire_Detection/train - Copy - Copy/images"
split_data(data_dir)