In [1]:
import os
import shutil
import random

def split_dataset(input_folder, output_folder, train_ratio=0.8, valid_ratio=0.1, test_ratio=0.1):
    # Crear la carpeta de salida si no existe
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # Listar los archivos en la carpeta de imágenes
    image_files = [f for f in os.listdir(os.path.join(input_folder, 'imagenes')) if f.lower().endswith(('.jpg', '.png'))]

    # Mezclar los nombres de los archivos para distribuir aleatoriamente
    random.shuffle(image_files)

    # Calcular los índices para dividir el dataset
    total_files = len(image_files)
    train_split = int(total_files * train_ratio)
    valid_split = int(total_files * (train_ratio + valid_ratio))

    # Dividir los archivos en conjuntos de train, valid y test
    train_files = image_files[:train_split]
    valid_files = image_files[train_split:valid_split]
    test_files = image_files[valid_split:]

    # Definir las carpetas de salida
    output_train_folder = os.path.join(output_folder, 'train')
    output_valid_folder = os.path.join(output_folder, 'valid')
    output_test_folder = os.path.join(output_folder, 'test')

    # Copiar archivos de imágenes y etiquetas a las carpetas de salida
    for dataset, output_dataset_folder in [(train_files, output_train_folder),
                                           (valid_files, output_valid_folder),
                                           (test_files, output_test_folder)]:
        # Crear carpetas de imágenes y etiquetas
        os.makedirs(os.path.join(output_dataset_folder, 'imagenes'))
        os.makedirs(os.path.join(output_dataset_folder, 'etiquetas'))

        for filename in dataset:
            # Copiar archivos de imágenes
            image_source_path = os.path.join(input_folder, 'imagenes', filename)
            image_dest_path = os.path.join(output_dataset_folder, 'imagenes', filename)
            shutil.copyfile(image_source_path, image_dest_path)

            # Copiar archivos de etiquetas
            label_source_path = os.path.join(input_folder, 'etiquetas', filename.replace(os.path.splitext(filename)[1], '.txt'))
            label_dest_path = os.path.join(output_dataset_folder, 'etiquetas', filename.replace(os.path.splitext(filename)[1], '.txt'))
            shutil.copyfile(label_source_path, label_dest_path)

if __name__ == "__main__":
    input_folder = r"C:\Users\nelsongomez\Desktop\detectores yolo\dataset\dataset"
    output_folder = r"C:\Users\nelsongomez\Desktop\detectores yolo\dataset\dataset_nas"
    split_dataset(input_folder, output_folder)