In [1]:
import os
import shutil
import random
from pathlib import Path
from tqdm import tqdm

# --- CONFIGURACIÓN PRINCIPAL ---

# Semilla aleatoria para que la división sea REPRODUCIBLE
RANDOM_STATE = 42
random.seed(RANDOM_STATE)

# =============================================================================
# IMPORTANTE: REVISA ESTAS RUTAS
# =============================================================================

# 1. RUTA_ORIGEN: Tu data original (NO SE MODIFICARÁ)
# Basado en tu imagen "image_584b62.png":
RUTA_ORIGEN = Path(r"D:\Python\RF_INTERF_4G\MUESTRAS_ini")

# 2. RUTA_DESTINO: Tu carpeta para el experimento (AQUÍ SE CREARÁN COPIAS)
# Basado en tu imagen "image_592c06.png":
RUTA_DESTINO = Path(r"D:\Python\RF_INTERF_4G\DATA\experimento_baselines")

# 3. Nombres de las carpetas de carrier a procesar
CARRIER_NAMES = [
    "Carrier_C1_675",
    "Carrier_C2_2825",
    "Carrier_C3_2975",
    "Carrier_C4_9435"
]

# 4. Nombres de las carpetas de destino que se crearán
TRAIN_FOLDER_NAME = "train_set_70"
TEST_FOLDER_NAME = "test_set_15"

# 5. Número de muestras para el set de entrenamiento (70% de 50 es 35)
TRAIN_COUNT = 35

# 6. Carpetas que el script debe ignorar al buscar clases
IGNORE_DIRS = [
    "SIN_CLASIFICAR",
    TRAIN_FOLDER_NAME,
    TEST_FOLDER_NAME,
    "validation_set_15"
]

def split_files_for_carrier(src_carrier_path: Path, dest_carrier_path: Path):
    """
    Procesa un carrier: lee de src_carrier_path, encuentra las clases
    (50 muestras/clase) y COPIA los archivos divididos a dest_carrier_path.
    """
    
    print(f"\n--- Procesando Carrier: {src_carrier_path.name} ---")
    
    # 1. Crear las carpetas de destino (ej. .../experimento_baselines/Carrier_C1_675/)
    os.makedirs(dest_carrier_path, exist_ok=True)
    train_dest_root = dest_carrier_path / TRAIN_FOLDER_NAME
    test_dest_root = dest_carrier_path / TEST_FOLDER_NAME
    os.makedirs(train_dest_root, exist_ok=True)
    os.makedirs(test_dest_root, exist_ok=True)
    
    # 2. Encontrar todas las carpetas de CLASE en el ORIGEN
    try:
        class_dirs = [
            d for d in src_carrier_path.iterdir() 
            if d.is_dir() and d.name not in IGNORE_DIRS
        ]
    except FileNotFoundError:
        print(f"  [ERROR] ¡La carpeta de origen {src_carrier_path} no existe! Saltando.")
        return

    if not class_dirs:
        print(f"  [ADVERTENCIA] No se encontraron carpetas de clases en {src_carrier_path.name}")
        return

    print(f"  Se encontraron {len(class_dirs)} clases. Iniciando copia y división...")

    # 3. Iterar sobre cada carpeta de CLASE (ej. ARM_ANCHO)
    for class_dir in tqdm(class_dirs, desc="  Procesando clases"):
        class_name = class_dir.name
        
        # 4. Crear las subcarpetas de destino (ej. .../train_set_70/ARM_ANCHO/)
        dest_train_class = train_dest_root / class_name
        dest_test_class = test_dest_root / class_name
        os.makedirs(dest_train_class, exist_ok=True)
        os.makedirs(dest_test_class, exist_ok=True)
        
        # 5. Encontrar todas las imágenes en la carpeta de ORIGEN
        image_files = list(class_dir.glob('*.png')) + \
                      list(class_dir.glob('*.jpg')) + \
                      list(class_dir.glob('*.jpeg'))
        
        if not image_files:
            print(f"  [INFO] Clase de origen '{class_name}' está vacía. Saltando.")
            continue
            
        total_files = len(image_files)
        
        # 6. Mezclar aleatoriamente los archivos
        random.shuffle(image_files)
        
        # 7. Dividir la lista de archivos
        files_for_train = image_files[:TRAIN_COUNT]
        files_for_test = image_files[TRAIN_COUNT:]
        
        # 8. COPIAR los archivos a TRAIN
        for file_path in files_for_train:
            try:
                # La diferencia clave: shutil.copy()
                shutil.copy(str(file_path), str(dest_train_class))
            except Exception as e:
                print(f"  Error copiando {file_path.name}: {e}")
                
        # 9. COPIAR los archivos a TEST
        for file_path in files_for_test:
            try:
                # La diferencia clave: shutil.copy()
                shutil.copy(str(file_path), str(dest_test_class))
            except Exception as e:
                print(f"  Error copiando {file_path.name}: {e}")
        
        tqdm.write(
            f"  Clase '{class_name}': {total_files} imgs -> "
            f"COPIADAS {len(files_for_train)} a TRAIN, {len(files_for_test)} a TEST."
        )

def main():
    """
    Función principal que ejecuta el "for" sobre los carriers.
    """
    print("="*60)
    print("INICIANDO SCRIPT DE COPIA Y DIVISIÓN DE DATOS")
    print(f"LEYENDO DE: {RUTA_ORIGEN} (Datos originales INTACTOS)")
    print(f"ESCRIBIENDO EN: {RUTA_DESTINO} (Nuevas carpetas de experimento)")
    print("="*60)
    
    # El "for" que solicitaste
    for carrier_name in CARRIER_NAMES:
        src_path = RUTA_ORIGEN / carrier_name
        dest_path = RUTA_DESTINO / carrier_name
        
        split_files_for_carrier(src_path, dest_path)
        
    print("\n" + "="*60)
    print("¡PROCESO COMPLETADO!")
    print(f"Tus carpetas 'train_set_70' y 'test_set_15' están listas en:")
    print(f"{RUTA_DESTINO}")
    print("Tu carpeta original MUESTRAS_ini no ha sido modificada.")
    print("="*60)

if __name__ == "__main__":
    main()

INICIANDO SCRIPT DE COPIA Y DIVISIÓN DE DATOS
LEYENDO DE: D:\Python\RF_INTERF_4G\MUESTRAS_ini (Datos originales INTACTOS)
ESCRIBIENDO EN: D:\Python\RF_INTERF_4G\DATA\experimento_baselines (Nuevas carpetas de experimento)

--- Procesando Carrier: Carrier_C1_675 ---
  Se encontraron 4 clases. Iniciando copia y división...


  Procesando clases:  75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                             | 3/4 [00:00<00:00, 21.29it/s]

  Clase 'ARM_ANCHO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'ARM_DELGADO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'PIM_OTRO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.


  Procesando clases: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 21.29it/s]


  Clase 'TINA': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.

--- Procesando Carrier: Carrier_C2_2825 ---
  Se encontraron 5 clases. Iniciando copia y división...


  Procesando clases:  60%|████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                        | 3/5 [00:00<00:00, 19.00it/s]

  Clase 'ARM_DELGADO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'MW': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'PIM_OTRO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.


  Procesando clases:  60%|████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                        | 3/5 [00:00<00:00, 19.00it/s]

  Clase 'TINA': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.


  Procesando clases: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 19.93it/s]


  Clase 'WIFI': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.

--- Procesando Carrier: Carrier_C3_2975 ---
  Se encontraron 5 clases. Iniciando copia y división...


  Procesando clases:  60%|████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                        | 3/5 [00:00<00:00, 22.91it/s]

  Clase 'ARM_DELGADO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'MW': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'PIM_OTRO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.


  Procesando clases: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 22.64it/s]


  Clase 'TINA': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'WIFI': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.

--- Procesando Carrier: Carrier_C4_9435 ---
  Se encontraron 6 clases. Iniciando copia y división...


  Procesando clases:  50%|██████████████████████████████████████████████████████████████████████████████████████████                                                                                          | 3/6 [00:00<00:00, 24.40it/s]

  Clase 'ARM_ANCHO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'ARM_DELGADO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'CADI_720': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.


  Procesando clases:  50%|██████████████████████████████████████████████████████████████████████████████████████████                                                                                          | 3/6 [00:00<00:00, 24.40it/s]

  Clase 'CADI_722': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.
  Clase 'PIM_OTRO': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.


  Procesando clases: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00, 25.12it/s]

  Clase 'TINA': 50 imgs -> COPIADAS 35 a TRAIN, 15 a TEST.

¡PROCESO COMPLETADO!
Tus carpetas 'train_set_70' y 'test_set_15' están listas en:
D:\Python\RF_INTERF_4G\DATA\experimento_baselines
Tu carpeta original MUESTRAS_ini no ha sido modificada.



