In [1]:
# ==============================================================================
# 07_generar_data_experimentos.ipynb
# ==============================================================================
import torch
import shutil
from pathlib import Path
from tqdm import tqdm
import models
import utils
import config

# --- CONFIGURACIÓN ESPECÍFICA ---
CARRIER_TARGET = "Carrier_C4_9435"
TEACHER_ARCH = "resnet50" # El Teacher ganador del C4
DEVICE = torch.device(config.DEVICE)

# Rutas Base
base_results = config.RESULTS_DIR # .../Carrier_C4_9435
unlabeled_dir = config.UNLABELED_DIR
class_names = sorted([p.name for p in config.TRAIN_VAL_DIR.iterdir() if p.is_dir()])

# --- DEFINICIÓN DE EXPERIMENTOS Y UMBRALES ---
# Cada entrada creará una carpeta INDEPENDIENTE con sus propias copias de imágenes.
EXPERIMENTS_DICT = {
    # Exp 3.3: Ablación de Umbral (Validar por qué elegiste 80%)
    "PSEUDO_EXP_3.3_Umb70": 0.70,
    "PSEUDO_EXP_3.3_Umb90": 0.90,
    
    # Exp 3.4: Ablación del Experto (Tu modelo pero SIN tu revisión manual)
    "PSEUDO_EXP_3.4_Auto80": 0.80, 

    # Exp 3.2: Comparativa vs FixMatch (SOTA Automático)
    "PSEUDO_EXP_3.2_FixMatch95": 0.95
}

print(f"--- GENERANDO DATASET AISLADOS PARA AUDITORÍA ---")
print(f"Carrier: {CARRIER_TARGET}")
print(f"Teacher Base: {TEACHER_ARCH}")
print(f"Experimentos a generar: {list(EXPERIMENTS_DICT.keys())}")

# 1. CARGAR EL TEACHER (Solo lectura)
def find_best_teacher_checkpoint(model_arch):
    # Busca la carpeta del teacher_resnet50 existente en RESULTADOS
    candidates = sorted([d for d in base_results.iterdir() if f"teacher_{model_arch}" in d.name])
    if not candidates: raise FileNotFoundError("No se encontró carpeta del Teacher ResNet50")
    return candidates[-1] / "best_model.pth"

ckpt_path = find_best_teacher_checkpoint(TEACHER_ARCH)
print(f"Cargando Pesos Teacher: {ckpt_path.name}")

model = models.make_model(TEACHER_ARCH, len(class_names), resnet_use_pretrain=False)
model.load_state_dict(torch.load(ckpt_path, map_location=DEVICE))
model.to(DEVICE)
model.eval()

# 2. CREAR ESTRUCTURA DE CARPETAS AISLADAS
# Creamos una carpeta raiz separada para no mezclar con la oficial
root_exp_dir = base_results / "EXPERIMENTOS_ABLACION"
if root_exp_dir.exists():
    print("Limpiando carpeta de experimentos previa...")
    shutil.rmtree(root_exp_dir)
root_exp_dir.mkdir()

# Crear subcarpetas para cada experimento y cada clase
for exp_name in EXPERIMENTS_DICT.keys():
    exp_path = root_exp_dir / exp_name
    exp_path.mkdir()
    for cname in class_names:
        (exp_path / cname).mkdir()
    print(f" > Carpeta creada: {exp_path}")

# 3. INFERENCIA Y DISTRIBUCIÓN
unlabeled_images = list(unlabeled_dir.glob("*.png"))
print(f"\nProcesando {len(unlabeled_images)} imágenes sin etiquetar...")

stats = {k: 0 for k in EXPERIMENTS_DICT.keys()}

with torch.no_grad():
    for img_path in tqdm(unlabeled_images, desc="Distribuyendo Data"):
        try:
            # Preprocesamiento
            img_tensor = utils.load_png_gray(img_path)
            # Resize obligatorio para ResNet
            img_tensor = torch.nn.functional.interpolate(
                img_tensor.unsqueeze(0), size=(224, 224), mode="bilinear", align_corners=False
            ).squeeze(0)
            img_tensor = img_tensor.unsqueeze(0).to(DEVICE)

            # Predicción del Teacher
            logits = model(img_tensor)
            probs = torch.softmax(logits, dim=1)
            max_prob, pred_idx = torch.max(probs, dim=1)
            
            confidence = max_prob.item()
            pred_class = class_names[pred_idx.item()]

            # LOGICA DE DISTRIBUCIÓN:
            # Una imagen puede ir a múltiples experimentos si cumple sus umbrales individuales.
            # Cada experimento es un universo aislado.
            for exp_name, threshold in EXPERIMENTS_DICT.items():
                if confidence >= threshold:
                    # Copiamos la imagen a la carpeta específica de ESE experimento
                    dest = root_exp_dir / exp_name / pred_class / img_path.name
                    shutil.copy(str(img_path), str(dest))
                    stats[exp_name] += 1

        except Exception as e:
            print(f"Error en {img_path.name}: {e}")

print("\n--- RESUMEN DE GENERACIÓN (AUDITORÍA) ---")
for exp_name, count in stats.items():
    print(f"[{exp_name}] (Umbral >={EXPERIMENTS_DICT[exp_name]}): {count} imágenes generadas.")

print(f"\n✅ Datos listos en: {root_exp_dir}")
print("Tu carpeta 'PSEUDO' original NO ha sido tocada.")

--- GENERANDO DATASET AISLADOS PARA AUDITORÍA ---
Carrier: Carrier_C4_9435
Teacher Base: resnet50
Experimentos a generar: ['PSEUDO_EXP_3.3_Umb70', 'PSEUDO_EXP_3.3_Umb90', 'PSEUDO_EXP_3.4_Auto80', 'PSEUDO_EXP_3.2_FixMatch95']
Cargando Pesos Teacher: best_model.pth


  model.load_state_dict(torch.load(ckpt_path, map_location=DEVICE))


 > Carpeta creada: D:\Python\RF_INTERF_4G\RESULTADOS\Carrier_C4_9435\EXPERIMENTOS_ABLACION\PSEUDO_EXP_3.3_Umb70
 > Carpeta creada: D:\Python\RF_INTERF_4G\RESULTADOS\Carrier_C4_9435\EXPERIMENTOS_ABLACION\PSEUDO_EXP_3.3_Umb90
 > Carpeta creada: D:\Python\RF_INTERF_4G\RESULTADOS\Carrier_C4_9435\EXPERIMENTOS_ABLACION\PSEUDO_EXP_3.4_Auto80
 > Carpeta creada: D:\Python\RF_INTERF_4G\RESULTADOS\Carrier_C4_9435\EXPERIMENTOS_ABLACION\PSEUDO_EXP_3.2_FixMatch95

Procesando 4285 imágenes sin etiquetar...


Distribuyendo Data: 100%|██████████████████████████████████████████████████████████| 4285/4285 [01:02<00:00, 68.34it/s]


--- RESUMEN DE GENERACIÓN (AUDITORÍA) ---
[PSEUDO_EXP_3.3_Umb70] (Umbral >=0.7): 3713 imágenes generadas.
[PSEUDO_EXP_3.3_Umb90] (Umbral >=0.9): 3081 imágenes generadas.
[PSEUDO_EXP_3.4_Auto80] (Umbral >=0.8): 3442 imágenes generadas.
[PSEUDO_EXP_3.2_FixMatch95] (Umbral >=0.95): 2725 imágenes generadas.

✅ Datos listos en: D:\Python\RF_INTERF_4G\RESULTADOS\Carrier_C4_9435\EXPERIMENTOS_ABLACION
Tu carpeta 'PSEUDO' original NO ha sido tocada.



