In [1]:
import torch
import torch.nn as nn
import numpy as np
import os
from PIL import Image
import matplotlib.pyplot as plt
import torchvision.transforms as T
import time

# FeatUp utilities
from featup.util import norm, unnorm
from featup.plotting import plot_feats

from sklearn.neighbors import NearestNeighbors
from sklearn.metrics.pairwise import euclidean_distances
import torch.nn.functional as F
from scipy.ndimage import gaussian_filter
from scipy.stats import median_abs_deviation

# Anomaly region detection and visualization
from skimage import measure
import matplotlib.patches as patches

# SAM2 imports
from sam2.build_sam import build_sam2
from sam2.automatic_mask_generator import SAM2AutomaticMaskGenerator
from sam2.sam2_image_predictor import SAM2ImagePredictor
import cv2

# PCA for manual visualization
from sklearn.decomposition import PCA

# --- Configuración ---
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
input_size = 224  # DINOv2 input size
BACKBONE_PATCH_SIZE = 14  # DINOv2 ViT-S/14 patch size
use_norm = True

H_prime = input_size // BACKBONE_PATCH_SIZE
W_prime = input_size // BACKBONE_PATCH_SIZE

# Directorios
TRAIN_GOOD_DIR = '/home/imercatoma/FeatUp/datasets/mvtec_anomaly_detection/hazelnut/train/good'
PLOT_SAVE_ROOT_DIR = '/home/imercatoma/FeatUp/plots_final_eval/cut/cut_006'
# --- Imagen de Consulta ---
query_image_path = '/home/imercatoma/FeatUp/datasets/mvtec_anomaly_detection/hazelnut/test/cut/006.png'
# IMPORTANT: You'll need the ground truth mask for pixel-level evaluation
# Assuming the ground truth mask follows MVTec AD dataset structure:
# 'test/cut/006.png' -> 'ground_truth/cut/006_mask.png'
gt_mask_path = query_image_path.replace('test', 'ground_truth').replace('.png', '_mask.png')
print(f"Ground Truth Mask Path: {gt_mask_path}")


os.makedirs(PLOT_SAVE_ROOT_DIR, exist_ok=True)

HEATMAPS_SAVE_DIR = os.path.join(PLOT_SAVE_ROOT_DIR, 'individual_heatmaps')
os.makedirs(HEATMAPS_SAVE_DIR, exist_ok=True)

ANOMALY_REGIONS_SAVE_DIR = os.path.join(PLOT_SAVE_ROOT_DIR, 'detected_anomaly_regions')
os.makedirs(ANOMALY_REGIONS_SAVE_DIR, exist_ok=True)

FEATUP_PLOTS_DIR = os.path.join(PLOT_SAVE_ROOT_DIR, 'featup_feature_plots')
os.makedirs(FEATUP_PLOTS_DIR, exist_ok=True)

# Coreset file paths
core_bank_filenames_file = os.path.join(TRAIN_GOOD_DIR, 'core_bank_filenames.pt')
coreset_relevant_flat_features_bank_file = os.path.join(TRAIN_GOOD_DIR, 'coreset_relevant_flat_features_bank.pt')
template_features_bank_coreset_file = os.path.join(TRAIN_GOOD_DIR, 'template_features_bank_coreset.pt')

# --- Cargar Datos del Coreset ---
print("Cargando datos del coreset...")
try:
    coreset_relevant_filenames = torch.load(core_bank_filenames_file)
    coreset_relevant_flat_features_bank = torch.load(coreset_relevant_flat_features_bank_file).to(device)
    coreset_features = torch.load(template_features_bank_coreset_file).to(device)
    print(f"Coreset cargado. Dimensión: {coreset_features.shape}")
except Exception as e:
    print(f"ERROR al cargar archivos del coreset: {e}. Asegúrate de que la Etapa 1 se ejecutó.")
    exit()

# Mover coreset a CPU para sklearn's NearestNeighbors
coreset_features_cpu = coreset_features.cpu().numpy()
# se calcula la distancia coseno == 1 - similitud coseno [0,1] 0 identico, 1 completamente diferente
nn_finder = NearestNeighbors(n_neighbors=1, algorithm='brute', metric='cosine').fit(coreset_features_cpu)
print("NearestNeighbors finder inicializado.")

# --- Cargar Modelo DINOv2 ---
print("Cargando modelo DINOv2...")
featup_local_path = "/home/imercatoma/FeatUp"
upsampler = torch.hub.load(featup_local_path, 'dinov2', use_norm=use_norm, source='local').to(device)

dinov2_model = upsampler.model
dinov2_model.eval()
print("Modelo DINOv2 cargado.")

# --- Transformación de Imagen ---
transform = T.Compose([
    T.Resize(input_size),
    T.CenterCrop((input_size, input_size)),
    T.ToTensor(),
    norm
])

# --- Carga del Modelo SAM2 ---
print(f"Cargando modelo SAM2 desde /home/imercatoma/sam2_repo_independent/checkpoints/sam2.1_hiera_small.pt...")
checkpoint = "/home/imercatoma/sam2_repo_independent/checkpoints/sam2.1_hiera_small.pt"
model_cfg_name = "configs/sam2.1/sam2.1_hiera_s.yaml"
sam2_model = build_sam2(model_cfg_name, checkpoint, device=device, apply_postprocessing=True)
sam2_model.eval()
print("Modelo SAM2 cargado.")

base_image_name = os.path.basename(query_image_path)
print(f"\n--- Procesando imagen: {base_image_name} ---")

query_img_pil = Image.open(query_image_path).convert("RGB")
input_tensor = transform(query_img_pil).unsqueeze(0).to(device)

with torch.no_grad():
    features_lr = dinov2_model(input_tensor)

query_lr_features = features_lr

# --- Función para buscar imágenes similares usando KNN ---
def buscar_imagenes_similares_knn(query_feature_map, pre_flattened_features_bank, k=3, nombres_archivos=None):
    query_feat_flatten = query_feature_map.flatten().cpu().numpy()
    features_bank_for_knn = pre_flattened_features_bank.cpu().numpy() if isinstance(pre_flattened_features_bank, torch.Tensor) else pre_flattened_features_bank

    start_time_knn_dist = time.time()
    distances = euclidean_distances([query_feat_flatten], features_bank_for_knn)
    nearest_indices = np.argsort(distances[0])[:k]
    end_time_knn_dist = time.time()
    print(f"Tiempo para calcular distancias KNN: {end_time_knn_dist - start_time_knn_dist:.4f} segundos")

    imagenes_similares = []
    rutas_imagenes_similares = []
    if nombres_archivos:
        for idx in nearest_indices:
            imagenes_similares.append(nombres_archivos[idx])
            rutas_imagenes_similares.append(os.path.join(TRAIN_GOOD_DIR, nombres_archivos[idx]))
    else: # Fallback if no filenames provided (less common for this use case)
        for idx in nearest_indices:
            imagenes_similares.append(f"Imagen_Banco_{idx:03d}.png")
            rutas_imagenes_similares.append(os.path.join(TRAIN_GOOD_DIR, f"Imagen_Banco_{idx:03d}.png"))
    return imagenes_similares, rutas_imagenes_similares, end_time_knn_dist

# --- Búsqueda KNN ---
print("\nBuscando imágenes similares usando el banco pre-aplanado del Coreset...")
imagenes_similares, rutas_imagenes_similares, time_knn_dist = buscar_imagenes_similares_knn(
    query_lr_features, coreset_relevant_flat_features_bank, nombres_archivos=coreset_relevant_filenames
)

# --- Aplicar FeatUp para obtener características de alta resolución ---
def apply_featup_hr(image_path, featup_upsampler, image_transform, device):
    image_pil = Image.open(image_path).convert("RGB")
    image_tensor = image_transform(image_pil).unsqueeze(0).to(device)
    with torch.no_grad():
        lr_feats = featup_upsampler.model(image_tensor)
        hr_feats = featup_upsampler(image_tensor)
    return lr_feats.cpu(), hr_feats.cpu()

# Características de la imagen de consulta
input_query_tensor_original = transform(Image.open(query_image_path).convert("RGB")).unsqueeze(0).to(device)
query_lr_feats_featup, query_hr_feats = apply_featup_hr(query_image_path, upsampler, transform, device)

# Características de las imágenes similares
similar_hr_feats_list = []
for j, similar_image_path in enumerate(rutas_imagenes_similares):
    input_similar_tensor_original = transform(Image.open(similar_image_path).convert("RGB")).unsqueeze(0).to(device)
    similar_lr_feats, similar_hr_feats = apply_featup_hr(similar_image_path, upsampler, transform, device)
    similar_hr_feats_list.append(similar_hr_feats)

################################
### Aplicando Máscaras SAM query y similares

def show_mask(mask, ax, random_color=False, borders=True):
    color = np.concatenate([np.random.random(3), np.array([0.6])], axis=0) if random_color else np.array([30/255, 144/255, 255/255, 0.6])
    h, w = mask.shape[-2:]
    mask_image_alpha = np.zeros((h, w, 4), dtype=np.float32)
    mask_image_alpha[mask > 0] = color
    if borders:
        mask_uint8 = mask.astype(np.uint8) * 255
        contours, _ = cv2.findContours(mask_uint8, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)
        contour_image = np.zeros((h, w, 3), dtype=np.uint8)
        cv2.drawContours(contour_image, contours, -1, (255, 255, 255), thickness=2)
        contour_mask = (contour_image.astype(np.float32) / 255.0).sum(axis=-1) > 0
        mask_image_alpha[contour_mask > 0, :3] = 1.0
        mask_image_alpha[contour_mask > 0, 3] = 0.5
    ax.imshow(mask_image_alpha)

def process_masks_with_hierarchy(image, masks, output_dir, filename_prefix, overlap_threshold=0.8):
    os.makedirs(output_dir, exist_ok=True)
    
    final_processed_masks_data = [] 
    original_mask_segments_for_comparison = [mask_data["segmentation"] for mask_data in masks]

    print(f"Procesando jerárquicamente {len(masks)} máscaras...")

    for i, mask_data_a_original in enumerate(masks): 
        mask_data_a_processed = mask_data_a_original.copy() 
        mask_a_current_processing = np.copy(mask_data_a_original["segmentation"]) 

        is_completely_internal_to_another = False 
        potential_holes_for_mask_a = [] 

        for j, mask_data_b_comparison in enumerate(masks): 
            if i == j:
                continue

            mask_b = original_mask_segments_for_comparison[j] 

            if np.sum(mask_a_current_processing) > 0 and np.all(np.logical_and(mask_a_current_processing, mask_b) == mask_a_current_processing):
                is_completely_internal_to_another = True
                break 

            intersection_ab = np.logical_and(mask_b, mask_a_current_processing)
            area_b = np.sum(mask_b)
            area_intersection_ab = np.sum(intersection_ab)

            if area_b > 0 and (np.all(intersection_ab == mask_b) or \
                               (area_intersection_ab / area_b > overlap_threshold and area_intersection_ab > 0)):
                if np.sum(mask_b) < np.sum(mask_a_current_processing) * 0.9: 
                    potential_holes_for_mask_a.append(mask_b)

        if is_completely_internal_to_another:
            display_title = f'Máscara {i + 1} (Interna - Sin cambios significativos)'
        else:
            hollowed = False
            for hole_mask in potential_holes_for_mask_a:
                mask_a_current_processing = np.logical_and(mask_a_current_processing, np.logical_not(hole_mask))
                hollowed = True
            
            mask_data_a_processed["segmentation"] = mask_a_current_processing 
            if hollowed:
                display_title = f'Máscara {i + 1} (Externa - Hueca)'
            else:
                display_title = f'Máscara {i + 1} (Externa - Sin huecos significativos)'

        final_processed_masks_data.append(mask_data_a_processed) 

        plt.figure(figsize=(8, 8))
        plt.imshow(image) 
        show_mask(mask_data_a_processed["segmentation"], plt.gca(), random_color=True) 
        plt.axis('off')
        plt.title(display_title)
        
        output_path = os.path.join(output_dir, f"{filename_prefix}_processed_mask_{i + 1}.png")
        plt.savefig(output_path, bbox_inches='tight')
        plt.close()
        print(f"Máscara procesada {i + 1} guardada en: {output_path}")

    print("Procesamiento jerárquico de máscaras completado.")
    return final_processed_masks_data 

def apply_morphological_closing(masks_list, kernel_size=5):
    if not masks_list:
        return masks_list
    kernel = np.ones((kernel_size, kernel_size), np.uint8)
    print(f"Aplicando cierre morfológico con kernel {kernel_size}x{kernel_size}...")
    for mask_data in masks_list:
        mask_boolean = mask_data['segmentation']
        mask_np_255 = (mask_boolean * 255).astype(np.uint8)
        mask_smoothed_np = cv2.morphologyEx(mask_np_255, cv2.MORPH_CLOSE, kernel)
        mask_data['segmentation'] = (mask_smoothed_np > 0).astype(bool)
    print("Suavizado de máscaras completado.")
    return masks_list

def apply_morphological_opening(masks_list, kernel_size=5):
    if not masks_list:
        print("La lista de máscaras está vacía, no se aplica la apertura morfológica.")
        return masks_list
    
    kernel = np.ones((kernel_size, kernel_size), np.uint8)
    print(f"Aplicando apertura morfológica con kernel {kernel_size}x{kernel_size}...")
    
    for mask_data in masks_list:
        mask_boolean = mask_data['segmentation']
        if mask_boolean.dtype != bool:
            mask_boolean = mask_boolean.astype(bool)

        mask_np_255 = (mask_boolean * 255).astype(np.uint8)
        mask_processed_np = cv2.morphologyEx(mask_np_255, cv2.MORPH_OPEN, kernel)
        mask_data['segmentation'] = (mask_processed_np > 0).astype(bool)
        
    print("Suavizado (apertura) de máscaras completado.")
    return masks_list

try:
    image_for_sam_np = np.array(Image.open(query_image_path).convert("RGB"))
    print(f"Dimensiones imagen SAM: {image_for_sam_np.shape}")
except Exception as e:
    print(f"Error procesando imagen para SAM: {e}. Saltando SAM.")
    sam2_model = None
    
PROCESSED_MASKS_DIR = os.path.join(PLOT_SAVE_ROOT_DIR, "processed_masks")

if sam2_model is not None:
    points_grid_density = 8
    min_mask_area_pixels =  80000.0
    max_mask_area_pixels = 450000.0

    mask_generator_query = SAM2AutomaticMaskGenerator(
        model=sam2_model,
        points_per_side=points_grid_density,
        points_per_batch=256,
        pred_iou_thresh=0.9,
        stability_score_thresh=0.9,
        crop_n_layers=0,
        min_mask_region_area=min_mask_area_pixels,
    )

    print(f"Generando máscaras para consulta con grid de {points_grid_density}x{points_grid_density} puntos...")
    masks_data_query_image = mask_generator_query.generate(image_for_sam_np)
        
    print(f"Número de máscaras generadas para la imagen de consulta: {len(masks_data_query_image)}")

    mask_generator_similar = SAM2AutomaticMaskGenerator( 
        model=sam2_model,
        points_per_side=points_grid_density,
        points_per_batch=256,
        pred_iou_thresh=0.9,
        stability_score_thresh=0.9,
        crop_n_layers=0,
        min_mask_region_area=min_mask_area_pixels,
    )

    print("\nGenerando máscaras SAM para imágenes similares...")
    similar_masks_raw_list = []
    # Initialize start_time_sam here, outside the loop
    start_time_sam = time.time()
    for j, similar_image_path in enumerate(rutas_imagenes_similares):
        try:
            image_np_similar_for_sam = np.array(Image.open(similar_image_path).convert('RGB'))
            print(f"--- Procesando vecino {j+1}: {os.path.basename(similar_image_path)} ---")
            current_similar_masks_data = mask_generator_similar.generate(image_np_similar_for_sam)
            processed_masks_similar = process_masks_with_hierarchy(image_np_similar_for_sam, current_similar_masks_data, PROCESSED_MASKS_DIR, f"similar_{j+1}")
            similar_masks_raw_list.append(processed_masks_similar)
            print(f"Máscaras generadas para vecino {j+1}: {len(current_similar_masks_data)}.")
            
        except Exception as e:
            print(f"Error procesando imagen similar {os.path.basename(similar_image_path)} para SAM: {e}")

    end_time_sam = time.time()
    print(f"Tiempo total de ejecución de SAM: {end_time_sam - start_time_sam:.4f} segundos.")

print("\nAnálisis de detección de anomalías para una sola imagen completado.")

# Llamar a la función para procesar las máscaras de la query
processed_masks_query = process_masks_with_hierarchy(image_for_sam_np, masks_data_query_image, PROCESSED_MASKS_DIR, "query")
masks_data_query_image = processed_masks_query
print("Shape de masks_data_query_image:", len(masks_data_query_image))

#####################

# --- Implementación del punto 3.4.3. Object Feature Map ---
def process_masks_to_object_feature_maps(raw_masks, hr_feature_map, target_h, target_w, sam_processed_image_shape):
    if not raw_masks:
        print("Advertencia: No se encontraron máscaras para procesar. Devolviendo tensores vacíos.")
        C_dim = hr_feature_map.shape[0] if hr_feature_map.ndim >= 3 else 0
        return torch.empty(0, C_dim, target_h, target_w, device=hr_feature_map.device), \
               torch.empty(0, 1, target_h, target_w, device=hr_feature_map.device)

    object_feature_maps_list = []
    scaled_mask_append = []
    C_dim = hr_feature_map.shape[0] 

    for mask_info in raw_masks:
        mask_np = mask_info['segmentation'].astype(np.float32)
        mask_tensor_original_res = torch.from_numpy(mask_np).unsqueeze(0).unsqueeze(0) 
        mask_tensor_original_res = mask_tensor_original_res.to(hr_feature_map.device)

        scaled_mask = F.interpolate(mask_tensor_original_res,
                                     size=(target_h, target_w),
                                     mode='bilinear',
                                     align_corners=False)
        scaled_mask = (scaled_mask > 0.5).float()
        scaled_mask_append.append(scaled_mask)
        
        if hr_feature_map.ndim == 3:
            hr_feature_map_with_batch = hr_feature_map.unsqueeze(0) 
        else: 
            hr_feature_map_with_batch = hr_feature_map

        object_feature_map_i = scaled_mask * hr_feature_map_with_batch
        object_feature_maps_list.append(object_feature_map_i)

    final_object_feature_maps = torch.cat(object_feature_maps_list, dim=0) 
    final_scaled_masks = torch.cat(scaled_mask_append, dim=0)
    
    return final_object_feature_maps, final_scaled_masks

# --- Visualización de Mapas de Características de Objeto ---
def visualize_object_feature_map(original_image_path, sam_mask_info, hr_feature_map_tensor,
                                   object_feature_map_tensor, target_h, target_w,
                                   plot_save_dir, plot_filename_prefix, mask_idx,
                                   sam_processed_image_shape):
    try:
        original_img = Image.open(original_image_path).convert("RGB")
        sam_mask_np = sam_mask_info['segmentation']

        fig, axes = plt.subplots(1, 3, figsize=(18, 6))

        axes[0].imshow(original_img)
        axes[0].set_title(f'Imagen Original\n{os.path.basename(original_image_path)}')
        axes[0].axis('off')

        mask_display = sam_mask_np 
        axes[1].imshow(original_img) 
        show_mask(mask_display, axes[1], random_color=False, borders=True) 
        axes[1].set_title(f'Máscara SAM {mask_idx}')
        axes[1].axis('off')

        if object_feature_map_tensor.numel() == 0:
            axes[2].text(0.5, 0.5, "No hay características de objeto", ha='center', va='center', transform=axes[2].transAxes)
            axes[2].set_title('Mapa de Características de Objeto (Vacío)')
            axes[2].axis('off')
        else:
            ofm_cpu = object_feature_map_tensor.squeeze().cpu().numpy() 
            if ofm_cpu.ndim == 3: 
                C, H, W = ofm_cpu.shape
                ofm_reshaped = ofm_cpu.transpose(1, 2, 0).reshape(-1, C) 

                if C > 3: 
                    pca = PCA(n_components=3)
                    ofm_pca = pca.fit_transform(ofm_reshaped)
                    ofm_pca_normalized = (ofm_pca - ofm_pca.min()) / (ofm_pca.max() - ofm_pca.min() + 1e-8)
                    ofm_display = ofm_pca_normalized.reshape(H, W, 3)
                    axes[2].imshow(ofm_display)
                    axes[2].set_title(f'Mapa de Características de Objeto (PCA)\nMáscara {mask_idx}')
                else: 
                    if C == 1:
                        ofm_display = ofm_cpu.squeeze()
                        axes[2].imshow(ofm_display, cmap='viridis')
                    elif C == 3:
                        ofm_display = ofm_cpu.transpose(1, 2, 0) 
                        ofm_display_norm = (ofm_display - ofm_display.min()) / (ofm_display.max() - ofm_display.min() + 1e-8)
                        axes[2].imshow(ofm_display_norm)
                    else: 
                        ofm_display = ofm_cpu[0]
                        axes[2].imshow(ofm_display, cmap='viridis')
                    axes[2].set_title(f'Mapa de Características de Objeto\nMáscara {mask_idx}')
            else: 
                axes[2].text(0.5, 0.5, "Formato de características de objeto inesperado", ha='center', va='center', transform=axes[2].transAxes)
                axes[2].set_title('Mapa de Características de Objeto (Error)')

            axes[2].axis('off')

        plt.tight_layout()
        save_path = os.path.join(plot_save_dir, f"{plot_filename_prefix}_mask_{mask_idx}.png")
        plt.savefig(save_path)
        plt.close(fig)

    except Exception as e:
        print(f"Error al visualizar el mapa de características de objeto para máscara {mask_idx} de {os.path.basename(original_image_path)}: {e}")

# --- Aplicar el proceso a la imagen de consulta y a las imágenes de referencia ---

print("\n--- Generando Mapas de Características de Objeto ---")

TARGET_MASK_H = 8 * H_prime 
TARGET_MASK_W = 8 * W_prime 
print(f"TARGET_MASK_H: {TARGET_MASK_H}")
print(f"TARGET_MASK_W: {TARGET_MASK_W}")

fobj_q, scaled_masks_query = process_masks_to_object_feature_maps(
    masks_data_query_image,
    query_hr_feats.squeeze(0), 
    TARGET_MASK_H,
    TARGET_MASK_W,
    image_for_sam_np.shape 
)

fobj_q = fobj_q.to(device)

print(f"Dimensiones de fobj_q (Mapas de Características de Objeto de Iq): {fobj_q.shape}") 

all_fobj_r_list = [] 
for i, similar_hr_feats in enumerate(similar_hr_feats_list):
    current_similar_masks_raw = similar_masks_raw_list[i]
    img_similar_pil = Image.open(rutas_imagenes_similares[i]).convert('RGB') 
    image_np_similar_for_sam_shape = np.array(img_similar_pil).shape

    fobj_r_current, scaled_masks_similar = process_masks_to_object_feature_maps(
        current_similar_masks_raw,
        similar_hr_feats.squeeze(0), 
        TARGET_MASK_H,
        TARGET_MASK_W,
        image_np_similar_for_sam_shape 
    )
    fobj_r_current = fobj_r_current.to(device)
    
    all_fobj_r_list.append(fobj_r_current)
    print(f"Dimensiones de fobj_r para vecino {i+1}: {fobj_r_current.shape}") 
    print("\nTipos de los elementos en all_fobj_r_list:")
    for idx, fobj_r in enumerate(all_fobj_r_list):
        print(f"Vecino {idx + 1}: Tipo de fobj_r:", type(fobj_r))
print("\nProceso de 'Object Feature Map' completado. ¡Ahora tienes los fobj_q y fobj_r listos!")

OFM_PLOTS_DIR = os.path.join(PLOT_SAVE_ROOT_DIR, "object_feature_map_plots")
os.makedirs(OFM_PLOTS_DIR, exist_ok=True)
print(f"\nLos plots de Mapas de Características de Objeto se guardarán en: {OFM_PLOTS_DIR}")

print("\nGenerando visualizaciones de Mapas de Características de Objeto para la consulta...")
for i, mask_info in enumerate(masks_data_query_image):
    if i < fobj_q.shape[0]: 
        visualize_object_feature_map(
            query_image_path,
            mask_info,
            query_hr_feats, 
            fobj_q[i].unsqueeze(0), 
            TARGET_MASK_H,
            TARGET_MASK_W,
            OFM_PLOTS_DIR,
            f"query_{base_image_name.replace('.png', '')}",
            i,
            image_for_sam_np.shape
        )
    else:
        print(f"Advertencia: No se encontró OFM para la máscara de consulta {i}.")

print("\nGenerando visualizaciones de Mapas de Características de Objeto para las imágenes similares...")
for i, similar_image_path in enumerate(rutas_imagenes_similares):
    current_similar_masks = similar_masks_raw_list[i]
    current_fobj_r = all_fobj_r_list[i]
    current_similar_hr_feats = similar_hr_feats_list[i] 
    
    img_similar_pil = Image.open(similar_image_path).convert('RGB')
    image_np_similar_for_sam_shape = np.array(img_similar_pil).shape

    for j, mask_info in enumerate(current_similar_masks):
        if j < current_fobj_r.shape[0]:
            visualize_object_feature_map(
                similar_image_path,
                mask_info,
                current_similar_hr_feats, 
                current_fobj_r[j].unsqueeze(0), 
                TARGET_MASK_H,
                TARGET_MASK_W,
                OFM_PLOTS_DIR,
                f"similar_{os.path.basename(similar_image_path).replace('.png', '')}",
                j,
                image_np_similar_for_sam_shape
            )
        else:
            print(f"Advertencia: No se encontró OFM para la máscara {j} de la imagen similar {os.path.basename(similar_image_path)}.")


# Visualización para las imágenes de referencia (Ir)
print("\nGenerando visualizaciones de Mapas de Características de Objeto para los vecinos...")
for i, similar_image_path in enumerate(rutas_imagenes_similares):
    current_similar_masks_raw = similar_masks_raw_list[i]
    current_similar_hr_feats = similar_hr_feats_list[i]
    current_fobj_r = all_fobj_r_list[i]
    img_similar_pil_for_shape = Image.open(similar_image_path).convert('RGB')
    image_np_similar_for_sam_shape = np.array(img_similar_pil_for_shape).shape

    if not current_fobj_r.numel() == 0: # Solo procesar si hay OFMs generados para este vecino
        for j, mask_info in enumerate(current_similar_masks_raw):
            if j < current_fobj_r.shape[0]: # Asegurarse de que tenemos un OFM para esta máscara
                visualize_object_feature_map(
                    similar_image_path,
                    mask_info,
                    current_similar_hr_feats,
                    current_fobj_r[j].unsqueeze(0), # OFM de la máscara actual
                    TARGET_MASK_H,
                    TARGET_MASK_W,
                    OFM_PLOTS_DIR,
                    f"neighbor_{i+1}_{os.path.basename(similar_image_path).replace('.png', '')}",
                    j,
                    image_np_similar_for_sam_shape
                )
            else:
                print(f"Advertencia: No se encontró OFM para la máscara {j} del vecino {i+1}.")
    else:
        print(f"No se generaron OFMs para el vecino {i+1} ({os.path.basename(similar_image_path)}), saltando visualización.")

print("\nVisualización de Mapas de Características de Objeto completada.")



# -----------3.5.2 Object matching module-----------------
## Matching
# --- Definición de la función show_anomalies_on_image ---
def show_anomalies_on_image(image_np, masks, anomalous_info, alpha=0.5, save_path=None):

    plt.figure(figsize=(8, 8))
    plt.imshow(image_np)

    for obj_id, similarity in anomalous_info: # Iterate through (id, similarity) tuples
        # Extraer la máscara binaria real
        mask = masks[obj_id]['segmentation']
        if isinstance(mask, torch.Tensor):
            mask = mask.cpu().numpy()

        # Crear máscara en rojo
        colored_mask = np.zeros((*mask.shape, 3), dtype=np.uint8)
        colored_mask[mask > 0] = [255, 0, 0]
        plt.imshow(colored_mask, alpha=alpha)

        # Calcular centroide para colocar el texto
        ys, xs = np.where(mask > 0)
        if len(xs) > 0 and len(ys) > 0:
            cx = int(xs.mean())
            cy = int(ys.mean())
            
            # Create text with index and percentage
            text_label = f"{obj_id} ({similarity*100:.2f}%)"
            plt.text(cx, cy, text_label, color='white', fontsize=10, fontweight='bold', ha='center', va='center',
                     bbox=dict(facecolor='red', alpha=0.6, edgecolor='none', boxstyle='round,pad=0.2'))

    plt.title("Objetos Anómalos en Rojo con Índice y Similitud") # Updated title for clarity
    plt.axis("off")

    if save_path:
        plt.tight_layout()
        plt.savefig(save_path)
        print(f"✅ Plot de anomalías guardado en: {save_path}")

    plt.show()
    plt.close()
# --- Fin de la definición de la función show_anomalies_on_image ---
# --- Nuevas funciones de ploteo para la matriz P y P_augmented_full ---
def plot_assignment_matrix(P_matrix, query_labels, reference_labels, save_path=None, title="Matriz de Asignación P"):
    """
    Visualiza la matriz de asignación P como un mapa de calor.

    Args:
        P_matrix (torch.Tensor or np.array): La matriz de asignación (M x N).
        query_labels (list): Etiquetas para los objetos de consulta (eje Y).
        reference_labels (list): Etiquetas para los objetos de referencia (eje X).
        save_path (str, optional): Ruta para guardar la imagen del plot.
        title (str): Título del plot.
    """
    if isinstance(P_matrix, torch.Tensor):
        #P_matrix = P_matrix.cpu().numpy()
        P_matrix = P_matrix.detach().cpu().numpy()

    plt.figure(figsize=(P_matrix.shape[1] * 0.8 + 2, P_matrix.shape[0] * 0.8 + 2))
    plt.imshow(P_matrix, cmap='viridis', origin='upper', aspect='auto')
    plt.colorbar(label='Probabilidad de Asignación')
    plt.xticks(np.arange(len(reference_labels)), reference_labels, rotation=45, ha="right")
    plt.yticks(np.arange(len(query_labels)), query_labels)
    plt.xlabel('Objetos de Referencia')
    plt.ylabel('Objetos de Consulta')
    plt.title(title)
    plt.tight_layout()
    if save_path:
        plt.savefig(save_path)
        print(f"✅ Plot de la matriz de asignación guardado en: {save_path}")
    plt.show()
    plt.close()

def plot_augmented_assignment_matrix(P_augmented_full, query_labels, reference_labels, save_path=None, title="Matriz de Asignación Aumentada (con Trash Bin)"):
    """
    Visualiza la matriz de asignación aumentada (incluyendo los trash bins) como un mapa de calor.

    Args:
        P_augmented_full (torch.Tensor or np.array): La matriz de asignación aumentada ((M+1) x (N+1)).
        query_labels (list): Etiquetas para los objetos de consulta.
        reference_labels (list): Etiquetas para los objetos de referencia.
        save_path (str, optional): Ruta para guardar la imagen del plot.
        title (str): Título del plot.
    """
    if isinstance(P_augmented_full, torch.Tensor):
        #P_augmented_full = P_augmented_full.cpu().numpy()
        P_augmented_full = P_augmented_full.detach().cpu().numpy()

    # Añadir etiquetas para los trash bins
    full_query_labels = [f"Q_{i}" for i in query_labels] + ["Trash Bin (Q)"]
    full_reference_labels = [f"R_{i}" for i in reference_labels] + ["Trash Bin (R)"]

    plt.figure(figsize=(P_augmented_full.shape[1] * 0.8 + 2, P_augmented_full.shape[0] * 0.8 + 2))
    plt.imshow(P_augmented_full, cmap='viridis', origin='upper', aspect='auto')
    plt.colorbar(label='Probabilidad de Asignación')
    plt.xticks(np.arange(len(full_reference_labels)), full_reference_labels, rotation=45, ha="right")
    plt.yticks(np.arange(len(full_query_labels)), full_query_labels)
    plt.xlabel('Objetos de Referencia y Trash Bin')
    plt.ylabel('Objetos de Consulta y Trash Bin')
    plt.title(title)
    plt.tight_layout()
    if save_path:
        plt.savefig(save_path)
        print(f"✅ Plot de la matriz de asignación aumentada guardado en: {save_path}")
    plt.show()
    plt.close()


# --- Fin de las nuevas funciones de ploteo ---

## Matching-continue---
## Matching
start_time_sam_matching = time.time()



import torch
import torch.nn as nn
import torch.nn.functional as F

def apply_global_max_pool(feat_map):
    return F.adaptive_max_pool2d(feat_map, output_size=1).squeeze(-1).squeeze(-1)

class SimpleObjectMatchingModule(nn.Module):
    def __init__(self, sinkhorn_iterations=100, sinkhorn_epsilon=0.1, bin_score_value=0.5):
        super(SimpleObjectMatchingModule, self).__init__()
        self.sinkhorn_iterations = sinkhorn_iterations
        self.sinkhorn_epsilon = sinkhorn_epsilon
        self.z = nn.Parameter(torch.tensor(bin_score_value, dtype=torch.float32))

    def forward(self, d_M_q, d_N_r):
        M = d_M_q.shape[0]
        N = d_N_r.shape[0]

        if M == 0 or N == 0:
            return torch.empty(M, N, device=d_M_q.device), \
                   torch.empty(M+1, N+1, device=d_M_q.device)

        score_matrix = torch.mm(d_M_q, d_N_r.T)
        #print("score_matrix (antes de Sinkhorn):\n", score_matrix)

        S_augmented = torch.zeros((M + 1, N + 1), device=d_M_q.device, dtype=d_M_q.dtype)
        S_augmented[:M, :N] = score_matrix
        S_augmented[:M, N] = self.z
        S_augmented[M, :N] = self.z
        S_augmented[M, N] = self.z
        print("S_augmented antes de Sinkhorn:\n", S_augmented)

        K = torch.exp(S_augmented / self.sinkhorn_epsilon)
        print("K (antes de Sinkhorn):\n", K)
        

        for i in range(self.sinkhorn_iterations):
            K = K / K.sum(dim=1, keepdim=True)
            K = K / K.sum(dim=0, keepdim=True)
            #print(f"Iteración {i+1}: K.shape = {K}")

        P_augmented_full = K
        P = P_augmented_full[:M, :N]

        return P, P_augmented_full

fobj_q_pooled = apply_global_max_pool(fobj_q)
print("Shape de fobj_q_pooled:", fobj_q_pooled.shape)
print("Máximo de fobj_q_pooled:", torch.max(fobj_q_pooled).item())
print("Mínimo de fobj_q_pooled:", torch.min(fobj_q_pooled).item())

all_fobj_r_pooled_list = []
for fobj_r_current in all_fobj_r_list:
    pooled_r = apply_global_max_pool(fobj_r_current)
    all_fobj_r_pooled_list.append(pooled_r)
    
d_M_q = F.normalize(fobj_q_pooled, p=2, dim=1) #shape (M, C)
d_N_r_list = [F.normalize(fobj_r_pooled, p=2, dim=1) 
                              for fobj_r_pooled in all_fobj_r_pooled_list]
print("Máximo de d_M_q:", torch.max(d_M_q).item())
print("Mínimo de d_M_q:", torch.min(d_M_q).item())

object_matching_module = SimpleObjectMatchingModule(
    sinkhorn_iterations=100,
    sinkhorn_epsilon=0.1,
    bin_score_value=0.9 #2.36
).to(device)

P_matrices = []
P_augmented_full_matrices = []

for i, d_N_r_current_image in enumerate(d_N_r_list):
    d_M_q_cuda = d_M_q.to(device)
    d_N_r_current_image_cuda = d_N_r_current_image.to(device)

    P_current, P_augmented_current = object_matching_module(d_M_q_cuda, d_N_r_current_image_cuda)
    P_matrices.append(P_current)
    P_augmented_full_matrices.append(P_augmented_current)


print("\n--- Matrices P y P_augmented_full generadas ---")
# --- NUEVOS DICCIONARIOS CONSOLIDADOS ---
# Almacenarán para cada query_idx, las referencias que le corresponden de TODOS los vecinos.
M = d_M_q.shape[0]
all_matched_ref_indices_by_query_obj = {q_idx: [] for q_idx in range(M)} # M es el número de objetos de consulta (Iq)
all_closest_unmatched_ref_indices_by_query_obj = {q_idx: [] for q_idx in range(M)}
# Imprimir shapes de los diccionarios consolidados
#//////
print("\n--- Resultados Consolidados ---")
print("all_matched_ref_indices_by_query_obj:")
for q_idx, matches in all_matched_ref_indices_by_query_obj.items():
    print(f"  Objeto de Consulta {q_idx}: {matches}")

print("\nall_closest_unmatched_ref_indices_by_query_obj:")
for q_idx, closest_unmatches in all_closest_unmatched_ref_indices_by_query_obj.items():
    print(f"  Objeto de Consulta {q_idx}: {closest_unmatches}")
#/////////////////
# Procesar matrices P y P_augmented_full para obtener índices
for i, (P, P_augmented_full) in enumerate(zip(P_matrices, P_augmented_full_matrices)):
    current_neighbor_key = f"Vecino_{i+1}"
    N_current = P.shape[1] 

    print(f"\n--- Vecino {current_neighbor_key} ---")
    print(f"Matriz P (MxN) para el vecino {current_neighbor_key}:")
    print(P)
    print(f"Matriz P_augmented_full (M+1 x N+1) para el vecino {current_neighbor_key}:")
    print(P_augmented_full)

    # Imprimir sumas de filas y columnas de P_augmented_full
    augmented_with_totals = torch.cat([
        torch.cat([P_augmented_full, P_augmented_full.sum(dim=0, keepdim=True)], dim=0),
        torch.cat([P_augmented_full.sum(dim=1, keepdim=True), P_augmented_full.sum().unsqueeze(0).unsqueeze(0)], dim=0)
    ], dim=1)
    print(f"Matriz P_augmented_full con totales (M+2 x N+2):\n{augmented_with_totals}")

    print(f"\n--- Decisiones de Emparejamiento para el Vecino {current_neighbor_key} ---")
    for obj_idx in range(P.shape[0]):
        
        # Obtener la probabilidad más alta dentro de P y su índice
        if N_current > 0:
            max_prob_P = P[obj_idx].max().item()
            max_idx_P = P[obj_idx].argmax().item()
        else:
            max_prob_P = -float('inf')
            max_idx_P = -1


        trash_bin_prob = P_augmented_full[obj_idx, -1].item() 

        print(f"   Objeto de Consulta {obj_idx}:")
        print(f"     Probabilidad máxima en P: {max_prob_P:.4f} en el índice {max_idx_P}")
        print(f"     Probabilidad en el 'Trash Bin': {trash_bin_prob:.4f}")


       # Decisión y almacenamiento en los diccionarios consolidados
        if trash_bin_prob > max_prob_P:
            # Desemparejado: ahora añadimos el 'primer máximo' a la lista de ese objeto de consulta
            if max_idx_P != -1: # Solo añadir si hay un 'primer máximo' válido
                all_closest_unmatched_ref_indices_by_query_obj[obj_idx].append((i, max_idx_P)) # (índice_vecino, índice_referencia)
            print(f"     Decisión: DESEMPAREJADO. 'Casi-par' (PRIMER más similar en P): objeto {max_idx_P}")
        else:
            # Emparejado: añadir el emparejamiento real a la lista de ese objeto de consulta
            all_matched_ref_indices_by_query_obj[obj_idx].append((i, max_idx_P)) # (índice_vecino, índice_referencia)
            print(f"     Decisión: EMPAREJADO con objeto de imagen {max_idx_P}")


# --- Resultados Finales Consolidados ---
print("\n--- Resultados Finales Consolidados (Índices) ---")
print("all_matched_ref_indices_by_query_obj (query_idx: [(vecino_idx, ref_idx), ...]):")
for q_idx, matches in all_matched_ref_indices_by_query_obj.items():
    print(f"  Query {q_idx}: {matches}")

print("\nall_closest_unmatched_ref_indices_by_query_obj (query_idx: [(vecino_idx, second_ref_idx), ...]):")
for q_idx, closest_unmatches in all_closest_unmatched_ref_indices_by_query_obj.items():
    print(f"  Query {q_idx}: {closest_unmatches}")


# --- AHORA SE NECESITAN ESTOS DICTIONARIOS PARA TU IMPLEMENTACIÓN DE MAHALANOBIS ---

print("--- FIN DE LÓGICA DE EMPAREJAMIENTO DE DEMOSTRACIÓN ---")
# ***************************************************************************************************


# %%## AMM (Anomaly Map Module) - Tus funciones de Mahalanobis
@torch.no_grad()
def compute_mahalanobis_map_single(query_fmap, ref_fmaps, regularization=1e-5):
    """
    Calcula el mapa de distancia de Mahalanobis por píxel entre un objeto de consulta
    y k objetos de referencia emparejados.
    Args:
        query_fmap (Tensor): (C, H, W) feature map del objeto de consulta.
        ref_fmaps (List[Tensor]): lista de k tensores (C, H, W) de objetos emparejados.
        regularization (float): término epsilon * I para la inversa numéricamente estable.
    Returns:
        maha_map (Tensor): (H, W) mapa escalar con distancia de Mahalanobis por píxel.
    """
    device = query_fmap.device
    k = len(ref_fmaps)
    C, H, W = query_fmap.shape
    
    if k < 2: # Necesitamos al menos 2 referencias para calcular covarianza
        return torch.zeros(H, W, device=device)

    # Stack: (k, C, H, W)
    ref_stack = torch.stack(ref_fmaps, dim=0)  # (k, C, H, W)

    maha_map = torch.zeros(H, W, device=device)

    for x in range(H):
        for y in range(W):
            vectors = ref_stack[:, :, x, y]          # (k, C)
            mu = vectors.mean(dim=0)                 # (C,)
            delta = vectors - mu                     # (k, C)
            cov = delta.T @ delta / (k - 1)          # (C, C) 
            cov += regularization * torch.eye(C, device=device)

            try:
                cov_inv = torch.linalg.inv(cov)      # (C, C)
            except RuntimeError:
                maha_map[x, y] = 0.0
                continue

            v_query = query_fmap[:, x, y]            # (C,)
            diff = (v_query - mu).unsqueeze(0)       # (1, C)

            # Mahalanobis distance squared
            maha_val_squared = (diff @ cov_inv @ diff.T).item()
            # Aplicar la raíz cuadrada para obtener la distancia
            maha_val = torch.sqrt(torch.tensor(maha_val_squared, device=device)).item() # Asegurarse de que sea un tensor para sqrt
            maha_map[x, y] = maha_val

    return maha_map

@torch.no_grad()
def compute_matching_score_map(
    fobj_q,
    all_matched_ref_indices_by_query_obj,
    all_fobj_r_list,
    regularization=1e-5,
    plot_save_dir=None):
    """
    Calcula los mapas de distancia de Mahalanobis para objetos de consulta
    que tienen referencias emparejadas. Devuelve los valores RAW de Mahalanobis.
    """
    matching_maha_maps = []
    all_raw_maha_values = [] 
    print("\n--- Calculando Matching Score Maps (Valores RAW de Mahalanobis) ---")

    for query_idx in range(len(fobj_q)):
        query_fmap = fobj_q[query_idx] # (C, H, W)

        matched_ref_fmaps_list = []
        for neighbor_idx, ref_idx in all_matched_ref_indices_by_query_obj.get(query_idx, []):
            ref_fmap = all_fobj_r_list[neighbor_idx][ref_idx] # (C, H, W)
            matched_ref_fmaps_list.append(ref_fmap)

        if len(matched_ref_fmaps_list) >= 2:
            maha_map_raw = compute_mahalanobis_map_single(
                query_fmap=query_fmap,
                ref_fmaps=matched_ref_fmaps_list,
                regularization=regularization
            )
            
            # Agrega los valores brutos a la lista global para min/max
            all_raw_maha_values.append(maha_map_raw.flatten().cpu()) 
            
            print(f"✅ Objeto de consulta {query_idx} emparejado con {len(matched_ref_fmaps_list)} referencias. Max RAW={maha_map_raw.max().item():.4f}, Min RAW={maha_map_raw.min().item():.4f}")
            matching_maha_maps.append(maha_map_raw.cpu()) # Devuelve el mapa RAW
        else:
            # Si no hay suficientes pares coincidentes, el mapa es cero
            print(f"ℹ️ Objeto de consulta {query_idx} NO tiene suficientes referencias emparejadas para un Matching Score.")
            matching_maha_maps.append(torch.zeros_like(query_fmap[0]).cpu())
        
        # Visualización (opcional) - Se normaliza solo para la visualización si hay valores.
        if plot_save_dir:
            plt.figure(figsize=(6, 5))
            maha_map_for_plot = matching_maha_maps[-1]
            if maha_map_for_plot.max() > 1e-8: # Evitar división por cero para mapas planos
                plot_normalized_maha = (maha_map_for_plot - maha_map_for_plot.min()) / (maha_map_for_plot.max() - maha_map_for_plot.min() + 1e-8)
            else:
                plot_normalized_maha = torch.zeros_like(maha_map_for_plot)
            plt.imshow(plot_normalized_maha.numpy(), cmap="hot")
            plt.title(f"Matching Score Map (Normalized for Plot) - Obj {query_idx}") # Cambia el título
            plt.axis("off")
            plt.colorbar(label="Normalized Mahalanobis Distance (for display)") # Cambia la etiqueta de la barra de color
            plt.tight_layout()
            save_path = os.path.join(plot_save_dir, f"matching_score_raw_obj_{query_idx}.png")
            plt.savefig(save_path) # Descomentar para guardar plots
            plt.close()

    # Calcular el min y max global de TODOS los valores brutos recolectados
    global_min_maha = 0.0
    global_max_maha = 1.0 # Valores por defecto si no hay ningún matched válido

    if all_raw_maha_values:
        combined_raw_values = torch.cat(all_raw_maha_values)
        global_min_maha = combined_raw_values.min().item()
        global_max_maha = combined_raw_values.max().item()
        # Asegurar que el rango no sea cero para evitar división por cero más tarde
        if global_max_maha <= global_min_maha:
            global_max_maha = global_min_maha + 1e-8 

    print(f"Rango global de Mahalanobis RAW para 'Matched': Min={global_min_maha:.4f}, Max={global_max_maha:.4f}")

    return matching_maha_maps, (global_min_maha, global_max_maha) # Devolvemos la tupla con min/max

@torch.no_grad()
def compute_unmatched_score_map(
    fobj_q,
    all_closest_unmatched_ref_indices_by_query_obj,
    all_fobj_r_list,
    regularization=1e-5,
    plot_save_dir=None,
    all_matched_ref_indices_by_query_obj=None,
    # --- RECIBE LA TUPLA CON MIN/MAX (YA NO SE USA PARA NORMALIZAR INTERNAMENTE) ---
    matched_maha_range_global=(0.0, 1.0) ):
    """
    Calcula los mapas de distancia de Mahalanobis para objetos de consulta
    que NO tienen referencias emparejadas. Devuelve los valores RAW de Mahalanobis.
    """
    print(f"matched_maha_range_global recibidos: {matched_maha_range_global}") # Se sigue recibiendo, pero no se usa para normalizar

    unmatched_maha_maps = []
    print("\n--- Calculando Unmatched Score Maps (Valores RAW de Mahalanobis) ---")

    # min_matched_maha_global, max_matched_maha_global = matched_maha_range_global # Ya no se necesitan para normalizar aquí.

    for query_idx in range(len(fobj_q)):
        query_fmap = fobj_q[query_idx] 

        matched_refs = all_matched_ref_indices_by_query_obj.get(query_idx, []) if all_matched_ref_indices_by_query_obj else []
        
        if len(matched_refs) >= 2: 
            unmatched_maha_maps.append(torch.zeros_like(query_fmap[0]).cpu())
            print(f"✅ Objeto de consulta {query_idx} ya emparejado. Unmatched map puesto a cero y saltado.")
            continue 

        closest_ref_fmaps = []
        for neighbor_idx, ref_idx in all_closest_unmatched_ref_indices_by_query_obj.get(query_idx, []):
            ref_fmap_closest = all_fobj_r_list[neighbor_idx][ref_idx] 
            closest_ref_fmaps.append(ref_fmap_closest)

        if len(closest_ref_fmaps) >= 2:
            maha_map_raw = compute_mahalanobis_map_single( # Obtén el mapa de Mahalanobis bruto
                query_fmap=query_fmap,
                ref_fmaps=closest_ref_fmaps,
                regularization=regularization
            )
            
            # --- Lógica Clave: ¡NO NORMALIZAR AQUÍ! DEVOLVER RAW ---
            # Si el objetivo es Mahalanobis RAW para UNMATCHED, se devuelve directamente
            maha_map_to_return = maha_map_raw

            print(f"🟡 Objeto de consulta {query_idx} NO emparejado, Mahalanobis RAW con {len(closest_ref_fmaps)} 'casi-pares'. Max RAW={maha_map_to_return.max().item():.4f}, Min RAW={maha_map_to_return.min().item():.4f}")
        else:
            maha_map_to_return = torch.zeros_like(query_fmap[0])
            print(f"⚠️ Objeto de consulta {query_idx} no emparejado y sin suficientes 'casi-pares', se pone mapa vacío.")
        
        unmatched_maha_maps.append(maha_map_to_return.cpu()) 

        # Visualización (opcional) - Normalizar solo para la visualización si hay valores
        if plot_save_dir:
            plt.figure(figsize=(6, 5))
            maha_map_for_plot = unmatched_maha_maps[-1]
            if maha_map_for_plot.max() > 1e-8:
                plot_normalized_maha = (maha_map_for_plot - maha_map_for_plot.min()) / (maha_map_for_plot.max() - maha_map_for_plot.min() + 1e-8)
            else:
                plot_normalized_maha = torch.zeros_like(maha_map_for_plot)
            plt.imshow(plot_normalized_maha.numpy(), cmap="hot")
            plt.title(f"Unmatched Anomaly Map (Normalized for Plot) - Obj {query_idx}") # Cambia el título
            plt.axis("off")
            plt.colorbar(label="Normalized Mahalanobis Distance (for display)")
            plt.tight_layout()
            save_path = os.path.join(plot_save_dir, f"unmatched_anomaly_raw_obj_{query_idx}.png")
            plt.savefig(save_path) # Descomentar para guardar plots
            plt.close()

    return unmatched_maha_maps

@torch.no_grad()
def build_aggregated_score_map(individual_score_maps_list, final_size=(1024, 1024), title_prefix="Global Score Map", plot_save_dir=None, filename_prefix="global_score_map"):
    """
    Construye un mapa de puntuación agregado (global) a partir de una lista de mapas individuales.
    Args:
        individual_score_maps_list (List[Tensor]): Lista de tensores (H', W') de mapas de puntuación individuales.                         Estos ya deberían estar en CPU.
        final_size (tuple): Tamaño final deseado para el mapa agregado (H, W).
        title_prefix (str): Prefijo para el título del gráfico.
        plot_save_dir (str, optional): Directorio para guardar las visualizaciones.
        filename_prefix (str): Prefijo para el nombre del archivo guardado.
    Returns:
        Tensor: Tensor (H, W) con el mapa de calor total de puntuación.
    """
    H_out, W_out = final_size
    aggregated_score_map = torch.zeros((H_out, W_out), device='cpu')

    print(f"\n--- Construyendo el {title_prefix} ---")
    if not individual_score_maps_list:
        print(f"No hay mapas individuales para {title_prefix}. Retornando un mapa vacío.")
        return aggregated_score_map

    for i, score_map in enumerate(individual_score_maps_list):
        if score_map.dim() == 2:
            score_map_tensor = score_map.unsqueeze(0).unsqueeze(0) # (1,1,H',W')
        else:
            print(f"Advertencia: El mapa de puntuación {i} tiene dimensiones inesperadas: {score_map.shape}. Saltando.")
            continue

        score_resized = F.interpolate(
            score_map_tensor,
            size=(H_out, W_out),
            mode="bilinear",
            align_corners=False
        ).squeeze()

        aggregated_score_map += score_resized

    print(f"Dimensiones del {title_prefix} final: {aggregated_score_map.shape}")

    if plot_save_dir:
        plt.figure(figsize=(8, 7))
        # Para el mapa agregado, también se normaliza solo para la visualización
        map_for_plot = aggregated_score_map
        if map_for_plot.max() > 1e-8:
            plot_normalized_map = (map_for_plot - map_for_plot.min()) / (map_for_plot.max() - map_for_plot.min() + 1e-8)
        else:
            plot_normalized_map = torch.zeros_like(map_for_plot)

        plt.imshow(plot_normalized_map.numpy(), cmap="hot")
        plt.title(title_prefix + " (Normalized for Plot)") # Ajusta el título para reflejar la normalización de visualización
        plt.axis("off")
        plt.colorbar(label="Score Acumulado (Normalized for display)")
        plt.tight_layout()
        save_path = os.path.join(plot_save_dir, f"{filename_prefix}.png")
        plt.savefig(save_path)
        plt.close()
        print(f"✅ Visualización del {title_prefix} guardada en: {save_path}")

    return aggregated_score_map

def overlay_anomaly_map_on_image(image_rgb_path, anomaly_map, alpha=0.7, cmap='magma', plot_save_dir=None, filename_suffix="overlay"):
    """
    Superpone el mapa de anomalía sobre la imagen original RGB como un heatmap.
    Args:
        image_rgb_path (str): Ruta a la imagen original RGB.
        anomaly_map (Tensor o ndarray): mapa de anomalía (H, W) — debe estar reescalado a 1024×1024.
        alpha (float): transparencia del mapa (0=solo imagen, 1=solo heatmap)
        cmap (str): mapa de color matplotlib a usar ("hot", "jet", etc.)
        plot_save_dir (str, optional): Directorio para guardar la visualización.
        filename_suffix (str): Sufijo para el nombre del archivo guardado.
    """
    print("\n--- Superponiendo el mapa de anomalía final sobre la imagen original ---")
    try:
        image_original_loaded = Image.open(image_rgb_path).convert("RGB")
        image_np = np.array(image_original_loaded)
    except FileNotFoundError:
        print(f"Error: No se encontró la imagen en {image_rgb_path}. No se puede superponer.")
        return

    if isinstance(anomaly_map, torch.Tensor):
        anomaly_np = anomaly_map.cpu().numpy()
    else:
        anomaly_np = anomaly_map

    # Normalizamos el mapa a [0, 1] PARA LA VISUALIZACIÓN
    # Añadimos un pequeño epsilon para evitar división por cero si max == min
    anomaly_min = anomaly_np.min()
    anomaly_max = anomaly_np.max()
    if (anomaly_max - anomaly_min) < 1e-8: # Si todos los valores son iguales
        anomaly_norm = np.zeros_like(anomaly_np)
    else:
        anomaly_norm = (anomaly_np - anomaly_min) / (anomaly_max - anomaly_min)

    # Redimensionamos si las resoluciones no coinciden con la imagen original
    if anomaly_norm.shape[:2] != image_np.shape[:2]:
        anomaly_norm = np.array(Image.fromarray(anomaly_norm).resize(
            (image_np.shape[1], image_np.shape[0]), resample=Image.BILINEAR
        ))

    # Visualización
    plt.figure(figsize=(10, 8))
    plt.imshow(image_np)
    plt.imshow(anomaly_norm, cmap=cmap, alpha=alpha)
    plt.title("Anomaly Heatmap Overlay (Normalized for Display)") # Ajusta el título
    plt.axis("off")
    plt.tight_layout()

    if plot_save_dir:
        save_path = os.path.join(plot_save_dir, f"{filename_suffix}.png")
        plt.savefig(save_path)
        print(f"✅ Visualización superpuesta guardada en: {save_path}")
    plt.close()


# --- 1. Calcular Matching Score Maps y obtener el rango global ---
all_matching_score_maps, matched_maha_range_global = compute_matching_score_map(
    fobj_q=fobj_q,
    all_matched_ref_indices_by_query_obj=all_matched_ref_indices_by_query_obj,
    all_fobj_r_list=all_fobj_r_list,
    regularization=1e-2,
    plot_save_dir=PLOT_SAVE_ROOT_DIR)
# matched_maha_range_global ahora es una tupla (min_value, max_value)
# --- 2. Calcular Unmatched Score Maps (ya no normaliza con el rango global, devuelve RAW) ---
all_unmatched_score_maps = compute_unmatched_score_map(
    fobj_q=fobj_q,
    all_closest_unmatched_ref_indices_by_query_obj=all_closest_unmatched_ref_indices_by_query_obj,
    all_fobj_r_list=all_fobj_r_list,
    regularization=1e-2,
    plot_save_dir=PLOT_SAVE_ROOT_DIR,
    all_matched_ref_indices_by_query_obj=all_matched_ref_indices_by_query_obj,
    matched_maha_range_global=matched_maha_range_global # Se sigue pasando, pero no se usa para normalización interna en compute_unmatched_score_map
)

# 3. Construir el Global Matched Score Map
# Obtener las dimensiones de la imagen original
image_original = Image.open(query_image_path)
H, W = image_original.size

# Construir el Global Matched Score Map
global_matched_score_map = build_aggregated_score_map(
    individual_score_maps_list=all_matching_score_maps,
    final_size=(H, W),
    title_prefix="Global Matched Anomaly Map (RAW Mahalanobis)", # Ajusta el título
    plot_save_dir=PLOT_SAVE_ROOT_DIR,
    filename_prefix="global_matched_anomaly_raw")

# 4. Construir el Global Unmatched Score Map
global_unmatched_score_map = build_aggregated_score_map(
    individual_score_maps_list=all_unmatched_score_maps,
    final_size=(H, W),
    title_prefix="Global Unmatched Anomaly Map (RAW Mahalanobis)", # Ajusta el título
    plot_save_dir=PLOT_SAVE_ROOT_DIR,
    filename_prefix="global_unmatched_anomaly_raw")

# 5. Combinar ambos tipos de mapas individuales para el Mapa Global Final (Total)
combined_individual_score_maps = []
num_queries = len(fobj_q)
for i in range(num_queries):
    matched_map_for_query = all_matching_score_maps[i] if i < len(all_matching_score_maps) else torch.zeros((H, W), device='cpu')
    unmatched_map_for_query = all_unmatched_score_maps[i] if i < len(all_unmatched_score_maps) else torch.zeros((H, W), device='cpu')
    
    combined_map_for_query_i = matched_map_for_query + unmatched_map_for_query
    combined_individual_score_maps.append(combined_map_for_query_i)
print("\n--- Proceso de combinación de mapas RAW completado. ---")

# 6. Construir el Global Total Anomaly Score Map (el que combina ambos)
# Este será el 'score_map' que usaremos para la evaluación
global_total_anomaly_score_map = build_aggregated_score_map(
    individual_score_maps_list=combined_individual_score_maps,
    final_size=(H, W), # Usar las dimensiones originales de la imagen para la evaluación
    title_prefix="Global Total Anomaly Map (Sum of RAW Mahalanobis)",
    plot_save_dir=PLOT_SAVE_ROOT_DIR,
    filename_prefix="global_total_anomaly_raw")

# 7. Superponer los mapas globales en la imagen original
# NOTA: La función overlay_anomaly_map_on_image SIEMPRE normalizará para la visualización.
overlay_anomaly_map_on_image(
    image_rgb_path=query_image_path,
    anomaly_map=global_matched_score_map,
    alpha=0.7,
    cmap="magma",
    plot_save_dir=PLOT_SAVE_ROOT_DIR,
    filename_suffix="global_matched_overlay_raw")

overlay_anomaly_map_on_image(
    image_rgb_path=query_image_path,
    anomaly_map=global_unmatched_score_map,
    alpha=0.7,
    cmap="magma",
    plot_save_dir=PLOT_SAVE_ROOT_DIR,
    filename_suffix="global_unmatched_overlay_raw")

overlay_anomaly_map_on_image(
    image_rgb_path=query_image_path,
    anomaly_map=global_total_anomaly_score_map,
    alpha=0.7,
    cmap="magma",
    plot_save_dir=PLOT_SAVE_ROOT_DIR,
    filename_suffix="global_total_anomaly_overlay_raw")

print("\n--- Proceso de generación y visualización de todos los mapas globales completado. ---")
print(f"Revisa la carpeta '{PLOT_SAVE_ROOT_DIR}' para las visualizaciones.")



Ground Truth Mask Path: /home/imercatoma/FeatUp/datasets/mvtec_anomaly_detection/hazelnut/ground_truth/cut/006_mask.png
Cargando datos del coreset...
Coreset cargado. Dimensión: torch.Size([10009, 384])
NearestNeighbors finder inicializado.
Cargando modelo DINOv2...


Using cache found in /home/imercatoma/.cache/torch/hub/facebookresearch_dinov2_main


Modelo DINOv2 cargado.
Cargando modelo SAM2 desde /home/imercatoma/sam2_repo_independent/checkpoints/sam2.1_hiera_small.pt...
Modelo SAM2 cargado.

--- Procesando imagen: 006.png ---

Buscando imágenes similares usando el banco pre-aplanado del Coreset...
Tiempo para calcular distancias KNN: 0.7916 segundos


  return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]


Dimensiones imagen SAM: (1024, 1024, 3)
Generando máscaras para consulta con grid de 8x8 puntos...
Número de máscaras generadas para la imagen de consulta: 1

Generando máscaras SAM para imágenes similares...
--- Procesando vecino 1: 030.png ---
Procesando jerárquicamente 1 máscaras...
Máscara procesada 1 guardada en: /home/imercatoma/FeatUp/plots_final_eval/cut/cut_006/processed_masks/similar_1_processed_mask_1.png
Procesamiento jerárquico de máscaras completado.
Máscaras generadas para vecino 1: 1.
--- Procesando vecino 2: 232.png ---
Procesando jerárquicamente 1 máscaras...
Máscara procesada 1 guardada en: /home/imercatoma/FeatUp/plots_final_eval/cut/cut_006/processed_masks/similar_2_processed_mask_1.png
Procesamiento jerárquico de máscaras completado.
Máscaras generadas para vecino 2: 1.
--- Procesando vecino 3: 127.png ---
Procesando jerárquicamente 1 máscaras...
Máscara procesada 1 guardada en: /home/imercatoma/FeatUp/plots_final_eval/cut/cut_006/processed_masks/similar_3_process

In [None]:
### **Evaluación de Detección de Anomalías (Pixel-level y Image-level)**

##Ahora que tienes tu `global_total_anomaly_score_map` (que es tu `score_map` principal para la anomalía), podemos aplicar los pasos de evaluación que mencionaste.

# --- 1. Load Ground Truth Mask ---
def load_ground_truth_mask(mask_path, target_size):
    try:
        gt_mask_pil = Image.open(mask_path).convert('L') # Convert to grayscale
        gt_mask_resized = gt_mask_pil.resize(target_size, Image.NEAREST) # Resize using nearest neighbor to preserve binary
        gt_mask_np = np.array(gt_mask_resized)
        # MVTec masks are typically 0 (background) and 255 (anomaly)
        gt_binary_mask = (gt_mask_np > 0).astype(np.uint8)
        print(f"Máscara Ground Truth cargada desde: {mask_path} con dimensiones {gt_binary_mask.shape}")
        return gt_binary_mask
    except FileNotFoundError:
        print(f"Error: Máscara Ground Truth no encontrada en {mask_path}.")
        return None
    except Exception as e:
        print(f"Error al cargar la máscara Ground Truth: {e}")
        return None

# Definir el tamaño objetivo para las máscaras de evaluación (el mismo que el mapa de anomalías)
# H, W son las dimensiones originales de la imagen de consulta cargadas anteriormente.
# Asegúrate de que `global_total_anomaly_score_map` también esté en estas dimensiones si no lo está ya.
# (Tu build_aggregated_score_map ya lo hace para H, W de la imagen original)
TARGET_EVAL_SIZE = (W, H) # (width, height) para resize de PIL

ground_truth_mask = load_ground_truth_mask(gt_mask_path, TARGET_EVAL_SIZE) 


if ground_truth_mask is None:
    print("No se pudo cargar la máscara Ground Truth. La evaluación a nivel de píxel y de imagen no se realizará.")
else:
    # --- 2. Apply Threshold and Filter Connected Components ---
    
    # Define a threshold for anomaly score map (this is a critical hyperparameter)
    # You might need to tune this based on your dataset and desired trade-off.
    # Los valores de Mahalanobis pueden ser diferentes a las distancias de coseno,
    # por lo que este umbral DEBE ser ajustado experimentalmente para tu dataset.
    ANOMALY_SCORE_THRESHOLD = 100 # <--- ¡AJUSTAR ESTE UMBRAL! Valor de ejemplo.

    # Define minimum pixel area for connected components
    MIN_PIXEL_AREA_THRESHOLD = 1000 # Example: components smaller than 500 pixels will be removed
                                   # Ajustar según el tamaño esperado de anomalías.

    print(f"Shape de la imagen de consulta: {query_img_pil.size}")
    # Binarize the anomaly score map (convertir a NumPy si es un tensor de PyTorch)
    anomaly_map_np = global_total_anomaly_score_map.cpu().numpy()
    max_value = anomaly_map_np.max()
    min_value = anomaly_map_np.min()
    ANOMALY_SCORE_THRESHOLD = int(np.percentile(anomaly_map_np, 98))
    percentile_10_below = np.percentile(anomaly_map_np, 20)
    print(f"Valor máximo: {max_value}")
    print(f"Valor mínimo: {min_value}")
    print(f"1 percentil arriba: {ANOMALY_SCORE_THRESHOLD}")
    print(f"10 percentil abajo: {percentile_10_below}")
    print(f"\nAplicando umbral de {ANOMALY_SCORE_THRESHOLD} al mapa de puntuación de anomalías RAW...")
    predicted_anomaly_mask_thresholded = (anomaly_map_np >= 125).astype(np.uint8)

    print(f"Filtrando componentes conectados menores de {MIN_PIXEL_AREA_THRESHOLD} píxeles...")
    # Find connected components
    labels = measure.label(predicted_anomaly_mask_thresholded)
    properties = measure.regionprops(labels)

    filtered_predicted_mask = np.zeros_like(predicted_anomaly_mask_thresholded, dtype=np.uint8)
    for prop in properties:
        if prop.area >= MIN_PIXEL_AREA_THRESHOLD:
            # Reconstruct the mask with only large enough components
            filtered_predicted_mask[labels == prop.label] = 1

    print(f"Máscara de anomalías predicha después del umbral y filtrado: {filtered_predicted_mask.shape}")

    # --- Visualización de la Máscara de Anomalías Predicha ---
    plt.figure(figsize=(10, 10))
    plt.imshow(query_img_pil) # Original image background
    # Overlay the predicted anomaly regions
    # Use alpha to make it semi-transparent, and a distinct color like red
    plt.imshow(filtered_predicted_mask, cmap='Blues', alpha=0.8 * filtered_predicted_mask, vmin=0, vmax=1)
    plt.title(f'Regiones de Anomalía Predichas\nUmbral: {ANOMALY_SCORE_THRESHOLD}, Área Mín: {MIN_PIXEL_AREA_THRESHOLD}')
    plt.axis('off')
    predicted_mask_output_path = os.path.join(ANOMALY_REGIONS_SAVE_DIR, f'predicted_anomaly_mask_{base_image_name}')
    plt.savefig(predicted_mask_output_path, bbox_inches='tight')
    plt.close()
    print(f"Máscara de anomalías predicha guardada en: {predicted_mask_output_path}")

    # --- 3. Pixel-Level TP, FP, TN, FN Calculation ---
    print("\nCalculando métricas de evaluación a nivel de píxel...")

    # Ensure masks are the same shape
    if ground_truth_mask.shape != filtered_predicted_mask.shape:
        print(f"Error de dimensiones: GT Mask {ground_truth_mask.shape} vs Predicted Mask {filtered_predicted_mask.shape}")
        # Esto no debería pasar si TARGET_EVAL_SIZE se usa consistentemente.
        print("Shapes mismatch. Evaluation might be inaccurate or skipped.")
    
    # Flatten the masks for element-wise comparison
    gt_flat = ground_truth_mask.flatten()
    pred_flat = filtered_predicted_mask.flatten()

    TP = np.sum((gt_flat == 1) & (pred_flat == 1))
    FP = np.sum((gt_flat == 0) & (pred_flat == 1))
    TN = np.sum((gt_flat == 0) & (pred_flat == 0))
    FN = np.sum((gt_flat == 1) & (pred_flat == 0))

    print(f"TP (True Positives): {TP}")
    print(f"FP (False Positives): {FP}")
    print(f"TN (True Negatives): {TN}")
    print(f"FN (False Negatives): {FN}")

    # Calculate metrics
    accuracy = (TP + TN) / (TP + FP + TN + FN) if (TP + FP + TN + FN) > 0 else 0
    sensitivity = TP / (TP + FN) if (TP + FN) > 0 else 0 # Also known as Recall
    specificity = TN / (TN + FP) if (TN + FP) > 0 else 0
    f1_score = 2 * (sensitivity * (TP / (TP + FP))) / (sensitivity + (TP / (TP + FP))) if (sensitivity + (TP / (TP + FP))) > 0 else 0
    precision = TP / (TP + FP) if (TP + FP) > 0 else 0

    print(f"Precision: {precision:.4f}")
    print(f"Accuracy: {accuracy:.4f}")
    print(f"Sensitivity (Recall): {sensitivity:.4f}")
    print(f"Specificity: {specificity:.4f}")
    print(f"F1-Score: {f1_score:.4f}")

    # --- (Optional) 4. Image-Level Classification and Evaluation ---
    print("\nRealizando clasificación a nivel de imagen...")

    # Image-level classification: If any anomaly pixels are detected, classify as anomalous.
    is_image_anomalous_gt = np.sum(ground_truth_mask) > 0
    is_image_anomalous_pred = np.sum(filtered_predicted_mask) > 0

    image_level_TP = 0
    image_level_FP = 0
    image_level_TN = 0
    image_level_FN = 0

    if is_image_anomalous_gt and is_image_anomalous_pred:
        image_level_TP = 1
    elif not is_image_anomalous_gt and is_image_anomalous_pred:
        image_level_FP = 1
    elif not is_image_anomalous_gt and not is_image_anomalous_pred:
        image_level_TN = 1
    elif is_image_anomalous_gt and not is_image_anomalous_pred:
        image_level_FN = 1
    
    print(f"Imagen GT Anómala: {is_image_anomalous_gt}")
    print(f"Imagen Predicha Anómala: {is_image_anomalous_pred}")
    print(f"Image-level TP: {image_level_TP}, FP: {image_level_FP}, TN: {image_level_TN}, FN: {image_level_FN}")

    if is_image_anomalous_pred:
        (print(f"La imagen {base_image_name} se clasifica como: ANÓMALA"))
    else:
        (print(f"La imagen {base_image_name} se clasifica como: NORMAL"))

#else:
#    print("La evaluación a nivel de píxel y de imagen se omitió debido a la falta de máscara Ground Truth.")

Máscara Ground Truth cargada desde: /home/imercatoma/FeatUp/datasets/mvtec_anomaly_detection/hazelnut/ground_truth/cut/006_mask.png con dimensiones (1024, 1024)
Shape de la imagen de consulta: (1024, 1024)
Valor máximo: 196.89837646484375
Valor mínimo: 0.0
1 percentil arriba: 126
10 percentil abajo: 0.0

Aplicando umbral de 126 al mapa de puntuación de anomalías RAW...
Filtrando componentes conectados menores de 2000 píxeles...
Máscara de anomalías predicha después del umbral y filtrado: (1024, 1024)
Máscara de anomalías predicha guardada en: /home/imercatoma/FeatUp/plots_final_eval/cut/cut_006/detected_anomaly_regions/predicted_anomaly_mask_006.png

Calculando métricas de evaluación a nivel de píxel...
TP (True Positives): 6699
FP (False Positives): 13890
TN (True Negatives): 1023954
FN (False Negatives): 4033
Precision: 0.3254
Accuracy: 0.9829
Sensitivity (Recall): 0.6242
Specificity: 0.9866
F1-Score: 0.4278

Realizando clasificación a nivel de imagen...
Imagen GT Anómala: True
Image