# üî¨ Notebook 02: An√°lisis de Activaciones

## üéØ Objetivo

Analizar en profundidad las activaciones de capas intermedias de ResNet18 para entender:
- ¬øQu√© patrones captura cada capa?
- ¬øC√≥mo var√≠an las activaciones entre capas?
- ¬øCu√°l es la sparsity de las activaciones?
- ¬øHay neuronas "muertas" o poco activas?
- ¬øC√≥mo se distribuyen las activaciones?

## üìã Contenido

1. Setup y carga del modelo
2. Extracci√≥n de activaciones en batch
3. An√°lisis estad√≠stico por capa
4. Visualizaci√≥n de distribuciones
5. An√°lisis de sparsity
6. Identificaci√≥n de neuronas muertas
7. Comparaci√≥n entre clases
8. Conclusiones y siguientes pasos

In [None]:
# ============================================================================
# üì¶ 1. Configuraci√≥n de paths y imports b√°sicos
# ============================================================================

import sys
import os
from pathlib import Path

# Detectar el directorio ra√≠z del proyecto
current_dir = Path.cwd()
print(f"üìÅ Directorio actual: {current_dir}")

# Si estamos en notebooks/, subir un nivel
if 'notebooks' in str(current_dir):
    project_root = current_dir.parent
else:
    project_root = current_dir

print(f"üìÅ Directorio ra√≠z del proyecto: {project_root}")

# Agregar el directorio ra√≠z al path de Python
if str(project_root) not in sys.path:
    sys.path.insert(0, str(project_root))
    print(f"‚úÖ Agregado al sys.path: {project_root}")

# Verificar que src/ existe
src_path = project_root / 'src'
if src_path.exists():
    print(f"‚úÖ Directorio src encontrado: {src_path}")
else:
    print(f"‚ùå ERROR: Directorio src NO encontrado en {src_path}")

# Verificar que analyze_neuron.py existe
analyze_neuron_path = src_path / 'utils' / 'analyze_neuron.py'
if analyze_neuron_path.exists():
    print(f"‚úÖ Archivo analyze_neuron.py encontrado")
else:
    print(f"‚ùå ERROR: analyze_neuron.py NO encontrado")

print("\n" + "="*80)

---
## üì¶ 1. Imports y Configuraci√≥n

In [None]:
# Imports est√°ndar
import sys
import os
from pathlib import Path
import logging
from typing import Dict, List, Tuple, Optional
from collections import defaultdict, OrderedDict

# Librer√≠as cient√≠ficas
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from tqdm.auto import tqdm

# PyTorch
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader

# Configuraci√≥n de estilos
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['figure.dpi'] = 100

# Configuraci√≥n de logging
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
logger = logging.getLogger(__name__)

# Agregar src al path
project_root = Path.cwd().parent if 'notebooks' in str(Path.cwd()) else Path.cwd()
sys.path.insert(0, str(project_root / 'src'))

print(f"‚úÖ Project root: {project_root}")
print(f"‚úÖ Python version: {sys.version.split()[0]}")
print(f"‚úÖ PyTorch version: {torch.__version__}")
print(f"‚úÖ CUDA available: {torch.cuda.is_available()}")

---
## üîß 2. Cargar Modelo y Dataset

Reutilizamos las clases implementadas en el Notebook 01.

In [None]:
# Importar nuestras utilidades
from models.model_loader import ModelLoader
from utils.image_loader import ImageLoader
from utils.hooks import ActivationHook, get_layer_types

# Configuraci√≥n
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
BATCH_SIZE = 64
NUM_WORKERS = 4

print(f"üñ•Ô∏è  Device: {DEVICE}")
print(f"üìä Batch size: {BATCH_SIZE}")

In [None]:
# Cargar modelo ResNet18
model_loader = ModelLoader(
    model_name='resnet18',
    pretrained=True,
    device=str(DEVICE)
)

model = model_loader.load_model()
model.eval()  # Modo evaluaci√≥n

# Mostrar informaci√≥n del modelo
arch_info = model_loader.get_architecture_info()
print(f"\nüìä Modelo: ResNet18")
print(f"   - Par√°metros totales: {arch_info['total_params']:,}")
print(f"   - Tama√±o: {arch_info['model_size_mb']:.2f} MB")
print(f"   - Capas: {arch_info['num_layers']}")

In [None]:
# Cargar dataset CIFAR-10
image_loader = ImageLoader(
    dataset_name='cifar10',
    batch_size=BATCH_SIZE,
    num_workers=NUM_WORKERS,
    download=True
)

train_loader, test_loader = image_loader.get_dataloaders()
dataset_info = image_loader.get_dataset_info()

print(f"\nüì¶ Dataset: {dataset_info['name'].upper()}")
print(f"   - Clases: {dataset_info['num_classes']}")
print(f"   - Train samples: {dataset_info['train_samples']:,}")
print(f"   - Test samples: {dataset_info['test_samples']:,}")
print(f"   - Image size: {dataset_info['image_size']}")
print(f"\nüè∑Ô∏è  Clases: {', '.join(dataset_info['classes'])}")

---
## üéØ 3. Seleccionar Capas Objetivo para An√°lisis

Vamos a analizar capas estrat√©gicas de ResNet18:
- **conv1**: Primera capa convolucional (features de bajo nivel)
- **layer1**: Primer bloque residual
- **layer2**: Segundo bloque residual
- **layer3**: Tercer bloque residual
- **layer4**: Cuarto bloque residual (features de alto nivel)
- **fc**: Capa fully connected final

In [None]:
# Obtener estructura de capas del modelo
layer_types = get_layer_types(model)

print("üîç Tipos de capas en ResNet18:")
for layer_type, layers in layer_types.items():
    print(f"   - {layer_type}: {len(layers)} capas")
    if len(layers) <= 5:
        print(f"     {layers}")

In [None]:
# Definir capas objetivo para an√°lisis
# Seleccionamos capas conv2d estrat√©gicas de cada bloque
TARGET_LAYERS = [
    'relu',                    # ReLU despu√©s de conv1: 64 filtros
    'layer1.0.relu',          # ReLU del bloque 1.0
    'layer1.1.relu',          # ReLU del bloque 1.1
    'layer2.0.relu',          # ReLU del bloque 2.0
    'layer2.1.relu',          # ReLU del bloque 2.1
    'layer3.0.relu',          # ReLU del bloque 3.0
    'layer3.1.relu',          # ReLU del bloque 3.1
    'layer4.0.relu',          # ReLU del bloque 4.0
    'layer4.1.relu',          # ReLU del bloque 4.1
]

print(f"\nüéØ Capas seleccionadas para an√°lisis: {len(TARGET_LAYERS)}")
for i, layer in enumerate(TARGET_LAYERS, 1):
    print(f"   {i}. {layer}")

---
## üîå 4. Registrar Hooks y Extraer Activaciones

Usamos la clase `ActivationHook` para capturar activaciones de las capas seleccionadas.

In [None]:
# Crear hook para capturar activaciones
activation_hook = ActivationHook(model, target_layers=TARGET_LAYERS)
activation_hook.register_hooks(capture_gradients=False)

print(f"‚úÖ Hooks registrados en {len(TARGET_LAYERS)} capas")
print(f"üìã Capas monitoreadas: {activation_hook.get_layer_names()}")

In [None]:
# Funci√≥n para extraer activaciones de un batch
def extract_activations_from_batch(
    model: nn.Module,
    hook: ActivationHook,
    images: torch.Tensor,
    device: torch.device
) -> Dict[str, torch.Tensor]:
    """
    Extrae activaciones de un batch de im√°genes.
    
    Args:
        model: Modelo de PyTorch
        hook: ActivationHook registrado
        images: Batch de im√°genes [B, C, H, W]
        device: Device (CPU/GPU)
    
    Returns:
        Diccionario con activaciones por capa
    """
    # Limpiar activaciones previas
    hook.clear_activations()
    
    # Forward pass
    images = images.to(device)
    with torch.no_grad():
        _ = model(images)
    
    # Obtener activaciones (se mantienen en GPU para eficiencia)
    activations = hook.get_activations()
    
    return activations

print("‚úÖ Funci√≥n de extracci√≥n definida")

---
## üìä 5. Extraer Activaciones de M√∫ltiples Batches

Para obtener estad√≠sticas robustas, extraemos activaciones de varios batches.

In [None]:
# Configuraci√≥n de extracci√≥n
NUM_BATCHES_TO_ANALYZE = 10  # Analizar 10 batches (640 im√°genes)
SAMPLE_SIZE = NUM_BATCHES_TO_ANALYZE * BATCH_SIZE

print(f"üî¢ Configuraci√≥n de extracci√≥n:")
print(f"   - Batches a analizar: {NUM_BATCHES_TO_ANALYZE}")
print(f"   - Batch size: {BATCH_SIZE}")
print(f"   - Total de im√°genes: {SAMPLE_SIZE}")

In [None]:
# Estructura para acumular activaciones
# accumulated_activations[layer_name] = lista de tensors
accumulated_activations = defaultdict(list)
accumulated_labels = []

print("\nüöÄ Extrayendo activaciones...")

# Iterar sobre batches del test set
with torch.no_grad():
    for batch_idx, (images, labels) in enumerate(tqdm(test_loader, total=NUM_BATCHES_TO_ANALYZE)):
        if batch_idx >= NUM_BATCHES_TO_ANALYZE:
            break
        
        # Extraer activaciones de este batch
        batch_activations = extract_activations_from_batch(
            model, activation_hook, images, DEVICE
        )
        
        # Acumular activaciones (mantener en GPU por ahora)
        for layer_name, activation in batch_activations.items():
            accumulated_activations[layer_name].append(activation.detach())
        
        # Acumular labels
        accumulated_labels.extend(labels.tolist())

print(f"\n‚úÖ Activaciones extra√≠das de {len(accumulated_labels)} im√°genes")
print(f"üìä Capas analizadas: {len(accumulated_activations)}")

In [None]:
# Concatenar activaciones de todos los batches
# Ahora cada capa tendr√° un tensor de shape [total_images, ...]
print("üîÑ Concatenando activaciones...")

concatenated_activations = {}
for layer_name, activation_list in accumulated_activations.items():
    concatenated_activations[layer_name] = torch.cat(activation_list, dim=0)

print("\nüìê Shapes de activaciones concatenadas:")
for layer_name, activation in concatenated_activations.items():
    print(f"   {layer_name}: {list(activation.shape)}")

# Convertir labels a numpy
labels_array = np.array(accumulated_labels)
print(f"\nüè∑Ô∏è  Labels shape: {labels_array.shape}")

---
## üìà 6. An√°lisis Estad√≠stico de Activaciones

Calculamos estad√≠sticas clave para cada capa:
- Media y desviaci√≥n est√°ndar
- Valores m√≠nimos y m√°ximos
- Sparsity (porcentaje de activaciones == 0)
- N√∫mero de neuronas activas

In [None]:
# Funci√≥n para calcular estad√≠sticas detalladas
def compute_activation_statistics(
    activations: Dict[str, torch.Tensor]
) -> pd.DataFrame:
    """
    Calcula estad√≠sticas completas de activaciones por capa.
    
    Args:
        activations: Diccionario con activaciones por capa
    
    Returns:
        DataFrame con estad√≠sticas por capa
    """
    stats_list = []
    
    for layer_name, activation in activations.items():
        # Convertir a numpy para c√°lculos (mover a CPU si est√° en GPU)
        act_np = activation.cpu().numpy()
        
        # Calcular estad√≠sticas
        stats = {
            'layer': layer_name,
            'shape': str(list(activation.shape)),
            'total_elements': activation.numel(),
            'mean': float(act_np.mean()),
            'std': float(act_np.std()),
            'min': float(act_np.min()),
            'max': float(act_np.max()),
            'median': float(np.median(act_np.flatten())),
            'q25': float(np.percentile(act_np.flatten(), 25)),
            'q75': float(np.percentile(act_np.flatten(), 75)),
            'sparsity_%': float((act_np == 0).sum() / act_np.size * 100),
            'active_neurons': int((act_np != 0).any(axis=(0, 2, 3)).sum() if len(act_np.shape) == 4 else (act_np != 0).any(axis=0).sum()),
            'total_neurons': activation.shape[1] if len(activation.shape) == 4 else activation.shape[-1],
        }
        
        stats_list.append(stats)
    
    return pd.DataFrame(stats_list)

# Calcular estad√≠sticas
stats_df = compute_activation_statistics(concatenated_activations)

print("\nüìä Estad√≠sticas de Activaciones por Capa:")
print("=" * 80)
display(stats_df)

In [None]:
# Visualizar estad√≠sticas clave
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# 1. Media de activaciones por capa
axes[0, 0].bar(range(len(stats_df)), stats_df['mean'], color='steelblue')
axes[0, 0].set_xticks(range(len(stats_df)))
axes[0, 0].set_xticklabels(stats_df['layer'], rotation=45, ha='right')
axes[0, 0].set_ylabel('Media')
axes[0, 0].set_title('Media de Activaciones por Capa')
axes[0, 0].grid(alpha=0.3)

# 2. Desviaci√≥n est√°ndar por capa
axes[0, 1].bar(range(len(stats_df)), stats_df['std'], color='coral')
axes[0, 1].set_xticks(range(len(stats_df)))
axes[0, 1].set_xticklabels(stats_df['layer'], rotation=45, ha='right')
axes[0, 1].set_ylabel('Desviaci√≥n Est√°ndar')
axes[0, 1].set_title('Desviaci√≥n Est√°ndar por Capa')
axes[0, 1].grid(alpha=0.3)

# 3. Sparsity por capa
axes[1, 0].bar(range(len(stats_df)), stats_df['sparsity_%'], color='mediumseagreen')
axes[1, 0].set_xticks(range(len(stats_df)))
axes[1, 0].set_xticklabels(stats_df['layer'], rotation=45, ha='right')
axes[1, 0].set_ylabel('Sparsity (%)')
axes[1, 0].set_title('Sparsity de Activaciones por Capa')
axes[1, 0].grid(alpha=0.3)

# 4. Rango (max - min) por capa
activation_range = stats_df['max'] - stats_df['min']
axes[1, 1].bar(range(len(stats_df)), activation_range, color='orchid')
axes[1, 1].set_xticks(range(len(stats_df)))
axes[1, 1].set_xticklabels(stats_df['layer'], rotation=45, ha='right')
axes[1, 1].set_ylabel('Rango')
axes[1, 1].set_title('Rango de Activaciones (Max - Min) por Capa')
axes[1, 1].grid(alpha=0.3)

plt.tight_layout()
plt.show()

---
## üìä 7. Distribuciones de Activaciones

Visualizamos la distribuci√≥n de activaciones para entender mejor su comportamiento.

In [None]:
# Seleccionar algunas capas representativas para visualizar distribuciones
LAYERS_TO_PLOT = ['relu', 'layer1.1.relu', 'layer2.1.relu', 'layer3.1.relu', 'layer4.1.relu']

print(f"üìä Capas seleccionadas para visualizar distribuciones: {len(LAYERS_TO_PLOT)}")
for layer in LAYERS_TO_PLOT:
    if layer in concatenated_activations:
        print(f"   ‚úÖ {layer}")
    else:
        print(f"   ‚ùå {layer} - NO ENCONTRADA")
        
fig, axes = plt.subplots(len(LAYERS_TO_PLOT), 2, figsize=(15, 4 * len(LAYERS_TO_PLOT)))

for idx, layer_name in enumerate(LAYERS_TO_PLOT):
    if layer_name not in concatenated_activations:
        continue
    
    activation = concatenated_activations[layer_name].cpu().numpy()
    activation_flat = activation.flatten()
    
    # Histograma
    axes[idx, 0].hist(activation_flat, bins=100, alpha=0.7, color='steelblue', edgecolor='black')
    axes[idx, 0].set_xlabel('Valor de Activaci√≥n')
    axes[idx, 0].set_ylabel('Frecuencia')
    axes[idx, 0].set_title(f'Distribuci√≥n de Activaciones - {layer_name}')
    axes[idx, 0].set_yscale('log')  # Escala log para mejor visualizaci√≥n
    axes[idx, 0].grid(alpha=0.3)
    
    # Box plot
    # Tomar muestra para box plot (demasiados puntos pueden ser lentos)
    sample_size = min(10000, len(activation_flat))
    sample_indices = np.random.choice(len(activation_flat), sample_size, replace=False)
    activation_sample = activation_flat[sample_indices]
    
    axes[idx, 1].boxplot(activation_sample, vert=True, patch_artist=True,
                         boxprops=dict(facecolor='lightblue', alpha=0.7))
    axes[idx, 1].set_ylabel('Valor de Activaci√≥n')
    axes[idx, 1].set_title(f'Box Plot - {layer_name}')
    axes[idx, 1].grid(alpha=0.3)

plt.tight_layout()
plt.show()

print("\nüí° Observaciones:")
print("   - Capas tempranas tienden a tener distribuciones m√°s amplias")
print("   - Capas profundas pueden mostrar mayor sparsity")
print("   - La escala logar√≠tmica ayuda a visualizar valores peque√±os")

---
## üîç 8. An√°lisis de Sparsity y Neuronas Muertas

Identificamos neuronas que nunca se activan (o muy raramente).

In [None]:
# Funci√≥n para identificar neuronas muertas
def find_dead_neurons_detailed(
    activations: Dict[str, torch.Tensor],
    threshold: float = 1e-6
) -> Dict[str, Dict]:
    """
    Identifica neuronas "muertas" (que nunca se activan significativamente).
    
    Args:
        activations: Diccionario con activaciones por capa
        threshold: Umbral para considerar una neurona como activa
    
    Returns:
        Diccionario con informaci√≥n de neuronas muertas por capa
    """
    dead_neurons_info = {}
    
    for layer_name, activation in activations.items():
        act_np = activation.cpu().numpy()
        
        # Para capas conv: [B, C, H, W] -> analizar por canal
        if len(act_np.shape) == 4:
            # M√°ximo de cada neurona (canal) a trav√©s de batch y spatial dims
            max_per_neuron = act_np.max(axis=(0, 2, 3))
        # Para capas fc: [B, N] -> analizar por neurona
        else:
            max_per_neuron = act_np.max(axis=0)
        
        # Identificar neuronas muertas
        dead_mask = max_per_neuron <= threshold
        dead_indices = np.where(dead_mask)[0]
        
        total_neurons = len(max_per_neuron)
        dead_count = len(dead_indices)
        dead_percentage = (dead_count / total_neurons * 100) if total_neurons > 0 else 0
        
        dead_neurons_info[layer_name] = {
            'total_neurons': total_neurons,
            'dead_neurons': dead_count,
            'dead_percentage': dead_percentage,
            'dead_indices': dead_indices.tolist(),
            'max_activations': max_per_neuron.tolist()
        }
    
    return dead_neurons_info

# Analizar neuronas muertas
dead_neurons_info = find_dead_neurons_detailed(concatenated_activations, threshold=1e-6)

print("\nüîç An√°lisis de Neuronas Muertas:")
print("=" * 80)
for layer_name, info in dead_neurons_info.items():
    print(f"\n{layer_name}:")
    print(f"   Total de neuronas: {info['total_neurons']}")
    print(f"   Neuronas muertas: {info['dead_neurons']} ({info['dead_percentage']:.2f}%)")
    if info['dead_neurons'] > 0:
        print(f"   √çndices: {info['dead_indices'][:10]}{'...' if len(info['dead_indices']) > 10 else ''}")

In [None]:
# Ver la neurona muerta #38 de conv1
dead_filter_weights = model.conv1.weight[38].detach().cpu().numpy()
# Shape: [3, 7, 7] (canal RGB, kernel 7x7)

plt.imshow(dead_filter_weights.transpose(1, 2, 0))
plt.title('Filtro #38 de conv1 (MUERTO)')
plt.show()

# Comparar con uno activo
active_filter = model.conv1.weight[0].detach().cpu().numpy()
plt.imshow(active_filter.transpose(1, 2, 0))
plt.title('Filtro #0 de conv1 (ACTIVO)')
plt.show()

In [None]:
# Visualizar porcentaje de neuronas muertas por capa
layers = list(dead_neurons_info.keys())
dead_percentages = [dead_neurons_info[layer]['dead_percentage'] for layer in layers]

plt.figure(figsize=(12, 6))
bars = plt.bar(range(len(layers)), dead_percentages, color='crimson', alpha=0.7, edgecolor='black')
plt.xticks(range(len(layers)), layers, rotation=45, ha='right')
plt.ylabel('Porcentaje de Neuronas Muertas (%)')
plt.title('Neuronas Muertas por Capa (threshold = 1e-6)')
plt.grid(alpha=0.3, axis='y')

# A√±adir valores en las barras
for i, bar in enumerate(bars):
    height = bar.get_height()
    if height > 0:
        plt.text(bar.get_x() + bar.get_width()/2., height,
                f'{height:.1f}%',
                ha='center', va='bottom', fontsize=9)

plt.tight_layout()
plt.show()

print("\nüí° Interpretaci√≥n:")
print("   - Un alto % de neuronas muertas puede indicar:")
print("     1. Over-parametrizaci√≥n del modelo")
print("     2. ReLU 'muriendo' (dying ReLU problem)")
print("     3. Neuronas especializadas que solo se activan con ciertos inputs")

---
## üé® 9. Comparaci√≥n de Activaciones entre Clases

¬øLas activaciones var√≠an seg√∫n la clase de la imagen?

In [None]:
# Funci√≥n para calcular estad√≠sticas por clase
def compute_class_wise_statistics(
    activations: Dict[str, torch.Tensor],
    labels: np.ndarray,
    class_names: List[str]
) -> Dict[str, pd.DataFrame]:
    """
    Calcula estad√≠sticas de activaciones separadas por clase.
    
    Args:
        activations: Diccionario con activaciones por capa
        labels: Array con labels de cada imagen
        class_names: Lista con nombres de clases
    
    Returns:
        Diccionario con DataFrames de estad√≠sticas por clase
    """
    class_stats = {}
    
    for layer_name, activation in activations.items():
        act_np = activation.cpu().numpy()
        
        # Calcular estad√≠sticas por clase
        stats_by_class = []
        
        for class_id, class_name in enumerate(class_names):
            # Filtrar activaciones de esta clase
            class_mask = labels == class_id
            if class_mask.sum() == 0:
                continue
            
            class_activations = act_np[class_mask]
            
            stats = {
                'class_id': class_id,
                'class_name': class_name,
                'num_samples': class_mask.sum(),
                'mean': float(class_activations.mean()),
                'std': float(class_activations.std()),
                'median': float(np.median(class_activations)),
                'sparsity_%': float((class_activations == 0).sum() / class_activations.size * 100)
            }
            stats_by_class.append(stats)
        
        class_stats[layer_name] = pd.DataFrame(stats_by_class)
    
    return class_stats

# Calcular estad√≠sticas por clase
class_wise_stats = compute_class_wise_statistics(
    concatenated_activations,
    labels_array,
    dataset_info['classes']
)

print("‚úÖ Estad√≠sticas por clase calculadas")

In [None]:
# Visualizar estad√≠sticas de una capa espec√≠fica por clase
LAYER_TO_ANALYZE = 'layer4.1.relu'  # √öltima capa convolucional

if LAYER_TO_ANALYZE in class_wise_stats:
    df = class_wise_stats[LAYER_TO_ANALYZE]
    
    fig, axes = plt.subplots(1, 2, figsize=(15, 5))
    
    # Media por clase
    axes[0].bar(df['class_name'], df['mean'], color='steelblue', alpha=0.7, edgecolor='black')
    axes[0].set_xlabel('Clase')
    axes[0].set_ylabel('Media de Activaciones')
    axes[0].set_title(f'Media de Activaciones por Clase - {LAYER_TO_ANALYZE}')
    axes[0].tick_params(axis='x', rotation=45)
    axes[0].grid(alpha=0.3, axis='y')
    
    # Sparsity por clase
    axes[1].bar(df['class_name'], df['sparsity_%'], color='coral', alpha=0.7, edgecolor='black')
    axes[1].set_xlabel('Clase')
    axes[1].set_ylabel('Sparsity (%)')
    axes[1].set_title(f'Sparsity por Clase - {LAYER_TO_ANALYZE}')
    axes[1].tick_params(axis='x', rotation=45)
    axes[1].grid(alpha=0.3, axis='y')
    
    plt.tight_layout()
    plt.show()
    
    print(f"\nüìä Estad√≠sticas por Clase - {LAYER_TO_ANALYZE}:")
    print("=" * 80)
    display(df)
else:
    print(f"‚ùå Capa {LAYER_TO_ANALYZE} no encontrada")

---
## üìä 10. Heatmap de Activaciones Promedio

Visualizamos la activaci√≥n promedio de cada neurona para identificar patrones.

In [None]:
# Seleccionar una capa para visualizar heatmap
LAYER_FOR_HEATMAP = 'layer3.1.relu'

if LAYER_FOR_HEATMAP in concatenated_activations:
    activation = concatenated_activations[LAYER_FOR_HEATMAP].cpu().numpy()
    # Shape: [num_images, num_channels, H, W]
    
    # Calcular activaci√≥n promedio por canal a trav√©s de spatial dimensions
    # Resultado: [num_images, num_channels]
    avg_per_channel = activation.mean(axis=(2, 3))
    
    # Seleccionar subset de im√°genes para visualizaci√≥n (primeras 50)
    num_images_to_plot = min(50, avg_per_channel.shape[0])
    avg_per_channel_subset = avg_per_channel[:num_images_to_plot]

    print(f"Este gr√°fico visualiza cu√°nto se activa cada neurona de la capa layer3.1.relu ")
    print(f"para cada una de las primeras 50 im√°genes del dataset.")
    # Crear heatmap
    plt.figure(figsize=(15, 10))
    sns.heatmap(
        avg_per_channel_subset.T,
        cmap='YlOrRd',
        xticklabels=5,
        yticklabels=10,
        cbar_kws={'label': 'Activaci√≥n Promedio'}
    )
    plt.xlabel('√çndice de Imagen')
    plt.ylabel('Canal (Neurona)')
    plt.title(f'Heatmap de Activaciones Promedio - {LAYER_FOR_HEATMAP}\n(Primeras {num_images_to_plot} im√°genes)')
    plt.tight_layout()
    plt.show()
    
    print("\nüí° Interpretaci√≥n del Heatmap:")
    print("   - Filas = canales/neuronas de la capa")
    print("   - Columnas = im√°genes procesadas")
    print("   - Colores c√°lidos = activaciones altas")
    print("   - Color amarillo claro = Activaci√≥n ‚âà 0")
    print("   - Patrones horizontales = neuronas especializadas")
    print("   - Patrones verticales = im√°genes con caracter√≠sticas similares")

    print("--------------------------")
    print("** HEATMAP SALUDABLE **")
    print("   - Mayor√≠a amarillo (sparsity esperada)")
    print("   - Puntos rojos dispersos (selectividad)")
    print("   - Sin filas completamente rojas (no overfitting)")
    print("   - Sin filas completamente rojas (no overfitting)")
    print("--------------------------")
    print("** HEATMAP PROBLEM√ÅTICO **")
    print("   - Todo naranja/rojo (sin sparsity, ReLU no funciona)")
    print("   - Filas completamente rojas (neurona siempre activa, no selectiva)")
    print("   - Columnas completamente amarillas (imagen no reconocida)")
    print("   - Patr√≥n de cuadr√≠cula (neuronas redundantes)")

else:
    print(f"‚ùå Capa {LAYER_FOR_HEATMAP} no encontrada")

In [None]:
# Nueva celda para investigar
print("="*80)
print("üîç INVESTIGACI√ìN: ¬øQu√© neuronas se activaron FUERTE con imagen #5?")
print("="*80)

IMAGE_INDEX = 5
LAYER_TO_INSPECT = 'layer3.1.relu'

if LAYER_TO_INSPECT in concatenated_activations:
    # Obtener activaciones de TODAS las neuronas para imagen #5
    all_neurons_img5 = concatenated_activations[LAYER_TO_INSPECT][IMAGE_INDEX]
    # Shape: [256 neuronas, 2, 2]
    
    # Calcular activaci√≥n promedio espacial de cada neurona
    avg_per_neuron = all_neurons_img5.mean(dim=(1, 2)).cpu().numpy()
    # Shape: [256]
    
    # Ordenar neuronas por activaci√≥n (de mayor a menor)
    neuron_indices = np.argsort(avg_per_neuron)[::-1]
    activations_sorted = avg_per_neuron[neuron_indices]
    
    # Top 10 neuronas m√°s activas
    print(f"\nüèÜ TOP 10 NEURONAS M√ÅS ACTIVAS para imagen #5 (frog):")
    print("="*80)
    for i in range(10):
        neuron_id = neuron_indices[i]
        activation = activations_sorted[i]
        print(f"   #{i+1}. Neurona #{neuron_id:3d}: Activaci√≥n = {activation:.4f}")
    
    # ¬øD√≥nde est√° la neurona #85?
    rank_85 = np.where(neuron_indices == 85)[0][0] + 1
    activation_85 = avg_per_neuron[85]
    
    print(f"\nüéØ Neurona #85 (la que analizamos):")
    print(f"   - Ranking: #{rank_85}/256")
    print(f"   - Activaci√≥n: {activation_85:.4f}")
    
    if rank_85 <= 50:
        print(f"   ‚úÖ Est√° en el top 50 (relativamente activa)")
    else:
        print(f"   ‚ö†Ô∏è  NO est√° en el top 50 (moderadamente activa)")
    
    # Visualizar distribuci√≥n
    fig, axes = plt.subplots(1, 2, figsize=(15, 5))
    
    # Histograma de activaciones de todas las neuronas
    axes[0].hist(avg_per_neuron, bins=50, alpha=0.7, color='steelblue', edgecolor='black')
    axes[0].axvline(activation_85, color='red', linestyle='--', linewidth=2,
                   label=f'Neurona #85 (rank #{rank_85})')
    axes[0].set_xlabel('Activaci√≥n Promedio')
    axes[0].set_ylabel('Frecuencia (n√∫mero de neuronas)')
    axes[0].set_title(f'Distribuci√≥n de Activaciones de las 256 Neuronas\nImagen #5 (frog)')
    axes[0].legend()
    axes[0].grid(alpha=0.3)
    
    # Bar plot del top 20
    top_20_indices = neuron_indices[:20]
    top_20_activations = activations_sorted[:20]
    
    colors = ['red' if idx == 85 else 'steelblue' for idx in top_20_indices]
    bars = axes[1].bar(range(20), top_20_activations, color=colors, alpha=0.7, edgecolor='black')
    axes[1].set_xticks(range(20))
    axes[1].set_xticklabels([f'#{idx}' for idx in top_20_indices], rotation=45, ha='right')
    axes[1].set_xlabel('Neurona ID')
    axes[1].set_ylabel('Activaci√≥n')
    axes[1].set_title('Top 20 Neuronas M√°s Activas\n(Rojo = Neurona #85)')
    axes[1].grid(alpha=0.3, axis='y')
    
    plt.tight_layout()
    plt.show()
    
    print("\nüí° EXPLICACI√ìN DE LA 'RAYA ROJA' EN EL HEATMAP:")
    print("="*80)
    print(f"   - El heatmap muestra TODAS las 256 neuronas")
    print(f"   - Para imagen #5, hay {(avg_per_neuron > 1.0).sum()} neuronas con activaci√≥n > 1.0")
    print(f"   - Estas neuronas 'rojas' crearon la raya visible en la columna")
    print(f"   - La neurona #85 (rank #{rank_85}) contribuy√≥ moderadamente")
    print(f"   - Las neuronas del top 10 son las que realmente causaron la raya roja")
    
else:
    print(f"‚ùå Capa no encontrada")

In [None]:
# ============================================================================
# üî¨ AN√ÅLISIS DETALLADO: Neurona espec√≠fica + Imagen espec√≠fica
# ============================================================================

# Configuraci√≥n
IMAGE_INDEX = 5          # √çndice de la imagen a analizar
NEURON_INDEX = 83        # √çndice de la neurona que queremos investigar
LAYER_TO_INSPECT = 'layer3.1.relu'  # Capa donde est√° la neurona

print("="*80)
print("üîç AN√ÅLISIS DETALLADO DE ACTIVACI√ìN")
print("="*80)
print(f"üìä Capa: {LAYER_TO_INSPECT}")
print(f"üß† Neurona: #{NEURON_INDEX}")
print(f"üñºÔ∏è  Imagen: #{IMAGE_INDEX}")
print("="*80)

In [None]:
# ============================================================================
# 1Ô∏è‚É£ VISUALIZAR LA IMAGEN
# ============================================================================

# Obtener la imagen espec√≠fica del test set
test_images, test_labels = next(iter(test_loader))

# Extraer imagen y label
image = test_images[IMAGE_INDEX]
label = test_labels[IMAGE_INDEX]
class_name = dataset_info['classes'][label]

# Denormalizar para visualizaci√≥n
image_denorm = image_loader.denormalize_image(image)

# Visualizar
fig, axes = plt.subplots(1, 2, figsize=(12, 5))

# Imagen original
axes[0].imshow(image_denorm)
axes[0].set_title(f'Imagen #{IMAGE_INDEX}\nClase: {class_name.upper()}', fontsize=14, fontweight='bold')
axes[0].axis('off')

# Imagen con informaci√≥n
axes[1].imshow(image_denorm)
axes[1].set_title(f'Dimensiones: {image.shape}\nNormalizaci√≥n: ImageNet', fontsize=12)
axes[1].axis('off')

plt.tight_layout()
plt.show()

print(f"\n‚úÖ Imagen cargada correctamente")
print(f"   - Clase real: {class_name}")
print(f"   - Label ID: {label}")
print(f"   - Shape original: {image.shape}")

In [None]:
# ============================================================================
# 2Ô∏è‚É£ EXTRAER ACTIVACI√ìN DE LA NEURONA PARA ESTA IMAGEN
# ============================================================================

# Verificar que tenemos las activaciones
if LAYER_TO_INSPECT in concatenated_activations:
    # Obtener activaciones de la capa completa
    layer_activations = concatenated_activations[LAYER_TO_INSPECT]
    # Shape esperado: [num_images, num_channels, H, W]
    
    # Extraer activaci√≥n de la imagen espec√≠fica
    image_activation = layer_activations[IMAGE_INDEX]  # Shape: [num_channels, H, W]
    
    # Extraer activaci√≥n de la neurona espec√≠fica
    neuron_activation = image_activation[NEURON_INDEX]  # Shape: [H, W]
    
    print(f"\nüìä INFORMACI√ìN DE ACTIVACIONES:")
    print(f"   - Shape de la capa completa: {list(layer_activations.shape)}")
    print(f"   - Shape para imagen #{IMAGE_INDEX}: {list(image_activation.shape)}")
    print(f"   - Shape de neurona #{NEURON_INDEX}: {list(neuron_activation.shape)}")
    
    # Convertir a numpy para an√°lisis
    neuron_activation_np = neuron_activation.cpu().numpy()
    
    # Estad√≠sticas de la activaci√≥n
    print(f"\nüî¢ ESTAD√çSTICAS DE LA ACTIVACI√ìN:")
    print(f"   - Valor m√°ximo: {neuron_activation_np.max():.4f}")
    print(f"   - Valor m√≠nimo: {neuron_activation_np.min():.4f}")
    print(f"   - Valor promedio: {neuron_activation_np.mean():.4f}")
    print(f"   - Desviaci√≥n est√°ndar: {neuron_activation_np.std():.4f}")
    print(f"   - Sparsity: {(neuron_activation_np == 0).sum() / neuron_activation_np.size * 100:.1f}%")
    
    # Calcular activaci√≥n promedio espacial (el valor que vimos en el heatmap)
    avg_activation = neuron_activation_np.mean()
    print(f"\nüéØ ACTIVACI√ìN PROMEDIO (valor del heatmap): {avg_activation:.4f}")
    
else:
    print(f"‚ùå ERROR: Capa '{LAYER_TO_INSPECT}' no encontrada en las activaciones")

In [None]:
# ============================================================================
# 3Ô∏è‚É£ VISUALIZAR EL MAPA DE ACTIVACI√ìN ESPACIAL
# ============================================================================

if LAYER_TO_INSPECT in concatenated_activations:
    fig, axes = plt.subplots(1, 3, figsize=(18, 5))
    
    # 1. Imagen original
    axes[0].imshow(image_denorm)
    axes[0].set_title(f'Imagen Original\n{class_name.upper()}', fontsize=12, fontweight='bold')
    axes[0].axis('off')
    
    # 2. Mapa de activaci√≥n (heatmap)
    im = axes[1].imshow(neuron_activation_np, cmap='hot', interpolation='nearest')
    axes[1].set_title(f'Activaci√≥n de Neurona #{NEURON_INDEX}\n{LAYER_TO_INSPECT}', 
                      fontsize=12, fontweight='bold')
    axes[1].set_xlabel(f'Ancho espacial (shape: {neuron_activation_np.shape[1]})')
    axes[1].set_ylabel(f'Alto espacial (shape: {neuron_activation_np.shape[0]})')
    plt.colorbar(im, ax=axes[1], label='Intensidad de activaci√≥n')
    
    # 3. Superposici√≥n (overlay)
    # Redimensionar activaci√≥n al tama√±o de la imagen original
    from scipy.ndimage import zoom
    zoom_factors = (image_denorm.shape[0] / neuron_activation_np.shape[0],
                    image_denorm.shape[1] / neuron_activation_np.shape[1])
    activation_resized = zoom(neuron_activation_np, zoom_factors, order=1)
    
    # Normalizar para overlay
    activation_norm = (activation_resized - activation_resized.min()) / (activation_resized.max() - activation_resized.min() + 1e-8)
    
    # Mostrar imagen con overlay
    axes[2].imshow(image_denorm)
    axes[2].imshow(activation_norm, cmap='hot', alpha=0.5)  # Alpha para transparencia
    axes[2].set_title(f'Superposici√≥n: ¬øD√≥nde se activa?\n(Rojo = alta activaci√≥n)', 
                      fontsize=12, fontweight='bold')
    axes[2].axis('off')
    
    plt.tight_layout()
    plt.show()
    
    print("\nüí° INTERPRETACI√ìN DEL MAPA DE ACTIVACI√ìN:")
    print("   - Mapa central: Muestra la activaci√≥n espacial (d√≥nde 'mira' la neurona)")
    print("   - Mapa derecho: Superposici√≥n sobre la imagen original")
    print("   - Zonas rojas/brillantes = La neurona se activ√≥ fuertemente ah√≠")
    print("   - Zonas oscuras = La neurona no detect√≥ nada interesante")

In [None]:
# ============================================================================
# 4Ô∏è‚É£ AN√ÅLISIS DE SESGO ESPACIAL
# ============================================================================

from src.utils.analyze_neuron import analyze_spatial_bias, visualize_spatial_bias

# Analizar sesgo espacial de la neurona #83
spatial_results = analyze_spatial_bias(
    neuron_index=83,
    layer_name='layer3.1.relu',
    concatenated_activations=concatenated_activations,
    num_samples=50,
    verbose=True
)

# Visualizar resultados
visualize_spatial_bias(spatial_results)

# Acceso r√°pido a resultados
print(f"\nüéØ Resumen:")
print(f"   Sesgo horizontal: {spatial_results['horizontal_bias']['bias_type']}")
print(f"   Sesgo vertical: {spatial_results['vertical_bias']['bias_type']}")
print(f"   Sesgo dominante: {spatial_results['dominant_bias']}")

In [None]:
# ============================================================================
# 5Ô∏è‚É£ AN√ÅLISIS POR CLASE: ¬øEsta neurona es selectiva a alguna clase?
# ============================================================================

from src.utils.analyze_neuron import analyze_class_selectivity, visualize_class_selectivity

# Analizar selectividad por clase
selectivity_results = analyze_class_selectivity(
    neuron_index=83,
    layer_name='layer3.1.relu',
    concatenated_activations=concatenated_activations,
    labels=labels_array,
    class_names=dataset_info['classes'],
    num_samples=50,
    verbose=True
)

# Visualizar resultados
visualize_class_selectivity(selectivity_results)

# Acceso program√°tico a resultados
print(f"\nüéØ Resumen r√°pido:")
print(f"   Clase preferida: {selectivity_results['selectivity']['top_class']}")
print(f"   Nivel de selectividad: {selectivity_results['selectivity']['level']}")
print(f"   Ratio: {selectivity_results['selectivity']['activation_ratio']:.2f}x")

In [None]:
# ============================================================================
# 6Ô∏è‚É£ AN√ÅLISIS DE TEXTURAS: Funci√≥n modular
# ============================================================================

from src.utils.analyze_neuron import analyze_neuron_texture_and_features, visualize_texture_analysis

# Llamar directamente sin crear instancia
results = analyze_neuron_texture_and_features(
    neuron_index=83,
    image_index=5,
    layer_name='layer3.1.relu',
    concatenated_activations=concatenated_activations,
    test_loader=test_loader,
    image_loader=image_loader,
    dataset_info=dataset_info,
    verbose=True
)

# Visualizar resultados
visualize_texture_analysis(results)

# Acceder a resultados
print(f"\nüéØ Acceso r√°pido a resultados:")
print(f"   Feature principal: {results['correlations']['top_feature']}")
print(f"   Correlaci√≥n: {results['correlations']['top_correlation']:.3f}")
print(f"   Color dominante: {results['color_analysis']['dominant_channel']}")
print(f"   Tipo de textura: {results['texture_analysis']['type']}")
print(f"   Complejidad de forma: {results['shape_analysis']['complexity']}")

---
## üî¨ 11. An√°lisis de Evoluci√≥n de Activaciones a trav√©s de Capas

¬øC√≥mo cambian las activaciones a medida que avanzamos en la red?

In [None]:
# Extraer m√©tricas clave de todas las capas para visualizar evoluci√≥n
layer_names = list(concatenated_activations.keys())
layer_means = []
layer_stds = []
layer_sparsities = []
layer_ranges = []

for layer_name in layer_names:
    act_np = concatenated_activations[layer_name].cpu().numpy()
    
    layer_means.append(act_np.mean())
    layer_stds.append(act_np.std())
    layer_sparsities.append((act_np == 0).sum() / act_np.size * 100)
    layer_ranges.append(act_np.max() - act_np.min())

# Crear gr√°ficos de evoluci√≥n
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# 1. Evoluci√≥n de la media
axes[0, 0].plot(range(len(layer_names)), layer_means, marker='o', linewidth=2, markersize=8, color='steelblue')
axes[0, 0].set_xticks(range(len(layer_names)))
axes[0, 0].set_xticklabels(layer_names, rotation=45, ha='right', fontsize=8)
axes[0, 0].set_ylabel('Media')
axes[0, 0].set_title('Evoluci√≥n de la Media de Activaciones')
axes[0, 0].grid(alpha=0.3)

# 2. Evoluci√≥n de la desviaci√≥n est√°ndar
axes[0, 1].plot(range(len(layer_names)), layer_stds, marker='s', linewidth=2, markersize=8, color='coral')
axes[0, 1].set_xticks(range(len(layer_names)))
axes[0, 1].set_xticklabels(layer_names, rotation=45, ha='right', fontsize=8)
axes[0, 1].set_ylabel('Desviaci√≥n Est√°ndar')
axes[0, 1].set_title('Evoluci√≥n de la Desviaci√≥n Est√°ndar')
axes[0, 1].grid(alpha=0.3)

# 3. Evoluci√≥n de la sparsity
axes[1, 0].plot(range(len(layer_names)), layer_sparsities, marker='^', linewidth=2, markersize=8, color='mediumseagreen')
axes[1, 0].set_xticks(range(len(layer_names)))
axes[1, 0].set_xticklabels(layer_names, rotation=45, ha='right', fontsize=8)
axes[1, 0].set_ylabel('Sparsity (%)')
axes[1, 0].set_title('Evoluci√≥n de la Sparsity')
axes[1, 0].grid(alpha=0.3)

# 4. Evoluci√≥n del rango
axes[1, 1].plot(range(len(layer_names)), layer_ranges, marker='D', linewidth=2, markersize=8, color='orchid')
axes[1, 1].set_xticks(range(len(layer_names)))
axes[1, 1].set_xticklabels(layer_names, rotation=45, ha='right', fontsize=8)
axes[1, 1].set_ylabel('Rango (Max - Min)')
axes[1, 1].set_title('Evoluci√≥n del Rango de Activaciones')
axes[1, 1].grid(alpha=0.3)

plt.tight_layout()
plt.show()

# ---- An√°lisis autom√°tico de tendencias
print("\nüí° Observaciones sobre la Evoluci√≥n:")
print("=" * 80)

# 1. MEDIA
mean_values = [stats_df.loc[stats_df['layer'] == layer, 'mean'].values[0] 
               for layer in layer_names]
mean_start = mean_values[0]
mean_end = mean_values[-1]
mean_max = max(mean_values)
mean_max_layer = layer_names[mean_values.index(mean_max)]
mean_min = min(mean_values)
mean_min_layer = layer_names[mean_values.index(mean_min)]

if mean_end > mean_start:
    mean_trend = "AUMENTA"
    mean_emoji = "üìà"
else:
    mean_trend = "DISMINUYE"
    mean_emoji = "üìâ"

print(f"\n1Ô∏è‚É£  MEDIA: {mean_emoji} {mean_trend} con la profundidad")
print(f"   ‚Ä¢ Inicial (relu):     {mean_start:.3f}")
print(f"   ‚Ä¢ Final (layer4.1):   {mean_end:.3f}")
print(f"   ‚Ä¢ Cambio total:       {mean_end - mean_start:+.3f} ({((mean_end/mean_start - 1)*100):+.1f}%)")
print(f"   ‚Ä¢ Pico M√ÅXIMO:        {mean_max:.3f} en {mean_max_layer}")
print(f"   ‚Ä¢ Valle M√çNIMO:       {mean_min:.3f} en {mean_min_layer}")
print(f"   üìä Interpretaci√≥n: ", end="")
if mean_max_layer == 'layer1.1.relu':
    print("Pico en layer1.1 indica features ricos antes del downsampling.")
else:
    print(f"El pico en {mean_max_layer} es inesperado, revisar.")

# 2. DESVIACI√ìN EST√ÅNDAR
std_values = [stats_df.loc[stats_df['layer'] == layer, 'std'].values[0] 
              for layer in layer_names]
std_start = std_values[0]
std_end = std_values[-1]
std_max = max(std_values)
std_max_layer = layer_names[std_values.index(std_max)]

if std_end > std_start * 1.5:
    std_trend = "SE VUELVEN MUCHO M√ÅS VARIABLES"
    std_emoji = "üìäüìä"
elif std_end > std_start:
    std_trend = "aumentan ligeramente"
    std_emoji = "üìä"
else:
    std_trend = "se mantienen estables"
    std_emoji = "‚û°Ô∏è"

print(f"\n2Ô∏è‚É£  DESVIACI√ìN EST√ÅNDAR: {std_emoji} {std_trend}")
print(f"   ‚Ä¢ Inicial:            {std_start:.3f}")
print(f"   ‚Ä¢ Final:              {std_end:.3f}")
print(f"   ‚Ä¢ Incremento:         {std_end - std_start:+.3f} ({((std_end/std_start - 1)*100):+.1f}%)")
print(f"   ‚Ä¢ M√°ximo:             {std_max:.3f} en {std_max_layer}")
print(f"   üìä Interpretaci√≥n: ", end="")
if std_max_layer == layer_names[-1]:
    print("Variabilidad m√°xima en √∫ltima capa ‚Üí neuronas ultra-especializadas ‚úÖ")
else:
    print(f"Alta variabilidad en {std_max_layer} indica respuestas diversas en esa capa.")

# 3. SPARSITY
sparsity_values = [stats_df.loc[stats_df['layer'] == layer, 'sparsity_%'].values[0] 
                   for layer in layer_names]
sparsity_start = sparsity_values[0]
sparsity_end = sparsity_values[-1]
sparsity_max = max(sparsity_values)
sparsity_max_layer = layer_names[sparsity_values.index(sparsity_max)]
sparsity_min = min(sparsity_values)
sparsity_min_layer = layer_names[sparsity_values.index(sparsity_min)]

if sparsity_end > sparsity_start + 10:
    sparsity_trend = "AUMENTA SIGNIFICATIVAMENTE"
    sparsity_emoji = "üî∫"
elif sparsity_end > sparsity_start:
    sparsity_trend = "aumenta moderadamente"
    sparsity_emoji = "‚ÜóÔ∏è"
else:
    sparsity_trend = "se mantiene estable"
    sparsity_emoji = "‚û°Ô∏è"

print(f"\n3Ô∏è‚É£  SPARSITY: {sparsity_emoji} {sparsity_trend} en capas profundas")
print(f"   ‚Ä¢ Inicial:            {sparsity_start:.1f}%")
print(f"   ‚Ä¢ Final:              {sparsity_end:.1f}%")
print(f"   ‚Ä¢ Incremento:         {sparsity_end - sparsity_start:+.1f} puntos")
print(f"   ‚Ä¢ M√°ximo:             {sparsity_max:.1f}% en {sparsity_max_layer}")
print(f"   ‚Ä¢ M√≠nimo:             {sparsity_min:.1f}% en {sparsity_min_layer}")
print(f"   üìä Interpretaci√≥n: ", end="")
if sparsity_max > 50:
    print(f"¬°M√°s del 50% de ceros en {sparsity_max_layer}! Neuronas MUY selectivas ‚úÖ")
else:
    print(f"Sparsity moderada indica balance entre activaci√≥n y selectividad.")

# 4. RANGO
range_values = [stats_df.loc[stats_df['layer'] == layer, 'max'].values[0] - 
                stats_df.loc[stats_df['layer'] == layer, 'min'].values[0]
                for layer in layer_names]
range_start = range_values[0]
range_end = range_values[-1]
range_max = max(range_values)
range_max_layer = layer_names[range_values.index(range_max)]
range_min = min(range_values)

if range_end > range_start * 2:
    range_trend = "SE EXPANDEN DRAM√ÅTICAMENTE"
    range_emoji = "üí•üí•"
elif range_end > range_start * 1.2:
    range_trend = "se expanden"
    range_emoji = "üìà"
else:
    range_trend = "se comprimen"
    range_emoji = "üìâ"

print(f"\n4Ô∏è‚É£  RANGO: {range_emoji} Los valores {range_trend}")
print(f"   ‚Ä¢ Inicial:            {range_start:.2f}")
print(f"   ‚Ä¢ Final:              {range_end:.2f}")
print(f"   ‚Ä¢ Multiplicador:      {range_end/range_start:.2f}x")
print(f"   ‚Ä¢ M√°ximo:             {range_max:.2f} en {range_max_layer}")
print(f"   ‚Ä¢ M√≠nimo:             {range_min:.2f}")
print(f"   üìä Interpretaci√≥n: ", end="")
if range_end > 10:
    print(f"Rango >10 en √∫ltima capa ‚Üí activaciones EXTREMAS cuando detectan algo üî•")
else:
    print(f"Rango moderado indica activaciones controladas.")

# RESUMEN FINAL
print("\n" + "=" * 80)
print("üéØ RESUMEN EJECUTIVO:")
print("=" * 80)
print(f"""
ResNet18 muestra un patr√≥n claro de ESPECIALIZACI√ìN PROGRESIVA:

‚úÖ Capas tempranas (layer1):
   - Baja sparsity ({sparsity_min:.1f}%) ‚Üí muchas neuronas activas
   - Variabilidad moderada ‚Üí detectan features generales
   
‚ö†Ô∏è  Transiciones entre bloques:
   - Ca√≠das en media por downsampling
   - Saltos en sparsity (+10-20 puntos)
   
üî• √öltima capa (layer4.1):
   - Alta sparsity ({sparsity_end:.1f}%) ‚Üí neuronas selectivas
   - Alta variabilidad (std={std_end:.2f}) ‚Üí respuestas diversas
   - Rango explosivo ({range_end:.1f}) ‚Üí activaciones extremas
   
üí° Conclusi√≥n: El modelo funciona correctamente con neuronas cada vez
   m√°s especializadas en features de alto nivel.
""")
print("=" * 80)

---
## üíæ 12. Guardar Resultados del An√°lisis

In [None]:
# Crear directorio para resultados
results_dir = project_root / 'results' / 'activation_analysis'
results_dir.mkdir(parents=True, exist_ok=True)

print(f"üìÅ Directorio de resultados: {results_dir}")

In [None]:
# Guardar estad√≠sticas en CSV
stats_df.to_csv(results_dir / 'activation_statistics.csv', index=False)
print("‚úÖ Estad√≠sticas guardadas en activation_statistics.csv")

# Guardar informaci√≥n de neuronas muertas
import json

with open(results_dir / 'dead_neurons_info.json', 'w') as f:
    # Convertir a formato serializable (sin listas muy largas)
    serializable_info = {}
    for layer, info in dead_neurons_info.items():
        serializable_info[layer] = {
            'total_neurons': info['total_neurons'],
            'dead_neurons': info['dead_neurons'],
            'dead_percentage': info['dead_percentage'],
            'dead_indices_count': len(info['dead_indices'])
        }
    json.dump(serializable_info, f, indent=2)

print("‚úÖ Informaci√≥n de neuronas muertas guardada en dead_neurons_info.json")

# Guardar estad√≠sticas por clase
for layer_name, df in class_wise_stats.items():
    safe_layer_name = layer_name.replace('.', '_')
    df.to_csv(results_dir / f'class_stats_{safe_layer_name}.csv', index=False)

print(f"‚úÖ Estad√≠sticas por clase guardadas ({len(class_wise_stats)} archivos)")

In [None]:
# Opcional: Guardar activaciones completas para an√°lisis posterior
# ADVERTENCIA: Esto puede ocupar mucho espacio
SAVE_ACTIVATIONS = False

if SAVE_ACTIVATIONS:
    activations_file = results_dir / 'concatenated_activations.pth'
    torch.save({
        'activations': {k: v.cpu() for k, v in concatenated_activations.items()},
        'labels': labels_array,
        'class_names': dataset_info['classes'],
        'num_samples': len(labels_array)
    }, activations_file)
    
    file_size_mb = activations_file.stat().st_size / (1024 * 1024)
    print(f"‚úÖ Activaciones guardadas en {activations_file}")
    print(f"üì¶ Tama√±o del archivo: {file_size_mb:.2f} MB")
else:
    print("‚ÑπÔ∏è  Activaciones NO guardadas (SAVE_ACTIVATIONS=False)")
    print("   Cambia a True si necesitas guardarlas para an√°lisis futuro")

---
## üìù 13. Conclusiones y Observaciones Clave

In [None]:
print("="*80)
print("üìä RESUMEN DEL AN√ÅLISIS DE ACTIVACIONES")
print("="*80)

print("\nüîç Hallazgos Principales:\n")

# 1. Capa con mayor sparsity
max_sparsity_idx = stats_df['sparsity_%'].idxmax()
max_sparsity_layer = stats_df.loc[max_sparsity_idx, 'layer']
max_sparsity_value = stats_df.loc[max_sparsity_idx, 'sparsity_%']
print(f"1. Capa con MAYOR sparsity: {max_sparsity_layer} ({max_sparsity_value:.2f}%)")

# 2. Capa con menor sparsity
min_sparsity_idx = stats_df['sparsity_%'].idxmin()
min_sparsity_layer = stats_df.loc[min_sparsity_idx, 'layer']
min_sparsity_value = stats_df.loc[min_sparsity_idx, 'sparsity_%']
print(f"2. Capa con MENOR sparsity: {min_sparsity_layer} ({min_sparsity_value:.2f}%)")

# 3. Capa con m√°s neuronas muertas
max_dead_layer = max(dead_neurons_info.items(), key=lambda x: x[1]['dead_percentage'])
print(f"3. Capa con M√ÅS neuronas muertas: {max_dead_layer[0]} ({max_dead_layer[1]['dead_percentage']:.2f}%)")

# 4. Total de neuronas muertas
total_dead = sum(info['dead_neurons'] for info in dead_neurons_info.values())
total_neurons = sum(info['total_neurons'] for info in dead_neurons_info.values())
print(f"4. Total de neuronas muertas: {total_dead}/{total_neurons} ({total_dead/total_neurons*100:.2f}%)")

# 5. Rango de medias
print(f"\n5. Rango de medias de activaciones:")
print(f"   - M√≠nima: {stats_df['mean'].min():.4f} ({stats_df.loc[stats_df['mean'].idxmin(), 'layer']})")
print(f"   - M√°xima: {stats_df['mean'].max():.4f} ({stats_df.loc[stats_df['mean'].idxmax(), 'layer']})")

print("\n" + "="*80)
print("üí° INTERPRETACIONES:")
print("="*80)
print("""
1. SPARSITY:
   - Alta sparsity (>50%) en capas profundas es normal debido a ReLU
   - Indica selectividad: pocas neuronas se activan para cada input
   - Puede ser beneficioso para eficiencia computacional

2. NEURONAS MUERTAS:
   - Algunas neuronas pueden estar especializadas en features raros
   - Un % muy alto (>70%) puede indicar sobreajuste o dying ReLU
   - Considerar: dropout, batch normalization, learning rate

3. EVOLUCI√ìN DE ACTIVACIONES:
   - Capas tempranas: features generales (bordes, texturas)
   - Capas profundas: features espec√≠ficos (objetos, partes)
   - La media deber√≠a estabilizarse en capas profundas

4. DIFERENCIAS ENTRE CLASES:
   - Clases visualmente similares ‚Üí activaciones similares
   - Clases muy diferentes ‚Üí activaciones divergentes
   - √ötil para entender confusiones del modelo
""")

print("="*80)
print("üéØ PR√ìXIMOS PASOS:")
print("="*80)
print("""
‚úÖ Completado: An√°lisis estad√≠stico de activaciones

üìã Siguiente (Notebook 03): Feature Visualization
   - Generar im√°genes sint√©ticas que maximicen activaciones
   - Visualizar qu√© detecta cada neurona
   - Identificar features de bajo y alto nivel

üìã Siguiente (Notebook 04): Neuron Probing
   - Entrenar clasificadores sobre activaciones
   - Entender qu√© informaci√≥n codifica cada capa
   - An√°lisis de emergencia de conceptos
""")

print("="*80)

---
## üßπ 14. Limpieza

In [None]:
# Remover hooks para liberar memoria
activation_hook.remove_hooks()
print("‚úÖ Hooks removidos")

# Limpiar cache de CUDA si es necesario
if torch.cuda.is_available():
    torch.cuda.empty_cache()
    print("‚úÖ Cache de CUDA limpiado")

print("\nüéâ Notebook 02 completado exitosamente!")

---
## üìö Funciones Helper (Si se necesitan agregar)

Las siguientes funciones pueden agregarse a `src/interpretability/activation_analyzer.py` si se reutilizan frecuentemente.

In [None]:
# FUNCIONES HELPER - Copiar a src/interpretability/activation_analyzer.py si es necesario

def compute_activation_statistics(activations: Dict[str, torch.Tensor]) -> pd.DataFrame:
    """Calcula estad√≠sticas completas de activaciones por capa."""
    # Implementaci√≥n ya mostrada arriba
    pass

def find_dead_neurons_detailed(
    activations: Dict[str, torch.Tensor],
    threshold: float = 1e-6
) -> Dict[str, Dict]:
    """Identifica neuronas muertas por capa."""
    # Implementaci√≥n ya mostrada arriba
    pass

def compute_class_wise_statistics(
    activations: Dict[str, torch.Tensor],
    labels: np.ndarray,
    class_names: List[str]
) -> Dict[str, pd.DataFrame]:
    """Calcula estad√≠sticas de activaciones por clase."""
    # Implementaci√≥n ya mostrada arriba
    pass

def extract_activations_from_batch(
    model: nn.Module,
    hook: ActivationHook,
    images: torch.Tensor,
    device: torch.device
) -> Dict[str, torch.Tensor]:
    """Extrae activaciones de un batch de im√°genes."""
    # Implementaci√≥n ya mostrada arriba
    pass

print("üí° Estas funciones pueden moverse a src/interpretability/activation_analyzer.py")
print("   para reutilizaci√≥n en futuros notebooks.")