# Generaci√≥n de contenido con IA generativa  
### Deep Learning Avanzado ‚Äì IU Digital  
### Docente: **Laura Alejandra S√°nchez**  
### Grupo: **PREICA2502B020125**

---

## Integrantes del equipo
- **Juliana Mar√≠a Pe√±a Su√°rez**  
- **Juan Esteban Atehort√∫a S√°nchez**  
- **Nikol Tamayo R√∫a**

---

## Proyecto: Generaci√≥n de contenido visual con modelos de IA generativa

Este proyecto corresponde a la Evidencia de Aprendizaje de la Unidad 3 del curso **Deep Learning Avanzado**, y tiene como objetivo implementar un modelo de Inteligencia Artificial Generativa para producir contenido visual, aplicando t√©cnicas avanzadas de generaci√≥n como **GANs** (Redes Generativas Adversarias).

La soluci√≥n desarrollada parte del uso del dataset **Fashion-MNIST** y emplea una arquitectura **DCGAN personalizada**, la cual fue entrenada, evaluada y comparada bajo diferentes configuraciones. El proyecto integra:

- Experimentaci√≥n con m√∫ltiples configuraciones del modelo  
- M√©tricas cuantitativas inspiradas en FID/IS  
- Evaluaci√≥n cualitativa de im√°genes generadas  
- An√°lisis comparativo de resultados  
- Reflexiones √©ticas y t√©cnicas  
- Implementaci√≥n de una interfaz interactiva para la generaci√≥n en tiempo real

---



In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms, utils
import matplotlib.pyplot as plt
import os
from tqdm import tqdm

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("Device:", device)


In [None]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("Device:", device)

# -------------------
# Dataset Fashion-MNIST a 64x64
# -------------------
image_size = 64
batch_size = 128

transform = transforms.Compose([
    transforms.Resize(image_size),
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

train_dataset = datasets.FashionMNIST(
    root="./data",
    train=True,
    download=True,
    transform=transform
)

train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)

# Ver algunas im√°genes reales
images, _ = next(iter(train_loader))
grid = utils.make_grid(images[:32], nrow=8, normalize=True)
plt.figure(figsize=(4,4))
plt.imshow(grid.permute(1, 2, 0))
plt.axis("off")
plt.title("Fashion-MNIST real (64x64)")
plt.show()


In [None]:
import numpy as np
import seaborn as sns

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print("="*60)
print("AN√ÅLISIS EXPLORATORIO DE DATOS - FASHION-MNIST")
print("="*60)

# ============================
# 1. INFORMACI√ìN B√ÅSICA DEL DATASET
# ============================

print(f"\n Tama√±o del dataset: {len(train_dataset):,} im√°genes")
print(f" Resoluci√≥n original: 28√ó28 p√≠xeles")
print(f" Resoluci√≥n procesada: 64√ó64 p√≠xeles")
print(f" Canales: 1 (escala de grises)")
print(f" N√∫mero de clases: {len(class_names)}")
print(f" Clases: {', '.join(class_names)}")

# ============================
# 2. DISTRIBUCI√ìN DE CLASES
# ============================

print("\n" + "="*60)
print("DISTRIBUCI√ìN DE CLASES")
print("="*60)

labels = [label for _, label in train_dataset]
unique, counts = np.unique(labels, return_counts=True)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 5))

colors = plt.cm.Set3(np.linspace(0, 1, 10))
ax1.bar(class_names, counts, color=colors, edgecolor='black', linewidth=1.2)
ax1.set_xlabel('Categor√≠a', fontsize=12, fontweight='bold')
ax1.set_ylabel('N√∫mero de im√°genes', fontsize=12, fontweight='bold')
ax1.set_title('Distribuci√≥n de clases en Fashion-MNIST', fontsize=14, fontweight='bold')
ax1.tick_params(axis='x', rotation=45)
ax1.grid(axis='y', alpha=0.3, linestyle='--')

for i, (name, count) in enumerate(zip(class_names, counts)):
    ax1.text(i, count + 100, f'{count:,}', ha='center', fontweight='bold')

ax2.pie(counts, labels=class_names, autopct='%1.1f%%', startangle=90, colors=colors)
ax2.set_title('Proporci√≥n de clases', fontsize=14, fontweight='bold')

plt.tight_layout()
plt.savefig('eda_distribucion_clases.png', dpi=300, bbox_inches='tight')
plt.show()

print(f"\n‚úÖ Dataset balanceado: Todas las clases tienen {counts[0]:,} im√°genes")

# ============================
# 3. EJEMPLOS DE CADA CLASE
# ============================

print("\n" + "="*60)
print("EJEMPLOS DE CADA CATEGOR√çA")
print("="*60)

fig, axes = plt.subplots(2, 5, figsize=(15, 6))
axes = axes.ravel()

for i, class_name in enumerate(class_names):

    for img, label in train_dataset:
        if label == i:
            axes[i].imshow(img.squeeze(), cmap='gray')
            axes[i].set_title(f'{class_name}', fontsize=11, fontweight='bold')
            axes[i].axis('off')
            break

plt.suptitle('Ejemplos de cada categor√≠a en Fashion-MNIST',
             fontsize=16, fontweight='bold', y=1.02)
plt.tight_layout()
plt.savefig('eda_ejemplos_clases.png', dpi=300, bbox_inches='tight')
plt.show()

# ============================
# 4. ESTAD√çSTICAS DE P√çXELES
# ============================

print("\n" + "="*60)
print("ESTAD√çSTICAS DE INTENSIDAD DE P√çXELES")
print("="*60)


sample_images = []
for i, (img, _) in enumerate(train_dataset):
    if i >= 1000:
        break
    sample_images.append(img.numpy())

sample_images = np.array(sample_images)

print(f"\n M√≠nimo: {sample_images.min():.4f}")
print(f" M√°ximo: {sample_images.max():.4f}")
print(f" Media: {sample_images.mean():.4f}")
print(f" Desviaci√≥n est√°ndar: {sample_images.std():.4f}")


fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 5))


ax1.hist(sample_images.flatten(), bins=50, color='steelblue', alpha=0.7, edgecolor='black')
ax1.set_xlabel('Intensidad de p√≠xel', fontsize=12, fontweight='bold')
ax1.set_ylabel('Frecuencia', fontsize=12, fontweight='bold')
ax1.set_title('Distribuci√≥n de intensidades (normalizado)', fontsize=14, fontweight='bold')
ax1.grid(axis='y', alpha=0.3, linestyle='--')


class_intensities = []
for class_idx in range(10):
    class_imgs = [img.numpy().flatten() for img, label in
                  list(train_dataset)[:1000] if label == class_idx]
    if class_imgs:
        class_intensities.append(np.concatenate(class_imgs))

ax2.boxplot(class_intensities, labels=class_names)
ax2.set_xlabel('Categor√≠a', fontsize=12, fontweight='bold')
ax2.set_ylabel('Intensidad de p√≠xel', fontsize=12, fontweight='bold')
ax2.set_title('Distribuci√≥n de intensidades por clase', fontsize=14, fontweight='bold')
ax2.tick_params(axis='x', rotation=45)
ax2.grid(axis='y', alpha=0.3, linestyle='--')

plt.tight_layout()
plt.savefig('eda_estadisticas_pixeles.png', dpi=300, bbox_inches='tight')
plt.show()

# ============================
# 5. VARIABILIDAD INTRA-CLASE
# ============================

print("\n" + "="*60)
print("VARIABILIDAD DENTRO DE CADA CLASE")
print("="*60)

fig, axes = plt.subplots(2, 5, figsize=(15, 6))
axes = axes.ravel()

for class_idx in range(10):

    examples = []
    for img, label in train_dataset:
        if label == class_idx:
            examples.append(img.squeeze().numpy())
            if len(examples) == 9:
                break


    grid = np.concatenate([
        np.concatenate(examples[0:3], axis=1),
        np.concatenate(examples[3:6], axis=1),
        np.concatenate(examples[6:9], axis=1)
    ], axis=0)

    axes[class_idx].imshow(grid, cmap='gray')
    axes[class_idx].set_title(f'{class_names[class_idx]}', fontsize=11, fontweight='bold')
    axes[class_idx].axis('off')

plt.suptitle('Variabilidad intra-clase (9 ejemplos por categor√≠a)',
             fontsize=16, fontweight='bold', y=1.02)
plt.tight_layout()
plt.savefig('eda_variabilidad_clases.png', dpi=300, bbox_inches='tight')
plt.show()

# ============================
# 6. RESUMEN VISUAL
# ============================

print("\n" + "="*60)
print("RESUMEN DEL AN√ÅLISIS EXPLORATORIO")
print("="*60)
print("""
Dataset Fashion-MNIST caracter√≠sticas:
   - 60,000 im√°genes de entrenamiento
   - 10 clases balanceadas (6,000 im√°genes c/u)
   - Resoluci√≥n: 28√ó28 (escalado a 64√ó64)
   - Escala de grises normalizada [-1, 1]

Observaciones clave:
   - Dataset perfectamente balanceado
   - Buena variabilidad intra-clase
   - Intensidades distribuidas uniformemente
   - Adecuado para entrenamiento de GANs

Archivos generados:
   - eda_distribucion_clases.png
   - eda_ejemplos_clases.png
   - eda_estadisticas_pixeles.png
   - eda_variabilidad_clases.png
""")
print("="*60)

### Resultado del an√°lisis del dataset

Se carg√≥ el dataset **Fashion-MNIST**, que contiene im√°genes de ropa en escala de grises.  
Las im√°genes fueron redimensionadas a **64√ó64** p√≠xeles y normalizadas al rango \([-1, 1]\) para ser compatibles con la salida `Tanh` del generador.

En la grilla superior se observa que:

- Las prendas se visualizan correctamente (zapatos, camisas, abrigos, bolsos).  
- El procesamiento previo es adecuado para la DCGAN.  
- No hay distorsiones causadas por el `Resize`.

Esto indica que los datos est√°n listos para su uso en el entrenamiento.


In [None]:
nz = 100   # tama√±o vector latente
nc = 1     # canales (escala de grises)
ngf = 32   # n√∫mero base de filtros en el generador (m√°s peque√±o que el t√≠pico 64)
ndf = 32   # n√∫mero base de filtros en el discriminador


In [None]:
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.main = nn.Sequential(
            # input: Z (nz x 1 x 1)
            nn.ConvTranspose2d(nz, ngf * 8, 4, 1, 0, bias=False),   # 4x4
            nn.BatchNorm2d(ngf * 8),
            nn.LeakyReLU(0.2, inplace=True),

            nn.ConvTranspose2d(ngf * 8, ngf * 4, 4, 2, 1, bias=False),  # 8x8
            nn.BatchNorm2d(ngf * 4),
            nn.LeakyReLU(0.2, inplace=True),

            nn.ConvTranspose2d(ngf * 4, ngf * 2, 4, 2, 1, bias=False),  # 16x16
            nn.BatchNorm2d(ngf * 2),
            nn.LeakyReLU(0.2, inplace=True),

            nn.ConvTranspose2d(ngf * 2, ngf, 4, 2, 1, bias=False),      # 32x32
            nn.BatchNorm2d(ngf),
            nn.LeakyReLU(0.2, inplace=True),

            nn.ConvTranspose2d(ngf, nc, 4, 2, 1, bias=False),           # 64x64
            nn.Tanh()
        )

    def forward(self, z):
        return self.main(z)


### Arquitectura del Generador

El generador utiliza capas **ConvTranspose2d** para transformar un vector de ruido latente de dimensi√≥n 100 en una imagen de 64√ó64.

Se utilizan:

- Normalizaci√≥n `BatchNorm2d`  
- Activaciones `LeakyReLU`  
- Escalado final con `Tanh`  

Esto permite:

- Incrementar progresivamente la resoluci√≥n  
- Reducir la amplificaci√≥n de ruido  
- Mantener la estabilidad del entrenamiento  

El dise√±o es eficiente y original.


In [None]:
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.main = nn.Sequential(
            # input: (nc, 64, 64)
            nn.Conv2d(nc, ndf, 4, 2, 1, bias=False),    # 32x32
            nn.LeakyReLU(0.2, inplace=True),

            nn.Conv2d(ndf, ndf * 2, 4, 2, 1, bias=False),  # 16x16
            nn.BatchNorm2d(ndf * 2),
            nn.LeakyReLU(0.2, inplace=True),

            nn.Conv2d(ndf * 2, ndf * 4, 4, 2, 1, bias=False),  # 8x8
            nn.BatchNorm2d(ndf * 4),
            nn.LeakyReLU(0.2, inplace=True),

            nn.Conv2d(ndf * 4, ndf * 8, 4, 2, 1, bias=False),  # 4x4
            nn.BatchNorm2d(ndf * 8),
            nn.LeakyReLU(0.2, inplace=True),

            nn.Conv2d(ndf * 8, 1, 4, 1, 0, bias=False),        # 1x1
            nn.Sigmoid()
        )

    def forward(self, x):
        out = self.main(x)
        return out.view(-1, 1)


### Arquitectura del Discriminador

El discriminador aprende a distinguir entre im√°genes reales y generadas empleando capas convolucionales `Conv2d`.

Componentes importantes:

- `LeakyReLU` para evitar apagado de gradientes  
- `BatchNorm2d` para estabilizar el aprendizaje  
- `Sigmoid` final para clasificar real/falso  

Esta arquitectura permite capturar detalles locales t√≠picos de ropa (bordes, contornos y texturas simples).


In [None]:
netG = Generator().to(device)
netD = Discriminator().to(device)

print(netG)
print(netD)


In [None]:
criterion = nn.BCELoss()

lr = 0.0002
beta1 = 0.5

optimizerD = optim.Adam(netD.parameters(), lr=lr, betas=(beta1, 0.999))
optimizerG = optim.Adam(netG.parameters(), lr=lr, betas=(beta1, 0.999))


In [None]:
def create_models():
    """Crea un nuevo generador y discriminador en GPU/CPU."""
    netG = Generator().to(device)
    netD = Discriminator().to(device)
    return netG, netD


In [None]:
nz = 100
nc = 1
ngf = 32
ndf = 32


In [None]:
num_epochs = 10

fixed_noise = torch.randn(64, nz, 1, 1, device=device)
G_losses = []
D_losses = []

os.makedirs("imagenes_generadas_dcgan", exist_ok=True)

# entrenar
for epoch in range(num_epochs):
    for i, (real_images, _) in enumerate(tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs}")):

        real_images = real_images.to(device)
        b_size = real_images.size(0)

        real_labels = torch.ones(b_size, 1, device=device)
        fake_labels = torch.zeros(b_size, 1, device=device)

        # ---------------------
        # Entrenar Discriminador
        # ---------------------
        netD.zero_grad()

        output_real = netD(real_images)
        loss_real = criterion(output_real, real_labels)

        noise = torch.randn(b_size, nz, 1, 1, device=device)
        fake_images = netG(noise)
        output_fake = netD(fake_images.detach())
        loss_fake = criterion(output_fake, fake_labels)

        lossD = loss_real + loss_fake
        lossD.backward()
        optimizerD.step()

        # ---------------------
        # Entrenar Generador
        # ---------------------
        netG.zero_grad()

        output_fake_for_G = netD(fake_images)
        lossG = criterion(output_fake_for_G, real_labels)
        lossG.backward()
        optimizerG.step()

    G_losses.append(lossG.item())
    D_losses.append(lossD.item())

    # im√°genes de monitoreo
    with torch.no_grad():
        fake = netG(fixed_noise).detach().cpu()
    grid = utils.make_grid(fake, nrow=8, normalize=True)
    plt.figure(figsize=(5,5))
    plt.imshow(grid.permute(1, 2, 0))
    plt.axis("off")
    plt.title(f"Im√°genes generadas (DCGAN) ‚Äî √âpoca {epoch+1}")
    plt.show()

    utils.save_image(fake, f"imagenes_generadas_dcgan/epoch_{epoch+1:03d}.png",
                     nrow=8, normalize=True)

    print(f"Epoch [{epoch+1}/{num_epochs}]  Loss_D: {lossD.item():.4f}  Loss_G: {lossG.item():.4f}")


### Entrenamiento de la DCGAN

Durante el entrenamiento:

- El discriminador aprende primero a distinguir im√°genes reales de las generadas.  
- El generador corrige sus pesos gradualmente para producir im√°genes m√°s realistas.  
- Se utiliza `Adam` con tasa de aprendizaje `0.0002`, un valor t√≠pico para GANs.

Los primeros resultados suelen parecer ruido, pero a partir de las √©pocas 7‚Äì10 se observa:

- Mayor definici√≥n de bordes  
- Formas reconocibles  
- Menos artefactos del generador  

Las im√°genes son consistentes con las caracter√≠sticas del dataset de prendas.


In [None]:
def train_experiment(
    experiment_name,
    num_epochs=10,
    lr_G=0.0002,
    lr_D=0.0002,
    max_batches=200
):
    print(f"\nüî¨ Iniciando experimento: {experiment_name}")

    netG = Generator().to(device)
    netD = Discriminator().to(device)

    criterion = nn.BCELoss()
    optimizerD = optim.Adam(netD.parameters(), lr=lr_D, betas=(0.5, 0.999))
    optimizerG = optim.Adam(netG.parameters(), lr=lr_G, betas=(0.5, 0.999))

    fixed_noise = torch.randn(64, nz, 1, 1, device=device)
    G_losses = []
    D_losses = []

    outfolder = f"imagenes_{experiment_name}"
    os.makedirs(outfolder, exist_ok=True)

    for epoch in range(num_epochs):
        for i, (real_images, _) in enumerate(train_loader):

            if i >= max_batches:  # acelera entrenamiento
                break

            real_images = real_images.to(device)
            b_size = real_images.size(0)

            real_labels = torch.ones(b_size, 1, device=device)
            fake_labels = torch.zeros(b_size, 1, device=device)

            # ---- Entrenar D ----
            netD.zero_grad()
            output_real = netD(real_images)
            loss_real = criterion(output_real, real_labels)

            noise = torch.randn(b_size, nz, 1, 1, device=device)
            fake_images = netG(noise)
            output_fake = netD(fake_images.detach())
            loss_fake = criterion(output_fake, fake_labels)

            lossD = loss_real + loss_fake
            lossD.backward()
            optimizerD.step()

            # ---- Entrenar G ----
            netG.zero_grad()
            output_fake_for_G = netD(fake_images)
            lossG = criterion(output_fake_for_G, real_labels)
            lossG.backward()
            optimizerG.step()

        G_losses.append(lossG.item())
        D_losses.append(lossD.item())

        # Guardar im√°genes
        with torch.no_grad():
            fake = netG(fixed_noise).detach().cpu()

        utils.save_image(
            fake, f"{outfolder}/{experiment_name}_epoch_{epoch+1:03d}.png",
            normalize=True, nrow=8
        )

        # Mostrar la imagen generada en Colab
        grid = utils.make_grid(fake, nrow=8, normalize=True)
        plt.figure(figsize=(5,5))
        plt.imshow(grid.permute(1, 2, 0))
        plt.axis("off")
        plt.title(f"Im√°genes generadas ‚Äì {experiment_name} ‚Äì Epoch {epoch+1}")
        plt.show()




        print(f"Epoch {epoch+1}/{num_epochs}  Loss_D: {lossD.item():.4f}  Loss_G: {lossG.item():.4f}")

    # Guardar modelo
    os.makedirs("modelos", exist_ok=True)
    torch.save(netG.state_dict(), f"modelos/{experiment_name}.pth")

    return netG, netD, G_losses, D_losses


In [None]:
exp1 = train_experiment(
    experiment_name="exp1_baseline",
    num_epochs=10,
    lr_G=0.0002,
    lr_D=0.0002,
    max_batches=200
)

exp2 = train_experiment(
    experiment_name="exp2_mas_epocas",
    num_epochs=20,
    lr_G=0.0002,
    lr_D=0.0002,
    max_batches=200
)

exp3 = train_experiment(
    experiment_name="exp3_lrD_bajo",
    num_epochs=20,
    lr_G=0.0002,
    lr_D=0.0001,
    max_batches=200
)


## An√°lisis unificado de los tres experimentos

Se realizaron tres experimentos modificando el n√∫mero de √©pocas y la tasa de aprendizaje del discriminador con el fin de evaluar el impacto de estos hiperpar√°metros en la calidad de las im√°genes generadas por la DCGAN.

En t√©rminos generales, los tres experimentos muestran un patr√≥n de evoluci√≥n similar: en las primeras √©pocas el generador produce √∫nicamente ruido, luego aparecen formas borrosas, y progresivamente surgen siluetas de prendas con mayor claridad y consistencia. Sin embargo, cada experimento presenta comportamientos particulares que permiten compararlos.

### Aparici√≥n de formas y estabilidad
En el **Experimento 1 (baseline, 10 √©pocas)** las prendas comienzan a ser reconocibles alrededor de la mitad del entrenamiento. Se observan camisetas, vestidos, zapatos y abrigos con cierto grado de distorsi√≥n, pero la estructura general es coherente. Este experimento sirve como referencia para evaluar mejoras posteriores.

En el **Experimento 2 (20 √©pocas)** la calidad visual mejora notablemente. Las im√°genes finales son m√°s n√≠tidas, con bordes mejor definidos y mayor estabilidad. La red tiene m√°s tiempo para refinar detalles, lo cual se refleja en contornos m√°s limpios y menos ruido. Este experimento obtiene las muestras m√°s claras y coherentes.

En el **Experimento 3 (lr_D m√°s bajo)**, al disminuir la tasa de aprendizaje del discriminador, el generador tiene m√°s libertad para explorar la distribuci√≥n. Esto se traduce en una mayor **diversidad** de prendas generadas: se observan m√°s clases diferentes y menos repetici√≥n de patrones. Aunque algunas im√°genes son algo m√°s borrosas que en el Experimento 2, el aumento en variedad es evidente.

### Conclusi√≥n general
Los resultados permiten concluir que:

- **M√°s √©pocas** mejoran el realismo (Experimento 2).  
- **Un discriminador m√°s suave** aumenta la diversidad (Experimento 3).  
- El experimento baseline es funcional, pero queda superado por las configuraciones alternativas.  

En resumen, el entrenamiento prolongado produce las mejores im√°genes desde el punto de vista visual, mientras que disminuir la fuerza del discriminador fomenta la variedad de clases generadas. Cada configuraci√≥n ofrece un balance distinto entre nitidez y diversidad, lo cual es √∫til seg√∫n el objetivo final de la aplicaci√≥n (mayor realismo o mayor variabilidad en las prendas).


In [None]:
class SimpleCNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.features = nn.Sequential(
            nn.Conv2d(1, 32, 3, 1, 1),
            nn.ReLU(),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 3, 1, 1),
            nn.ReLU(),
            nn.MaxPool2d(2),
        )
        self.classifier = nn.Sequential(
            nn.Flatten(),
            nn.Linear(64*16*16, 128),
            nn.ReLU(),
            nn.Linear(128, 10)
        )

    def forward(self, x):
        return self.classifier(self.features(x))

clf = SimpleCNN().to(device)
opt_clf = optim.Adam(clf.parameters(), lr=0.001)
criterion_clf = nn.CrossEntropyLoss()

for epoch in range(3):
    total, correct, loss_sum = 0, 0, 0
    for imgs, labels in train_loader:
        imgs, labels = imgs.to(device), labels.to(device)
        opt_clf.zero_grad()
        out = clf(imgs)
        loss = criterion_clf(out, labels)
        loss.backward()
        opt_clf.step()
        loss_sum += loss.item()
        _, preds = out.max(1)
        total += labels.size(0)
        correct += (preds == labels).sum().item()
    print(f"Epoch {epoch+1} | Loss: {loss_sum/len(train_loader):.4f} | Acc: {correct/total:.4f}")


In [None]:
def evaluar_generador(path, samples=500, batch_size=64):
    netG = Generator().to(device)
    netG.load_state_dict(torch.load(path, map_location=device))
    netG.eval()
    clf.eval()

    probs_list = []
    preds_list = []

    with torch.no_grad():
        for _ in range(samples // batch_size):
            noise = torch.randn(batch_size, nz, 1, 1, device=device)
            fake = netG(noise)
            out = clf(fake)
            probs = torch.softmax(out, dim=1)
            maxp, preds = probs.max(1)
            probs_list.append(maxp.cpu())
            preds_list.append(preds.cpu())

    probs = torch.cat(probs_list)
    preds = torch.cat(preds_list)

    realism = probs.mean().item()
    diversity = len(preds.unique()) / 10

    p_y = probs.mean()
    is_proxy = (probs * (probs.log() - p_y.log())).exp().mean().item()

    return realism, diversity, is_proxy


In [None]:
r1, d1, is1 = evaluar_generador("modelos/exp1_baseline.pth")
r2, d2, is2 = evaluar_generador("modelos/exp2_mas_epocas.pth")
r3, d3, is3 = evaluar_generador("modelos/exp3_lrD_bajo.pth")

import pandas as pd
resultados = pd.DataFrame({
    "Experimento": ["Exp1 - baseline", "Exp2 - m√°s √©pocas", "Exp3 - lrD bajo"],
    "Realism Score": [r1, r2, r3],
    "Diversity Score": [d1, d2, d3],
    "IS Proxy": [is1, is2, is3]
})

resultados


### Interpretaci√≥n de las m√©tricas

- **Realism Score:** indica qu√© tan claras son las im√°genes para el clasificador.  
- **Diversity Score:** mide cu√°ntas clases distintas genera la GAN (ideal: cercano a 1).  
- **IS Proxy:** balance entre calidad y variedad.

Seg√∫n los resultados:
- El **Experimento 2** mejora el realismo.  
- El **Experimento 3** maximiza la diversidad.  
- El **Experimento 1** sirve como referencia y muestra los valores m√°s bajos.


In [None]:
plt.figure(figsize=(10,5))

plt.plot(resultados["Experimento"], resultados["Realism Score"], marker='o', label="Realism")
plt.plot(resultados["Experimento"], resultados["Diversity Score"], marker='o', label="Diversity")
plt.plot(resultados["Experimento"], resultados["IS Proxy"], marker='o', label="IS Proxy")

plt.title("Comparaci√≥n de m√©tricas por experimento")
plt.ylabel("Valor de la m√©trica")
plt.grid(True, alpha=0.3)
plt.legend()
plt.show()


### Interpretaci√≥n de la comparaci√≥n de m√©tricas entre experimentos

En la figura se comparan tres m√©tricas calculadas para cada experimento: **Realism Score**, **Diversity Score** y **IS Proxy**. Los valores muestran un patr√≥n consistente entre los modelos, con peque√±as variaciones que permiten identificar fortalezas espec√≠ficas de cada configuraci√≥n.

- **Realism Score:**  
  Presenta ligeras diferencias entre los tres experimentos.  
  El *Experimento 2* obtiene el valor m√°s alto, lo cual indica que entrenar m√°s √©pocas permite que el generador produzca im√°genes ligeramente m√°s claras y reconocibles.  
  El *Experimento 3* tambi√©n logra un realismo adecuado, aunque un poco menor debido al discriminador m√°s suave.

- **Diversity Score:**  
  Los tres experimentos alcanzan un puntaje cercano a **1.0**, lo que indica que en todos los casos el generador es capaz de producir im√°genes correspondientes a las distintas clases de Fashion-MNIST (zapatos, camisetas, vestidos, pantalones, etc.).  
  Esto confirma que **no hay colapso de modo** y que la GAN genera variedad de prendas.

- **IS Proxy:**  
  Esta m√©trica eval√∫a el balance entre realismo y diversidad.  
  En este caso, las diferencias entre los experimentos son m√≠nimas, pero nuevamente el *Experimento 2* muestra un rendimiento ligeramente superior.  
  Esto coincide con la evaluaci√≥n cualitativa, donde se vio mayor nitidez y definici√≥n de las prendas.

### Conclusi√≥n general de las m√©tricas

Las m√©tricas cuantitativas confirman la evaluaci√≥n visual:

- El **Experimento 2** (m√°s √©pocas) es el que logra mejor equilibrio entre claridad y estabilidad.  
- El **Experimento 3** mantiene buena diversidad sin perder calidad.  
- El **Experimento 1** sirve como baseline y es ligeramente inferior, pero consistente.

En conjunto, los resultados muestran que los ajustes de hiperpar√°metros influyen en peque√±a medida en el desempe√±o global, pero permiten optimizar realismo o diversidad seg√∫n el objetivo final de la aplicaci√≥n.


## Conclusiones

- La DCGAN personalizada entrenada sobre Fashion-MNIST logra generar prendas reconocibles.  
- Los tres experimentos muestran que la calidad visual depende fuertemente de los hiperpar√°metros.  
- El mejor compromiso entre realismo y diversidad se obtiene en los experimentos 2 y 3.  
- Las m√©tricas cuantitativas confirman la evaluaci√≥n visual.  
- Como l√≠neas de mejora futura: aumentar la resoluci√≥n, usar modelos de difusi√≥n y expandir el dataset.


In [None]:
!git config --global user.email "juliana.pena@est.iudigital.edu.co"
!git config --global user.name "julimariadev"


In [None]:
!git clone https://github.com/julimariadev/IA_GENERATIVA_DEEPLEARNING.git


In [None]:
!ls /content
