# Investigación sobre StyleGAN - Pablo García Muñoz

## Contexto Histórico
La **StyleGAN** fue introducida por **NVIDIA** en un artículo titulado *"A Style-Based Generator Architecture for Generative Adversarial Networks"* publicado en 2018. Fue desarrollado por **Tero Karras, Samuli Laine y Timo Aila**. Este trabajo fue una evolución de la **Progressive Growing GAN (ProGAN)**, también desarrollada por NVIDIA. 

La motivación principal detrás de StyleGAN era proporcionar un control más granular sobre las imágenes generadas, específicamente en términos de estilo, para permitir manipular aspectos como la estructura global y los detalles finos de manera separada. Esto resultó en un avance significativo en la calidad y realismo de las imágenes generadas, especialmente en aplicaciones como la generación de rostros humanos.

## Principales Características y Comparativa

### Características principales
- **Espacio latente extendido**: Introducción de un nuevo espacio latente denominado **W**, transformado a partir del espacio latente original **Z** mediante una red de mapeo. Esto permite mayor flexibilidad en la generación de imágenes.
- **Control de estilo multi-escala**: Permite controlar diferentes niveles de estilo en la imagen, desde aspectos globales (pose, forma) hasta detalles más finos (textura, color).
- **Normalización adaptativa de características (AdaIN)**: Ajusta las características en cada capa del generador para aplicar el estilo deseado.
- **Eliminación de artefactos**: StyleGAN minimiza problemas comunes en GANs anteriores, como artefactos repetitivos o incoherencias en las imágenes.

### Comparativa frente a otras GANs
| Tipo de GAN       | Ventajas                                     | Desventajas                          |
|-------------------|---------------------------------------------|---------------------------------------|
| **Vanilla GAN**   | Concepto simple y base para otras GANs      | Difícil de entrenar, mode collapse    |
| **ProGAN**        | Generación progresiva para alta resolución  | Sin control detallado del estilo      |
| **StyleGAN**      | Control granular del estilo, alta calidad   | Más compleja y costosa computacionalmente |
| **WGAN**          | Entrenamiento estable                       | Sin enfoque en control del estilo     |

## Arquitectura


### Descripción
La arquitectura de StyleGAN se diferencia por el uso de:

1. **Red de Mapeo**: Convierte el vector latente **Z** en el espacio intermedio **W**, que proporciona mayor disentanglement y control del estilo.
2. **Inyección de Estilo**: Utiliza la normalización adaptativa de características (**AdaIN**) para aplicar estilos específicos en cada capa del generador.
3. **Generador basado en estilo**: En lugar de depender solo de un vector latente inicial, el estilo se aplica a través de múltiples capas, permitiendo modificar aspectos a diferentes escalas.
4. **Desacoplamiento del ruido**: Se introduce ruido aleatorio independiente en diferentes capas para añadir detalles locales, como textura o granulado.

### Diagrama de la arquitectura
![Figura 2: Diagrama de la arquitectura StyleGAN](img_cuaderno/Arquitectura_StyleGAN.png)

### Parámetros clave
- **Capas de convolución progresivas**: Permiten generar imágenes en resoluciones crecientes.
- **AdaIN**: Calcula las estadísticas (media y desviación estándar) para ajustar el estilo en cada capa.
- **Ruido independiente**: Mejora la variabilidad en detalles finos.

## Aplicaciones y Casos de Uso

1. **Generación de rostros humanos**: Aplicación más destacada, con resultados hiperrealistas (e.g., *ThisPersonDoesNotExist.com*).
2. **Diseño gráfico y artístico**: Generación de texturas, estilos artísticos, y arte conceptual.
3. **Investigación médica**: Generación de imágenes médicas sintéticas para entrenamiento de modelos sin violar la privacidad de datos.
4. **Entretenimiento**: Creación de personajes realistas para videojuegos o películas.
5. **Diseño de interiores y moda**: Generación de prototipos y visualizaciones rápidas.

StyleGAN ha sido un punto de inflexión en la investigación de GANs debido a su capacidad para generar contenido de alta calidad con control detallado, lo que la convierte en una herramienta versátil y poderosa en múltiples industrias.