# Capítulo 14 - Generative Adversarial Networks

En este capítulo introducimos las redes conocidas como Generative Adversarial Networks (GAN), que están generando un gran intereés al ser las responsables en gran medida de las *deepfakes*. Estoy seguro de que resultará interesante para el lector o lectroa acabar el libro con este tema tan actual. Aprovecharemos la explicación de las GAN para introducir ootros tipos de capas de redes no vistas hasta ahora, y alternativas de programación de la API de Keras hasta ahora en el entorno TensorFlow 2.0. 

## 14.1. Generative Adversarial Networks

### 14.1.1. Motivación por las GAN

### 14.1.2. Arquitectura de las GAN

### 14.1.3. Proceso de entrenamiento

## 14.2. Programando una GAN

### 14.2.1. Preparación del entrono y la descarga de datos

Pasamos a codificar nuestro ejemplo, comenzando por preparar el entorno:

In [1]:
#%tensorflow_version 2.x
import tensorflow as tf
from tensorflow import keras
print(tf.__version__)

2.13.1


Es importante asegurarse de que estamos usando TensorFlow 2. Además, también es relevante comprobar que tenemos asignada una GPU, pues ahora la etapa de entrenamiento ya es computacionalmente costosa y se requiere *hardware* acelerador para asegurar que se ejecuta en un tiempo razonable. Podemos hacerlo ejecutando el comando *bash* de Linux `nvidia-smi`. 

In [2]:
!nvidia-smi

Mon Feb  5 23:10:35 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 546.33                 Driver Version: 546.33       CUDA Version: 12.3     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                     TCC/WDDM  | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  NVIDIA GeForce GTX 1080      WDDM  | 00000000:01:00.0  On |                  N/A |
|  0%   44C    P8              14W / 198W |   2810MiB /  8192MiB |      8%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

Vemos que en este caso tenemos asignada una P100, ¡no está mal! A continuación, podemos importar todos los paquetes necesarios para ejecutar el modelo propuesto:

In [3]:
import imageio
import matplotlib.pyplot as pyplot
import numpy as np
import os
import time

Ahora ya podemos descargar las imágenes de conjunto de datos MNIST de dígitos escritos a mano, que serán las imágenes que consideremos reales para nuestro ejemplo. Podemos hacerlo directamente desde `keras.datasets` y preparar las imágenes para ser usadas por las redes con el siguiente código:

In [4]:
(train_images, _), (_, _) = tf.keras.datasets.mnist.load_data()

train_images = train_images.reshape(train_images.shape[0], 28, 28, 1).astype('float32')

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


En este caso solo nos interesan las imágenes y, por tanto, no descargamos ni las *labels* ni los datos de prueba (usaremos `_` para indicar que no necesitamos estos datos y que pueden ser desechables).

Podemos ver en el código que estas imágenes se han normalizado en el rango [-1, 1] para poder usar como función de activación en la capa final del Generador la funcion `tanh`, como veremos a continuación:

In [5]:
train_images = (train_images - 127.5) / 127.5

Barajamos y preparamos los datos en lotes con el siguiente código:

In [6]:
BUFFER_SIZE = 60000
BATCH_SIZE = 256

train_dataset = tf.data.Dataset.from_tensor_slices(train_images).shuffle(BUFFER_SIZE).batch(BATCH_SIZE)

### 14.2.2. Creación de los modelos

A continuación, ya podemos pasar a crear las redes neuronales que actuarán de Generador y Discriminador.

#### 14.2.2.1. Generador

Siguiendo el esquema que habíamos descrito, el Generador recibe como entrada ruido, que puede obtener por ejemplo con `tf.random.normal`. De este ruido debe crear una imagen de 28 x 28 píxeles.

El generador que obtiene una imagen de estas características a partir del vector de ruido que hemos indicado podría ser como el programado en el siguiente código:

In [None]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, Reshape, Conv2DTranspose, BatchNormalization, LeakyReLU

def make_generator_model():
    model = Sequential()
    model.add(Dense(7*7*256, use_bias=False, input_shape=(100)))

    model.add(Reshape(7,7,256))

    model.add(Conv2DTranspose(128, (5, 5), strides=(2, 2), padding='same'))
    model.add(BatchNormalization())
    model.add(LeakyReLU(alpha=0.01))

    model.add(Conv2DTranspose(64, (5, 5), strides=(1, 1), padding='same'))
    model.add(BatchNormalization())
    model.add(LeakyReLU(alpha=0.01))

    model.add(Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', activation='tanh'))

    return model

#### 14.2.2.2. Discriminador

### 14.2.3. Funciones de pérdida y optimizadores

## 14.3. Enrutamiento de la API de bajo nivel de TensorFlow

### 14.2.1. API de bajo nivel de TensorFlow

### 14.2.2. Algoritmo de aprendizaje a bajo nivel

### 14.2.3. Entrenamiento de las redes GAN

### 14.2.4. Mejora del rendimiento computacional con decoradores de funciones

### 14.2.5. Evaluación de los resultados