<a href="https://colab.research.google.com/github/davidlealo/sic_ai_2024/blob/main/007_depp_learning/Clase30_SIC_AI_2024.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Redes Neuronales Avanzadas: RNN, LSTM, Autoencoder y GAN

Este notebook cubre los siguientes temas:
1. Redes Neuronales Recurrentes (RNN)
2. Memoria a Corto y Largo Plazo (LSTM)
3. Autoencoders
4. Redes Generativas Adversarias (GAN)

## 1. Redes Neuronales Recurrentes (RNN)

Las RNN son un tipo de red neuronal diseñada para trabajar con datos secuenciales.

Las Redes Neuronales Recurrentes (RNN) son un tipo de arquitectura de red neuronal diseñada específicamente para procesar datos secuenciales. A diferencia de las redes neuronales feedforward tradicionales, las RNN tienen conexiones que forman ciclos, permitiéndoles mantener una especie de "memoria" de entradas anteriores.
##Características clave de las RNN:

1. Procesamiento secuencial: Las RNN procesan datos de entrada uno a la vez en una secuencia, lo que las hace ideales para tareas como procesamiento de lenguaje natural o análisis de series temporales.

2. Estado oculto: Mantienen un estado interno (llamado estado oculto) que se actualiza con cada nueva entrada, permitiendo a la red "recordar" información de pasos anteriores.
Compartición de parámetros: Las RNN utilizan los mismos parámetros para cada paso de la secuencia, lo que reduce el número total de parámetros que necesitan ser aprendidos.

3. Capacidad de manejar secuencias de longitud variable: Pueden procesar secuencias de diferentes longitudes, lo que es útil en muchas aplicaciones del mundo real.


Sin embargo, las RNN básicas tienen dificultades para capturar dependencias a largo plazo debido al problema del desvanecimiento del gradiente, lo que llevó al desarrollo de arquitecturas más avanzadas como LSTM.

In [None]:
import numpy as np
import tensorflow as tf

# Ejemplo simple de RNN
rnn = tf.keras.layers.SimpleRNN(units=64, input_shape=(None, 1))
model = tf.keras.Sequential([rnn, tf.keras.layers.Dense(1)])
model.compile(optimizer='adam', loss='mse')
print(model.summary())

## 2. Memoria a Corto y Largo Plazo (LSTM)

LSTM es una variante de RNN que puede aprender dependencias a largo plazo.

Las redes de Memoria a Corto y Largo Plazo (LSTM) son una variante especializada de RNN diseñada para superar el problema del desvanecimiento del gradiente y capturar mejor las dependencias a largo plazo en los datos secuenciales.
##Características clave de las LSTM:

1. Estructura de celda compleja: Las LSTM utilizan una estructura de celda más compleja que incluye varias "puertas" (gates) para controlar el flujo de información.

2. Puerta de olvido: Decide qué información del estado anterior debe ser descartada.

3. Puerta de entrada: Determina qué nueva información se almacenará en el estado de la celda.

4. Puerta de salida: Controla qué partes del estado de la celda se outputearán.
5. Línea de memoria a largo plazo: Permite que la información fluya a través de muchos pasos de tiempo con cambios mínimos, ayudando a capturar dependencias a largo plazo.

Las LSTM son particularmente efectivas en tareas que requieren memoria a largo plazo, como la traducción automática, el reconocimiento de voz y la generación de texto.

In [None]:
# Ejemplo de LSTM
lstm = tf.keras.layers.LSTM(units=64, input_shape=(None, 1))
model_lstm = tf.keras.Sequential([lstm, tf.keras.layers.Dense(1)])
model_lstm.compile(optimizer='adam', loss='mse')
print(model_lstm.summary())

## 3. Autoencoders

Los autoencoders son redes neuronales utilizadas para aprender representaciones eficientes de datos.

Los Autoencoders son un tipo de red neuronal no supervisada diseñada para aprender representaciones eficientes (codificaciones) de los datos de entrada, típicamente para reducción de dimensionalidad o para aprendizaje de características.
##Características clave de los Autoencoders:

1. Arquitectura simétrica: Consisten en un codificador que comprime los datos de entrada y un decodificador que intenta reconstruir los datos originales a partir de la representación comprimida.

2. Cuello de botella: La capa central (capa latente) generalmente tiene menos dimensiones que la entrada, forzando a la red a aprender una representación comprimida de los datos.

3. Aprendizaje no supervisado: No requieren etiquetas para el entrenamiento, ya que el objetivo es reconstruir la entrada.

4. Variantes especializadas: Existen varios tipos de autoencoders, como los Autoencoders Variacionales (VAE) o los Autoencoders de Eliminación de Ruido (DAE), cada uno con propósitos específicos.

Los Autoencoders se utilizan en una variedad de aplicaciones, incluyendo reducción de ruido, detección de anomalías y generación de características para otros modelos de aprendizaje automático.

In [None]:
# Ejemplo de Autoencoder
input_dim = 784  # para MNIST
encoding_dim = 32

input_img = tf.keras.Input(shape=(input_dim,))
encoded = tf.keras.layers.Dense(encoding_dim, activation='relu')(input_img)
decoded = tf.keras.layers.Dense(input_dim, activation='sigmoid')(encoded)

autoencoder = tf.keras.Model(input_img, decoded)
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')
print(autoencoder.summary())

## 4. Redes Generativas Adversarias (GAN)

Las GAN consisten en dos redes que compiten entre sí: un generador y un discriminador.

Las Redes Generativas Adversarias (GAN) son un marco de aprendizaje no supervisado que consiste en dos redes neuronales que compiten entre sí: un generador y un discriminador.
##Características clave de las GAN:

1. Generador: Intenta crear datos sintéticos que sean indistinguibles de los datos reales.

2. Discriminador: Intenta distinguir entre los datos reales y los generados sintéticamente.

3. Entrenamiento adversario: Las dos redes se entrenan simultáneamente, con el generador tratando de engañar al discriminador y el discriminador tratando de no ser engañado.

4. Aprendizaje no supervisado: No requieren etiquetas para el entrenamiento, ya que aprenden de la distribución de los datos de entrada.

5. Versatilidad: Pueden ser aplicadas a una amplia gama de tareas, incluyendo generación de imágenes, traducción de imagen a imagen, y síntesis de texto.

Las GAN han mostrado resultados impresionantes en la generación de imágenes realistas, la mejora de la resolución de imágenes, y la creación de arte, entre otras aplicaciones. Sin embargo, su entrenamiento puede ser desafiante debido a la necesidad de equilibrar el rendimiento del generador y el discriminador.


Estas arquitecturas avanzadas de redes neuronales han expandido significativamente las capacidades del aprendizaje profundo, permitiendo abordar tareas cada vez más complejas en procesamiento de secuencias, comprensión y generación de datos.

In [None]:
# Ejemplo simple de GAN
def make_generator_model():
    model = tf.keras.Sequential([
        tf.keras.layers.Dense(7*7*256, use_bias=False, input_shape=(100,)),
        tf.keras.layers.BatchNormalization(),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Reshape((7, 7, 256)),
        tf.keras.layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same', use_bias=False),
        tf.keras.layers.BatchNormalization(),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same', use_bias=False),
        tf.keras.layers.BatchNormalization(),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', use_bias=False, activation='tanh')
    ])
    return model

def make_discriminator_model():
    model = tf.keras.Sequential([
        tf.keras.layers.Conv2D(64, (5, 5), strides=(2, 2), padding='same', input_shape=[28, 28, 1]),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Dropout(0.3),
        tf.keras.layers.Conv2D(128, (5, 5), strides=(2, 2), padding='same'),
        tf.keras.layers.LeakyReLU(),
        tf.keras.layers.Dropout(0.3),
        tf.keras.layers.Flatten(),
        tf.keras.layers.Dense(1)
    ])
    return model

generator = make_generator_model()
discriminator = make_discriminator_model()

print("Generador:")
print(generator.summary())
print("\nDiscriminador:")
print(discriminator.summary())