<a href="https://colab.research.google.com/github/SerArtDev/redes-neuronales/blob/main/keras_avanzado.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Keras avanzado
Keras contiene tres APIs:
- **Secuencial**: Permite crear modelos apilando capas una detrás de la otra de forma sencilla.
- **Funcional**: Da mayor flexibilidad y control sobre los modelos creados. Permite crear modelos más sofisticados que los de capas ordenadas linealmente.
- **Subclases**: Permite crear secciones de redes en clases, las cuales luego pueden ser unidas. Esto es útil para modelos con arquitectura dinámica, que necesita cambiar en el tiempo. También es útil para algunos modelos personalizados de aprendizaje reforzado. Esta API permite crear capas que no están disponibles en Keras, por lo cual es una buena herramienta de investigación.

La API funcional permite definir la capas primero y luego crear el modelo poniendo esas capas en el orden deseado, de esta manera se pueden reutilizar capas. Por tro lado, la API de subclases da control total, permitiendo incluso cambiar conexiones entre neuronas en el entrenamiento.


# Functional API
Vamos a hacer uso de la API funcional de Keras para crear un modelo sencillo

In [2]:
import keras
from keras.layers import Input, Dense
from keras.models import Model

In [3]:
# Para una capa de 20 entradas
input_layer = Input(shape=(20,))
# Definimos dos capas ocultas de 64 neuronas. Se pone la capa de la cual recibe
# sus conexiones. En este ejemplo, la capa hidden_layer1 recibe datos de
# input_layer y hidden_layer2 recibe de hidden_layer1.
hidden_layer1 = Dense(64, activation='relu')(input_layer)
hiden_layer2 = Dense(64, activation='relu')(hidden_layer1)
# Finalmente, se añade una capa de salida. Suponiendo un problema de
# clasificación binaria, se asigna una neurona de salida con función sigmoid
output_layer = Dense(1, activation='sigmoid')(hiden_layer2)
# Creamos el modelo especificando entradas y salidas
model = Model(inputs=input_layer, outputs=output_layer)
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])


In [4]:
# Entrenamos el modelo con datos aleatorios
import numpy as np

x_train = np.random.random((1000, 20))
y_train = np.random.randint(2, size=(1000, 1))

model.fit(x_train, y_train, epochs=10, batch_size=32)

Epoch 1/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.5126 - loss: 0.6987
Epoch 2/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5052 - loss: 0.6938
Epoch 3/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5274 - loss: 0.6926 
Epoch 4/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5295 - loss: 0.6853
Epoch 5/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5619 - loss: 0.6833
Epoch 6/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5760 - loss: 0.6818 
Epoch 7/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5664 - loss: 0.6757
Epoch 8/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.6144 - loss: 0.6726
Epoch 9/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m

<keras.src.callbacks.history.History at 0x7c0784dfb460>

In [5]:
# Evaluamos el modelo
x_test = np.random.random((100, 20))
y_test = np.random.randint(2, size=(100, 1))

model.evaluate(x_test, y_test, batch_size=32)

[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.4962 - loss: 0.6981  


[0.7000386118888855, 0.47999998927116394]

## Dropout y Batch Normalization

Estas son técnicas utilizadas para mejorar el rendimiento de la red.

 El dropout convierte aleatoriamente algunos valores de entrada en 0 durante el entrenamiento, reduciendo el overfitting. Esto obliga al modelo a no depender de una pocas neuronas y permite detectar otras características en los datos. Es un hiperparámetro que determina la fracción de neuronas que serán "apagadas" durante el entrenamiento.

Batch normalization es una técnica en la cual los datos de salida de la capa anterior son escalados y centrados lo cual estabiliza el proceso de entrenamiento. Esta técnica puede mejorar la convergencia del entrenamiento. Esta técnica es aplicada tanto en entrenamiento como en inferencia.


In [6]:
# Vamos a generar una red aplicando dropout
from keras.layers import Dropout

input_layer = Input(shape=(20,))
hidden_layer1 = Dense(64, activation='relu')(input_layer)
dropout_layer = Dropout(rate=0.5)(hidden_layer1)
hidden_layer2 = Dense(64, activation='relu')(dropout_layer)
output_layer = Dense(1, activation='sigmoid')(hidden_layer2)
model = Model(inputs=input_layer, outputs=output_layer)
model.summary()

In [7]:
# Ejemplo de batch normalization
from keras.layers import BatchNormalization

input_layer = Input(shape=(20,))
hidden_layer1 = Dense(64, activation='relu')(input_layer)
batch_norm_layer = BatchNormalization()(hidden_layer1)
hidden_layer2 = Dense(64, activation='relu')(batch_norm_layer)
output_layer = Dense(1, activation='sigmoid')(hidden_layer2)
model = Model(inputs=input_layer, outputs=output_layer)
model.summary()

# Custom Layer

Se pueden crear capas personalizadas, lo cual nos permite tener control total de su comportamiento. Esto se logra definiendo una clase heredada de la clase Layer y sobreescribiendo tres métodos claves: init, build y call.


In [12]:
from keras.layers import Layer
import tensorflow as tf

# Clase que hereda de Layer
class CustomLayer(Layer):

    def __init__(self, units=32, **kwargs):
      # En __init__ se inicializan los atributos de la capa
        self.units = units
        super(CustomLayer, self).__init__(**kwargs)

    def build(self, input_shape):
      # En build se inicializan los pesos de la capa. Este método se llama una
      # sola vez durante la primer llamada de la capa.
      self.w = self.add_weight(shape=(input_shape[-1], self.units),
                               initializer='random_normal',
                               trainable=True)
      self.b = self.add_weight(shape=(self.units,),
                               initializer='zeros',
                               trainable=True)
      super(CustomLayer, self).build(input_shape)

    def call(self, inputs):
      # En call se define el comportamiento de la capa o la lógica del
      # forward.
      return tf.nn.relu(tf.matmul(inputs, self.w) + self.b)



In [13]:
# Esta capa puede ser usada en un modelo
input_layer = Input(shape=(20,))
custom_layer = CustomLayer(units=64)(input_layer)
output_layer = Dense(1, activation='sigmoid')(custom_layer)

model = Model(inputs=input_layer, outputs=output_layer)
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])