# Introducción: Capas personalizadas con Tensorflow (Capa de Activación)

En este ejericio vamos a crear una capa personalizada utilizando Lambda dentro de Tensorflow.
Esto nos ayuda a poder modificar parámetros dentro de las capas de activación y entrenar modelos de maneras distintas.

Para este ejericio realizaremos los siguientes pasos:

1. Importar librerías y datasts
2. Preparar datasets
3. Construir modelos con capas personalizadas
4. Comparar resultados de modelos y evaluar su entrenamiento.

# 1. Importar Librerías

In [1]:
import tensorflow as tf
from tensorflow.keras import backend as K

# 2. Preparar Datasets

In [2]:
mnist = tf.keras.datasets.mnist

In [None]:
# Importamos datasets de imagenes de númoers escitos a mano y los dividimos en datasets
(x_train, y_train), (x_test, y_test) = mnist.load_data()

In [None]:
#Escalamos las imagenes dividiendo entre 255, esto es debido a que los valores de los
# pixeles se encuentran entre 0 y 255. Así podemos escalar la data para entrenamiento teniendo un rango más sencillo de manejar.
x_train, x_test = x_train/255.0, x_test/255.0

# 3. Construis modelos con capas personalizadas.

Para este ejericio vamos a crear dos modelos, uno que incluya una capa lamdba con una función de marcador de posición y una que conteca una función definida anteriorimente.

In [9]:
model_1 = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    tf.keras.layers.Dense(128),
    tf.keras.layers.Lambda(lambda x: tf.abs(x)),
    tf.keras.layers.Dense(10, activation='softmax')
])




In [11]:
model_1.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
model_1.fit(x_train, y_train, epochs=5)
model_1.evaluate(x_test, y_test)

Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9913 - loss: 0.0280
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.9935 - loss: 0.0213
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9936 - loss: 0.0212
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9951 - loss: 0.0154
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9954 - loss: 0.0149
313/313 - 0s - 1ms/step - accuracy: 0.9731 - loss: 0.1127


[0.11268296837806702, 0.9731000065803528]

Como podemos observar en el primer modelo, utilizamos la capa de Lambda para crear nuestra propida activazion, donde todos los valores se pasan como absolutos. Esto funciona para datasets qye requiere individualización y no tengas una gran cantidad de datos a entrenar. Mientras más compleja sea la categorización, esta función puede ser menos efectiva.

In [14]:
def relu(x):
    return K.maximum(0.0, x)

In [15]:
model_2 = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    tf.keras.layers.Dense(128),
    tf.keras.layers.Lambda(relu),
    tf.keras.layers.Dense(10, activation='softmax')
])

  super().__init__(**kwargs)


In [16]:
model_2.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [17]:
model_1.fit(x_train, y_train, epochs=5)
model_1.evaluate(x_test, y_test)

Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9961 - loss: 0.0123
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.9955 - loss: 0.0139
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.9959 - loss: 0.0120
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.9967 - loss: 0.0100
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.9977 - loss: 0.0080
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.9682 - loss: 0.1625


[0.13724906742572784, 0.9729999899864197]

Como podemos observar en el segundo modelo, en este caso definimos una función que nos permite usar Relu como método de activación para la capa neuronal. Esto nos permite usar distintos métodos de activación que podrían no estar incluidos dentro de la librería TensorFlow. También nos permite modificar parámetros de entrenamiento cambiando los rangos máximos dentro de la función definida o definir una función "wrap" que nos permite modificar los parámetros de activación como si fuera hiperparámetros.

# Conclusión

Poder personalizar las capas de un modelo nos permite agregar funciones de activación o pérdida como quisiesemos. Esto nos puede ser muy útil para poder resolver problemáticas con metodologías más allá de las que nos brinda la librería TensorFlow.