Funciones de activación de las capas --- 0:00 min
===

* Última modificación: Marzo 7, 2022 | YouTube

* Adaptado de: https://keras.io/api/layers/activations/

Importación de librerías
---

In [1]:
import os

os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"

import tensorflow as tf

tf.__version__

'2.8.0'

Uso de activaciones
--

In [2]:
#
# Código comunmente usado
#
model = tf.keras.Sequential()
model.add(
    tf.keras.layers.Dense(64, activation=tf.keras.activations.relu),
)

In [3]:
#
# Código equivalente al anterior. La activación puede usarse como una capa.
#
model = tf.keras.Sequential()
model.add(
    tf.keras.layers.Dense(64),
)
model.add(
    tf.keras.layers.Activation(
        tf.keras.activations.relu,
    ),
)

In [4]:
#
# Usando funciones built-in:
#
model = tf.keras.Sequential()
model.add(
    tf.keras.layers.Dense(
        64,
        activation="relu",
    ),
)

Funciones de activación
--

In [5]:
#
# Entrada de ejemplo
#
foo = tf.constant([-10, -5, 0.0, 5, 10], dtype=tf.float32)

**Función `linear`**

```a(x) = x```

In [6]:
tf.keras.activations.linear(x=foo).numpy()

array([-10.,  -5.,   0.,   5.,  10.], dtype=float32)

**Función `relu`**

In [7]:
tf.keras.activations.relu(
    x=foo,
    alpha=0.0,
    max_value=None,
    threshold=0.0,
).numpy()

array([ 0.,  0.,  0.,  5., 10.], dtype=float32)

In [8]:
tf.keras.activations.relu(
    x=foo,
    alpha=0.5,
    max_value=None,
    threshold=0.0,
).numpy()

array([-5. , -2.5,  0. ,  5. , 10. ], dtype=float32)

In [9]:
tf.keras.activations.relu(
    x=foo,
    alpha=0.0,
    max_value=5.0,
    threshold=0.0,
).numpy()

array([0., 0., 0., 5., 5.], dtype=float32)

In [10]:
tf.keras.activations.relu(
    x=foo,
    alpha=0.0,
    max_value=None,
    threshold=5.0,
).numpy()

array([-0., -0.,  0.,  0., 10.], dtype=float32)

**Función `sigmoid`**

```sigmoid(x) = 1 / (1 + exp(-x))```

In [11]:
a = tf.constant([-20, -1.0, 0.0, 1.0, 20], dtype=tf.float32)
tf.keras.activations.sigmoid(a).numpy()

array([2.0611537e-09, 2.6894143e-01, 5.0000000e-01, 7.3105860e-01,
       1.0000000e+00], dtype=float32)

**Función `softmax`**

In [12]:
inputs = tf.random.normal(shape=(32, 10))
outputs = tf.keras.activations.softmax(inputs)
tf.reduce_sum(outputs[0, :])

<tf.Tensor: shape=(), dtype=float32, numpy=1.0>

In [13]:
layer = tf.keras.layers.Dense(32, activation=tf.keras.activations.softmax)

**Función `softplus`**

```softplus(x) = log(exp(x) + 1)```

In [14]:
a = tf.constant([-20, -1.0, 0.0, 1.0, 20], dtype=tf.float32)
tf.keras.activations.softplus(a).numpy()

array([2.0611537e-09, 3.1326169e-01, 6.9314718e-01, 1.3132616e+00,
       2.0000000e+01], dtype=float32)

**Función `softsign`**

```softsign(x) = x / (abs(x) + 1)```

In [15]:
a = tf.constant([-1.0, 0.0, 1.0], dtype=tf.float32)
tf.keras.activations.softsign(a).numpy()

array([-0.5,  0. ,  0.5], dtype=float32)

**Función `tanh`**

```tanh(x) = sinh(x)/cosh(x) = ((exp(x) - exp(-x))/(exp(x) + exp(-x)))```

In [16]:
a = tf.constant([-3.0, -1.0, 0.0, 1.0, 3.0], dtype=tf.float32)
tf.keras.activations.tanh(a).numpy()

array([-0.9950547, -0.7615942,  0.       ,  0.7615942,  0.9950547],
      dtype=float32)

**Función `selu` (Scaled Exponential Linear Unit)**

* ```if x > 0: return scale * x```

* ```if x < 0: return scale * alpha * (exp(x) - 1)```

In [17]:
num_classes = 10
model = tf.keras.Sequential()

model.add(
    tf.keras.layers.Dense(
        64,
        kernel_initializer="lecun_normal",
        activation="selu",
    )
)

model.add(
    tf.keras.layers.Dense(
        32,
        kernel_initializer="lecun_normal",
        activation="selu",
    )
)

model.add(
    tf.keras.layers.Dense(
        16,
        kernel_initializer="lecun_normal",
        activation="selu",
    )
)

model.add(
    tf.keras.layers.Dense(
        num_classes,
        activation="softmax",
    ),
)

**Función `elu` (Exponential Linear Unit)**

* Para `alpha > 0`: `x if x > 0 else alpha * (exp(x) - 1)`

* Para `alpha < 0`: controla la saturación para valores negativos

In [18]:
model = tf.keras.Sequential()

model.add(
    tf.keras.layers.Conv2D(
        32,
        (3, 3),
        activation="elu",
        input_shape=(28, 28, 1),
    ),
)
model.add(
    tf.keras.layers.MaxPooling2D(
        (2, 2),
    ),
)
model.add(
    tf.keras.layers.Conv2D(
        64,
        (3, 3),
        activation="elu",
    ),
)
model.add(
    tf.keras.layers.MaxPooling2D(
        (2, 2),
    ),
)
model.add(
    tf.keras.layers.Conv2D(
        64,
        (3, 3),
        activation="elu",
    ),
)

**Función `exp`**

In [19]:
a = tf.constant([-3.0, -1.0, 0.0, 1.0, 3.0], dtype=tf.float32)
tf.keras.activations.exponential(a).numpy()

array([ 0.04978707,  0.36787945,  1.        ,  2.7182817 , 20.085537  ],
      dtype=float32)

Funciones personalizadas de activación
---

In [20]:
#
# Es posile usar cualquier función de TensorFlow que recibe y retorna un tensor
#
model = tf.keras.Sequential()
model.add(
    tf.keras.layers.Dense(
        64,
        activation=tf.nn.tanh,
    ),
)