In [1]:
%matplotlib inline

import matplotlib.pyplot as plt
import matplotlib.cm as cm
import json, matplotlib
s = json.load( open("styles/bmh_matplotlibrc.json") )
matplotlib.rcParams.update(s)
from IPython.core.pylabtools import figsize
figsize(11, 5)
colores = ["#348ABD", "#A60628","#06A628"]

from ipywidgets import interact, interact_manual, interactive, fixed
import ipywidgets as widgets
from IPython.display import display

In [2]:
import numpy as np

# Soft max
La función de activación _soft max_ se utiliza cuando la salida esperada de la red es la probabilidad de que el vector de entrada corresponda a un ejemplar de entre un conjunto de clases posibles.  Cada clase posible es representada por una neurona, utilizando _one hot enconding_, pero en este caso la entrada sólo debería pertenecer a una de las clases.

Por ejemplo: una imagen es de un perro, gato o caballo, así que la salida podría indicar 50% de probabilidad de que sea un perro, 30% de que sea gato, 20% de que sea caballo.  Si, en otro caso, pudiera haber fotografías con gatos y perros entonces no se utiliza softmax, porque cada neurona de salida debería codificar, independientemente, la probabilidad de que haya un gato y la probabilidad de que haya un perro.

Por lo tanto _soft max_ depende de los potenciales de activación de todas las neuronas en la capa, de modo que las salidas de todas las neuronas representan una distribución de probabilidad discreta sobre las clases posibles.

\begin{align}
  y(x_j) = \frac{e^{x_j}}{\sum_k e^{x_k}}, \forall j
\end{align}

In [7]:
def softmax(x):
    """Compute softmax values for each sets of scores in x."""
    #print("Scores of ", x)
    sm = np.exp(x)
    sm = sm / sm.sum(axis=0)
    return sm

In [8]:
scores = [3.0, 1.0, 0.2]
print(softmax(scores))

[0.8360188  0.11314284 0.05083836]


In [9]:
@interact()
def plot_softmax():
    x = np.arange(-2.0, 6.0, 0.1)
    scores = np.vstack([x, np.ones_like(x), 0.2 * np.ones_like(x)])

    lines = plt.plot(x, softmax(scores).T, linewidth=2)
    for i, line in enumerate(lines):
        line.set_label("Val " + str(i))
    plt.legend()
    plt.xlabel("Val 0")
    plt.ylabel("Softmax")
    plt.title("Variaciones en softmax con $val_1 = 1, val_2 = 0.2$")
    plt.show()

interactive(children=(Output(),), _dom_classes=('widget-interact',))

In [6]:
from IPython.core.display import HTML
def css_styling():
    styles = open("styles/custom.css", "r").read() #or edit path to custom.css
    return HTML(styles)
css_styling()