# Function softmax

## Definicion
La funcion softmax tambien se conoce con el nombre de funcion exponencial normalizada.  Tambien se suele llamar a la funcion softmax como funcion de generalizacion de la funcion logistica.  De forma general, la funcion logistica es una funcion matematica que se ha utilizado como refinamiento del modelo exponencial.     Un modelo exponencial es aplicado para resolver problemas sobre el crecimiento de poblaciones, propagacion de enfermedades y difusion de redes sociales.  El comportamiento de una funcion logistica tiene tres etapas, inicial, crecimiento y madurez.   En la fase inicial el crecimiento se aproxima a ser exponencial, en la fase de crecimiento los miembros compiten por los recursos criticos y en la fase de madurez, los miembros provocan un cuello de botella que disminuye el crecimiento hasta detenerse.     En la Figura 1, puede apreciarse el comportamiento de la funcion softmax.


Figura 1. Grafica de la funcion softmax

![](https://qph.ec.quoracdn.net/main-qimg-fda2f008df90ed5d7b6aff89b881e1ac)


# Sintaxis

En tensorFlow 2,017 su definicion es calcula las activaciones softmax, una defincion muy basica para comprender su proposito.  La funcion realiza el equivalente de:
```
softmax = tf.exp(logits) / tf.reduce_sum(tf.exp(logits), dim)
```

El codigo de la funcion softmax en tensorflow es el siguiente:
```
softmax(logits,dim=-1,name=None)
```

Luego de conocer que la funcion de activacion softmax proviene de una funcion logistica y esta a su vez es el refinamiento del modelo exponencial, se puede enteder con claridad cual es su comportamiento.

En la Figura 2, se puede observar que la funcion de activacion softmax es utilizada para normalizar los valores de la ultima capa, que frecuentemente es una capa totalmente conectada (full connected layer)


Figura 2. Uso de funcion softmax en una red nuronal convolucional

![](https://sebastianraschka.com/images/faq/softmax_regression/logistic_regression_schematic.png)

## Objetivo
El objetivo de la funcion softmax es comprimir un vector de k-dimensiones de valores reales y convertir en un vector de k-dimensiones (las mismas dimensiones) de valores reales contenidos en el rango [0-1].

## Proposito
Su proposito es normalizar los valores de un tensor, es decir, proporcionar el resultado en un rango de [0-1], incluyendo valores negativos y positivos.
Segun cv-tricks en 2,017, la funcion softmax convierte un vector de k-dimensiones de valores reales a un vector en la misma forma de valores reales en un rango de [0-1] que suman 1.  Deberiamos aplicar la funcion softmax al resultado de nuestra red neuronal convolucional a fin de convertir el resultado a una probabilidad para cada clase.   Es decir que si tenemos tres clases o tres tipos de objectos que la red neuronal reconoce, entonces la sumatoria de las probabilidades de cada clase debe sumar 1.

sebastianraschka.com en 2,017, hace tambien su aporte describiendo a la funcion softmax como una funcion logistica de regresion multi-clase, utilizada para clasificacion mult-clases.

Los resultados de la funcion softmax serviran para clasificar determinar la probabilidad que una nueva imagen pertenezca a una de las clases de nuestro resultados de la funcion softmax, en la Figura 3 se puede observar que una imagen de un gato es analizada y el modelo retorna la probabilidad de que sea un gato o un perro.

Figura 3. Uso de la funcion softmax.
![](https://cdn-images-1.medium.com/max/1600/1*eEKb2RxREV6-MtLz2DNWFQ.gif)

## Argumentos de la funcion en tensorFlow
Para ejecutar la funcion en tensorflow necesitamos conocer cuales son los parametros de entrada y como utilizarlos.
1. logits: es un tensor no vacio.  El tipo de datos puede ser half, float32 o float64. logits significa que los valores de entrada pueden ser valores no normalizados, es decir que puede ser cualquier numero, no solo entre el rango [0-1]
2. dim: la dimension softmax podria ser realizada en, el valor default es -1 el cual indica la ultima dimension.
3. name: un nombre para la operacion, este argumento es opcional.


# Referencias
* [wikipedia.org (2,017). Funcion softmax](https://es.wikipedia.org/wiki/Funci%C3%B3n_SoftMax)
* [wikipedia.org (2,017). Funcion logistica](https://es.wikipedia.org/wiki/Funci%C3%B3n_log%C3%ADstica)
* [wikipedia.org (2,017). Modelo exponencial](https://es.wikipedia.org/wiki/Modelo_exponencial)
* [cv-tricks.com (2,017). Tensorflow Tutorial 2: image classifier using convolutional neural network](http://cv-tricks.com/tensorflow-tutorial/training-convolutional-neural-network-for-image-classification/)
* [tensorflow.org (2,017). tf.nn.softmax](https://www.tensorflow.org/api_docs/python/tf/nn/softmax)
* [Stackoverflow.com (2,017). What's the difference between softmax and softmax_cross entropy with logits?](https://stackoverflow.com/questions/34240703/whats-the-difference-between-softmax-and-softmax-cross-entropy-with-logits)
* [What is Softmax regression and how is it related to Logistic regression?](https://sebastianraschka.com/faq/docs/softmax_regression.html)
* [What the Hell is Perceptron?](https://towardsdatascience.com/what-the-hell-is-perceptron-626217814f53)

In [4]:
# IMPORTS
import tensorflow as tf
import numpy as np
import math
# CREATE SESSION
session = tf.Session()
#CREATE VARIABLES AND PLACEHOLDERS
valuesOneDimension = tf.constant(np.array([[-.2, .0, .1, .2, .3, 0.4, .5, .6, .7, .8, .9 , 1]]))
valuesTwoDimension = tf.constant(np.array([[-.2, .0, .1, .2, .4, 0.3],[-.2,.5, .6, .7, .8, .9]]))
#INIT VARIABLES
session.run(tf.global_variables_initializer())

## GET VALUES OF valuesOneDimension AND TO SAVE IN valuesOneDimensionArray
valuesOneDimensionArray = session.run(valuesOneDimension[0])
print("original values of of one dimension \n"+str(valuesOneDimensionArray)+"\n")

#RUN SESSION
resultOneDimension = session.run(tf.nn.softmax(valuesOneDimension))
resultTwoDimension = session.run(tf.nn.softmax(valuesTwoDimension))
flattenedResultOfOneDimension =session.run(tf.argmax(resultOneDimension, axis=1))
flattenedResultOfTwoDimension =session.run(tf.argmax(resultTwoDimension, axis=1))

#PRINT RESULTS.
print("Result one dimension: \n"+str(resultOneDimension)+"\n")
print("Result two dimension: \n"+str(resultTwoDimension)+"\n")
print("Flatten result of one dimension \n"+str(flattenedResultOfOneDimension)+"\n")
print("Flatten result of two dimension \n"+str(flattenedResultOfTwoDimension)+"\n")

#CHECK RESULT STEP BY STEP
print("2. CHECK RESULT OF SOFTMAX FUNCTION STEP BY STEP \n")

# GET VALUES WITH ONE DIMENSION IN AN ARRAY
valuesOneDimensionExponential = [math.exp(i) for i in valuesOneDimensionArray]
print("Return e elevated to the power of each number \n "+str(valuesOneDimensionExponential)+"\n")

SumValuesOneDimensionExponential = sum(valuesOneDimensionExponential)
print("sum the result of elevate e to the power of each number \n"+str(SumValuesOneDimensionExponential)+"\n")

softmax = [round(number / SumValuesOneDimensionExponential, 3) for number in valuesOneDimensionExponential]
print("softmax values \n"+str(softmax)+"\n")


original values of of one dimension 
[-0.2  0.   0.1  0.2  0.3  0.4  0.5  0.6  0.7  0.8  0.9  1. ]

Result one dimension: 
[[ 0.04119399  0.05031445  0.05560607  0.06145421  0.0679174   0.07506034
   0.0829545   0.0916789   0.10132086  0.11197686  0.12375357  0.13676885]]

Result two dimension: 
[[ 0.11717936  0.14312319  0.15817559  0.17481106  0.21351471  0.1931961 ]
 [ 0.07450818  0.15004106  0.16582101  0.18326056  0.20253424  0.22383495]]

Flatten result of one dimension 
[11]

Flatten result of two dimension 
[4 5]

2. CHECK RESULT OF SOFTMAX FUNCTION STEP BY STEP 

Return e elevated to the power of each number 
 [0.8187307530779818, 1.0, 1.1051709180756477, 1.2214027581601699, 1.3498588075760032, 1.4918246976412703, 1.6487212707001282, 1.8221188003905089, 2.0137527074704766, 2.225540928492468, 2.45960311115695, 2.718281828459045]

sum the result of elevate e to the power of each number 
19.875006581200648

softmax values 
[0.041, 0.05, 0.056, 0.061, 0.068, 0.075, 0.083, 0.092, 0