# Ejemplo de ANN: Análisis de la función OR

Vamos a ver el ejemplo que vimos en clase.

Para esto vamos a usar KERAS (NO Tensorflow) para implementar nuestra 1ra ANN.

Documentación de KERAS: https://keras.io/getting-started/sequential-model-guide/

In [1]:
#Importamos los modelos Sequential y Dense de KERAS:
from keras.models import Sequential
from keras.layers.core import Dense
import numpy as np
#Keras USA TensorFlow como "Backend".. por eso abajo nos tira esto:

Using TensorFlow backend.


In [0]:
#Cargamos las 4 combinaciones de las compuertas XOR --> las ENTRADAS.
training_data = np.array([[0,0],[0,1],[1,0],[1,1]], "float32")

In [0]:
#Estos son los resultados que se obtienen, en el mismo orden --> las SALIDAS.
target_data = np.array([[0],[1],[1],[1]], "float32")

In [0]:
#Vamos a definir la cantidad de neuronas que queremos en la capa oculta... 1er ejemplo vemos con 16:
neuronas_capa_oculta = 16

#Después vamos a ver usando 32.. la función de pérdida debería ser más precisa y MENOR. 

## Creación del modelo de la Red Neuronal en Keras:
Los modelos en Keras se definen como una secuencia de capas (Sequential model). En base a esto, se van agregando distintas capas hasta que se completa el modelo.

In [0]:
model = Sequential()

Una vez definido el modo Sequencial (Sequential model), hay que definir que la red será "Fully-Conected" (totalmente conectada --> osea que todas nuestras capas estarán conectadas) y para esto se define la clase "Dense", la cual permite definir la cantidad de entradas que tendrá la red como así también las funciones de activación y otros parámetros.

En la siguiente función se definen 2 DENSE.. osea 2 capas:

a) En el 1er Dense definimos la capa es oculta con 16 nodos (neuronas_capa_oculta); nuestras 2 entradas --> en nuestro ejemplo eran x1 y x2; y la (f) de activación de dicha capa oculta --> osea para las 16 neuronas, en este caso mediante función Sigmoid.

b) En el 2do Dense definimos la capa de salida, la cual tiene un solo nodo y usa la función de activación Sigmoide; esta función de activación es para las neuronas de la capa de salida.

Podriamos agregar más capas oculta haciendo más DENSE (estoy casi seguro que es asi, je).

In [0]:
# neuronas_capa_oculta = número de neuronas de la capa oculta
# input_dim = número de entradas
# activation = función de activación

#De esta manera usamos el método add de nuestro modelo secuencial para añadr los DENSE... y esto nos dice que todas
#nuestras capas están interconectadas. 1ro definimos las 16 neuronas de la capa oculta, 2 neuronas de entrada y que cada una de 
#esas neuronas va a usar una función sigmoide. Y en el 2do add añadimos solo 1 neurona de salida, tambien con (f) de activación sigmoide.
model.add(Dense(neuronas_capa_oculta, input_dim=2, activation='sigmoid'))   #sigmoide sobre la capa de entrada y oculta (osea a las 2 + 16 neuronas)
model.add(Dense(1, activation='sigmoid'))                                    #sigmoide sobre la capa de salida (osea a la única neurona)

#Hasta acá armamos nuestro modelo: capa oculta, capa entrada, capa de salida. 
#Nos falta definir nuestra función de pérdida (LOSS) y el tipo de entrenamiento.

## Definimos la función de pérdida, optimizador y métricas de nuestro modelo:

Previamente a entrenar el modelo, debemos definir algunas herramientas:

1) Función de pérdida: evalúa los pesos de la red a medida que se la va entrenando.

2) Optimizador: El optimizador se utiliza para buscar diferentes pesos para la red. Pueden ser: SGD : Gradiente descendente

3) Metrics: Una métrica es una función que se utiliza para juzgar el rendimiento de su modelo.

In [0]:
#De esta manera, con la función compile definimos la función de perdida, el optimizador (osea el tipo de entrenamiento... envés del 
#SGD en este caso, usamos ADAM... este es un algoritmo que es una evolución del Gradiente Descendiente --> Ver documentación), y Metrics que sería
#la precisión en cuanto a los valores de los pesos que estamos obteniendo. 

#Así, con esto definimos "que tan bueno" va a ser nuestro entrenamiento.
model.compile(loss='mean_squared_error', optimizer='adam', metrics=['binary_accuracy'])

## Entrenamos nuestro modelo:

*  Epochs: Número de iteraciones que queremos que haga la ANN para que se  entrene.
*  Bach: Número de filas del conjunto de datos que se consideran antes de que los pesos del modelo se actualicen dentro de cada Epochs

In [14]:
model.fit(training_data, target_data, epochs=1000)

#training_data son nuestras entradas.
#target_data son las salidas que queremos. 
#epochs = épocas = iteraciones... ponemos que itere 1000 veces. 

#¿Por qué usamos epochs? En la clase vimos que hacemos feedforward y luego backpropagation hasta encontrar 
#los W y bias óptimos... esto NO se hace infinitamente, sino que lo hacemos un número determinado de veces. 
#De esta manera encontramos el valor de los W óptimo y la idea es cada vez minimizar más y más el LOSS.. vemos que en 
#la 1ra iteración tenemos LOSS: 0.1990. Luego hizo feedforward, backpropagation y en la 2da iteración obtenemos un loss=0,1988... MEJOR. 
#De esta manera, en la iteración 1000 vemos que LOSS = 0.1085.. mejoró bastante. 

#Osea que a mayor iteración nuestro LOSS disminuye y nuestro ACCURACY aumenta... de una iteración a otra los LOSS se MANTIENEN o DISMINUYEN (NUNCA pueden aumentar... CREO.)

Epoch 1/1000
Epoch 2/1000
Epoch 3/1000
Epoch 4/1000
Epoch 5/1000
Epoch 6/1000
Epoch 7/1000
Epoch 8/1000
Epoch 9/1000
Epoch 10/1000
Epoch 11/1000
Epoch 12/1000
Epoch 13/1000
Epoch 14/1000
Epoch 15/1000
Epoch 16/1000
Epoch 17/1000
Epoch 18/1000
Epoch 19/1000
Epoch 20/1000
Epoch 21/1000
Epoch 22/1000
Epoch 23/1000
Epoch 24/1000
Epoch 25/1000
Epoch 26/1000
Epoch 27/1000
Epoch 28/1000
Epoch 29/1000
Epoch 30/1000
Epoch 31/1000
Epoch 32/1000
Epoch 33/1000
Epoch 34/1000
Epoch 35/1000
Epoch 36/1000
Epoch 37/1000
Epoch 38/1000
Epoch 39/1000
Epoch 40/1000
Epoch 41/1000
Epoch 42/1000
Epoch 43/1000
Epoch 44/1000
Epoch 45/1000
Epoch 46/1000
Epoch 47/1000
Epoch 48/1000
Epoch 49/1000
Epoch 50/1000
Epoch 51/1000
Epoch 52/1000
Epoch 53/1000
Epoch 54/1000
Epoch 55/1000
Epoch 56/1000
Epoch 57/1000
Epoch 58/1000
Epoch 59/1000
Epoch 60/1000
Epoch 61/1000
Epoch 62/1000
Epoch 63/1000
Epoch 64/1000
Epoch 65/1000
Epoch 66/1000
Epoch 67/1000
Epoch 68/1000
Epoch 69/1000
Epoch 70/1000
Epoch 71/1000
Epoch 72/1000
E

<keras.callbacks.callbacks.History at 0x7f4168e5b780>

De esta manera con 16 neuronas en la capa oculta, obtuvimos un LOSS de loss: 0.1085 y accuracy: 0.7500

## Predecimos sobre nuestro modelo:

In [15]:
print (model.predict(training_data).round())

#Vemos que nos dió MAL... la salida debería dar 0,1,1,1 y nos dío 1,1,1,1:

[[1.]
 [1.]
 [1.]
 [1.]]


##Nuevo modelo con más neuronas en la capa oculta:

In [16]:
#Ahora definimos un modelo con el doble de neuronas en la capa oculta:
model_32 = Sequential()
neuronas_capa_oculta = 32
model_32.add(Dense(neuronas_capa_oculta, input_dim=2, activation='sigmoid'))
model_32.add(Dense(1, activation='sigmoid'))

#Previo al entrenamiento:
model_32.compile(loss='mean_squared_error', optimizer='adam', metrics=['binary_accuracy'])

#Entrenamos:
model_32.fit(training_data, target_data, epochs=1000)

Epoch 1/1000
Epoch 2/1000
Epoch 3/1000
Epoch 4/1000
Epoch 5/1000
Epoch 6/1000
Epoch 7/1000
Epoch 8/1000
Epoch 9/1000
Epoch 10/1000
Epoch 11/1000
Epoch 12/1000
Epoch 13/1000
Epoch 14/1000
Epoch 15/1000
Epoch 16/1000
Epoch 17/1000
Epoch 18/1000
Epoch 19/1000
Epoch 20/1000
Epoch 21/1000
Epoch 22/1000
Epoch 23/1000
Epoch 24/1000
Epoch 25/1000
Epoch 26/1000
Epoch 27/1000
Epoch 28/1000
Epoch 29/1000
Epoch 30/1000
Epoch 31/1000
Epoch 32/1000
Epoch 33/1000
Epoch 34/1000
Epoch 35/1000
Epoch 36/1000
Epoch 37/1000
Epoch 38/1000
Epoch 39/1000
Epoch 40/1000
Epoch 41/1000
Epoch 42/1000
Epoch 43/1000
Epoch 44/1000
Epoch 45/1000
Epoch 46/1000
Epoch 47/1000
Epoch 48/1000
Epoch 49/1000
Epoch 50/1000
Epoch 51/1000
Epoch 52/1000
Epoch 53/1000
Epoch 54/1000
Epoch 55/1000
Epoch 56/1000
Epoch 57/1000
Epoch 58/1000
Epoch 59/1000
Epoch 60/1000
Epoch 61/1000
Epoch 62/1000
Epoch 63/1000
Epoch 64/1000
Epoch 65/1000
Epoch 66/1000
Epoch 67/1000
Epoch 68/1000
Epoch 69/1000
Epoch 70/1000
Epoch 71/1000
Epoch 72/1000
E

<keras.callbacks.callbacks.History at 0x7f4161c46a20>

Ahora vemos que con 32 neuronas en la capa oculta, obtuvimos un LOSS mucho mejor que el anterior (MENOR)... de 0.0417 y un ACCURACY mucho mejor (MAYOR): 1 ... osea que ahora nuestro modelo predecirá bien.

## Predecimos con nuestro nuevo modelo:

In [17]:
print (model_32.predict(training_data).round())

#Vemos que ahora nos dio BIEN!. Perfecto.

[[0.]
 [1.]
 [1.]
 [1.]]
