<a href="https://colab.research.google.com/github/bcruzrui/deep-learning/blob/master/XOR.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# XOR con Keras
## Deep Learning



> Brandon Alain Cruz Ruiz

> Oscar Allan Ruiz Toledo



Inicializamos nuestras entradas y nuestras salidas que servirán para el modelo.

In [None]:
import tensorflow as tf
import numpy as np

inputs = np.array([[0,0],[0,1],[1,0],[1,1]], "float32")
outputs = np.array([[0],[1],[1],[0]], "float32")

Utilizaremos keras para la creación del modelo, en este primer ejemplo utilizaremos una red oculta de 16 nodos con la función de activación Relu para la capa oculta y Sigmoid para la capa de salida.

In [None]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(16, input_dim=2, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')])

Pensabamos utilizar funciones de pérdida y optimizadores "externos" como los ejercicios vistos en clase, pero fue más sencillo agregarlos directamente al modelo con las funciones predefinidas de keras. Utilizamos la función de pérdida de [entropía cruzada binaria](https://keras.io/api/losses/probabilistic_losses/#binarycrossentropy-class), pues de acuerdo al [artículo](hthttps://medium.com/analytics-vidhya/understanding-basics-of-deep-learning-by-solving-xor-problem-cb3ff6a18a06tps://) leído esta función de pérdida es la mas adecuada para este ejemplo, y el [optimizador de gradiente descendiente](https://keras.io/api/optimizers/sgd/).

In [134]:
model.compile(loss='binary_crossentropy',
              optimizer='sgd',
              metrics=['binary_accuracy'])

<tensorflow.python.keras.callbacks.History at 0x7f6f88197be0>

Finalmente entrenamos el modelo. En este caso fue un poco de prueba y error para determinar el número adecuado de epochs para poder optener una precisión adecuada para el modelo. En este caso utilizamos 480 epochs, pero viendo los resultados, más o menos obtenemos los resultados esperados aproximadamente a partir de la epoch 460.

In [148]:
model.fit(inputs, outputs, verbose=0, epochs=480)

<tensorflow.python.keras.callbacks.History at 0x7f6f82c9dfd0>

Y al momento de realizar una predicción, logramos los resultados esperados. 

Nota: Al aumentar las epochs a 500, el último valor que debería ser 0 se volvía 1.

In [149]:
print(model.predict(inputs).round())

[[0.]
 [1.]
 [1.]
 [0.]]


Realizamos un segundo modelo con una segunda capa oculta igual de 16 nodos para observar si existían mejoras en el número de epochs que se realizan.

In [150]:
model2 = tf.keras.models.Sequential([
    tf.keras.layers.Dense(16, input_dim=2, activation='relu'),
    tf.keras.layers.Dense(16, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')])

model2.compile(loss='binary_crossentropy',
              optimizer='sgd',
              metrics=['binary_accuracy'])

model2.fit(inputs, outputs, verbose=0, epochs=300)

<tensorflow.python.keras.callbacks.History at 0x7f6f82c00c50>

Agregando una segunda capa oculta, observamos mejoría evidente. El número de epochs necesarios para alcanzar una precisión de 1 es aproximadamente a partir de la epoch número 230.

In [151]:
print(model2.predict(inputs).round())

[[0.]
 [1.]
 [1.]
 [0.]]


Estos fueron los sitios que nos ayudaron a crear esta red neuronal utilizando keras:

*   Burgdorf, G. (2016). *Understanding XOR with Keras and TensorFlow*. Thoughtram. https://blog.thoughtram.io/machine-learning/2016/11/02/understanding-XOR-with-keras-and-tensorlow.html
*   Pal, L. (2019). *Understanding Basics of Deep Learning by solving XOR problem*. Medium. https://medium.com/analytics-vidhya/understanding-basics-of-deep-learning-by-solving-xor-problem-cb3ff6a18a06