<a href="https://colab.research.google.com/github/torresmateo/redes-neuronales/blob/master/Clase_1/De_ejemplos_a_reglas.ipynb" target="_parent">
  <img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/>
</a>

# De ejemplos a reglas
En este notebook se muestra como generar un programa a partir de ejemplos usando TensorFlow.

In [1]:
# Se incluyen las bibliotecas necesarias
#%tensorflow_version 2.x
import numpy as np
import tensorflow as tf

# Generar Datos de prueba

Definimos una función simple y generamos ejemplos de prueba, en este caso:
* las reglas son definidas por la función `f(x)`
* la variable `xs` contiene todos los **inputs** 
* la variable `ys` contiene todos los **outputs**

En este ejemplo, la función definida es $f(x) = x + 5$, y generamos un *dataset* con 20 ejemplos.


In [2]:
def f(x):
  return x + 5
xs = np.arange(0,10,0.5)
ys = f(xs)

In [3]:
# reset de la sesión, en caso de querer reentrenar el modelo
tf.keras.backend.clear_session()

# Neurona Artificial
Este modelo consta de una sola neurona, con un solo input. Se incluye la imágen de la presentación para recordar el concepto de neurona artifical.

<img alt='perceptron' src='./img/Perceptron.png' width="300"/>

Recordar que la función que se ejecuta en la neurona es $\varphi \left( \mathbf{w} \cdot \mathbf{x} + b \right)$ donde:
* $\varphi$ es una función arbitratia, derivable, usualmente no lineal
* $\mathbf{w}$ son los coeficientes de cada *input* 
* $b$ es el *bias*, un parámetro entrenable que no depende de los valores de entrada.


In [4]:
model = tf.keras.Sequential([tf.keras.layers.Dense(units=1, input_shape=[1])])

Compilamos el modelo, indicando la función de optimización que deseamos utilizar. En este caso, la función es [Stochastic Gradient Descent](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers/SGD?version=stable). 

Además, indicamos la función a optimizar (o *loss function*, pues se busca minimizar la "perdida" o *loss*). En este caso, usamos el [Mean Squared Error](https://www.tensorflow.org/api_docs/python/tf/keras/losses/MSE?version=stable) o "error cuadrado promedio". Esta función es adecuada para problemas de regresión, pues penaliza con más severidad a los valores más lejanos al valor de entrenamiento dado por los ejemplos.

In [5]:
model.compile(optimizer='sgd', loss='mse')

Podemos ver un resumen del modelo, que nos indica información útil como el detalle de cada *layer* y la cantidad de parámetros del modelo.

En este caso contamos con una sola neurona, y por lo tanto 2 parámetros:
1. el coeficiente que se multiplica al valor de entrada.
2. el valor de *bias* que se suma a la combinación lineal de valores de entrada.

In [6]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 1)                 2         
Total params: 2
Trainable params: 2
Non-trainable params: 0
_________________________________________________________________


# Entrenando la red neuronal
El entrenamiento consiste en actualizar los parámetros del modelo basado en los ejemplos del *dataset*. En cada *epoch*, se muestra todo el *dataset* y se actualizan los parámetros del modelo. En este ejemplo, usamos 500 *epochs* para entrenar nuestro modelo.

In [7]:
model.fit(xs, ys, epochs=500)

- 0s 4ms/step - loss: 0.4124
Epoch 253/500
Epoch 254/500
Epoch 255/500
Epoch 256/500
Epoch 257/500
Epoch 258/500
Epoch 259/500
Epoch 260/500
Epoch 261/500
Epoch 262/500
Epoch 263/500
Epoch 264/500
Epoch 265/500
Epoch 266/500
Epoch 267/500
Epoch 268/500
Epoch 269/500
Epoch 270/500
Epoch 271/500
Epoch 272/500
Epoch 273/500
Epoch 274/500
Epoch 275/500
Epoch 276/500
Epoch 277/500
Epoch 278/500
Epoch 279/500
Epoch 280/500
Epoch 281/500
Epoch 282/500
Epoch 283/500
Epoch 284/500
Epoch 285/500
Epoch 286/500
Epoch 287/500
Epoch 288/500
Epoch 289/500
Epoch 290/500
Epoch 291/500
Epoch 292/500
Epoch 293/500
Epoch 294/500
Epoch 295/500
Epoch 296/500
Epoch 297/500
Epoch 298/500
Epoch 299/500
Epoch 300/500
Epoch 301/500
Epoch 302/500
Epoch 303/500
Epoch 304/500
Epoch 305/500
Epoch 306/500
Epoch 307/500
Epoch 308/500
Epoch 309/500
Epoch 310/500
Epoch 311/500
Epoch 312/500
Epoch 313/500
Epoch 314/500
Epoch 315/500
Epoch 316/500
Epoch 317/500
Epoch 318/500
Epoch 319/500
Epoch 320/500
Epoch 321/500
Epoch

<tensorflow.python.keras.callbacks.History at 0x2ab59e5d588>

Una vez que el modelo está entrenado, podemos determinar su presición imprimiendo un valor conocido, y comparándolo con el valor real generado por la
función `f` que queremos aproximar.

In [8]:
print(model.predict([5]))

[[9.925377]]


Quizás sea sorpresivo que el valor no es exactamente igual a 10 luego de entrenar el modelo con 500 iteraciones del *dataset*.

Por esto es importante recordar que las redes neuronales se
entrenan calculando probabilidades, y el modelo aprendió que existe una relación entre los *inputs* y *outputs* que es altamente probable dados los ejemplos en el *dataset*. Aún así, "altamente probable" no significa "exactamente".