# Regresión
En una regresión lo que queremos es obtener uno o más valores concretos, no clases. Es como si quisieramos un resultado de una operación matemática. Vemos un ejemplo de una red de regresión que queremos que aprenda a sumar 3 números. 

Primero generamos número aleatorios:


In [1]:
import numpy as np
#Generamos training set con 1000 datos. 
X1 = np.random.uniform(size = 100000) * 100
X2 = np.random.uniform(size = 100000) * 100
X3 = np.random.uniform(size = 100000) * 100
X = np.transpose([X1, X2, X3])

Este seran nuestro valores de entrada o *inputs*. Los *outputs* de nuestro problema serán la suma de los números,

In [2]:
Y = X1 + X2 + X3  

Ahora que ya tenemos un set de ejemplo. Volvemos a separar los datos en set de entrenamiento y set de validación

In [3]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, Y) 
np.shape(y_train),np.shape(y_test) # comprobamos tamaño

((75000,), (25000,))

Usamos el objeto `MLPRegressor` para definir las características de la red. La **batch_size** no la hemos tocado antes, por defecto toman un valor que dependerá del método de optimización escogido, pero la podríamos cambiar si nos interesa. 

In [4]:
from sklearn.neural_network import MLPRegressor
# Escojo 3 capas de 10 neuronas
#mlp = MLPRegressor(hidden_layer_sizes=(100),max_iter=500,verbose=True) 
mlp = MLPRegressor(hidden_layer_sizes=(1000,1000,1000),max_iter=500,verbose=False) # aumento el max_iter a 5000 para que aprenda mas 

Y entrenamos

In [None]:
mlp.fit(X_train,y_train) # usa modelo red neuronal que hemos definido antes y(x,w)
# mlp.loss_curve en Clasificación te guarda el valor de la función coste a cada iteración

In [None]:
import matplotlib.pyplot as pl
pl.plot(mlp.loss_curve_)  # mlp.loss_curve nos da una idea de como converge el training set
pl.xlabel('iteration')
pl.ylabel('loss function')

Hacemos las predicciones con el set de validación y hacemos algún cálculo para ver si se parecen con los valores reales. Aquí calculo el coeficiente de correlación (que debería ser 1) y el error relativo. 

In [None]:
predictions = mlp.predict(X_test) # estimamos resultado con el TEST
print('coeficiente correlación', np.corrcoef(predictions,y_test)[0][1] ) # calculamos correlación con el valor esperado
print('error relativo', np.mean(abs(predictions-y_test)/y_test)*100)  # calculamos correlación con el valor esperado

import matplotlib.pyplot as pl
pl.plot(predictions,y_test,'.')

Le pido a la red que sume 10 + 2 + 6

In [None]:
A=np.array([10, 2, 6]).reshape(1,-1) # sklearn necesita que se lo de dimension(1,n)
print('la suma predicha es', np.round(mlp.predict(A))) # redondamos
print('la suma real es',np.round(np.sum(A)))

Le pido a la red que sume 100 + 100 + 100

In [None]:
# si miramos valores muy lejos del rango
A=np.array([100,100,100]).reshape(1,-1) 
np.shape(A)
print('la suma predicha es', np.round(mlp.predict(A))) # redondamos
print('la suma real es',np.round(np.sum(A)))

Y ahora Le pido a la red que sume 1000 + 1000 + 1000

In [None]:
# si miramos valores muy lejos del rango
A=np.array([2000,1050,4000]).reshape(1,-1) 
np.shape(A)
print('la suma predicha es', np.round(mlp.predict(A))) # redondamos
print('la suma real es',np.round(np.sum(A)))

In [None]:
# si miramos valores muy lejos del rango
A=np.array([20000,10500,40000]).reshape(1,-1) 
np.shape(A)
print('la suma predicha es', np.round(mlp.predict(A))) # redondamos
print('la suma real es',np.round(np.sum(A)))

**NO ha aprendido a sumar!** Ha ajustado muy bien los datos pero a la que me alejo del rango (0,100) se equivoca

## Ejercicios: 

1. Haz pruebas con esta red para ver si mejoras los resultados. Para mejorar un ajuste puedes probar:

* cambiar el número de neuronas o capas 

* Parámetros del MPLRegressor como función de activación, optimizer, loss_function, batch_size,...

* Añadir más datos, usamos cuantos más datos mejor, hasta que veamos que añadir más datos no mejora la solución.

2. Entrena una red para que aprenda a multiplicar 4 números.