# Regression Neural Network

Una red neuronal simple tiene la siguiente estructura:

![Simple NN](NN.png)

Donde cada nodo representa una neurona y se realizan dos operaciones, una es calcular el producto punto entre los inputs (a la respectiva layer) y los pesos: $z11 = w1*x1 + ... + wn*xn + b11$ y seguido por el calculo de la activacion a11 = f(z11), donde f puede ser sigmoid, relu etc. 
El primer indice es la layer y el segundo el nodo. 

## Implementacion usando keras

El siguiente es un ejemplo de como se implementa una NN simple usando una base de datos de ejemplo.

### packages

In [1]:
import pandas as pd
import numpy as np
import os
import keras
from keras.models import Sequential
from keras.layers import Dense
from keras.models import load_model

ModuleNotFoundError: No module named 'keras'

In [20]:
import keras as kr
kr.__version__

'2.1.5'

### load data
La data que se usa para el ejemplo fue bajada del curso de Coursera.
En mi caso guardo la tabla en una variable llamada df. Se puede bajar de internet (si funciona) o desde mi sistema (solo funciona en la compu actual). Descomentar una de las opciones.

In [25]:
#df = pd.read_csv('https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DL0101EN/labs/data/concrete_data.csv')
os.chdir(r"C:\Users\ng7d6b2\Documents\Otros\NN_Compos\scripts\keras_examples\regression_NN")
df = pd.read_csv("concrete_data.csv")
df.head()

Unnamed: 0,Cement,Blast Furnace Slag,Fly Ash,Water,Superplasticizer,Coarse Aggregate,Fine Aggregate,Age,Strength
0,540.0,0.0,0.0,162.0,2.5,1040.0,676.0,28,79.99
1,540.0,0.0,0.0,162.0,2.5,1055.0,676.0,28,61.89
2,332.5,142.5,0.0,228.0,0.0,932.0,594.0,270,40.27
3,332.5,142.5,0.0,228.0,0.0,932.0,594.0,365,41.05
4,198.6,132.4,0.0,192.0,0.0,978.4,825.5,360,44.3


### split
Los datos se separan en dos df diferentes, predictors y targets (inputs y outputs) 

In [28]:
df_columns = df.columns
predictors = df[df_columns[df_columns != 'Strength']] 
target = df['Strength'] 

Es aconsejable normalizar los datos, en este caso se normaliza utilizando la media y std de los datos existentes

In [29]:
predictors_norm = (predictors - predictors.mean()) / predictors.std()

### build NN
La NN se construye espeficicando la arquitectura de cada layer, numero de nodos (neuronas), tipo de activacion y  si es densa o no. Aparte de la estrategia de optimizacion y como medir el error.
Ejemplo de:
- 1er layer: hidden layer con 50 neuronas, usando relu y numero de predictors 
- 2da layer: hidden layer con 50 neuronas, usando relu
- output layer: solo un output
- optimiser: adam (mejor que gradiente)
- loss: mean_squared_error como medida del error

se modifica como sea necesario:

In [30]:
n_cols = predictors_norm.shape[1]
model = Sequential()
model.add(Dense(50, activation='relu', input_shape=(n_cols,)))
model.add(Dense(50, activation='relu'))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mean_squared_error')

### fit (train and test)

El modelo tiene que entrenarse y validarse. Se escoge los inputs y outputs para este fin y se escoge que porcentage de los datos se usara en preddicion y validacion (30% en este caso). Se escoge los epochs (numero de iteraciones para la convergencia)

In [31]:
model.fit(predictors_norm, target, validation_split=0.3, epochs=100, verbose=2)

Train on 721 samples, validate on 309 samples
Epoch 1/100
 - 0s - loss: 1670.1454 - val_loss: 1176.0135
Epoch 2/100
 - 0s - loss: 1555.8882 - val_loss: 1073.6855
Epoch 3/100
 - 0s - loss: 1383.2668 - val_loss: 915.0906
Epoch 4/100
 - 0s - loss: 1109.4794 - val_loss: 697.9443
Epoch 5/100
 - 0s - loss: 759.9688 - val_loss: 461.2088
Epoch 6/100
 - 0s - loss: 442.9929 - val_loss: 278.9956
Epoch 7/100
 - 0s - loss: 269.0485 - val_loss: 195.8125
Epoch 8/100
 - 0s - loss: 222.6820 - val_loss: 174.9443
Epoch 9/100
 - 0s - loss: 208.9540 - val_loss: 169.3138
Epoch 10/100
 - 0s - loss: 199.3586 - val_loss: 167.1051
Epoch 11/100
 - 0s - loss: 191.9435 - val_loss: 163.0724
Epoch 12/100
 - 0s - loss: 185.6554 - val_loss: 160.4505
Epoch 13/100
 - 0s - loss: 180.5343 - val_loss: 160.8201
Epoch 14/100
 - 0s - loss: 175.7008 - val_loss: 157.8241
Epoch 15/100
 - 0s - loss: 171.6560 - val_loss: 155.3396
Epoch 16/100
 - 0s - loss: 168.2239 - val_loss: 155.2662
Epoch 17/100
 - 0s - loss: 164.8050 - val_los

<keras.callbacks.History at 0x15b4ee6d438>

Si el modelo tarda much en entrenarse este se puede guardar para futuro uso. Para guardarlo y abrirlo usar:

In [32]:
model.save('regTest_model.h5')
pretrain_model = load_model('regTest_model.h5')

### predicciones

Se puede usar el modelo para predecir cosas, en este caso uso un ejemplo donde "predigo" los primeros 5 datos de la base de datos usados para entrenar

In [33]:
test_data = predictors_norm.head()
pred = model.predict(test_data)
pred

array([[ 68.94968414],
       [ 68.84531403],
       [ 45.17293549],
       [ 48.21352768],
       [ 41.78632736]], dtype=float32)

<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>