<a href="https://colab.research.google.com/github/JCaballerot/Deep_learning_program/blob/main/Deep_learning_program/Modulo_I/Lab_Regresi%C3%B3n_con_Keras.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


<h1 align=center><font size = 5>Modelos de Regresión con Keras</font></h1>


## Introducción


Keras es una API de alto nivel para crear modelos de aprendizaje profundo. Ha ganado popularidad por su facilidad de uso y simplicidad sintáctica que facilita el desarrollo rápido. Como verá en este laboratorio y en los otros laboratorios de este curso, la construcción de una red de aprendizaje profundo muy compleja se puede lograr con Keras con solo unas pocas líneas de código. Apreciará Keras aún más, una vez que aprenda a construir modelos profundos usando PyTorch y TensorFlow en los otros módulos.

Entonces, en este laboratorio, aprenderá a usar la biblioteca de Keras para construir un modelo de regresión.

<h2>Modelos de regresión con Keras</h2>

<h3>Objetivo de este Notebook</h3>    
<h5> 1. Como usar Keras y construir un modelo de regresión.</h5>
<h5> 2. Descargar y limpiar un Dataset </h5>
<h5> 3. Construir una red Neuronal </h5>
<h5> 4. Entrenar y Testear una Red. </h5>     


## Tabla de Contenidos

<div class="alert alert-block alert-info" style="margin-top: 20px">

<font size = 3>
    
1. <a href="#item31">Descargar y limpiar el Dataset</a>  
2. <a href="#item32">Importar Keras</a>  
3. <a href="#item33">Construir una Red Neuronal</a>  
4. <a href="#item34">Entrenar y Testear la Red</a>  

</font>
</div>


<a id="item31"></a>


## Descargar y limpiar Dataset


Comencemos importando las bibliotecas <em>pandas</em> y <em>Numpy</em>.


In [None]:
import pandas as pd
import numpy as np

<strong>El conjunto de datos trata sobre la resistencia a la compresión de diferentes muestras de hormigón en función de los volúmenes de los diferentes ingredientes que se utilizaron para fabricarlas. Los ingredientes incluyen:</strong>

<strong>1. Cemento</strong>

<strong>2. Escoria de alto horno</strong>

<strong>3. Cenizas volantes</strong>

<strong>4. Agua</strong>

<strong>5. Superplastificante</strong>

<strong>6. Agregado grueso</strong>

<strong>7. Agregado fino</strong>

Descarguemos los datos y leamos en un dataframe de <em>pandas</em>.


In [None]:
concrete_data = pd.read_csv('https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DL0101EN/labs/data/concrete_data.csv')
concrete_data.head(10)

Así que la primera muestra de hormigón tiene 540 metros cúbicos de cemento, 0 metros cúbicos de escoria de alto horno, 0 metros cúbicos de cenizas volantes, 162 metros cúbicos de agua, 2,5 metros cúbicos de superplaticizador, 1040 metros cúbicos de agregado grueso, 676 metros cúbicos de agregado fino. Una mezcla de hormigón de este tipo, que tiene 28 días, tiene una resistencia a la compresión de 79,99 MPa.


#### Comprobemos cuántos datos tenemos.


In [None]:
concrete_data.shape

Entonces, hay aproximadamente 1000 muestras para entrenar nuestro modelo. Debido a las pocas muestras, debemos tener cuidado de no sobreajustar los datos de entrenamiento.


Revisemos el conjunto de datos en busca de <strong>missings.</strong>


In [None]:
concrete_data.describe().transpose()

In [None]:
concrete_data.isnull().sum()

Los datos se ven muy limpios y están listos para usarse para construir nuestro modelo.

#### Dividir los datos en predictores y target


La variable objetivo en este problema es la resistencia de la muestra de hormigón. Por lo tanto, nuestros predictores serán todas las demás columnas.

In [None]:
concrete_data_columns = concrete_data.columns

predictors = concrete_data[concrete_data_columns[concrete_data_columns != 'Strength']] # todas las columnas excepto Strength
target = concrete_data['Strength'] # Columna Strength 


Hagamos una comprobación rápida de la coherencia de los predictores y el target del dataframe.


In [None]:
predictors.head()

In [None]:
target.head()

Finalmente, el último paso es normalizar los datos restando la media y dividiendo por la desviación estándar.

In [None]:
predictors_norm = (predictors - predictors.mean()) / predictors.std()
predictors_norm.head()

Guardemos el número de predictores en _n_cols_ ya que necesitaremos este número al construir nuestra red.


In [None]:
n_cols = predictors_norm.shape[1] # número de predictores

<a id='item32'></a>


## Importar Keras


Keras normalmente ejecuta sobre una biblioteca de bajo nivel como TensorFlow. Esto significa que para poder usar la biblioteca de Keras, primero deberá instalar TensorFlow y cuando importe la biblioteca de Keras, se mostrará explícitamente qué backend se usó para instalar la biblioteca de Keras. Usamos TensorFlow como backend para instalar Keras, por lo que debería imprimirlo claramente cuando importamos Keras.




#### Vamos a importar la biblioteca de Keras


In [None]:
from tensorflow import keras as keras

Como puede ver, el backend de TensorFlow se usó para instalar la biblioteca de Keras.


Importemos el resto de los paquetes de la biblioteca de Keras que necesitaremos para construir nuestro modelo de regresión.

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

In [None]:

# Definido el modelo

model = Sequential()
model.add(Dense(16, activation='relu', input_shape = (n_cols, )))
model.add(Dense(8, activation='relu'))
model.add(Dense(1))

model.compile(loss = "mean_squared_error", optimizer = "sgd")


In [None]:
model.summary()

In [None]:
keras.utils.plot_model(model, show_shapes=True)

In [None]:
history = model.fit(predictors_norm, target, epochs = 30, validation_split = 0.3, verbose = 1)


In [None]:
import pandas as pd
import matplotlib.pyplot as plt

pd.DataFrame(history.history).plot(figsize=(16, 8)) 
plt.grid(True)
plt.gca().set_ylim(0, 40) # set the vertical range to [0-1] plt.show()

<a id='item33'></a>


## Contruir una Red Neuronal

Definamos una función que defina nuestro modelo de regresión para que podamos llamarlo convenientemente para crear nuestro modelo.

In [None]:
# definir el modelo de regresión
def regression_model():
    # crear el modelo
    model = Sequential()
    model.add(Dense(50, activation='relu', input_shape=(n_cols,)))
    model.add(Dense(50, activation='relu'))
    model.add(Dense(1))
    
    # compilar el modelo
    model.compile(optimizer='adam', loss='mean_squared_error')
    return model

La función anterior crea un modelo que tiene dos capas ocultas, cada una de 50 unidades ocultas.

<a id="item4"></a>


## Entrenar y Testear la Red


Llamemos a la función ahora para crear nuestro modelo.

In [None]:
# contruir el modelo
model = regression_model()

A continuación, entrenaremos y probaremos el modelo al mismo tiempo usando el método _fit_. Dejaremos fuera el 30% de los datos para su validación y entrenaremos el modelo para 100 epochs.


In [None]:
# entrenar el modelo
history = model.fit(predictors_norm, target, validation_split=0.3, epochs=100, verbose=2)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

pd.DataFrame(history.history).plot(figsize=(16, 8)) 
plt.grid(True)
plt.gca().set_ylim(0, 1200) # set the vertical range to [0-1] plt.show()

<strong>Puede consultar este [link](https://keras.io/models/sequential?cm_mmc=Email_Newsletter-_-Developer_Ed%2BTech-_-WW_WW-_-SkillsNetwork-Courses-IBMDeveloperSkillsNetwork-DL0101EN-SkillsNetwork-20718188&cm_mmca1=000026UJ&cm_mmca2=10006555&cm_mmca3=M12345678&cvosrc=email.Newsletter.M12345678&cvo_campaign=000026UJ&cm_mmc=Email_Newsletter-_-Developer_Ed%2BTech-_-WW_WW-_-SkillsNetwork-Courses-IBMDeveloperSkillsNetwork-DL0101EN-SkillsNetwork-20718188&cm_mmca1=000026UJ&cm_mmca2=10006555&cm_mmca3=M12345678&cvosrc=email.Newsletter.M12345678&cvo_campaign=000026UJ&cm_mmc=Email_Newsletter-_-Developer_Ed%2BTech-_-WW_WW-_-SkillsNetwork-Courses-IBMDeveloperSkillsNetwork-DL0101EN-SkillsNetwork-20718188&cm_mmca1=000026UJ&cm_mmca2=10006555&cm_mmca3=M12345678&cvosrc=email.Newsletter.M12345678&cvo_campaign=000026UJ) para aprender sobre otra funciones que puede utilizar para la predicción o la evaluación.</strong>


Siéntase libre de variar lo siguiente y observe qué impacto tiene cada cambio en el rendimiento del modelo:

1. Incrementar o disminuir la cantidad de neuronas en capas ocultas
2. Agrega más capas ocultas
3. Incrementar el número de epochs

In [None]:
pd.DataFrame(target).hist()

In [None]:
pd.DataFrame(model.predict(predictors_norm)).hist()

In [None]:
concrete_data['prediction'] = model.predict(predictors_norm)


In [None]:
concrete_data[['Strength','prediction']].corr()

In [None]:
0.77656**2

In [None]:
from sklearn.metrics import r2_score


r2_score(concrete_data.Strength, concrete_data.prediction)


### ¡Gracias por completar este laboratorio!



In [None]:
# definir el modelo de regresión
def regression_model():
    # crear el modelo
    model = Sequential()
    model.add(Dense(18, activation='relu', input_shape=(n_cols,)))
    model.add(Dense(36, activation='relu'))
    model.add(Dense(18, activation='sigmoid'))
    model.add(Dense(9,  activation='sigmoid'))
    model.add(Dense(1))
    
    # compilar el modelo
    model.compile(optimizer='adam', loss='mean_absolute_error')
    return model




In [None]:
# contruir el modelo
model = regression_model()

# entrenar el modelo
model.fit(predictors_norm, target, validation_split=0.3, epochs=200, verbose=2)