# Modelos predictivos de regresión lineal uni-variable utilizando Tensorflow
Por Rodolfo Antonio Zea Posadas

El presente jupyter notebook hace referencia a este [link](https://github.com/razp26/python-jupyterNotebooks/blob/master/Python%20para%20Data%20Science/Proyecto/Proyecto%20-%20Modelos%20predictivos%20de%20regresi%C3%B3n%20lineal%20uni-variable.ipynb) 

En esta ocasión, utilizaremos el mismo set de datos y elegiremos una variable independiente (Overall_Quality) para crear un modelo de regresión lineal para calcular el valor de la variable dependiente SalePrace. 

# Análisis inicial
El método de optimizador que estaremos utilizando es el de Gradient Descent. En resumen, este método consiste en acercarse a un mínimo (local o global) de la función moviéndose, en cada iteración, el valor del “earning rate, en sentido contrario al valor de la derivada de la función de costo.
Tomando como consideración lo anterior, es probable que con un learning rate muy alto, sea muy difícil lograr una aproximación al valor mínimo deseado. Se estima que a medida que el learning rate disminuye, el cálculo del costo (error) es más preciso, sin embargo, si este llega a un punto muy pequeño, puede que sea muy difícil aproximarse al valor deseado.

El primer paso consiste en importar las librerías que utilizaremos.

In [1]:
import numpy as np
import tensorflow as tf

A continuación procedemos a cargar la información del data set. Para ello, utilizaremos el 80% de los datos como datos de entrenamiento y el 20% de los datos como datos de prueba.

In [2]:
data = np.load('proyecto_training_data.npy')
# 80% de los datos para datos de entrenamiento
n_train_rows = int(np.shape(data)[0]*0.8)
data_train = data[0:n_train_rows]

# 20% de los datos para datos de prueba
n_test_rows = int(np.shape(data)[0]*0.2)
data_test = data[-1*n_test_rows:]

Una vez hemos cargado nuestro data set y lo hemos separado en datos de entrenamiento y datos de prueba, procedemos a extraer de este los valores de las variables que utilizaremos para ejemplificar la regresión lineal utilizando Tensforflow.

Las variables que utilizaremos son OverallQuality (x) y SalePrice(y).

In [3]:
# obtenemos los datos de entrenamiento de la variable Overall Quality
x_overall_quality = data_train[:,1]
y_overall_quality = data_train[:,0]

# Número de ephochs
epochs_overall_quality = 60000

# Cada cuantos epochs se imprime el resultado del error
imprimir_error_cada_overall_quality = 10000

In [4]:
def modelo_lineal_tf(x, y, epochs, imprimir_error_cada, lrs):
    
    # Creamos el grafo que utilizaremos
    grafo = tf.Graph()
    with grafo.as_default():
    
        # Definimos nuestros placeholders
        X = tf.placeholder(tf.float32, name="X") 
        Y = tf.placeholder(tf.float32, name="Y")
        LR = tf.placeholder(tf.float32, name="LR")

        # Declaramos dos variables, una para los "weights" y la otra para "biases" y los inicializaremos con valores aleatorios.
        m = tf.Variable(np.random.randn(), name="m")
        b = tf.Variable(np.random.randn(), name="b")

        # Calculamos la cantidad de registros, como un valor constante, de x
        n = np.shape(x)[0]

        # Construimos la hipótesis o modelo de regresion lineal 
        yhat = m*X + b

        # Definimos la función de costo (error)
        costo = tf.reduce_sum(tf.square(yhat-Y)) / (2 * n)
        
        # Creamos nuestro resumen de tipo scalar
        costo_summary = tf.summary.scalar(name='costo_summary', tensor=costo)
        
        # Definimos el optimizador de Gradient Descent
        optimizador = tf.train.GradientDescentOptimizer(LR).minimize(costo)
        
        # Recorremos nuestro vector de learning rates
        for lr in np.nditer(lrs):
            
            # Imprimimos el learning reate a utilizar en la iteración
            print('Learning rate: ', lr)

            # Inicializamos las variables globales
            init = tf.global_variables_initializer()

            # Inicializamos el grafo
            with tf.Session(graph = grafo) as session:
                
                # Creamos un writer para nuestros logs en tensorboard
                writer = tf.summary.FileWriter('./grafos/lr=' + str(lr), session.graph)

                # Inicializamos las variables en la sesión
                session.run(init)

                # Iteramos el número de veces que indica el parámetro "epochs"
                for epoch in range(epochs):

                    # Ejecutamos el paso de gradient descent
                    session.run(optimizador, feed_dict = {X: x, Y: y, LR: lr})
                    
                    summary = session.run(costo_summary, feed_dict = {X: x, Y: y, LR: lr})
                    writer.add_summary(summary, epoch)
                    
                    # Verificamos si debemos de imprimir el resultado
                    if (epoch + 1) % imprimir_error_cada == 0:

                        # Calculamos el costo de cada epoch
                        c = session.run(costo, feed_dict = {X: x, Y: y})
                        print('Iteración: ' + str(epoch + 1))
                        print('Error del modelo: ', c)

                # Obtenemos el costo y los estimados para Weights y Bias
                costos = session.run(costo, feed_dict = {X: x, Y: y})
                weights = session.run(m)
                bias = session.run(b)
                
                # Cerramos el writer
                writer.close()
                
                # Imrpimimos los valores finales
                print('********** VALORES FINALES **********')
                print('Costos: ', costos)
                print('Weights: ', weights)
                print('Bias: ', bias)
                print('*************** ***************')

Una vez hemos definido nuestra función que calcula el modelo de regresión lineal utilizando Tensorflow, procedemos a invocarla utilizando distintos learning rates.

In [5]:
# Creamos un arreglo en donde almacenaremos los distintos learning rates que tendremos
learning_rates_overall_quality = np.array([10,1,0.1,0.01,0.001,0.0001])

# Ejecutamos nuestra función que construye el modelo regresión lineal.
modelo_lineal_tf(x_overall_quality, y_overall_quality, epochs_overall_quality, imprimir_error_cada_overall_quality, learning_rates_overall_quality)

Instructions for updating:
Colocations handled automatically by placer.
Instructions for updating:
Use tf.cast instead.
Learning rate:  10.0
Iteración: 10000
Error del modelo:  nan
Iteración: 20000
Error del modelo:  nan
Iteración: 30000
Error del modelo:  nan
Iteración: 40000
Error del modelo:  nan
Iteración: 50000
Error del modelo:  nan
Iteración: 60000
Error del modelo:  nan
********** VALORES FINALES **********
Costos:  nan
Weights:  nan
Bias:  nan
*************** ***************
Learning rate:  1.0
Iteración: 10000
Error del modelo:  nan
Iteración: 20000
Error del modelo:  nan
Iteración: 30000
Error del modelo:  nan
Iteración: 40000
Error del modelo:  nan
Iteración: 50000
Error del modelo:  nan
Iteración: 60000
Error del modelo:  nan
********** VALORES FINALES **********
Costos:  nan
Weights:  nan
Bias:  nan
*************** ***************
Learning rate:  0.1
Iteración: 10000
Error del modelo:  nan
Iteración: 20000
Error del modelo:  nan
Iteración: 30000
Error del modelo:  nan
Ite

Una vez que hemos completado la ejecución de la función para obtener un modelo de regresión lineal para distintos learning rates, mostramos el grafo computacional de Tensorflow obtenido con la herramienta Tensorboard.

![title](grafos/grafo.png)

# Conclusión
Como punto de partida para explicar la conclusión obtenida, mostramos una gráfica (obtenida utilizando la herramienta Tensorboard) que nos permite ver el comportamiento del costo (error) en la estimación de los parámetros de regresión, para cada uno de los learning rates utilizados.

![title](grafos/costo_summary.png)

![title](grafos/costo_summary2.png)
 
A manera de conclusión, podemos decir que el learning rate que mejor predice el modelo de regresión lineal, ya que produce el menor error (costo) es cuando tiene el valor de 0.01. Si se ve el la bitácora de ejecución, es posible observar que ya para la iteración 20,000 ya se había alcanzado este valor mínimo de error. 

Por este motivo, concluimos que se consigue el mejor modelo de regresión lineal entre las variables X (OverallQuality) y Y (SalePrice) con un learning rate de 0.01.

El modelo final queda de la siguiente manera:

Y = 45410.65X -96460.945

Traducido a las variables seleccionadas

SalePrice = 45410.65OverallQuality -96460.945

