# Importar librerías

In [1]:
# Imports estándar
import numpy as np
import pandas as pd
%matplotlib inline
import matplotlib.pyplot as plt
%load_ext autoreload
%autoreload 2
import datetime

# scikit-learn
from sklearn.dummy           import DummyClassifier
from sklearn.linear_model    import LogisticRegression
from sklearn.linear_model    import LinearRegression
from sklearn.linear_model    import Lasso
from sklearn.metrics         import confusion_matrix
from sklearn.metrics         import roc_curve
from sklearn.metrics         import roc_auc_score
from sklearn.preprocessing   import StandardScaler
from sklearn.model_selection import train_test_split

# Definir funciones que nos serán útiles

In [2]:
def estandarizacion(X):
    """ 
    Función para estandarizar una variable
    
    Args:
        x     set de variables independientes
    """
    media_X = np.mean(X)
    X = X - media_X
    std_X = np.std(X)
    X = X / std_X
    return X, media_X, std_X

# Importar set de datos

In [3]:
# Importar datos


In [4]:
# Hecha un vistazo a los datos


# Preprocesa set de datos
Para este ejercicio no vamos a dividir el set en entrenamiento y validación, nos quedaremos con un solo set de datos

In [5]:
# Crear variables dummy para la variable categórica "Gender"


In [6]:
# Mostrar el nombre de las variables dummy creadas


In [7]:
# Define la variable target (Weight)


# Define el conjunto de variables independientes


In [8]:
# Checa el tamaño de las variables dependiente e independientes


In [9]:
# Estandarizar las variables independientes


In [10]:
# Hecha un vistazo a las variables estandarizadas


# Define las funciones que nos van a servir para ejecutar el algoritmo de gradiente descendente

## Función de costo error cuadrático medio (MSE)
 $\mathcal{L}(w) =  \displaystyle \frac{1}{N} \sum_{i=1}^{N} \textbf{e}^2$, $\textbf{e} = \textbf{y-Xw}$

In [11]:
def calcula_costo_mse(y, X, w):
    """ 
    Función para calcular el valor de la función de costo/pérdida
    
    Args:
        y     arreglo de numpy que contiene variable target
        X     matriz que contiene variables independientes
        w     arreglo de numpy que contiene parámetros w
    """
    # Pon aquí el código

## Fórmula del gradiente de la función de costo error cuadrático medio (MSE)
$\nabla \mathcal{L}(w) =  \displaystyle \frac{1}{N} \textbf{X}^T\textbf{e}$, $\textbf{e} = \textbf{y-Xw}$

In [12]:
def calcula_gradiente(y, X, w):
    """ 
    Función para calcular el valor del gradiente
    
    Args:
        y     arreglo de numpy que contiene variable target
        X     matriz que contiene variables independientes
        w     arreglo de numpy que contiene parámetros w
    """
    # Pon aquí el código

## Pasos para llevar a cabo el algoritmo gradiente descendente
Itera las veces que sean necesarias
1. Calcula el valor de la función de costo
2. Calcula el valor del gradiente de la función de costo
3. Da un paso de tamaño $\gamma$ en dirección contraria al gradiente de la función de costo, i.e. $\textbf{w}^{(t+1)} = \textbf{w}^{(t)}-\gamma \nabla\mathcal{L}(\textbf{w}^{(t)})$
4. Guarda el valor de los parámetros ws y de los valores de la función de costo en cada iteración
5. Imprime resultados de cada iteración para que veas como va la ejecución del algoritmo 

In [13]:
def gradiente_descendente(y, X, w_inicial, max_iters, gamma):
    """ 
    Función para llevar a cabo el algoritmo de optimización llamado gradiente descendente
    
    Args:
        y             arreglo de numpy que contiene variable target
        X             matriz que contiene variables independientes
        w_inicial     arreglo de numpy que contiene parámetros w iniciales
        max_iters     número de iteraciones máximas para ejecutar el algoritmo
        gamma         parámetro de aprendizaje
    """
    # Define variables para guardar w y el valor de la función de costo
    ws = [w_inicial]
    costos = []
    w = w_inicial
    for n_iter in range(max_iters):
        # Calcula el valor de la función de costo y del gradiente
        costo = calcula_costo_mse(y, X, w)
        gradiente = calcula_gradiente(y, X, w)
        # Actualiza el valor de w
        w = w - gamma * gradiente
        # Almacena el valor de w y de la función de costo
        ws.append(w)
        costos.append(costo)
        print("Gradiente Descendente({bi}/{ti}): valor función de costo={l}, w0={w0}, w1={w1}, w2={w2}".format(
              bi=n_iter, ti=max_iters - 1, l=costo, w0=w[0], w1=w[1], w2=w[2]))

    return costos, ws

In [14]:
# Definir parámetros para iniciar con el algoritmo
max_iters = 50
gamma = 0.7

# Inicializar el vector de parámetros w
w_inicial = np.array([0,0,0])

# Iniciar algoritmo de gradiente descendente
inicio = datetime.datetime.now()
costo_gradiente, ws_gradiente = gradiente_descendente(y, X, w_inicial, max_iters, gamma)
final = datetime.datetime.now()

# Imprimir proceso de ejecución
tiempo_ejecucion = (inicio - final).total_seconds()
print("Gradiente Descendente: tiempo de ejecución={t:.3f} segundos".format(t=tiempo_ejecucion))

Gradiente Descendente: tiempo de ejecución=-0.000 segundos


# Confirma predicción utilizando el objeto de regresión lineal de sklearn

## Fórmula de regresión lineal con tres variables independientes
$y = b + w_0x_0 + w_1x_1 + w_2x_2$

In [15]:
# Entrena una regresión lineal para confirmar los resultados anteriores
modelo_LinReg = LinearRegression()
modelo_LinReg.fit(X, y)
y_pred_proba_LinReg = modelo_LinReg.predict(X)

In [16]:
# Revisa la medida de R^2 de la regresión anterior
modelo_LinReg.score(X,y)

In [17]:
# Checa los coefientes del modelo
print("Los parámetros del modelo son: w0= {0}, w1={1}, w2={2}".format(modelo_LinReg.coef_[0], modelo_LinReg.coef_[1], modelo_LinReg.coef_[2]))