## TAREA I: Gradiente Descendiente

**_Jessenia Piza Londoño_**

Para la siguiente clase realicé, de forma individual, una implementación en python del algoritmo de gradiente descendiente. Esta implementación debe solucionar el problema de regresión que se trabajo en clase. Se debe tener en cuenta lo siguiente:

1. Debe realizar la implementación en un notebook de jupyter.
2. La implementación debe ser interactiva. Es decir yo deberia poder modificar la taza de aprendizaje por medio de un elemento de interacción, para esto estudie la libreria _ipywidgets_.
3. Se debe hacer una grafica de la función de costo a medida que ese actualizan los parámetros, de tal forma que ese pueda observar a medida qu elos parámetros cambia como cambia la función de costo.
4. Realicé la implementación para que funcione también para regresión múltiple.

In [1]:
import pandas as pd
import numpy as np
import ipywidgets as widgets
import matplotlib.pyplot as plt
from IPython.display import display, Latex

import ipywidgets as widgets
from ipywidgets import interact

%matplotlib inline

Creamos la función de costo que está dada por:
$$\frac{\partial}{\partial\theta_j}J(\theta_0,\theta_1) = \frac{\partial}{\partial\theta_j}\frac{1}{2m}\sum_{i=1}^{m}\left[h_\theta(x^{(i)})-y^{(i)}\right]^2,$$


In [2]:
def cost_function(X,y, theta):
    '''
        INPUT:
            x: Variables independientes
            y: Variables dependientes
            theta: Parameters
        OUTPUT:
            cost: Cost of parameter       
    '''    
    m = len(X)
    h_theta = np.dot(X, theta)
    cost = (1/(2*m))*np.sum(np.square(h_theta-y))
    return cost    

Teniendo en cuenta que $\mathbf{h_\theta(x)}= \mathbf{\theta}^{T}\mathbf{x}$, que $\theta_j := \theta_j-\alpha \frac{\partial}{\partial\theta_j}J(\boldsymbol{\theta}) $ y que las derivadas respectivas son:

$$ \begin{equation}
   \begin{split}
      \theta_0 &=& \frac{1}{m}\sum_{i=1}^{m}\left[h_\theta(x^{(i)})-y^{(i)}\right]x_0^{(i)}\\
      \theta_1 &=& \frac{1}{m}\sum_{i=1}^{m}\left[h_\theta(x^{(i)})-y^{(i)}\right]x_1^{(i)}\\
      & & \vdots\\
      \theta_n &=& \frac{1}{m}\sum_{i=1}^{m}\left[h_\theta(x^{(i)})-y^{(i)}\right]x_n^{(i)}\\
   \end{split}
   \end{equation}$$
   
Donde $x_0^{(i)}= 1$ para todo $i$.

Creamos la función de gradiente descendiente para la regresión lineal multivariable.

In [3]:
def gradient_descent(x, y, theta, learning_rate, steps):
    '''
        INPUT:
            x: Variables independientes
            y: Variables dependientes
            theta: Parameters
            learning_rate: rate of learning
            steps: Numbers of iterations that the algorithm have to do
        OUTPUT:
            theta: Estimated parameters 
            cost_vec: Vector of cost which is updated with the parameters
            theta_matrix: Vector with the parameters updates        
    '''
    ones = np.ones((len(x),1))
    X = np.column_stack((x, ones))
    m = len(X)
    cost_vec = []
    for q in range(steps):
        h_theta = np.dot(X, theta)
        theta_gradient = X.T.dot(h_theta - y)/m
        theta = theta - learning_rate*theta_gradient
        cost_vec.append(cost_function(X,y,theta))
    fig,ax = plt.subplots(figsize=(8,6))
    ax.set_title("Cost")
    ax.set_ylabel(r'J($\theta$)')
    ax.set_xlabel('Iterations')
    ax.plot(range(steps),cost_vec)
    return theta, cost_vec

Para probar la función antes creada, procedemos a realizar el ejercicio hecho en clase:

In [4]:
data = pd.read_excel('Real estate valuation data set.xlsx') # data
ones = np.ones((len(data),1)) # vector of ones
x = data['X2 house age'] # Independent Variable
y = data['Y house price of unit area'] # Dependent Variable

Creamos una función para la interacción. De esta manera, el usuario puede cambiar parámetros de la taza de aprendizaje, las iteraciones a realizar, el grado de la variable para lograr una regresión multivariable y la variable dependiente a evaluar en el problema.

In [5]:
def interaction_gradient(alpha=0.002, steps=5000, mult_grade=1, column_variable = 'X2 house age'):
    '''
        INPUT:
            alpha: Learning rate
            steps: Number of iterations
            mult_grade: Grade of multivarible gradient
            column_variable: Variable independent to do multivariable gradient
    '''
    theta = np.random.randn(mult_grade+1)
    Xtemp = data[column_variable]
    X = data[column_variable]
    for i in range(2, mult_grade + 1):
        X = np.column_stack((X, Xtemp**i))
    theta,cost_vec = gradient_descent(X,y,theta,alpha,steps)
    for i in range(len(theta)):       
        display(Latex(f'$\\theta_{i}:$ {theta[i]}'))

Para el problema realizado en clase basta con poner en column_variable = _'X2 house age'_ con mult_grade = 1. Además, con la interacción se logra evidenciar los thetas respectivos. Para verificar el problema multivariado se recomienda usar la variable _'X4 number of convenience stores'_ con más o menos $10^{-6}$ de taza de aprendizaje.

In [6]:
interact(interaction_gradient,alpha=(0,0.01,0.001),steps=(0,10000,500), mult_grade=(0,5,1), column_variable = [column for column in data.columns[1:len(data.columns)-1,]])

interactive(children=(FloatSlider(value=0.002, description='alpha', max=0.01, step=0.001), IntSlider(value=500…

<function __main__.interaction_gradient(alpha=0.002, steps=5000, mult_grade=1, column_variable='X2 house age')>