# Gradiente descendiente
En esta tarea se implementa el gradiente descendiente y se crea una grafica interactiva en la que se grafica el costo de la función en función de las épocas de actualización de los parámetros de la regresión.

In [122]:
import numpy as np
import seaborn as sns
sns.set()

## Función de costo
A continuación se implenenta la función de costo $J(\Theta)$.


In [1]:
def J(theta,X,y):
    """
  Calcula la funcion de costo para una regresion lineal (simple o múltiple)
  
  args:
    theta: vector de coeficientes de los regresores (el primero es el independiente)
    X: matriz de datos
    y: valores de la variable respuesta
  
  returns
    el error cuadrático medio
  """
    n = len(X)
    A = np.concatenate([np.ones([n,1]),X],axis=1)
    h = np.matmul(A,theta)
    e = h-y
    mse = (np.matmul(e.T,e)[0][0])/n
    return mse



## Gradiente descendiente
A continuación se implementa el algoritmo Gradiente Desendiente. En la función de a continuación se puede elegir el valor de la tasa de aprendizaje $\alpha$ y el número de épocas con las que los parametros $\theta$ de la regresión lineal se actualizan.
El vector $\Theta$ retornado es $(\theta_0, \theta_1,...,\theta_p)$, con $\theta_0$ el parámetro independiente y para todo $j\not = p$, $\theta_j$ es coeficiente que multiplica el j-ésimo regresor.  

In [179]:
def grad_descent(X,y,alfa,epochs):
    """
  Calcula el gradiente para encontrar los parametros optimos theta.

  args:
    X: matriz de datos
    y: valores de la variable respuesta
    alfa: tasa de aprendizaje
    epochs: numero de actualizaciones de los parametros theta

  returns:
    vector theta con valores optimos theta que minimizan la funcion de costo y lista con el costo calculado dados unos parametros theta
    """
    m = len(X)
    y = np.reshape(y,[m,1])
    # la primera columna es de 0
    A = np.concatenate([np.ones([m,1]),X],axis=1)   
    # inicializacion aleatoria de coeficientes
    theta = np.random.rand(A.shape[1],1)
    costo = []
    h = np.matmul(A,theta)
    new_theta = np.copy(theta)
    for k in range(epochs):
        for p in range(len(theta)):
            if p == 0:
                new_theta[p][0] = new_theta[p][0] - alfa*(1/m)*sum(h-y)
            else:
                new_theta[p][0] = new_theta[p][0] - alfa*(1/m)*sum(np.multiply(h-y,np.reshape(X[:,p-1],[m,1])))
        costo.append(J(new_theta,X,y))
        h = np.matmul(A,new_theta)
    return new_theta, costo



## Gráfica de la función de costo
A continuación se encuentra la función que grafica la evolución del costo en función del número de iteraciones (epochs).

In [180]:
def plot_cost_function(X,y,alfa,epochs):
    best_theta, mse = grad_descent(X,y,alfa,epochs)
    lista_epocas = range(1,epochs+1)
    ax = (sns.lineplot(x=lista_epocas,y=mse,markers=True)).set(xticks=lista_epocas,
                                                                 title="Evolución de la función de costo con learning rate igual a "+str(alfa),
                                                                 xlabel= "Epocas",ylabel="Costo")

In [181]:
# Ensayos: la ultima columna de X  es y
data = np.random.rand(10,3)
X = data[:,:-1]
# La 3era columna es y
y = X[:,-1]
alfa = 0.1
epochs = 20
n_theta, mse = grad_descent(X,y,alfa,epochs)

## Gráfica interactiva
En esta sección se creará una gráfica interactiva sencilla donde se puede manipular la tasa de aprendizaje $\alpha$ como lo desee el usuario y así pueda ver como cambia la gráfica de la evolución de la función de costo.
Para esto usaremos la librería *ipywidgets*.



In [184]:
import ipywidgets as widgets
from ipywidgets import interact, fixed

In [183]:
def graficar(alpha,epocas):
    plot_cost_function(X,y,alpha,epocas)
interact(graficar, alpha=(0,2,0.1),epocas=fixed(20))

interactive(children=(FloatSlider(value=1.0, description='alpha', max=2.0), Output()), _dom_classes=('widget-i…

<function __main__.graficar>