## Librerias

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import sympy as sym

## Problema

Considere los siguientes puntos

```
x = [1., 2., 3., 4., 5.]
y = [1.20,  0.31, 3.92, 3.78, 4.47]
```

Basados en el metodo de los mínimos cuadrados, se puede ajustar una parábola a los puntos

$$ y = a + bx + cx^2$$

En este problema vamos a considerar la regresión, por medio de la gradiente descendiente,

a) El método de minimos cuadrados por gradiente descediente considera minimizar la distancia cuadratica entre los puntos. Implemente una función que retorne la siguiente función de costo, la cual se espera que sea mínima en el punto optimo de la regresión. 

$$
\mathcal{L} = \sum_{i=1}^N(y_i - (a + bx_i + cx_i^2))^2
$$

Donde $a$, $b$, y $c$ son los valores a optimizar. 

In [2]:
x = np.array([1., 2., 3., 4., 5.])
y = np.array([1.20,  0.31, 3.92, 3.78, 4.47])

def loss(x, y, a, b, c):
  loss = 0
  for i in range(len(x)):
    loss += (y[i] - (a+b*x[i]+c*x[i]**2))**2
  return loss

# codigo para verificar su respuesta
loss(x, y, -1, 2, 3)

9960.6318

b) Para el algoritmo de gradiente descendiente, se requiere la gradiente de la función de costo. Obtenga la gradiente de la función de costo de forma analitica,

Su expresión aquí,

$$
\vec{\nabla} \mathcal{L} = \Big(\frac{\partial  \mathcal{L}}{\partial a} , \quad \frac{\partial  \mathcal{L}}{\partial b}, \quad \frac{\partial  \mathcal{L}}{\partial c} \Big) =\Big(\ , \ , \ \Big)
$$

c) Implemente una función que retorne la gradiente de la función de costo obtenida en el númeral anterior.

In [3]:
def symbolic_loss_function():
  x, y, a, b, c = sym.symbols('x y a b c')
  loss = (y - (a+b*x+c*x**2))**2
  return loss

def symbolic_loss_function_derivative():
  x_s, y_s, a_s, b_s, c_s = sym.symbols('x y a b c')
  loss = (y_s - (a_s+b_s*x_s+c_s*x_s**2))**2
  loss_a = sym.lambdify((x_s, y_s, a_s, b_s, c_s), sym.diff(loss, a_s))
  loss_b = sym.lambdify((x_s, y_s, a_s, b_s, c_s), sym.diff(loss, b_s))
  loss_c = sym.lambdify((x_s, y_s, a_s, b_s, c_s), sym.diff(loss, c_s))
  return loss_a, loss_b, loss_c

In [4]:
def grad_loss(x, y, a, b, c):
    grad = np.zeros(3)
    da, db, dc = symbolic_loss_function_derivative()

    for i in range(len(x)):
        grad[0] += da(x[i], y[i], a, b, c)
        grad[1] += db(x[i], y[i], a, b, c)
        grad[2] += dc(x[i], y[i], a, b, c)

    return np.array(grad)


# codigo para verificar su respuesta
grad_loss(x, y, -1, 2, 0)

array([ 22.64,  87.9 , 370.1 ])

d) Implemente el algoritmo de gradiente descendiente, para encontrar los valores optimos de la regresión, use $e = 0.0001$, 10000 iteraciones, e imprima el valor de la función de costo cada 100 iteraciones. 

El algoritmo de gradiente descendiente nos indica que los puntos optimos de la regresión se van actualizando iterativamente, a partir de la regla, 

$$
  \vec{x} = \vec{x} - e\vec{\nabla} \mathcal{L}
$$

Donde $e$ es el tamaño del paso, y $\vec{x} = [a, b, c]$. Pueden usar el siguiente notebook como guía [gradiente descendiente](https://github.com/diegour1/CompMetodosComputacionales/blob/main/Notebooks/08%20-%20Gradient_Descent_Neural_Networks.ipynb).


In [5]:
# su codigo aqui
def GradientDescent(x, y, a, b, c, e, iter):
    for i in range(iter):
        grad = grad_loss(x, y, a, b, c)
        a = a - e*grad[0]
        b = b - e*grad[1]
        c = c - e*grad[2]
    return a, b, c

e) Imprima los valores finales de la regresión y de la función de costo para los valores optimos.

In [8]:
# su codigo aqui
a_opt, b_opt, c_opt = GradientDescent(x, y, 1, 1, 1, 0.01, 100)
print(a_opt, b_opt, c_opt)

1.461287960587385e+128 5.933770187993464e+128 2.5721860397610182e+129


f) Ahora obtenga los valores optimos de la regresión, usando el método matricial. Puede usar el siguiente notebook como guía, [Minimos cuadrados](https://github.com/diegour1/CompMetodosComputacionales/blob/main/Notebooks/05%20-%20fit_lineal_y_solucion_sistema_de_ecuaciones.ipynb).


In [None]:
param = np.zeros(3)
# su codigo aqui

print(param, loss(x, y, *tuple(param)))

[0. 0. 0.] 51.1718


g) ¿La función de costo con el método de regresión matricial es mayor o menor que con el método de gradiente descediente? ¿Sí, No, por qué?

Su comentario aqui

.

.

.

.



h) Realice una gráfica mostrando los puntos $x$ y $y$, ademas de las gráficas de las funciones obtenidas con el método de gradiente descendiente y con el método de regresión matricial.

In [None]:
# su codigo aqui
