# Matemática para Ciencia de los Datos
# Trabajo Práctico 6

Profesor: Luis Alexánder Calvo Valverde 

Instituto Tecnológico de Costa Rica, 

Programa Ciencia de Datos

---

Fecha de entrega: Lunes 5 de Junio del 2023, a más tardar a las 3:00 pm.

Medio de entrega: Por medio del TEC-Digital.

Entregables: Un archivo jupyter ( .IPYNB ). 

Estudiante:
1. Gabriel Valentine Fonseca



## Ejercicio 1 (50 puntos)



El algoritmo del descenso de gradiente sigue la idea de modificar el punto óptimo estimado de forma iterativa. Para una función en una
variable $f\left(x\right)$, la estimación del punto óptimo en una iteración $i+1$ está dada por: 

\begin{equation}
x\left(t+1\right)=x\left(t\right)+\alpha f'\left(x\left(t\right)\right)
\end{equation}

donde el coeficiente $\alpha$ determina el *grado de confianza o velocidad* con la que el proceso de optimización iterativa sigue
la dirección de la derivada. Para la optimización de una función multivariable $f\left(\overrightarrow{x}\left(t\right)\right)$ con $\overrightarrow{x}\in\mathbb{R}^{n}$, la posición óptima se estima usando el vector gradiente:

\begin{equation}
\overrightarrow{x}\left(t+1\right)=\overrightarrow{x}\left(t\right)+\alpha\nabla_{\overrightarrow{x}}f\left(\overrightarrow{x}\left(t\right)\right)
\end{equation}

Para la función: 

\begin{equation}
f\left(\overrightarrow{x}\right)=x^{2}-y^{2},
\end{equation}

Implemente la función en python denominada:

$$funcion\_SGD \left(tasa\_aprendizaje, iteraciones, xy, tolerancia\right)$$

donde los parámetros corresponden a:

* tasa_aprendizaje: es el $\alpha$
* iteraciones: es el máximo número de iteraciones a ejecutar
* xy: es el vector con los dos valores iniciales [x,y]
* tolerancia: es el valor mínimo para un cambio entre iteración. Si la función de costo no mejora en al menos "tolerancia", sale del ciclo de iteración.

**Nota:** 
1. Para iniciar la implementación puede utilizar el código en el cuaderno "070_1_LACV_Optimizacion".
1. Cada iteración le generará un vector con dos valores ($\overrightarrow{x}\left(t+1\right)$), por lo que para saber el valor de la función de pérdida en ese punto, evalúelo en la función inicial ($x^{2}-y^{2}$) para saber si aumentó o disminuyó.



---




In [None]:
%matplotlib inline

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cm
import plotly.graph_objects as go

# Estilo del gráfico, existe classic
plt.style.use('ggplot')

In [None]:
def funcion(x, y):
  return x**2 - y**2

#Se define la funcion de la derivadad de f de x
def dxdf(x,y):
    return 2*x

#Se define la funcion de la derivadad de f de y
def dydf(x,y):
    return -2*y

#función SGD
def funcion_SGD(learning_rate, iters, xy, tolerance):
    current_iter = 0
    previous_step_size = 1
    cur_x = xy
    
    while previous_step_size > tolerance and current_iter < iters:
      prev_x = cur_x #Store current x value in prev_x
      gradient = np.array([dxdf(prev_x[0], prev_x[1]), dydf(prev_x[0], prev_x[1])])
      cur_x = cur_x - learning_rate * gradient #Grad descent
      previous_step_size = sum(abs(cur_x - prev_x)) #Change in x
      current_iter = current_iter + 1 #iteration count
      if (current_iter % 40) == 0:
        print("Iteration",current_iter,"\nX value is",cur_x) #Print iterations every 40
  
    print("\nThe local minimum occurs at", cur_x)
    print("f:", funcion(cur_x[0], cur_x[1]))


In [None]:
funcion_SGD(0.01, 1000, ([3, -3]), 0.000001)

Iteration 40 
X value is [ 1.33710121 -6.62411899]
Iteration 80 
X value is [  0.59594655 -14.62631747]
Iteration 120 
X value is [  0.26561362 -32.2954891 ]
Iteration 160 
X value is [  0.1183841  -71.30972089]
Iteration 200 
X value is [ 5.27638398e-02 -1.57454692e+02]
Iteration 240 
X value is [ 2.35168647e-02 -3.47666205e+02]
Iteration 280 
X value is [ 1.04814761e-02 -7.67660771e+02]
Iteration 320 
X value is [ 4.67159813e-03 -1.69502543e+03]
Iteration 360 
X value is [ 2.08213318e-03 -3.74268338e+03]
Iteration 400 
X value is [ 9.28007597e-04 -8.26399336e+03]
Iteration 440 
X value is [ 4.13613361e-04 -1.82472251e+04]
Iteration 480 
X value is [ 1.84347642e-04 -4.02905968e+04]
Iteration 520 
X value is [ 8.21638185e-05 -8.89632358e+04]
Iteration 560 
X value is [ 3.66204471e-05 -1.96434353e+05]
Iteration 600 
X value is [ 1.63217481e-05 -4.33734843e+05]
Iteration 640 
X value is [ 7.27460971e-06 -9.57703738e+05]
Iteration 680 
X value is [ 3.24229649e-06 -2.11464784e+06]
Iteratio

## Ejercicio 2

Para la función  $f_{1}\left(x_{1},x_{2}\right)=x_{1}^4 + x_{2}^4$

Realice lo siguiente:

1. En una celda de texto:

 - Calcule el vector gradiente. **(15 puntos)**

 - Calcule la matriz Hessiana. **(15 puntos)**

2. Para el resultado obtenido en el punto anterior: **(20 puntos)**
  - Evalúela en el punto $x_{1},x_{2}\in\left[4,4\right]$. 
  - Luego aplique el criterio de la segunda derivada parcial ¿qué conclusiones saca para ese punto? 

---

Vector gradiente:

$\nabla f_1(x_1, x_2) = \left(\frac{\partial f_1}{\partial x_1}, \frac{\partial f_1}{\partial x_2}\right)$

Calculamos las derivadas parciales:

$\frac{\partial f_1}{\partial x_1} = 4x_1^3$

$\frac{\partial f_1}{\partial x_2} = 4x_2^3$

Por lo tanto, el vector gradiente es:

$\nabla f_1(x_1, x_2) = \left(4x_1^3, 4x_2^3\right)$

Su matriz Hessiana:

$H_f(x_1, x_2) = \begin{bmatrix} \frac{\partial^2 f_1}{\partial x_1^2} & \frac{\partial^2 f_1}{\partial x_1 \partial x_2} \ \frac{\partial^2 f_1}{\partial x_2 \partial x_1} & \frac{\partial^2 f_1}{\partial x_2^2} \end{bmatrix}$

Segundas derivadas parciales:

$\frac{\partial^2 f_1}{\partial x_1^2} = 12x_1^2$

$\frac{\partial^2 f_1}{\partial x_2^2} = 12x_2^2$

$\frac{\partial^2 f_1}{\partial x_1 \partial x_2} = 0$

Por lo tanto, la matriz Hessiana es:

$H_f(x_1, x_2) = \begin{bmatrix} 12x_1^2 & 0 \\ 0 & 12x_2^2  \end{bmatrix}$

Para evaluar la matriz Hessiana en el punto $x_1 = 4$, $x_2 = 4$:

$H_f(4, 4) = \begin{bmatrix} 12(4)^2 & 0 \\ 0 & 12(4)^2 \end{bmatrix} = \begin{bmatrix} 192 & 0 \\ 0 & 192 \end{bmatrix}$

Por lo tanto, podemos afirmar que en el punto $(x_1, x_2) = (4, 4)$ la función $f_1(x_1, x_2) = x_1^4 + x_2^4$ tiene un mínimo local.