# Matemática para Ciencia de los Datos
# Trabajo Práctico 6

Profesor: Juan Luis Crespo Mariño (basado en trabajo previo de Luis Alexánder Calvo Valverde)

Instituto Tecnológico de Costa Rica,

Programa Ciencia de Datos

---

Fecha de entrega: 26 de Noviembre del 2023, a más tardar a las 6:00 pm.

Medio de entrega: Por medio del TEC-Digital.

Entregables: Un archivo jupyter ( .IPYNB ).

Estudiante:
1. Luis Felipe Quesada Miranda



## Ejercicio 1 (50 puntos)



El algoritmo del descenso de gradiente sigue la idea de modificar el punto óptimo estimado de forma iterativa. Para una función en una
variable $f\left(x\right)$, la estimación del punto óptimo en una iteración $i+1$ está dada por:

\begin{equation}
x\left(t+1\right)=x\left(t\right)+\alpha f'\left(x\left(t\right)\right)
\end{equation}

donde el coeficiente $\alpha$ determina el *grado de confianza o velocidad* con la que el proceso de optimización iterativa sigue
la dirección de la derivada. Para la optimización de una función multivariable $f\left(\overrightarrow{x}\left(t\right)\right)$ con $\overrightarrow{x}\in\mathbb{R}^{n}$, la posición óptima se estima usando el vector gradiente:

\begin{equation}
\overrightarrow{x}\left(t+1\right)=\overrightarrow{x}\left(t\right)+\alpha\nabla_{\overrightarrow{x}}f\left(\overrightarrow{x}\left(t\right)\right)
\end{equation}

Para la función:

\begin{equation}
f\left(\overrightarrow{x}\right)=x^{2}-y^{2},
\end{equation}

Implemente la función en python denominada:

$$funcion\_SGD \left(tasa\_aprendizaje, iteraciones, xy, tolerancia\right)$$

donde los parámetros corresponden a:

* tasa_aprendizaje: es el $\alpha$
* iteraciones: es el máximo número de iteraciones a ejecutar
* xy: es el vector con los dos valores iniciales [x,y]
* tolerancia: es el valor mínimo para un cambio entre iteración. Si la función de costo no mejora en al menos "tolerancia", sale del ciclo de iteración.

**Nota:**
1. Para iniciar la implementación puede utilizar el código en el cuaderno "070_1_LACV_Optimizacion".
1. Cada iteración le generará un vector con dos valores ($\overrightarrow{x}\left(t+1\right)$), por lo que para saber el valor de la función de pérdida en ese punto, evalúelo en la función inicial ($x^{2}-y^{2}$) para saber si aumentó o disminuyó.



---




In [1]:
import numpy as np
import math

def funcion_f(x, y):
    return x**2-y**2

def dfdx(x):
    return 2*x

def dfdy(y):
    return -2*y


def funcion_SGD(tasa_aprendizaje, iteraciones, xy, tolerancia):
    
    iters = 0
    previous_step_size_x = 1
    previous_step_size_y = 1
    cur_x=0
    cur_y=0

    while previous_step_size_x > tolerancia and previous_step_size_y > tolerancia and iters < iteraciones:
        
        prev_x = cur_x #Store current x value in prev_x
        cur_x = cur_x - tasa_aprendizaje * dfdx(xy[0]) #Grad descent
        previous_step_size_x = abs(cur_x - prev_x) #Change in x
        
        prev_y = cur_y #Store current x value in prev_y
        cur_y = cur_y - tasa_aprendizaje * dfdy(xy[1]) #Grad descent
        previous_step_size_y = abs(cur_y - prev_y) #Change in y
        
        iters = iters+1 #iteration count

        
        if (iters % 10) == 0:
            print("Iteracion",iters,"\nX value is",cur_x, "\nY value is", cur_y) #Print iterations
            print("previous_step_size_x >>> x", previous_step_size_x)
            print("previous_step_size_y >>> y", previous_step_size_y)
            print("Valores de f en el punto: ", "x= " , cur_x, "y= ", cur_y, "f(x,y)= ", funcion_f(cur_x, cur_y), "\n" )
    
    print("El minimo local sucede en los valores x= ", cur_x, " y =" , cur_y ,"\n")     

x=15
y=9
xy=[x, y]
tolerancia = 0.00001
tasa_aprendizaje = 0.001
iteraciones = 1000

funcion_SGD(tasa_aprendizaje, iteraciones, xy, tolerancia)

Iteracion 10 
X value is -0.30000000000000004 
Y value is 0.18000000000000005
previous_step_size_x >>> x 0.030000000000000027
previous_step_size_y >>> y 0.018000000000000016
Valores de f en el punto:  x=  -0.30000000000000004 y=  0.18000000000000005 f(x,y)=  0.057600000000000005 

Iteracion 20 
X value is -0.6000000000000003 
Y value is 0.3600000000000002
previous_step_size_x >>> x 0.030000000000000027
previous_step_size_y >>> y 0.018000000000000016
Valores de f en el punto:  x=  -0.6000000000000003 y=  0.3600000000000002 f(x,y)=  0.23040000000000022 

Iteracion 30 
X value is -0.9000000000000006 
Y value is 0.5400000000000004
previous_step_size_x >>> x 0.030000000000000027
previous_step_size_y >>> y 0.018000000000000016
Valores de f en el punto:  x=  -0.9000000000000006 y=  0.5400000000000004 f(x,y)=  0.5184000000000006 

Iteracion 40 
X value is -1.2000000000000008 
Y value is 0.7200000000000005
previous_step_size_x >>> x 0.030000000000000027
previous_step_size_y >>> y 0.018000000000

## Ejercicio 2

Para la función  $f_{1}\left(x_{1},x_{2}\right)=x_{1}^4 + x_{2}^4$

Realice lo siguiente:

1. En una celda de texto:

 - Calcule el vector gradiente. **(15 puntos)**

 - Calcule la matriz Hessiana. **(15 puntos)**

2. Para el resultado obtenido en el punto anterior: **(20 puntos)**
  - Evalúela en el punto $x_{1},x_{2}\in\left[4,4\right]$.
  - Luego aplique el criterio de la segunda derivada parcial ¿qué conclusiones saca para ese punto?

---



$$

𝑓_{1}(𝑥_{1},𝑥_{2}) = 𝑥^{4}_{1} + 𝑥^{4}_{2}\\
\textrm{Calculamos todas las derivadas parciales:}\\

\frac{∂𝑓_{1}}{∂𝑥_{1}} =  4𝑥^{3}_{1} \\
\frac{∂𝑓_{1}}{∂𝑥_2} = 4𝑥^{3}_{2}\\

\textrm{Segundo orden:}\\

\frac{∂^{2}f_{1}}{∂x^{2}_{1}} =  12x^{2}_{1}\\
\frac {∂^{2}f_{1}}{∂x^{2}_{2}} =  12x^{2}_{2}\\

\frac {∂^{2}f_{1}}{∂x_{1}∂x_{2}} =  0 \\

\frac {∂^{2}f_{1}}{∂x_{2}∂x_{1}} =  0 \\

\textrm{Creamos la matriz Hessiana:}\\

𝐻(𝑓_{1}) = \begin{bmatrix} 12𝑥^{2}_{1} & 0 \\\\ 0 & 12x^{2}_{2} \end{bmatrix}\\

\textrm{Evaluamos en el punto (4,4):}\\

𝐻(𝑓_{1}|_{(4,4)}) =\begin{bmatrix} 12(4)^{2} & 0 \\\\ 0 & 12(4)^{2} \end{bmatrix}\\


𝐻(𝑓_{1}|_{(4,4)}) =\begin{bmatrix} 192 & 0 \\\\ 0 & 192 \end{bmatrix}\\

\textrm{Calculamos el determinante de la matriz Hessiana:}\\

\textrm{ det(H) = 192*192 - 0*0 =  36,864 }\\



\textrm{Ya que det(H) > 0 y }  \frac {∂^{2}f_{1}}{∂x^{2}_{1}} = 192 \\ \textrm {el punto (4,4) es un minimo local}

$$