# Matemática para Ciencia de los Datos
# Trabajo Práctico 6

Profesor: Juan Luis Crespo Mariño (basado en trabajo previo de Luis Alexánder Calvo Valverde)

Instituto Tecnológico de Costa Rica,

Programa Ciencia de Datos

---

Fecha de entrega: 2 de septiembre, hora límite las 6:00 pm.

Medio de entrega: Por medio del TEC-Digital.

Entregables: Un archivo jupyter ( .IPYNB ).

Estudiante:
1. **Roberto Baltodano**



## Ejercicio 1 (50 puntos)



El algoritmo del descenso de gradiente sigue la idea de modificar el punto óptimo estimado de forma iterativa. Para una función en una
variable $f\left(x\right)$, la estimación del punto óptimo en una iteración $i+1$ está dada por:

\begin{equation}
x\left(t+1\right)=x\left(t\right)+\alpha f'\left(x\left(t\right)\right)
\end{equation}

donde el coeficiente $\alpha$ determina el *grado de confianza o velocidad* con la que el proceso de optimización iterativa sigue
la dirección de la derivada. Para la optimización de una función multivariable $f\left(\overrightarrow{x}\left(t\right)\right)$ con $\overrightarrow{x}\in\mathbb{R}^{n}$, la posición óptima se estima usando el vector gradiente:

\begin{equation}
\overrightarrow{x}\left(t+1\right)=\overrightarrow{x}\left(t\right)+\alpha\nabla_{\overrightarrow{x}}f\left(\overrightarrow{x}\left(t\right)\right)
\end{equation}

Para la función:

\begin{equation}
f\left(\overrightarrow{x}\right)=x^{2}-y^{2},
\end{equation}

Implemente la función en python denominada:

$$funcion\_SGD \left(tasa\_aprendizaje, iteraciones, xy, tolerancia\right)$$

donde los parámetros corresponden a:

* tasa_aprendizaje: es el $\alpha$
* iteraciones: es el máximo número de iteraciones a ejecutar
* xy: es el vector con los dos valores iniciales [x,y]
* tolerancia: es el valor mínimo para un cambio entre iteración. Si la función de costo no mejora en al menos "tolerancia", sale del ciclo de iteración.

**Nota:**
1. Para iniciar la implementación puede utilizar el código en el cuaderno "070_1_LACV_Optimizacion".
1. Cada iteración le generará un vector con dos valores ($\overrightarrow{x}\left(t+1\right)$), por lo que para saber el valor de la función de pérdida en ese punto, evalúelo en la función inicial ($x^{2}-y^{2}$) para saber si aumentó o disminuyó.



---




In [4]:
import numpy as np
# Ejercicio descenso de gradiente
# f( x, y ) =  x**2 - y**2
# código base: https://towardsdatascience.com/implement-gradient-descent-in-python-9b93ed7108d1

def gradiente_f(x, y):
    return np.array([2*x, -2*y])

def SGD(tasa_aprendizaje, iteraciones, xy, tolerancia) -> None:
    cur_xy = np.array(xy, dtype=float)
    previous_step_size = 1
    iters = 0 #iteration counter

    while previous_step_size > tolerancia and iters < iteraciones:
        prev_xy = cur_xy # Store current point value in previous_point
        cur_xy = prev_xy - tasa_aprendizaje * gradiente_f(prev_xy[0], prev_xy[1]) #Grad descent
        previous_step_size = np.linalg.norm(cur_xy - prev_xy, ord=2) # Euclidean distance
        iters += 1 #iteration count
        if (iters % 1) == 0:
            print("Iteration",iters,"\nPoint value is", cur_xy) #Print iterations
            print("previous_step_size >>> ", previous_step_size)


    print("The local minimum occurs at", cur_xy)

SGD(tasa_aprendizaje=0.1, iteraciones=1000, xy=(5, -3), tolerancia=0.000000000000000000000000001)

Iteration 1 
Point value is [ 4.  -3.6]
previous_step_size >>>  1.1661903789690602
Iteration 2 
Point value is [ 3.2  -4.32]
previous_step_size >>>  1.0762899237658967
Iteration 3 
Point value is [ 2.56  -5.184]
previous_step_size >>>  1.0752190474503323
Iteration 4 
Point value is [ 2.048  -6.2208]
previous_step_size >>>  1.1563296415815
Iteration 5 
Point value is [ 1.6384  -7.46496]
previous_step_size >>>  1.309849711073755
Iteration 6 
Point value is [ 1.31072  -8.957952]
previous_step_size >>>  1.528528473553568
Iteration 7 
Point value is [  1.048576  -10.7495424]
previous_step_size >>>  1.8106671803808014
Iteration 8 
Point value is [  0.8388608  -12.89945088]
previous_step_size >>>  2.160112714070021
Iteration 9 
Point value is [  0.67108864 -15.47934106]
previous_step_size >>>  2.585339594307174
Iteration 10 
Point value is [  0.53687091 -18.57520927]
previous_step_size >>>  3.0987762713090734
Iteration 11 
Point value is [  0.42949673 -22.29025112]
previous_step_size >>>  3.7

## Ejercicio 2

Para la función  $f_{1}\left(x_{1},x_{2}\right)=x_{1}^3 + x_{2}^3 - 3x_{1}^2 - 3x_{2}^2 - 3x_{1}x_{2} +2 $

Realice lo siguiente:

1. En una celda de texto:

 - Calcule el vector gradiente. **(15 puntos)**

 - Calcule la matriz Hessiana. **(15 puntos)**

2. Para el resultado obtenido en el punto anterior: **(20 puntos)**
  - Evalúela en los puntos que tentativamente anulen el gradiente de la misma (pueden usar python o métodos similares para resolver sistemas de ecuaciones, si lo necesitan).
  - Luego aplique el criterio de la segunda derivada parcial ¿qué conclusiones saca para esos puntos?

---

$f(x,y) = x^{3} + y^{3} - 3x^{2} - 3y^{2} - 3xy + 2$

### Derivadas parciales de primer orden

$\frac{\partial f(x,y)}{\partial x} = 3x^{2} - 6x - 3y$

$\frac{\partial f(x,y)}{\partial y} = 3y^{2} - 6y - 3x$

### Vector gradiente

$\nabla f(x,y) = \left( 3x^{2} - 6x - 3y,\; 3y^{2} - 6y - 3x \right)$

### Derivadas parciales de segundo orden

$\frac{\partial^{2} f}{\partial x^{2}} = 6x - 6$

$\frac{\partial^{2} f}{\partial y^{2}} = 6y - 6$

$\frac{\partial^{2} f}{\partial x \partial y} = 
\frac{\partial^{2} f}{\partial y \partial x} = -3$

### Matriz Hessiana

$Hf(x,y) =
\begin{pmatrix}
6x - 6 & -3 \\
-3 & 6y - 6
\end{pmatrix}$

In [None]:
def grad(x, y):
    return np.array([3*x**2 + 6*x - 4*y, 4*y**3 + 8*y - 4*x - 5])

#def puntosDeAnulacion(gradiente):

[ 0.00113088 -0.00074252]
