# Matemática para Ciencia de los Datos
# Trabajo Práctico 6

Profesor: Luis Alexánder Calvo Valverde 

Instituto Tecnológico de Costa Rica, 

Programa Ciencia de Datos

---

Fecha de entrega: Lunes 5 de Junio del 2023, a más tardar a las 3:00 pm.

Medio de entrega: Por medio del TEC-Digital.

Entregables: Un archivo jupyter ( .IPYNB ). 

Estudiante:
1. **Ricardo Chacon Brenes**



## Ejercicio 1 (50 puntos)



El algoritmo del descenso de gradiente sigue la idea de modificar el punto óptimo estimado de forma iterativa. Para una función en una
variable $f\left(x\right)$, la estimación del punto óptimo en una iteración $i+1$ está dada por: 

\begin{equation}
x\left(t+1\right)=x\left(t\right)+\alpha f'\left(x\left(t\right)\right)
\end{equation}

donde el coeficiente $\alpha$ determina el *grado de confianza o velocidad* con la que el proceso de optimización iterativa sigue
la dirección de la derivada. Para la optimización de una función multivariable $f\left(\overrightarrow{x}\left(t\right)\right)$ con $\overrightarrow{x}\in\mathbb{R}^{n}$, la posición óptima se estima usando el vector gradiente:

\begin{equation}
\overrightarrow{x}\left(t+1\right)=\overrightarrow{x}\left(t\right)+\alpha\nabla_{\overrightarrow{x}}f\left(\overrightarrow{x}\left(t\right)\right)
\end{equation}

Para la función: 

\begin{equation}
f\left(\overrightarrow{x}\right)=x^{2}-y^{2},
\end{equation}

Implemente la función en python denominada:

$$funcion\_SGD \left(tasa\_aprendizaje, iteraciones, xy, tolerancia\right)$$

donde los parámetros corresponden a:

* tasa_aprendizaje: es el $\alpha$
* iteraciones: es el máximo número de iteraciones a ejecutar
* xy: es el vector con los dos valores iniciales [x,y]
* tolerancia: es el valor mínimo para un cambio entre iteración. Si la función de costo no mejora en al menos "tolerancia", sale del ciclo de iteración.

**Nota:** 
1. Para iniciar la implementación puede utilizar el código en el cuaderno "070_1_LACV_Optimizacion".
1. Cada iteración le generará un vector con dos valores ($\overrightarrow{x}\left(t+1\right)$), por lo que para saber el valor de la función de pérdida en ese punto, evalúelo en la función inicial ($x^{2}-y^{2}$) para saber si aumentó o disminuyó.



---




In [1]:
import numpy as np

def funcion_SGD(tasa_aprendizaje, iteraciones, xy, tolerancia):
    x, y = xy
    
    for i in range(iteraciones):
        # Calcular las derivadas
        df_dx = 2 * x
        df_dy = -2 * y
        
        # Calcular los nuevos valores de x y y
        new_x = x + tasa_aprendizaje * df_dx
        new_y = y + tasa_aprendizaje * df_dy
        
        # Comprobar la condición de tolerancia
        if np.sqrt((new_x - x)**2 + (new_y - y)**2) < tolerancia:
            break
            
        # Actualizar x y y
        x, y = new_x, new_y
        
    return [x, y]


## Ejercicio 2

Para la función  $f_{1}\left(x_{1},x_{2}\right)=x_{1}^4 + x_{2}^4$

Realice lo siguiente:

1. En una celda de texto:

 - Calcule el vector gradiente. **(15 puntos)**

 - Calcule la matriz Hessiana. **(15 puntos)**

2. Para el resultado obtenido en el punto anterior: **(20 puntos)**
  - Evalúela en el punto $x_{1},x_{2}\in\left[4,4\right]$. 
  - Luego aplique el criterio de la segunda derivada parcial ¿qué conclusiones saca para ese punto? 

---

In [2]:
import numpy as np

# Definir las variables
x1 = 4
x2 = 4

# Calcular las derivadas para el vector gradiente
df_dx1 = 4 * x1**3
df_dx2 = 4 * x2**3

# Calcular las segundas derivadas para la matriz Hessiana
d2f_dx12 = 12 * x1**2
d2f_dx22 = 12 * x2**2

# Crear el vector gradiente y la matriz Hessiana
gradiente = np.array([df_dx1, df_dx2])
hessiana = np.array([[d2f_dx12, 0], [0, d2f_dx22]])

# Imprimir los resultados
print("Vector Gradiente: ", gradiente)
print("Matriz Hessiana: ", hessiana)

# Calcular el determinante de la matriz Hessiana
det_hessiana = np.linalg.det(hessiana)
print("Determinante de la Matriz Hessiana: ", det_hessiana)



Vector Gradiente:  [256 256]
Matriz Hessiana:  [[192   0]
 [  0 192]]
Determinante de la Matriz Hessiana:  36863.99999999999
