# Tarea 5. Optimización
Guillermo Segura Gómez

## Ejercicio 1

**1. Encuentre y clasifique los puntos estacionarios para la función**

$$
f(\mathbf{x}) = x_1^2 - x_2^2 + x_3^2 - 2x_1x_3 - x_2x_3 + 4x_1 + 12. 
$$

---

Los puntos estacionarios de una función son aquellos puntos en los que la primera derivada o el gradiente, de la función es igual a cero. Son los puntos donde la pendiente de la función es cero. Para encontrar los puntos estacionarios, podemos definir la función gradiente y encontrar los valores para los cuales la función es igual a cero. El gradiente de una función $f$ de tres variables es igual a

$$
\nabla f = \left[ \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \frac{\partial f}{\partial x_3} \right]
$$

Derivando, el gradiente es igual a 

$$
\nabla f(\mathbf{x}) = \left[ 2x_1 - 2x_3 + 4, -2x_2 - x_3, -2x_1 - x_2 + 2x_3 \right] 
$$

Podemos expresar el gradiente como una matriz de tres ecuaciones con tres incógnitas

$$
\begin{bmatrix}
2 & 0 & -2 \\
0 & -2 & -1 \\
-2 & -1 & 2
\end{bmatrix}
\begin{bmatrix}
x_1 \\
x_2 \\
x_3
\end{bmatrix} = 
\begin{bmatrix}
4 \\
0 \\
0
\end{bmatrix}
$$

Solucionar este sistema $Ax = b$ es similar a encontrar los puntos estacionarios de la función. Podemos utilizar cualquier método de solución de matrices, pero es un sistema muy simple, la solución se puede encontrar a mano. 

De la primera ecuación encontramos $x_1 = x_3 - 2$.
De la segunda ecuación encontramos $x_2 = -\frac{1}{2}x_3$

Sustituyendo en la ecuación 3 encontramos que $x_3 = -8$. Por lo tanto, $x_1 = -10$ y $x_2 = 4$. La función tiene un único punto estacionario.

$$
x = (-10, 4, -8)
$$

Para clasificar el punto estacionario $(-10, 4, -8)$ de la función $f(\mathbf{x})$, necesitamos evaluar el Hessiano de $f$ en este punto. Para una función de tres variables $f(x_1, x_2, x_3)$, la hessiana se define:

$$
H = \begin{bmatrix} \frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1 \partial x_2} & \frac{\partial^2 f}{\partial x_1 \partial x_3} \\ \frac{\partial^2 f}{\partial x_2 \partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \frac{\partial^2 f}{\partial x_2 \partial x_3} \\ \frac{\partial^2 f}{\partial x_3 \partial x_1} & \frac{\partial^2 f}{\partial x_3 \partial x_2} & \frac{\partial^2 f}{\partial x_3^2} \end{bmatrix}
$$

Calculando la hessiana de $f$ en el punto estacionario $(-10, 4, -8)$ es:

$$
H = \begin{bmatrix} 2 & 0 & -2 \\ 0 & -2 & -1 \\ -2 & -1 & 2 \end{bmatrix}
$$

Para clasificar el punto estacionario, necesitamos examinar los valores propios de la matriz hessiana. La naturaleza del punto estacionario está determinada por el signo de los valores propios:

- Si todos los valores propios son positivos, el punto estacionario es un mínimo local.
- Si todos los valores propios son negativos, el punto estacionario es un máximo local.
- Si los valores propios son de signos mixtos, el punto estacionario es un punto de silla.

Calculando los valores propios de la matriz.

In [10]:
import numpy as np

# Matrix hessiana
H = np.array([[2,0,-2],[0,-2,-1],[-2,-1,2]])

print("Los eigenvalores de la matriz Hessiana son:")
eigenvalues, eigecvectors = np.linalg.eig(H)
print(eigenvalues)

Los eigenvalores de la matriz Hessiana son:
[ 4.08387236  0.21319818 -2.29707054]


Por lo que encontramos, los valores propios son mixtos, por lo que el punto estacionario $(-10, 4, -8)$ es un **punto silla**.

**2. Sea $\mathbf{x}_0 = (1,0,0)^\top$. Calcule el punto $\mathbf{x}_1$ usando la dirección de descenso máximo con paso exacto.**



## Ejercicio 2

Considere la función

$$
f(\mathbf{x}) = 2x_1^2 + x_2^2 - 2x_1x_2 + 2x_1^3 + x_1^4
$$

Sea $\mathbf{x}_0 = (0,1)^\top$

1. Aplique un paso del método de Newton a partir del punto si la Hessiana en $\mathbf{x}_0$ es definida positiva. Si no, aplique el algoritmo de descenso máximo con un tamaño de paso apropiado.

2. Calcule el cambio de la función objetivo:$f(\mathbf{x}_1) - f(\mathbf{x}_0)$.

## Ejercicio 3

Supongamos que$f_1, f_2: \mathbb{R}^n \rightarrow \mathbb{R}$son funciones convexas.
   
1. Muestre que también es convexa la función$f(\mathbf{x})$
   definida como
   
$$f(\mathbf{x}) = \max\{f_1(\mathbf{x}), f_2(\mathbf{x}) \}.$$

2. Si$n=1$y$f_1(-0.4) = 0.36$,
  $f_1(0.6) = 2.56$,$f_2(-0.4) = 3.66$y$f_2(1) = 2$, identifique 
   el intervalo más pequeño en el que se puede garantizar que se 
   encuentra el minimizador de la función$f(x)$. 
   Explique su respuesta.

## Ejercicio 4 (3 puntos)

Programe el método de región de confianza (MRC) que usa como 
aproximación del subproblema de optimización al punto de Cauchy,
descrito en la Clase 13 en el Algoritmo 3.


1. Si la dimensión$n$de la variable$\mathbf{x}$es 2, en 
   la función que implementa el algoritmo se crea un arreglo$\mathbf{M}$ 
   en el que se guarda los puntos$\mathbf{x}_0, \mathbf{x}_1,
   ..., \mathbf{x}_k$generados. Si$n>2$, definir$\mathbf{M}$como$None$.

   La función debe devolver el último valor$k$,$\mathbf{x}_k$, 
  $\mathbf{g}_k$y $\mathbf{M}$.

2. Pruebe el algoritmo en la siguientes funciones, fijando 
   la cantidad de iteraciones máximas$N=50000$,$\Delta_{\min}=10^{-5}$,$\eta=0.25$
   y la tolerancia 
  $\tau = \sqrt{n\epsilon_m}$, donde$\epsilon_m$es el épsilon de máquina,
   excepto para la función Hartmann para la cual es mejor usar una tolerancia más 
   grande, como$\tau = \sqrt{n}\epsilon_m^{1/3}$.
   Use los puntos iniciales siguientes y pruebe dos valores para el radio de 
   la región de confianza$\Delta_{\max}=4$y$\Delta_{\max}=0.25$.
   

**Función de Himmelblau** 
-$\mathbf{x}_0 = (2,4)$


**Función de Beale**
-$\mathbf{x}_0 = (2,3)$ 


**Función de Rosenbrock**
-$\mathbf{x}_0 = (-1.2, 1.0)\in \mathbb{R}^{2}$ 
-$\mathbf{x}_0 = (-1.2, 1.0, ..., -1.2, 1.0) \in \mathbb{R}^{10}$ 
-$\mathbf{x}_0 = (-1.2, 1.0, ..., -1.2, 1.0) \in \mathbb{R}^{20}$


**Función de Hartmann de dimensión 6**
-$\mathbf{x}_0 = (0,0,0,0,0,0)$


En cada caso imprima los resultados:
- El número de iteraciones realizadas$k$
- El punto$\mathbf{x}_k$obtenido
-$f(\mathbf{x}_k)$
-$\|\nabla f(\mathbf{x}_k)\|$
- La variable que indica si el algoritmo terminó porque se cumplió el criterio de paro o no.
- Si$n=2$, genere la gráfica de los contornos de nivel de la función y la trayectoria
  de los puntos$\mathbf{x}_0, \mathbf{x}_1, ..., \mathbf{x}_k$.
  