# Curso de Optimización 
## Tarea 4

| Descripción:                         | Fechas                 |
|--------------------------------------|------------------------|
| Fecha de publicación del documento:  | **Febrero 25, 2025**   |
| Fecha límite de entrega de la tarea: | **Marzo    4, 2025**   |


### Indicaciones

- Envie el notebook con los códigos y las pruebas realizadas de cada ejercicio.
- Si se requiren algunos scripts adicionales para poder reproducir las pruebas,
  agreguelos en un ZIP junto con el notebook.
- Genere un PDF del notebook y suba el archivo por separado, sin comprimirlo, 
  para anotar la evaluación y comentarios de cada ejercicio.

### Resuelto por Cesar Amilkar Rivera Covarrubias

---

## Ejercicio 1 (1 puntos)

1. Muestre que los eigenvectores de una matriz $\mathbf{A}$ simétrica y definida positiva 
   forman un conjunto de direcciones conjugadas respecto a la matriz $\mathbf{A}$.

### Solución:

Sea $A$ una matriz simetrica y definida positiva. Dados dos vectores $u$ y $v$ asociados a los eigenvalores $ \alpha$ y $\beta$, respectivamente, tales que $\alpha \neq \beta$. Veamos que 

$$ (v^T A u)^T  = u^T A v, $$

notemos que $v^T A u = (v^T A u)^T$ pues el producto es un número real. Luego, 

$$
v^T A u  = v^T \alpha u = \alpha v^t u, 
$$

además 

$$
u^T A v = u^t \beta v = \beta u^t v.
$$


Por lo mencionado anteriormente, tenemos que 

$$
\alpha v^t u = \beta u^t v \Rightarrow (\alpha - \beta) u^t v, 
$$

la hipotesis nos permite concluir que el producto anterior es cero, del teorema espectral se cumple que $u \perp v$. Así, obtenemos que para cuales quiera dos eigenvectores $u$ y $v$ asociados a diferentes eigenvalores se cumple que 

$$ u^T A v = 0, $$ 

formando yun conjunto de direcciones conjugadas respecto a la matriz A. Como queriamos probar. 

Notemos que no es posible garantizar lo anterior si los eigenvectores $u$ y $v$ estan asociados al mismo eigenvalor, ya que el teorema espectral no nos garantiza que $u \perp v$






```


```
---


## Ejercicio 2 (9 puntos)

Programe el método de gradiente conjugado lineal, Algoritmo 2 de la Clase 11,
para minimizar la función cuadrática 
   
$$ f(\mathbf{x}) = \frac{1}{2} \mathbf{x}^\top\mathbf{A}\mathbf{x}-\mathbf{b}^\top\mathbf{x},  $$ 
  
donde $\mathbf{A}$ es una matriz simétrica y definida positiva.

1. La función que implementa el algoritmo recibe como entrada la matriz
   $\mathbf{A}$, el vector $\mathbf{b}$, el punto inicial $\mathbf{x}_0$,
   el número máximo de iteraciones $N$ y una tolerancia $\tau>0$.
   Haga que la función devuelva el último punto  $\mathbf{x}_k$, 
   el último residual $\mathbf{r}_k$, el número de iteraciones $k$ 
   y una variable binaria $bres$ que indique si se cumplió que $\|\mathbf{r}_k \|<\tau$
   ($bres=True$) o no ($bres=False$).

2. Pruebe el algoritmo con las matrices y vectores usadas en la Tarea 2.

- Lea cada  archivo `npz` para obtener  $\mathbf{A}$ y el vector $\mathbf{b}$.
- Defina $n$ como el tamaño del arreglo $\mathbf{b}$.
- Use $n$ como el máximo número de iteraciones para el algoritmo.
- Defina $\mathbf{x}_{0} = (-5, 0, ..., 0)^\top$ de dimensión $n$ y la tolerancia
  $\tau = \sqrt{n\epsilon_m}$,  donde $\epsilon_m$ es el épsilon máquina.

Para archivo de prueba imprima los siguientes datos

- la dimensión $n$,
- el  número $k$ de iteraciones realizadas,
- las primeras y últimas 3 entradas del punto $\mathbf{x}_k$ que devuelve el algoritmo,
- la norma del residual $\mathbf{r}_k$, 
- la variable $bres$ para saber si el algoritmo puedo converger.
- El número de condición de la matriz $\kappa_2(\mathbf{A}) = \lambda_{\max}/\lambda_{\min}$,
  donde $\lambda_{\max}$ es el eigenvalor más grande de la matriz y $\lambda_{\min}$
  es el eigenvalor más pequeño.
  
3. Compare estos resultados con los obtenidos en el Ejercicio 2 de la Tarea 3
   con el método de descenso máximo con paso exacto y escriba un comentario
   al respecto.

### Solución:

In [1]:
import numpy as np 
from funciones_prop import *

eps = np.finfo('float').eps

In [2]:
def gradiente_conjugado (A, b, x0, N, tol = eps):

    n = len(A)
    rk = A@x0 - b 
    pk = -rk
    xk = x0.copy()

    for i in range(N+1):
        
        if np.linalg.norm(rk) < tol: 
            return xk, rk, i+1, True
            
        alpha_k = (rk.T @ rk) / (pk.T @ A @ pk)
        xk = xk + alpha_k * pk 
        rk_new = rk + alpha_k * (A @ pk)

        beta_k = (rk_new.T @ rk_new) / (rk.T @ rk) 

        pk = -rk_new + beta_k * pk 

        rk = rk_new.copy()

    

    return xk, rk, i+1, False
     



In [10]:
for i in range(1, 6): 
    path = f'datosTarea02/matA_vecb{i}.npz'

    A, b = load_data(path)
    n = len(b)

    print("Iteracion: ", i)
    x0 = [0 for i in range(n)]
    x0[0] = -5 
    tol = (n * eps)**(1/2)

    xk, rk, k, flag = gradiente_conjugado (A, b, x0, n, tol)

    print("n: ", n)
    print("k: ", k)
    print("xk[:3]", xk[:3])
    print("xk[-3:]", xk[-3:])
    print(f"||rk||: {np.linalg.norm(rk) : .4}")
    print("flag: ", flag)

    condicion = get_condicion(A) 

    print(f"Numero de condicion: {condicion : .4}")
    print("-----------------------------------------")

Iteracion:  1
n:  2
k:  3
xk[:3] [ 4.  -1.5]
xk[-3:] [ 4.  -1.5]
||rk||:  2.383e-14
flag:  True
Numero de condicion:  4.0
-----------------------------------------
Iteracion:  2
n:  2
k:  3
xk[:3] [-5. -9.]
xk[-3:] [-5. -9.]
||rk||:  2.874e-12
flag:  True
Numero de condicion:  279.2
-----------------------------------------
Iteracion:  3
n:  10
k:  11
xk[:3] [1. 1. 1.]
xk[-3:] [1. 1. 1.]
||rk||:  3.833e-17
flag:  True
Numero de condicion:  7.544
-----------------------------------------
Iteracion:  4
n:  100
k:  58
xk[:3] [-1. -1. -1.]
xk[-3:] [-1. -1. -1.]
||rk||:  1.375e-07
flag:  True
Numero de condicion:  102.0
-----------------------------------------
Iteracion:  5
n:  500
k:  12
xk[:3] [ 1. -1.  1.]
xk[-3:] [-1.  1. -1.]
||rk||:  7.606e-08
flag:  True
Numero de condicion:  22.91
-----------------------------------------


Ahora, compararemos los resultados con los obtenidos en el ejericico 2 de la tarea 2. 

Como comentarios generales podemos observar que el algoritmo implementado en esta tarea utiliza menos iteraciones para poder obtener los mismos resultados. 

En los primeros casos el contenido del vector xk son identicos, sin embargo, a partir del tercer caso, podemos observar una diferencia en la precisión del resultado, pues en la implementación de la tarea actual alcanzamos el valor de 1 o -1 según el caso, mientras que en la implementación de la tarea 2 se alcanzan valores cercanos a 1 o -1, pero no iguales en todos los casos. 

Podemos concluir que este algoritmo obtiene se desempeña mejor, en general, pues obtiene resultados más precisos y en menos iteraciones. 


```


```
---
