# Curso de Optimización I
## Tarea 6

| Descripción:                         | Fechas               |
|--------------------------------------|----------------------|
| Fecha de publicación del documento:  | **Marzo 25, 2024**   |
| Fecha límite de entrega de la tarea: | **Abril 14, 2024**   |


### Indicaciones

- Envie el notebook con los códigos y las pruebas realizadas de cada ejercicio.
- Si se requiren algunos scripts adicionales para poder reproducir las pruebas,
  agreguelos en un ZIP junto con el notebook.
- Genere un PDF del notebook y envielo por separado.

---

## Ejercicio 1 (3 puntos)

1. Programe el método de gradiente conjugado lineal, Algoritmo 1 de la Clase 18,
   para resolver el sistema de ecuaciones $\mathbf{A}\mathbf{x}=\mathbf{b}$, donde
   $\mathbf{A}$ es una matriz simétrica y definida positiva.
   
   Haga que la función devuelva el último punto  $\mathbf{x}_k$,
   el último residual $\mathbf{r}_k$, el número de iteraciones $k$
   y una variable binaria $bres$ que indique si se cumplió el criterio
   de paro ($bres=True$) o si el algoritmo terminó por
   iteraciones ($bres=False$).

2. Pruebe el algoritmo para resolver el sistema de ecuaciones

$$ \mathbf{A}_1\mathbf{x}=\mathbf{b}_1$$

donde

$$ \mathbf{A}_1 = n\mathbf{I} + \mathbf{1} =
\left[\begin{array}{llll} n      & 0      & \cdots & 0 \\
                       0      & n      & \cdots & 0 \\
                       \vdots & \vdots & \ddots & \vdots \\
                       0      & 0      & \cdots & n \end{array}\right]
+ \left[\begin{array}{llll} 1    & 1      & \cdots & 1 \\
                       1      & 1      & \cdots & 1 \\
                       \vdots & \vdots & \ddots & \vdots \\
                       1      & 1      & \cdots & 1 \end{array}\right],  \qquad
\mathbf{b}_1 = \left[\begin{array}{l} 1 \\ 1 \\ \vdots \\ 1 \end{array}\right], $$

$n$ es la dimensión de la variable independiente
$\mathbf{x}=(x_1, x_2, ..., x_n)$,
$\mathbf{I}$ es la matriz identidad y $\mathbf{1}$ es la matriz llena de 1's,
ambas de tamaño $n$.

También aplique el algoritmo para resolver el sistema

$$ \mathbf{A}_2\mathbf{x}=\mathbf{b}_2$$

donde  $\mathbf{A}_2 = [a_{ij}]$ con

$$ a_{ij} = exp\left(-0.25(i-j)^2 \right),  \qquad
\mathbf{b}_2 = \left[\begin{array}{l} 1 \\ 1 \\ \vdots \\ 1 \end{array}\right] $$


- Use $\mathbf{x}_0$ como el vector cero, el máximo número de iteraciones
  $N=n$ y una toleracia $\tau=\sqrt{n} \epsilon_m^{1/3}$,
  donde $\epsilon_m$ es el épsilon máquina.
- Pruebe el algoritmo resolviendo los dos sistemas de ecuaciones con $n=10, 100, 1000$ y
  en cada caso imprima la siguiente información

- la dimensión $n$,
- el  número $k$ de iteraciones realizadas,
- las primeras y últimas 4 entradas del punto $\mathbf{x}_k$ que devuelve el algoritmo,
- la norma del residual $\mathbf{r}_k$,
- la variable $bres$ para saber si el algoritmo puedo converger.

### Solución:

In [1]:
# importamos librerías
import numpy as np
import time

In [2]:
# creamos la función
def grad_conj(x0, A, b, maxIter, tol):
    xk = x0
    rk = A@xk - b
    pk = -rk
    for k in range(maxIter):
        rk_norm = np.linalg.norm(rk)
        if rk_norm < tol:
            return xk, rk, k+1, True
        ak = rk_norm**2 / (pk.T@A@pk)
        xk = xk + ak*pk
        rk = rk + ak*A@pk
        bk = np.dot(rk, rk)/rk_norm**2
        pk = -rk + bk*pk
    return xk, rk, maxIter, False

In [3]:
# función para imprimir resultados
def solution1(sol):
    print(f"Dimension: {len(sol[0])}")
    print(f"¿Terminó por criterio de paro?: {sol[-1]}")
    print(f"Número de iteraciones realizadas: {sol[2]}")
    print("La solución alcanzada es: ",sol[0][:4],"...", sol[0][-4:])
    print(f"La norma del residual final es: {np.linalg.norm(sol[1])}")

In [2]:
# definimos algunas constantes
eps = np.finfo(float).eps
n = [10, 100, 1000]

In [3]:
# para generar las matrices del primer ejercicio
def gen_matrix1(N):
    A = np.ones([N,N]) + N*np.eye(N)
    b = np.ones(N)
    return A, b

In [4]:
# para generar las segundas matrices del primer  ejercicio
def gen_matrix2(N):
    A = np.zeros([N,N])
    for i in range(N):
        for j in  range(N):
            A[i][j]=np.exp(-0.25*((i-j)**2))
    b = np.ones(N)
    return A, b

In [7]:
# para la primera matriz con la primer dimensión
A1, b1 = gen_matrix1(n[0])
x01 = np.zeros(n[0])
sol1 = grad_conj(x01, A1, b1, n[0], np.sqrt(n[0])*eps**(1/3.0))
solution1(sol1)

Dimension: 10
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 2
La solución alcanzada es:  [0.05 0.05 0.05 0.05] ... [0.05 0.05 0.05 0.05]
La norma del residual final es: 7.021666937153402e-16


In [8]:
# ahora con la segunda dimensión
A2, b2 = gen_matrix1(n[1])
x02 = np.zeros(n[1])
sol2 = grad_conj(x02, A2, b2, n[1], np.sqrt(n[1])*eps**(1/3.0))
solution1(sol2)

Dimension: 100
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 2
La solución alcanzada es:  [0.005 0.005 0.005 0.005] ... [0.005 0.005 0.005 0.005]
La norma del residual final es: 1.6011864169946884e-15


In [9]:
# ahora con la tercer dimensión
A3, b3 = gen_matrix1(n[2])
x03 = np.zeros(n[2])
sol3 = grad_conj(x03, A3, b3, n[2], np.sqrt(n[2])*eps**(1/3.0))
solution1(sol3)

Dimension: 1000
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 2
La solución alcanzada es:  [0.0005 0.0005 0.0005 0.0005] ... [0.0005 0.0005 0.0005 0.0005]
La norma del residual final es: 2.4130518021186067e-13


In [10]:
# ahora probaremos con la segunda matriz en la primer dimensión
A4, b4 = gen_matrix2(n[0])
x04 = np.zeros(n[0])
sol4 = grad_conj(x04, A4, b4, n[0], np.sqrt(n[0])*eps**(1/3.0))
solution1(sol4)

Dimension: 10
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 6
La solución alcanzada es:  [ 1.36909916 -1.16637682  1.60908281 -0.61339053] ... [-0.61339053  1.60908281 -1.16637682  1.36909916]
La norma del residual final es: 2.5050526736723508e-11


In [11]:
# ahora probaremos con la segunda dimension
A5, b5 = gen_matrix2(n[1])
x05 = np.zeros(n[1])
sol5 = grad_conj(x05, A5, b5, n[1], np.sqrt(n[1])*eps**(1/3.0))
solution1(sol5)

Dimension: 100
¿Terminó por criterio de paro?: False
Número de iteraciones realizadas: 100
La solución alcanzada es:  [ 1.44626669 -1.41632456  2.1104745  -1.42498036] ... [-1.42492833  2.11044145 -1.41636897  1.44632425]
La norma del residual final es: 0.00013543899923613298


In [12]:
# ahora probaremos con la tercer dimension
A6, b6 = gen_matrix2(n[2])
x06 = np.zeros(n[2])
sol6 = grad_conj(x06, A6, b6, n[2], np.sqrt(n[2])*eps**(1/3.0))
solution1(sol6)

Dimension: 1000
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 263
La solución alcanzada es:  [ 1.44628824 -1.41635954  2.1105181  -1.42507231] ... [-1.42507231  2.1105181  -1.41635954  1.44628824]
La norma del residual final es: 0.00018766135270274152



```


```
---


## Ejercicio 2 (3.5 puntos)

Programar el método de gradiente conjugado no lineal descrito en el Algoritmo 3
de Clase 19 usando la fórmula de Fletcher-Reeves:

$$ \beta_{k+1} = \frac{\nabla f_{k+1}^\top \nabla f_{k+1}}{\nabla f_{k}^\top\nabla f_{k}}  $$

```


```

1. Escriba la función que implemente el algoritmo.

- La función debe recibir como argumentos $\mathbf{x}_0$, la función $f$ y
  su gradiente, el número máximo de iteraciones $N$, la tolerancia $\tau$, y los
  parámetros para el algoritmo de backtracking: factor $\rho$, la constante $c_1$
  para la condición de descenso suficiente, la constante $c_2$ para la condición
  de curvatura, y el máximo número de iteraciones $N_b$.
- Agregue al algoritmo un contador
  $nr$ que se incremente cada vez que se aplique el reinicio, es decir, cuando
  se hace $\beta_{k+1}=0$.
   
- Para calcular el tamaño de paso $\alpha_k$ use el algoritmo de backtracking
  usando las condiciones de Wolfe con el valor inicial $\alpha_{ini}=1$.

- Haga que la función devuelva el último punto  $\mathbf{x}_k$,
  el último gradiente $\mathbf{g}_k$, el número de iteraciones $k$
  y una variable binaria $bres$ que indique si se cumpli\'o el criterio
  de paro ($bres=True$) o si el algoritmo terminó por
  iteraciones ($bres=False$), y el contador $br·.

2. Pruebe el algoritmo usando la siguientes funciones con los puntos iniciales dados:


**Función de cuadrática 1:** Para $\mathbf{x}=(x_1,x_2, ..., x_n)$

- $f(\mathbf{x}) = \frac{1}{2} \mathbf{x}^\top\mathbf{A}_1\mathbf{x} - \mathbf{b}_1^\top\mathbf{x}$,
  donde $\mathbf{A}_1$ y $\mathbf{b}_1$ están definidas como en el Ejercicio 1.
- $\mathbf{x}_0 = (0,...,0)\in \mathbb{R}^{10}$
- $\mathbf{x}_0 = (0,...,0)\in \mathbb{R}^{100}$
- $\mathbf{x}_0 = (0,...,0)\in \mathbb{R}^{1000}$

**Función de cuadrática 2:** Para $\mathbf{x}=(x_1,x_2, ..., x_n)$

- $f(\mathbf{x}) = \frac{1}{2} \mathbf{x}^\top\mathbf{A}_2\mathbf{x} - \mathbf{b}_2^\top\mathbf{x}$,
  donde $\mathbf{A}_2$ y $\mathbf{b}_2$ están definidas como en el Ejercicio 1.
- $\mathbf{x}_0 = (0,...,0)\in \mathbb{R}^{10}$
- $\mathbf{x}_0 = (0,...,0)\in \mathbb{R}^{100}$
- $\mathbf{x}_0 = (0,...,0)\in \mathbb{R}^{1000}$

**Función de Beale :** Para $\mathbf{x}=(x_1,x_2)$

$$f(\mathbf{x}) = (1.5-x_1 + x_1x_2)^2 + (2.25 - x_1 + x_1x_2^2)^2 + (2.625 - x_1 + x_1x_2^3)^2.$$
- $\mathbf{x}_0 = (2,3)$  
   

**Función de Himmelblau:** Para $\mathbf{x}=(x_1,x_2)$

$$f(\mathbf{x}) = (x_1^2 + x_2 - 11)^2 + (x_1 + x_2^2 - 7)^2. $$
- $\mathbf{x}_0 = (2,4)$



**Función de Rosenbrock:** Para $\mathbf{x}=(x_1,x_2, ..., x_n)$

$$ f(\mathbf{x}) = \sum_{i=1}^{n-1} \left[100(x_{i+1} - x_i^2)^2 + (1-x_i)^2 \right]
\quad n\geq 2.$$
- $\mathbf{x}_0 = (-1.2, 1.0)\in \mathbb{R}^{2}$  
- $\mathbf{x}_0 = (-1.2, 1.0, ..., -1.2, 1.0) \in \mathbb{R}^{20}$  
- $\mathbf{x}_0 = (-1.2, 1.0, ..., -1.2, 1.0) \in \mathbb{R}^{40}$


3. Fije $N=5000$, $\tau = \sqrt{n}\epsilon_m^{1/3}$, donde $n$ es la dimensión
   de la variable $\mathbf{x}$ y $\epsilon_m$ es el épsilon máquina.
   Para backtracking use $\rho=0.5$, $c_1=0.001$, $c_2=0.01$, $N_b=500$.
   
4. Para cada función de prueba imprima
   
- la dimensión $n$,
- $f(\mathbf{x}_0)$,
- el  número $k$ de iteraciones realizadas,
- $f(\mathbf{x}_k)$,
- las primeras y últimas 4 entradas del punto $\mathbf{x}_k$ que devuelve el algoritmo,
- la norma del vector gradiente $\mathbf{g}_k$,
- la variable $bres$ para saber si el algoritmo puedo converger.
- el número de reinicios $nr$.
  

### Solución:

In [5]:
def backtracking(a0, r, c1, c2, xk, f, df, pk, maxIter):
  a=a0
  for i in range(maxIter):
    # condicion de Armijo
    if f(xk+a*pk)<= f(xk) + c1*a*(np.dot(df(xk), pk)):
      # condición de curvatura
      if np.dot(df(xk+a*pk), pk) >= c2*np.dot(df(xk), pk):
        return a, i+1, True
    a=r*a
  return a, maxIter, False

In [16]:
# programamos la función
def nonlinear_grad_conj(f, grad, x0, a0, maxIter, tol, c1, c2, r, maxIter2):
    xk = x0
    gk = grad(xk)
    dk = -gk
    ak = a0
    nr = 0
    for k in range(maxIter):
        aux1 = np.dot(gk, gk)
        if np.sqrt(aux1) < tol:
            return xk, gk, k, True, nr
        z = backtracking(a0, r, c1, c2, xk, f, grad, dk, maxIter2)
        if z[-1]==False:
           print("Backtracking está consumiendo todas las iteraciones. k =",k)
        ak = z[0]
        xk = xk + ak*dk
        gk1 = grad(xk)
        aux2 = np.dot(gk1, gk1)
        if np.abs(np.dot(gk1,gk)) < 0.2*aux2:
            bk = aux2 / aux1
        else:
            bk = 0
            nr += 1
        gk = gk1.copy()
        dk = -gk + bk*dk
    return xk, gk, maxIter, False, nr

In [7]:
# función para imprimir resultados
def solution2(sol, f, x0):
    print(f"Dimension: {len(sol[0])}")
    print(f"¿Terminó por criterio de paro?: {sol[3]}")
    print(f"Número de iteraciones realizadas: {sol[2]}")
    print("La solución alcanzada es: ",sol[0][:4],"...", sol[0][-4:])
    print(f"f(xk)={f(sol[0])}")
    print(f"f(x0)={f(x0)}")
    print(f"La norma del gradiente final es: {np.linalg.norm(sol[1])}")
    print("Número de reinicios: ", sol[-1])

In [8]:
# funciones
def quadratic(x, A, b):
    return (x.T@(A@x))/2.0 - np.dot(b, x)

def Grad_quadratic(x, A, b):
    return A@x - b

def himmelblau(x):
  return (x[0]**2+x[1]-11)**2 + (x[0]+x[1]**2-7)**2

def Grad_himmelblau(x):
  d1=4*x[0]**3 + 4*x[0]*x[1] - 42*x[0] + 2*x[1]**2 - 14
  d2=4*x[1]**3 + 4*x[0]*x[1] + 2*x[0]**2 - 26*x[1] - 22
  return np.array([d1,d2])

def beale(x):
  return (1.5-x[0]+x[1]*x[0])**2 + (2.25-x[0]+x[0]*x[1]**2)**2 + (2.625-x[0]+x[0]*x[1]**3)**2

def Grad_beale(x):
  d1=2*(x[1]-1)*(1.5-x[0]+x[1]*x[0])+2*(x[1]**2-1)*(2.25-x[0]+x[0]*x[1]**2)+2*(x[1]**3-1)*(2.625-x[0]+x[0]*x[1]**3)
  d2=2*(x[0])*(1.5-x[0]+x[1]*x[0])+4*(x[0]*x[1])*(2.25-x[0]+x[0]*x[1]**2)+6*(x[0]*x[1]**2)*(2.625-x[0]+x[0]*x[1]**3)
  return np.array([d1, d2])

def rosenbrock(x):
  f=0
  n=x.shape[0]
  for i in range(n-1):
    f+=100*(x[i+1]-x[i]**2)**2 + (1-x[i])**2
  return f

def Grad_rosenbrock(x):
  n=x.shape[0]
  grad=np.zeros(n)
  grad[0]=-2*(1-x[0])-400*x[0]*(x[1]-x[0]**2)
  grad[-1]=200*(x[-1]-x[-2]**2)
  for i in range(1,n-1):
    grad[i]=200*(x[i]-x[i-1]**2-2*x[i]*x[i+1]+2*x[i]**3) -2*(1-x[i])
  return grad

In [9]:
# definimos
maxIter = 5000
rho = 0.5
c1 = 0.001
c2 = 0.01
maxIter2 = 500
a0 = 1

In [17]:
#probemos con la forma cuadratica, y el primer tipo de matriz con la primer dimension
A1, b1 = gen_matrix1(n[0])
sol1 = nonlinear_grad_conj(lambda x: quadratic(x, A1, b1),
                           lambda x: Grad_quadratic(x, A1, b1),
                           np.zeros(n[0]), a0, maxIter, np.sqrt(n[0])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol1, lambda x: quadratic(x, A1, b1), np.zeros(n[0]))

Dimension: 10
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 9
La solución alcanzada es:  [0.05000019 0.05000019 0.05000019 0.05000019] ... [0.05000019 0.05000019 0.05000019 0.05000019]
f(xk)=-0.24999999999636202
f(x0)=0.0
La norma del gradiente final es: 1.206313194339134e-05
Número de reinicios:  9


In [18]:
#probemos con la segunda dimension
A2, b2 = gen_matrix1(n[1])
sol2 = nonlinear_grad_conj(lambda x: quadratic(x, A2, b2),
                           lambda x: Grad_quadratic(x, A2, b2),
                           np.zeros(n[1]), a0, maxIter, np.sqrt(n[1])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol2, lambda x: quadratic(x, A2, b2), np.zeros(n[1]))

Dimension: 100
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 21
La solución alcanzada es:  [0.00500003 0.00500003 0.00500003 0.00500003] ... [0.00500003 0.00500003 0.00500003 0.00500003]
f(xk)=-0.24999999999200045
f(x0)=0.0
La norma del gradiente final es: 5.656829153792843e-05
Número de reinicios:  21


In [19]:
# con la tercer dimension
A3, b3 = gen_matrix1(n[2])
sol3 = nonlinear_grad_conj(lambda x: quadratic(x, A3, b3),
                           lambda x: Grad_quadratic(x, A3, b3),
                           np.zeros(n[2]), a0, maxIter, np.sqrt(n[2])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol3, lambda x: quadratic(x, A3, b3), np.zeros(n[2]))

Dimension: 1000
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 251
La solución alcanzada es:  [0.0005 0.0005 0.0005 0.0005] ... [0.0005 0.0005 0.0005 0.0005]
f(xk)=-0.24999999999146555
f(x0)=0.0
La norma del gradiente final es: 0.00018476304776620826
Número de reinicios:  251


In [20]:
# con la segunda matriz y la primer dimensión
A4, b4 = gen_matrix2(n[0])
sol4 = nonlinear_grad_conj(lambda x: quadratic(x, A4, b4),
                           lambda x: Grad_quadratic(x, A4, b4),
                           np.zeros(n[0]), a0, maxIter, np.sqrt(n[0])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol4, lambda x: quadratic(x, A4, b4), np.zeros(n[0]))

Backtracking está consumiendo todas las iteraciones. k = 12
Backtracking está consumiendo todas las iteraciones. k = 20
Backtracking está consumiendo todas las iteraciones. k = 22
Backtracking está consumiendo todas las iteraciones. k = 25
Backtracking está consumiendo todas las iteraciones. k = 27
Backtracking está consumiendo todas las iteraciones. k = 43
Backtracking está consumiendo todas las iteraciones. k = 45
Backtracking está consumiendo todas las iteraciones. k = 48
Backtracking está consumiendo todas las iteraciones. k = 50
Backtracking está consumiendo todas las iteraciones. k = 53
Backtracking está consumiendo todas las iteraciones. k = 55
Backtracking está consumiendo todas las iteraciones. k = 58
Backtracking está consumiendo todas las iteraciones. k = 60
Backtracking está consumiendo todas las iteraciones. k = 63
Backtracking está consumiendo todas las iteraciones. k = 65
Backtracking está consumiendo todas las iteraciones. k = 68
Backtracking está consumiendo todas las 

In [21]:
# con la segunda dimension
A5, b5 = gen_matrix2(n[1])
sol5 = nonlinear_grad_conj(lambda x: quadratic(x, A5, b5),
                           lambda x: Grad_quadratic(x, A5, b5),
                           np.zeros(n[1]), a0, maxIter, np.sqrt(n[1])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol5, lambda x: quadratic(x, A5, b5), np.zeros(n[1]))

Backtracking está consumiendo todas las iteraciones. k = 20
Backtracking está consumiendo todas las iteraciones. k = 32
Backtracking está consumiendo todas las iteraciones. k = 47
Backtracking está consumiendo todas las iteraciones. k = 53
Backtracking está consumiendo todas las iteraciones. k = 59
Backtracking está consumiendo todas las iteraciones. k = 74
Backtracking está consumiendo todas las iteraciones. k = 80
Backtracking está consumiendo todas las iteraciones. k = 90
Backtracking está consumiendo todas las iteraciones. k = 96
Backtracking está consumiendo todas las iteraciones. k = 106
Backtracking está consumiendo todas las iteraciones. k = 116
Backtracking está consumiendo todas las iteraciones. k = 131
Backtracking está consumiendo todas las iteraciones. k = 137
Backtracking está consumiendo todas las iteraciones. k = 139
Backtracking está consumiendo todas las iteraciones. k = 148
Backtracking está consumiendo todas las iteraciones. k = 157
Backtracking está consumiendo tod

In [22]:
# con la última dimensión
A6, b6 = gen_matrix2(n[2])
sol6 = nonlinear_grad_conj(lambda x: quadratic(x, A6, b6),
                           lambda x: Grad_quadratic(x, A6, b6),
                           np.zeros(n[2]), a0, maxIter, np.sqrt(n[2])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol6, lambda x: quadratic(x, A6, b6), np.zeros(n[2]))

Backtracking está consumiendo todas las iteraciones. k = 26
Backtracking está consumiendo todas las iteraciones. k = 37
Backtracking está consumiendo todas las iteraciones. k = 43
Backtracking está consumiendo todas las iteraciones. k = 49
Backtracking está consumiendo todas las iteraciones. k = 60
Backtracking está consumiendo todas las iteraciones. k = 70
Backtracking está consumiendo todas las iteraciones. k = 76
Backtracking está consumiendo todas las iteraciones. k = 86
Backtracking está consumiendo todas las iteraciones. k = 92
Backtracking está consumiendo todas las iteraciones. k = 102
Backtracking está consumiendo todas las iteraciones. k = 108
Backtracking está consumiendo todas las iteraciones. k = 118
Backtracking está consumiendo todas las iteraciones. k = 124
Backtracking está consumiendo todas las iteraciones. k = 134
Backtracking está consumiendo todas las iteraciones. k = 144
Backtracking está consumiendo todas las iteraciones. k = 150
Backtracking está consumiendo tod

In [23]:
# con beale
x07 = np.array([2,3])
sol7 = nonlinear_grad_conj(beale, Grad_beale, x07, a0, maxIter, np.sqrt(2)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol7, beale, x07)

Backtracking está consumiendo todas las iteraciones. k = 42
Backtracking está consumiendo todas las iteraciones. k = 53
Backtracking está consumiendo todas las iteraciones. k = 70
Dimension: 2
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 78
La solución alcanzada es:  [2.99998551 0.49999649] ... [2.99998551 0.49999649]
f(xk)=3.377431057983643e-11
f(x0)=3347.203125
La norma del gradiente final es: 6.924867590358913e-06
Número de reinicios:  65


In [24]:
# con himmelbleau
x08 = np.array([2,4])
sol8 = nonlinear_grad_conj(himmelblau, Grad_himmelblau, x08, a0, maxIter, np.sqrt(2)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol8, himmelblau, x08)

Dimension: 2
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 37
La solución alcanzada es:  [ 3.58442828 -1.84812653] ... [ 3.58442828 -1.84812653]
f(xk)=2.0568411702376188e-13
f(x0)=130
La norma del gradiente final es: 6.585280714101221e-06
Número de reinicios:  36


In [25]:
# con rosen
x09 = np.array([-1.2,1])
sol9 = nonlinear_grad_conj(rosenbrock, Grad_rosenbrock, x09, a0, maxIter, np.sqrt(2)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol9, rosenbrock, x09)

Backtracking está consumiendo todas las iteraciones. k = 23
Backtracking está consumiendo todas las iteraciones. k = 25
Backtracking está consumiendo todas las iteraciones. k = 36
Backtracking está consumiendo todas las iteraciones. k = 38
Backtracking está consumiendo todas las iteraciones. k = 113
Backtracking está consumiendo todas las iteraciones. k = 115
Backtracking está consumiendo todas las iteraciones. k = 130
Backtracking está consumiendo todas las iteraciones. k = 141
Backtracking está consumiendo todas las iteraciones. k = 152
Backtracking está consumiendo todas las iteraciones. k = 163
Backtracking está consumiendo todas las iteraciones. k = 165
Backtracking está consumiendo todas las iteraciones. k = 180
Backtracking está consumiendo todas las iteraciones. k = 191
Backtracking está consumiendo todas las iteraciones. k = 193
Backtracking está consumiendo todas las iteraciones. k = 208
Backtracking está consumiendo todas las iteraciones. k = 210
Backtracking está consumiend

In [26]:
# con rosen
x010 = np.ones(20)
for i in range(0, 20, 2):
    x010[i] = -1.2
sol10 = nonlinear_grad_conj(rosenbrock, Grad_rosenbrock, x010, a0, maxIter, np.sqrt(20)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol10, rosenbrock, x010)

Backtracking está consumiendo todas las iteraciones. k = 54
Backtracking está consumiendo todas las iteraciones. k = 161
Backtracking está consumiendo todas las iteraciones. k = 173
Backtracking está consumiendo todas las iteraciones. k = 222
Backtracking está consumiendo todas las iteraciones. k = 238
Backtracking está consumiendo todas las iteraciones. k = 250
Backtracking está consumiendo todas las iteraciones. k = 255
Backtracking está consumiendo todas las iteraciones. k = 272
Backtracking está consumiendo todas las iteraciones. k = 288
Backtracking está consumiendo todas las iteraciones. k = 304
Backtracking está consumiendo todas las iteraciones. k = 320
Backtracking está consumiendo todas las iteraciones. k = 340
Backtracking está consumiendo todas las iteraciones. k = 360
Backtracking está consumiendo todas las iteraciones. k = 369
Backtracking está consumiendo todas las iteraciones. k = 378
Backtracking está consumiendo todas las iteraciones. k = 383
Backtracking está consumi

In [27]:
# con rosen
x011 = np.ones(40)
for i in range(0, 40, 2):
    x011[i] = -1.2
sol11 = nonlinear_grad_conj(rosenbrock, Grad_rosenbrock, x011, a0, maxIter, np.sqrt(40)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol11, rosenbrock, x011)

Backtracking está consumiendo todas las iteraciones. k = 71
Backtracking está consumiendo todas las iteraciones. k = 158
Backtracking está consumiendo todas las iteraciones. k = 252
Backtracking está consumiendo todas las iteraciones. k = 257
Backtracking está consumiendo todas las iteraciones. k = 278
Backtracking está consumiendo todas las iteraciones. k = 298
Backtracking está consumiendo todas las iteraciones. k = 303
Backtracking está consumiendo todas las iteraciones. k = 313
Backtracking está consumiendo todas las iteraciones. k = 335
Backtracking está consumiendo todas las iteraciones. k = 340
Backtracking está consumiendo todas las iteraciones. k = 349
Backtracking está consumiendo todas las iteraciones. k = 379
Backtracking está consumiendo todas las iteraciones. k = 384
Backtracking está consumiendo todas las iteraciones. k = 412
Backtracking está consumiendo todas las iteraciones. k = 417
Backtracking está consumiendo todas las iteraciones. k = 422
Backtracking está consumi


```


```
---

## Ejercicio 3 (3.5 puntos)

Programar el método de gradiente conjugado no lineal de usando la fórmula de
Hestenes-Stiefel:

En este caso el algoritmo es igual al del Ejercicio 2, con excepción del cálculo de $\beta_{k+1}$. Primero se calcula el vector $\mathbf{y}_k$ y luego $\beta_{k+1}$:

$$ \mathbf{y}_k =  \nabla f_{k+1}-\nabla f_{k} $$
$$ \beta_{k+1} =   \frac{\nabla f_{k+1}^\top\mathbf{y}_k }{\nabla p_{k}^\top\mathbf{y}_k}  $$

1. Repita el Ejercicio 2 usando la fórmula de Hestenes-Stiefel.
2. ¿Hay alguna diferencia que indique que es mejor usar la fórmula de Hestenes-Stiefel
   respesto a Fletcher-Reeves?
3. La cantidad de reinicios puede indicar que tanto se comporta el algoritmo
   como el algoritmo de descenso máximo. Agregue un comentario sobre esto
   de acuerdo a los resultados obtenidos para cada fórmula.

### Solución:

In [28]:
# escribimos la función
def nonlinear_grad_conj1(f, grad, x0, a0, maxIter, tol, c1, c2, r, maxIter2):
    xk = x0
    gk = grad(xk)
    dk = -gk
    ak = a0
    nr = 0
    for k in range(maxIter):
        if np.linalg.norm(gk) < tol:
            return xk, gk, k, True, nr
        z = backtracking(a0, r, c1, c2, xk, f, grad, dk, maxIter2)
        if z[-1]==False:
            print("Backtracking está consumiendo todas las iteraciones. k =",k)
        ak = z[0]
        xk = xk + ak*dk
        gk1 = grad(xk)
        yk = gk1 - gk
        if np.abs(np.dot(gk1,gk)) < 0.2*np.dot(gk1, gk1):
            bk = np.dot(gk1, yk) / np.dot(yk, dk)
        else:
            bk = 0
            nr += 1
        dk = -gk1 + bk*dk
        gk = gk1
    return xk, gk, maxIter, False, nr

In [29]:
#probemos con la forma cuadratica, y el primer tipo de matriz con la primer dimension
sol1 = nonlinear_grad_conj1(lambda x: quadratic(x, A1, b1),
                           lambda x: Grad_quadratic(x, A1, b1),
                           np.zeros(n[0]), a0, maxIter, np.sqrt(n[0])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol1, lambda x: quadratic(x, A1, b1), np.zeros(n[0]))

Dimension: 10
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 9
La solución alcanzada es:  [0.05000019 0.05000019 0.05000019 0.05000019] ... [0.05000019 0.05000019 0.05000019 0.05000019]
f(xk)=-0.24999999999636202
f(x0)=0.0
La norma del gradiente final es: 1.206313194339134e-05
Número de reinicios:  9


In [30]:
#probemos con la segunda dimension
sol2 = nonlinear_grad_conj1(lambda x: quadratic(x, A2, b2),
                           lambda x: Grad_quadratic(x, A2, b2),
                           np.zeros(n[1]), a0, maxIter, np.sqrt(n[1])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol2, lambda x: quadratic(x, A2, b2), np.zeros(n[1]))

Dimension: 100
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 21
La solución alcanzada es:  [0.00500003 0.00500003 0.00500003 0.00500003] ... [0.00500003 0.00500003 0.00500003 0.00500003]
f(xk)=-0.24999999999200045
f(x0)=0.0
La norma del gradiente final es: 5.656829153792843e-05
Número de reinicios:  21


In [31]:
# con la tercer dimension
sol3 = nonlinear_grad_conj1(lambda x: quadratic(x, A3, b3),
                           lambda x: Grad_quadratic(x, A3, b3),
                           np.zeros(n[2]), a0, maxIter, np.sqrt(n[2])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol3, lambda x: quadratic(x, A3, b3), np.zeros(n[2]))

Dimension: 1000
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 251
La solución alcanzada es:  [0.0005 0.0005 0.0005 0.0005] ... [0.0005 0.0005 0.0005 0.0005]
f(xk)=-0.24999999999146555
f(x0)=0.0
La norma del gradiente final es: 0.00018476304776620826
Número de reinicios:  251


In [32]:
# con la segunda matriz y la primer dimensión
sol4 = nonlinear_grad_conj1(lambda x: quadratic(x, A4, b4),
                           lambda x: Grad_quadratic(x, A4, b4),
                           np.zeros(n[0]), a0, maxIter, np.sqrt(n[0])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol4, lambda x: quadratic(x, A4, b4), np.zeros(n[0]))

Backtracking está consumiendo todas las iteraciones. k = 12
Backtracking está consumiendo todas las iteraciones. k = 20
Backtracking está consumiendo todas las iteraciones. k = 22
Backtracking está consumiendo todas las iteraciones. k = 25
Backtracking está consumiendo todas las iteraciones. k = 27
Backtracking está consumiendo todas las iteraciones. k = 43
Backtracking está consumiendo todas las iteraciones. k = 45
Backtracking está consumiendo todas las iteraciones. k = 48
Backtracking está consumiendo todas las iteraciones. k = 50
Backtracking está consumiendo todas las iteraciones. k = 53
Backtracking está consumiendo todas las iteraciones. k = 55
Backtracking está consumiendo todas las iteraciones. k = 58
Backtracking está consumiendo todas las iteraciones. k = 60
Backtracking está consumiendo todas las iteraciones. k = 63
Backtracking está consumiendo todas las iteraciones. k = 65
Backtracking está consumiendo todas las iteraciones. k = 68
Backtracking está consumiendo todas las 

In [33]:
# con la segunda dimension
sol5 = nonlinear_grad_conj1(lambda x: quadratic(x, A5, b5),
                           lambda x: Grad_quadratic(x, A5, b5),
                           np.zeros(n[1]), a0, maxIter, np.sqrt(n[1])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol5, lambda x: quadratic(x, A5, b5), np.zeros(n[1]))

Backtracking está consumiendo todas las iteraciones. k = 20
Backtracking está consumiendo todas las iteraciones. k = 32
Backtracking está consumiendo todas las iteraciones. k = 34
Backtracking está consumiendo todas las iteraciones. k = 39
Backtracking está consumiendo todas las iteraciones. k = 41
Backtracking está consumiendo todas las iteraciones. k = 60
Backtracking está consumiendo todas las iteraciones. k = 66
Backtracking está consumiendo todas las iteraciones. k = 68
Backtracking está consumiendo todas las iteraciones. k = 73
Backtracking está consumiendo todas las iteraciones. k = 75
Backtracking está consumiendo todas las iteraciones. k = 84
Backtracking está consumiendo todas las iteraciones. k = 90
Backtracking está consumiendo todas las iteraciones. k = 96
Backtracking está consumiendo todas las iteraciones. k = 98
Backtracking está consumiendo todas las iteraciones. k = 107
Backtracking está consumiendo todas las iteraciones. k = 113
Backtracking está consumiendo todas la

In [34]:
# con la última dimensión
sol6 = nonlinear_grad_conj1(lambda x: quadratic(x, A6, b6),
                           lambda x: Grad_quadratic(x, A6, b6),
                           np.zeros(n[2]), a0, maxIter, np.sqrt(n[2])*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol6, lambda x: quadratic(x, A6, b6), np.zeros(n[2]))

Backtracking está consumiendo todas las iteraciones. k = 26
Backtracking está consumiendo todas las iteraciones. k = 28
Backtracking está consumiendo todas las iteraciones. k = 33
Backtracking está consumiendo todas las iteraciones. k = 39
Backtracking está consumiendo todas las iteraciones. k = 45
Backtracking está consumiendo todas las iteraciones. k = 51
Backtracking está consumiendo todas las iteraciones. k = 53
Backtracking está consumiendo todas las iteraciones. k = 58
Backtracking está consumiendo todas las iteraciones. k = 60
Backtracking está consumiendo todas las iteraciones. k = 65
Backtracking está consumiendo todas las iteraciones. k = 67
Backtracking está consumiendo todas las iteraciones. k = 81
Backtracking está consumiendo todas las iteraciones. k = 87
Backtracking está consumiendo todas las iteraciones. k = 89
Backtracking está consumiendo todas las iteraciones. k = 94
Backtracking está consumiendo todas las iteraciones. k = 96
Backtracking está consumiendo todas las 

In [35]:
# con beale
x07 = np.array([2,3])
sol7 = nonlinear_grad_conj1(beale, Grad_beale, x07, a0, maxIter, np.sqrt(2)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol7, beale, x07)

Backtracking está consumiendo todas las iteraciones. k = 30
Backtracking está consumiendo todas las iteraciones. k = 32
Backtracking está consumiendo todas las iteraciones. k = 38
Backtracking está consumiendo todas las iteraciones. k = 46
Backtracking está consumiendo todas las iteraciones. k = 48
Backtracking está consumiendo todas las iteraciones. k = 53
Backtracking está consumiendo todas las iteraciones. k = 55
Backtracking está consumiendo todas las iteraciones. k = 60
Backtracking está consumiendo todas las iteraciones. k = 62
Backtracking está consumiendo todas las iteraciones. k = 67
Backtracking está consumiendo todas las iteraciones. k = 69
Backtracking está consumiendo todas las iteraciones. k = 74
Backtracking está consumiendo todas las iteraciones. k = 76
Backtracking está consumiendo todas las iteraciones. k = 81
Backtracking está consumiendo todas las iteraciones. k = 83
Backtracking está consumiendo todas las iteraciones. k = 91
Backtracking está consumiendo todas las 

In [36]:
# con himmelbleau
x08 = np.array([2,4])
sol8 = nonlinear_grad_conj1(himmelblau, Grad_himmelblau, x08, a0, maxIter, np.sqrt(2)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol8, himmelblau, x08)

Dimension: 2
¿Terminó por criterio de paro?: True
Número de iteraciones realizadas: 37
La solución alcanzada es:  [ 3.58442828 -1.84812653] ... [ 3.58442828 -1.84812653]
f(xk)=1.983378785152025e-13
f(x0)=130
La norma del gradiente final es: 6.466611390455732e-06
Número de reinicios:  36


In [37]:
# con rosen
x09 = np.array([-1.2,1])
sol9 = nonlinear_grad_conj1(rosenbrock, Grad_rosenbrock, x09, a0, maxIter, np.sqrt(2)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol9, rosenbrock, x09)

Backtracking está consumiendo todas las iteraciones. k = 23
Backtracking está consumiendo todas las iteraciones. k = 25
Backtracking está consumiendo todas las iteraciones. k = 36
Backtracking está consumiendo todas las iteraciones. k = 38
Backtracking está consumiendo todas las iteraciones. k = 40
Backtracking está consumiendo todas las iteraciones. k = 51
Backtracking está consumiendo todas las iteraciones. k = 54
Backtracking está consumiendo todas las iteraciones. k = 58
Backtracking está consumiendo todas las iteraciones. k = 61
Backtracking está consumiendo todas las iteraciones. k = 65
Backtracking está consumiendo todas las iteraciones. k = 69
Backtracking está consumiendo todas las iteraciones. k = 72
Backtracking está consumiendo todas las iteraciones. k = 76
Backtracking está consumiendo todas las iteraciones. k = 79
Backtracking está consumiendo todas las iteraciones. k = 83
Backtracking está consumiendo todas las iteraciones. k = 86
Backtracking está consumiendo todas las 

In [38]:
# con rosen
x010 = np.ones(20)
for i in range(0, 20, 2):
    x010[i] = -1.2
sol10 = nonlinear_grad_conj1(rosenbrock, Grad_rosenbrock, x010, a0, maxIter, np.sqrt(20)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol10, rosenbrock, x010)

Backtracking está consumiendo todas las iteraciones. k = 138
Backtracking está consumiendo todas las iteraciones. k = 140
Backtracking está consumiendo todas las iteraciones. k = 143
Backtracking está consumiendo todas las iteraciones. k = 145
Backtracking está consumiendo todas las iteraciones. k = 155
Backtracking está consumiendo todas las iteraciones. k = 157
Backtracking está consumiendo todas las iteraciones. k = 170
Backtracking está consumiendo todas las iteraciones. k = 172
Backtracking está consumiendo todas las iteraciones. k = 182
Backtracking está consumiendo todas las iteraciones. k = 184
Backtracking está consumiendo todas las iteraciones. k = 187
Backtracking está consumiendo todas las iteraciones. k = 189
Backtracking está consumiendo todas las iteraciones. k = 196
Backtracking está consumiendo todas las iteraciones. k = 198
Backtracking está consumiendo todas las iteraciones. k = 201
Backtracking está consumiendo todas las iteraciones. k = 203
Backtracking está consum

In [39]:
# con rosen
x011 = np.ones(40)
for i in range(0, 40, 2):
    x011[i] = -1.2
sol11 = nonlinear_grad_conj1(rosenbrock, Grad_rosenbrock, x011, a0, maxIter, np.sqrt(40)*eps**(1/3.0), c1, c2, rho, maxIter2)
solution2(sol11, rosenbrock, x011)

Backtracking está consumiendo todas las iteraciones. k = 12
Backtracking está consumiendo todas las iteraciones. k = 17
Backtracking está consumiendo todas las iteraciones. k = 19
Backtracking está consumiendo todas las iteraciones. k = 21
Backtracking está consumiendo todas las iteraciones. k = 24
Backtracking está consumiendo todas las iteraciones. k = 26
Backtracking está consumiendo todas las iteraciones. k = 28
Backtracking está consumiendo todas las iteraciones. k = 30
Backtracking está consumiendo todas las iteraciones. k = 34
Backtracking está consumiendo todas las iteraciones. k = 39
Backtracking está consumiendo todas las iteraciones. k = 41
Backtracking está consumiendo todas las iteraciones. k = 44
Backtracking está consumiendo todas las iteraciones. k = 47
Backtracking está consumiendo todas las iteraciones. k = 49
Backtracking está consumiendo todas las iteraciones. k = 58
Backtracking está consumiendo todas las iteraciones. k = 60
Backtracking está consumiendo todas las 

Como se observa, no parece haber mucha diferencia entre ambas fórmulas para $\beta$, pues para la mismas funciones el comportamiento es prácticamente el mismo.

En cuanto al número de reinicios, no hay mucho que decir, pues el número de reinicios varía según la función, en algunas se reinicia en cada iteración mientras que en otras es mucho menor el número de reinicios. Esto puede depender de factores como la complejidad de la función así como de su forma. Pues notamos que, en las que son formas cuadráticas, los reinicios eran en cada iteración mientras que, en las que no, esto no era así.


```


```
---