### Introducción a la Investigación Operativa y la Optimización

### • Clase 4  - Método de Newton

**Nazareno Faillace Mullen - Departamento de Matemática, FCEN, UBA**

### Comentario sobre Sección Áurea

Definimos $\varphi\colon [0,+\infty)\rightarrow \mathbb{R}$ de la siguiente manera:
$$\varphi(t)=f(x+td)$$
__Definición (Función unimodal):__ una función continua $\varphi\colon [0,+\infty)\rightarrow \mathbb{R}$ se dice unimodal si admite un conjunto de minimizadores $[t_1, t_2]$ y es estrictamente decreciente en $[0,t_1]$ ($t_1\neq 0$) y estrictamente creciente en $[t_2, +\infty)$

<img src="https://i.postimg.cc/KzYJR30n/unimodal.png"/>

Cuando $\varphi$ es unimodal, la sección áurea funciona muy bien para encontrar una aproximación al minimizador. Si $\varphi$ no es unimodal, este algoritmo puede no ser eficiente.

Problema: función de Rosenbrock comenzando en $(0,0)$

<img src="https://i.postimg.cc/tJSk3qmL/no-unimodal.png"/>

## Método de Newton

En este método, se elige como dirección de descenso:
$$d = -Hf(x)^{-1}\nabla f(x)$$
Notar que, si $Hf(x)$ es definida positiva, $d$ es dirección descenso:
$$\nabla f(x)^T d= -\nabla f(x)^THf(x)^{-1}\nabla f(x) < 0$$

__Observación:__ $d$ puede no estar bien definido si $Hf(x)$ es singular o puede no ser una dirección de descenso si $Hf(x)$ no es definida positiva.

__Teorema:__ si $Hf(x)$ es definida positiva para todo $x\in\mathbb{R}^n$, el Método de Newton es globalmente convergente.

__Algoritmo del Método de Newton para $f$ tal que $Hf(x)$ es definida positiva para todo $x\in\mathbb{R}^n$__

Dados: $f, x_0 \in \mathbb{R}^n,\; \varepsilon>0,\; k_{MAX}>0$ <br>
$k=0$ <br>
REPETIR mientras $\lVert\nabla f(x_{k})\rVert > \varepsilon$ y $k<k_{MAX}$: <br>
&nbsp;&nbsp;&nbsp;&nbsp; Definir $d_{k}$ como la solución de $Hf(x_{k})d_{k} = -\nabla f(x_{k})$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Determinar el tamaño del paso $t_k > 0$ (con sección áurea, Armijo o Wolfe) <br>
&nbsp;&nbsp;&nbsp;&nbsp; Hacer $x_{k+1} = x_{k} + t_kd_{k}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; k = k + 1 <br>
DEVOLVER $x_k$

**Obs.:** para definir $d_k$ utilizar el comando `np.linalg.solve` de la siguiente manera: `dk = np.linalg.solve(H,g)` donde `H `es  $Hf(x_k)$ y `g` es $-\nabla f(x_{k})$. 

### Método de Newton para funciones cuadráticas

En el caso de las funciones cuadráticas $f(x)=\frac{1}{2}x^T A x + bx + c$ con $A$ simétrica definida positiva, se tiene que:
$$Hf(x) = A$$

Dados: $A, b, x_0 \in \mathbb{R}^n,\; \varepsilon>0,\; k_{MAX}>0$ <br>
$k=0$ <br>
REPETIR mientras $\lVert Ax + b\rVert > \varepsilon$ y $k<k_{MAX}$: <br>
&nbsp;&nbsp;&nbsp;&nbsp; Definir $d_{k}$ como la solución de $Ad_{k} = -(Ax_k + b)$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Hacer $x_{k+1} = x_{k} + d_{k}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; k = k + 1 <br>
DEVOLVER $x_k$

In [4]:
def newtonParaCuadraticas(A, b, x0, eps, maxIter):
    iter = 0
    x = x0
    dk = A@x0+b
    xs = [x]
    while(np.linalg.norm(dk)>eps and iter<maxIter):
        dk = np.linalg.solve(A, -(A@x+b))
        x = x + dk
        iter = iter + 1
        xs.append(x)
    return(x, iter, xs)

# Ejercicios

1. Implementar el Método de Newton para funciones cuadráticas.
2. Comparar su desempeño (en términos de cantidad de iteraciones) con el de Método de Gradiente y el de Gradiente Conjugado, para las funciones cuadráticas dadas por $f(x)=\frac{1}{2}x^T A_i x$ para cada una de las $A_i$ que figuran debajo. Probar con puntos iniciales que se encuentren _lejos_ del minimizador $(0,0)$
3. ¿Qué ocurre si hacemos $x_{k+1} = x_k + \gamma d_k$ con $\gamma\in (0, 1]$?

In [5]:
pip install plotly

Collecting plotly
  Downloading plotly-5.11.0-py2.py3-none-any.whl (15.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m15.3/15.3 MB[0m [31m24.9 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25hCollecting tenacity>=6.2.0
  Downloading tenacity-8.1.0-py3-none-any.whl (23 kB)
Installing collected packages: tenacity, plotly
Successfully installed plotly-5.11.0 tenacity-8.1.0

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.2.2[0m[39;49m -> [0m[32;49m22.3.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [6]:
import numpy as np
import matplotlib.pyplot as plt
import plotly
import plotly.express as px
import plotly.graph_objs as go
import math
from plotly.offline import init_notebook_mode, iplot

A1 = np.array([[8, 3, 3, 6, 5, 4, 4, 3, 6, 3],
             [3, 4, 2, 2, 2, 1, 3, 3, 3, 2],
             [3, 2, 5, 2, 1, 2, 4, 2, 4, 1],
             [6, 2, 2, 6, 3, 2, 4, 2, 4, 2],
             [5, 2, 1, 3, 5, 4, 1, 2, 4, 3],
             [4, 1, 2, 2, 4, 5, 1, 2, 5, 2],
             [4, 3, 4, 4, 1, 1, 6, 2, 4, 2],
             [3, 3, 2, 2, 2, 2, 2, 4, 4, 2],
             [6, 3, 4, 4, 4, 5, 4, 4, 8, 3],
             [3, 2, 1, 2, 3, 2, 2, 2, 3, 4]])

A2 = np.array([[2, 0, 1, 0, 1],
               [0, 2, 1, 1, 1],
               [1, 1, 3, 1, 1],
               [0, 1, 1, 1, 0],
               [1, 1, 1, 0, 2]])

A3 = np.diag(np.random.randint(1, 5, 100))

A4 = np.array([[10, 0], [0, 1]])

A5 = np.array([[1, -1], [0, 0.8]])

A6 = np.array([[163., 162., 171.,  -9.,   0.,   0.],
               [162., 163., 171.,  -9.,   0.,   0.],
               [171., 171., 181.,  -9.,   0.,   0.],
               [ -9.,  -9.,  -9.,   1.,   0.,   0.],
               [  0.,   0.,   0.,   0.,   1.,   0.],
               [  0.,   0.,   0.,   0.,   0.,   1.]])

In [7]:
newtonParaCuadraticas(A6, np.zeros(len(A6)), np.ones(len(A6)), 0.01, 1000)

(array([ 1.18329136e-30, -2.05103835e-29,  1.73549399e-29, -1.57279143e-29,
         0.00000000e+00,  0.00000000e+00]),
 2,
 [array([1., 1., 1., 1., 1., 1.]),
  array([ 2.66453526e-15, -7.32747196e-15,  4.44089210e-15, -4.44089210e-16,
          0.00000000e+00,  0.00000000e+00]),
  array([ 1.18329136e-30, -2.05103835e-29,  1.73549399e-29, -1.57279143e-29,
          0.00000000e+00,  0.00000000e+00])])

## ¿Qué pasa si $Hf(x)$ no es definida positiva o si es singular?


**Recordar:** $A\in\mathbb{R}^{n\times n}$ inversible $\Leftrightarrow$ $0$ no es autovalor de $A$.<br><br>
**Recordar:** $A\in\mathbb{R}^{n\times n}$ simétrica, $A$ es definida positiva $\Leftrightarrow$ todos los autovalores de $A$ son positivos

### Modificación de Levenberg-Marquardt

Considerar
$$x_{k+1} = x_{k} - t_k(Hf(x_{k})+\mu I)^{-1}\nabla f(x_{k})$$

donde $\mu>0$ es lo suficientemente grande como para que $B_{k}= Hf(x_{k})+\mu I$ sea definida positiva. 

__Obs:__ si $\mu$ es demasiado grande, $d_{k}$ tiende a estar en la dirección de $-\nabla f(x_{k})$, pues $(Hf(x_{k})+\mu I)^{-1}\nabla f(x_{k}) \approx \frac{1}{\mu}\nabla f(x_{k})$ . En cambio, si $\mu$ es pequeño, $d_{k}$ se parece más a la dirección de descenso del Método de Newton

Con la modificación de L-M, se obtiene un método que utiliza las ventajas del Método del Gradiente y del Método de Newton. Pensándolo con ideas generales:
* cerca del mínimo $\approx$ $Hf(x)$ definida positiva $\approx$ $\mu=0$ o $\mu$ pequeño $\approx$ Método de Newton $\approx$ convergencia rápida cerca de un mínimo
* lejos del mínimo $\approx$ $Hf(x)$ no definida positiva $\approx$ $\mu$ grande $\approx$ Método del gradiente $\approx$ más velocidad de descenso


__Obs:__ Como pedíamos que $f\in C^3$, en particular resulta que $Hf(x)$ es simétrica $\forall x \in \mathbb{R}^n$, entonces los autovalores de $Hf(x)$ son reales $\forall x \in \mathbb{R}^n$.

__Obs:__ Si $\lambda_1, \dots, \lambda_n$ son los autovalores de $Hf(x)$, entonces $\lambda_1+\mu, \dots, \lambda_n+\mu$ son los autovalores de $B=Hf(x)+\mu I$, y $B$ tiene los mismos autovectores que $Hf(x)$. Sea $v_i$ autovector de $Hf(x)$:
$$\begin{array}{rcl} Bv_i &=& (Hf(x)+\mu I)v_i \\ &=& Hf(x)v_i+\mu Iv_i \\ &=& \lambda_iv_i+\mu v_i \\ &=& (\lambda_i+\mu)v_i \end{array}$$
Entonces, en caso de que $Hf(x)$ no sea definida positiva, se puede utilizar su mínimo autovalor como una aproximación a $-\mu$

__Algoritmo del Método de Newton con modificación de Levenberg-Marquardt__

Dados: $f, x_0 \in \mathbb{R}^n,\; k_{MAX}>0,\; \varepsilon>0,\; \gamma>0$ <br>
$k=0$ <br>
REPETIR mientras $\lVert\nabla f(x_{k})\rVert > \varepsilon$ y $k<k_{MAX}$: <br>
&nbsp;&nbsp;&nbsp;&nbsp; $B = Hf(x_{k})$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; $\mu = \min \{ \lambda \colon \lambda \text{ es autovalor de } B\}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Si $\mu \leq 0$: <br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; $B = B+(-\mu+\gamma)I$  
&nbsp;&nbsp;&nbsp;&nbsp; Definir $d_{k}$ como la solución de $Bd_{k} = -\nabla f(x_{k})$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Determinar el tamaño del paso $t_k > 0$ (con sección áurea, Armijo o Wolfe)<br>
&nbsp;&nbsp;&nbsp;&nbsp; Hacer $x_{k+1} = x_{k} + t_kd_{k}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; k = k + 1 <br>
DEVOLVER $x_k$

Utilizar la función `np.linalg.eigvals(B)` para calcular los autovalores de $B$

## Aproximando el Hessiano de $f$

Aproximaremos el valor del Hessiano en cierto $x$, teniendo en cuenta que:
$$Hf(x)={\begin{pmatrix}{\frac  {\partial ^{2}f}{\partial x_{1}^{2}}}&{\frac  {\partial ^{2}f}{\partial x_{1}\partial x_{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{1}\partial x_{n}}}\\{\frac  {\partial ^{2}f}{\partial x_{2}\partial x_{1}}}&{\frac  {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{2}\partial x_{n}}}\\\vdots &\vdots &\ddots &\vdots \\{\frac  {\partial ^{2}f}{\partial x_{n}\partial x_{1}}}&{\frac  {\partial ^{2}f}{\partial x_{n}\partial x_{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{n}^{2}}}\end{pmatrix}} = {\begin{pmatrix}{\nabla \frac{\partial f}{\partial x_1}}\\{\vdots}\\{{\nabla \frac{\partial f}{\partial x_n}}}\end{pmatrix}}$$

Algunos hints para implementar:
* Ir definiendo al Hessiano por filas
* Para cada $i$ utilizar `lambda` para definir la función $\frac{\partial f}{\partial x_i}(x)$ (a partir de `derivada direccional`)
* La fila $i$-ésima del Hessiano es aplicar `gradiente` a la función definida en el ítem anterior

In [8]:
def derivadaEn1Punto1coordenada(f,Xs, x, h=0.01):
  extra = np.zeros(len(Xs))
  extra[x]=1
  return((f(Xs+extra*h)-f(Xs-extra*h))/(2*h))

In [9]:
def gradiente(f,Xs, h=0.01):
  df = np.zeros(len(Xs))
  for i in range(0, len(Xs)):
    df[i]= derivadaEn1Punto1coordenada(f,Xs, i, h)
  return(df)

In [10]:
def hessiano(f, xs, h=0.01):
    hes = np.zeros((len(xs), len(xs)))
    for i in range(0,len(xs)):
        for j in range(0, len(xs)):
            extra = np.zeros(len(xs))
            extra[i] = 1
            grad1 = derivadaEn1Punto1coordenada(f, xs+extra*h, j)
            

            grad2 = derivadaEn1Punto1coordenada(f, xs-extra*h, j)

            hes[i,j] = ((grad1-grad2)/(2*h))
           
    return (hes)

In [11]:
f = lambda x: x[0]**3 * x[1]**4 + x[2]**3 + 5 * x[3]**4

In [12]:
m = np.round(hessiano(f, np.array([1,2,3,1])))

In [13]:
min(np.linalg.eigvals(m))

-26.954535014823865

In [14]:
def seccionAurea(f, x, d, epsilon, p ):
    theta1 = (3- math.sqrt(5))/2
    theta2 = 1 - theta1
    a = 0
    s = p
    b = 2*p
    phiB = f(x+ b*d)
    phiS = f(x+ s*d)
    while(phiB<phiS):
        a = s
        s = b
        b = 2*b
        phiS = phiB
        phiB = f(x + b * d)
    u = a + theta1 * (b-a)
    v = a + theta2 * (b-a)
    phiU = f(x + u*d)
    phiV = f(x + v*d)
    while((b-a)>epsilon):
        if(phiU<phiV):
            b = v
            v = u
            u = a + theta1*(b-a)
            phiV = phiU
            phiU = f(x + u * d)
        else:
            a = u
            u = v
            v = a + theta2*(b-a)
            phiU = phiV
            phiV = f(x + v * d)
    return((u+v)/2)
            

In [16]:
#from os import XATTR_CREATE
def newtonConModificacionLevenbergMarquardt(f, x0, gamma, eps = 0.01, maxIter=1000):
  iter = 0
  x = x0
  xs = [x]
  grad = gradiente(f, x, 10**-5)
  while(np.linalg.norm(grad)>eps and iter<maxIter):
    grad = gradiente(f, x, 10**-5)
    B = hessiano(f, x, 10**-5)
    u = min(np.linalg.eigvals(B))
    if(u<=0):
      B = B + (-u + gamma)*np.identity(len(B))
    dk = np.linalg.solve(B, -grad)
    tk = seccionAurea(f, x, dk, 10**-5, 1)
    x = x + dk*tk
    xs.append(x)
    iter = iter + 1
  return(x, iter, xs)

## Ejercicios

1. Implementar la función `hessiano` que, dados una función `f` y un punto `x`, aproxime $Hf(x)$.
2. Implementar el Método de Newton con Modificación de Levenberg-Marquardt.
3. Probar el método con la función de Rosenbrock con $x_0=(0,0)$ 😱
3. Probar el método aplicándolo a la función de resta de exponenciales cuyo minimizador es $(1.1, 1.1)$. Comenzar en distintos puntos iniciales:
* $x_0=(1,0)$
* $x_0 =(2, 1.5)$
* $x_0=(0.5, 0.5)$
* $x_0=(0,0)$
* $x_0=(-0.7, -0.2)$ <br>
¿Qué sucede en el último caso? ¿Por qué? (Interpretar a partir del gráfico de la función)

4. ¿Funciona el método si fijamos $t=1$?
4. Comparar con Método del Gradiente y con Gradiente Conjugado

In [17]:
def rosenbrock(x):
    """
    minimiser : x = (1,..., 1)
    """
    d = np.shape(x)[0]
    return sum(100*(x[i+1]-x[i]**2)**2+(x[i]-1)**2 for i in range(d-1))

def resta_exponenciales(x):
    s1 = np.exp(-x[0] ** 2 - x[1] ** 2)
    s2 = np.exp(-(x[0] - 1) ** 2 - (x[1] - 1) ** 2)
    return (s1 - s2) * 2

def plot_fun(f, limites, points=None):
    """
    f : función a graficar
    limites : toma una tupla (x1,x2,y1,y2) de los límites del gráfico: grafica en el dominio [x1,x2] x [y1,y2]
    points : lista de puntos a graficar sobre la superficie; se ingresa como una lista de tuplas (x,y,z) 
    """
    init_notebook_mode(connected=True)

    x = np.linspace(limites[0], limites[1], 1000)
    y = np.linspace(limites[2], limites[3], 1000)
    X, Y = np.meshgrid(x, y)
    Z = f((X, Y))
    data = [go.Surface(x=x, y=y, z=Z)]
    if points is not None:
        for p in points:
            data.append(go.Scatter3d(x=[p[0]], y=[p[1]], z=[p[2]], mode='markers'))
    fig = go.Figure(data=data)
    iplot(fig)

%matplotlib notebook
def graficar_recorrido(f, limites, recorrido=None, levels=10):
    """ 
    Función que grafica curvas de nivel y, opcionalmente, el recorrido de un método.
    f : es la función a graficar (tiene que ir de R2 en R)
    limites : es una lista o tupla de números: [a,b,c,d]. Va a graficar la función en el cuadrado [a,b] x [c,d]
    recorrido : acepta una lista de arrays bidimensionales para graficar el recorrido de un método
    levels : cantidad de curvas de nivel a graficar
    """
    plt.figure()
    x = np.linspace(limites[0], limites[1], 1000)
    y = np.linspace(limites[2], limites[3], 1000)
    X, Y = np.meshgrid(x, y)
    Z = f((X, Y))
    plt.contour(X,Y,Z, cmap='plasma', levels=levels)
    if recorrido is not None:
        x_coords = [x[0] for x in recorrido]
        y_coords = [x[1] for x in recorrido]
        plt.plot(x_coords, y_coords, marker='o', lw=2, ms=8)
    plt.tight_layout()
    plt.gca().set_aspect('equal', adjustable='box')
    plt.show()

In [19]:
def correrMuchosPuntos(f, puntos):
  recorridos = []
  finales = []
  for p in puntos:
    n = (newtonConModificacionLevenbergMarquardt(f, p, 1))
    recorridos.append(n[2])
    finales.append(np.round((n[0]+0.001)*1000)/1000 - 0.001)
  return finales,recorridos

In [22]:
def puntoFinalColores(finales, recorridos):
  dicc = {}
  cont = 0
  for i in range (0, len(finales)):
    if(str(finales[i]) not in dicc):
      dicc[str(finales[i])] = recorridos[i]
      cont = cont + 1
    else:
      dicc[str(finales[i])] =  dicc[str(finales[i])] +  recorridos[i]
  return dicc


In [24]:
def generarGrillaPuntos(xlims, ylims, pasito):
  xm = xlims[0]
  ym = ylims[0]
  puntos = []
  while(ym<ylims[1]):
    if(xm>xlims[1]):
      xm =  xlims[0]
      ym = ym + pasito
    puntos.append(np.array([xm,ym]))
    xm = xm + pasito
  return puntos

In [25]:
puntos = generarGrillaPuntos([-10,10],[-10,10],0.1)

In [26]:
fs = lambda x: - 3*x[0]**2 - 6*x[1]**2 + x[0]**4 + x[1]**4  # + 3*math.sin(x[0]*6.28) - 4*math.cos(x[1]*6.28)

In [27]:
(fines, recs) = correrMuchosPuntos(fs, puntos)


In [28]:
dicc = puntoFinalColores(fines, recs)

In [34]:
res = newtonConModificacionLevenbergMarquardt(fs, np.array([0.2,0.2]), 1)

In [64]:
graficar_recorrido(fs, [-2.3,2.3,-2.3,2.3],None)

<IPython.core.display.Javascript object>

In [74]:
def graficar_finales(f, xlims, ylims, dicc, levels=10):
    """ 
    Función que grafica curvas de nivel y, opcionalmente, el recorrido de un método.
    f : es la función a graficar (tiene que ir de R2 en R)
    limites : es una lista o tupla de números: [a,b,c,d]. Va a graficar la función en el cuadrado [a,b] x [c,d]
    recorrido : acepta una lista de arrays bidimensionales para graficar el recorrido de un método
    levels : cantidad de curvas de nivel a graficar
    """
    plt.figure()
    x = np.linspace(xlims[0], xlims[1], 1000)
    y = np.linspace(ylims[0], ylims[1], 1000)
    X, Y = np.meshgrid(x, y)
    Z = f((X, Y))
    plt.contour(X,Y,Z, cmap='plasma', levels=levels)
    valores = dicc.values()
    for lista in valores:
        x_coords = [x[0] for x in lista]
        y_coords = [x[1] for x in lista]
        plt.plot(x_coords, y_coords, lw=0.02, ms=100)
    plt.tight_layout()
    plt.gca().set_aspect('equal', adjustable='box')
    plt.show()

In [75]:
xlim = [-4.1,4.1]
ylim = [-4.1, 4.1]

In [80]:
list("dgdd".strip())

['d', 'g', 'd', 'd']

In [76]:
graficar_finales(fs, xlim, ylim, dicc)

<IPython.core.display.Javascript object>

In [39]:
dicc.values()

dict_values([[array([-4, -4]), array([-1.40546758, -1.59632991]), array([-1.25758733, -1.74843159]), array([-1.22501909, -1.73178254]), array([-1.22474498, -1.73205086]), array([-3.95, -4.  ]), array([-1.40034428, -1.60365546]), array([-1.25480376, -1.74760085]), array([-1.22498135, -1.73182715]), array([-1.22474495, -1.73205085]), array([-3.9, -4. ]), array([-1.39499244, -1.61091414]), array([-1.25209973, -1.74673829]), array([-1.22494619, -1.73186697]), array([-1.22474492, -1.73205084]), array([-3.85, -4.  ]), array([-1.38939421, -1.61808343]), array([-1.24948674, -1.74584594]), array([-1.22491373, -1.73190193]), array([-1.22474491, -1.73205083]), array([-3.8, -4. ]), array([-1.38356005, -1.62516705]), array([-1.24697298, -1.74492973]), array([-1.22488432, -1.73193225]), array([-1.22474489, -1.73205082]), array([-3.75, -4.  ]), array([-1.37747706, -1.63214548]), array([-1.24456966, -1.74399331]), array([-1.22485804, -1.73195807]), array([-1.22474489, -1.73205082]), array([-3.7, -4. ]