### Introducción a la Investigación Operativa y la Optimización

### • Clase 4  - Método de Newton

**Nazareno Faillace Mullen - Departamento de Matemática, FCEN, UBA**

### Comentario sobre Sección Áurea

Definimos $\varphi\colon [0,+\infty)\rightarrow \mathbb{R}$ de la siguiente manera:
$$\varphi(t)=f(x+td)$$
__Definición (Función unimodal):__ una función continua $\varphi\colon [0,+\infty)\rightarrow \mathbb{R}$ se dice unimodal si admite un conjunto de minimizadores $[t_1, t_2]$ y es estrictamente decreciente en $[0,t_1]$ ($t_1\neq 0$) y estrictamente creciente en $[t_2, +\infty)$

<img src="https://i.postimg.cc/KzYJR30n/unimodal.png"/>

Cuando $\varphi$ es unimodal, la sección áurea funciona muy bien para encontrar una aproximación al minimizador. Si $\varphi$ no es unimodal, este algoritmo puede no ser eficiente.

Problema: función de Rosenbrock comenzando en $(0,0)$

<img src="https://i.postimg.cc/tJSk3qmL/no-unimodal.png"/>

## Método de Newton

En este método, se elige como dirección de descenso:
$$d = -Hf(x)^{-1}\nabla f(x)$$
Notar que, si $Hf(x)$ es definida positiva, $d$ es dirección descenso:
$$\nabla f(x)^T d= -\nabla f(x)^THf(x)^{-1}\nabla f(x) < 0$$

__Observación:__ $d$ puede no estar bien definido si $Hf(x)$ es singular o puede no ser una dirección de descenso si $Hf(x)$ no es definida positiva.

__Teorema:__ si $Hf(x)$ es definida positiva para todo $x\in\mathbb{R}^n$, el Método de Newton es globalmente convergente.

__Algoritmo del Método de Newton para $f$ tal que $Hf(x)$ es definida positiva para todo $x\in\mathbb{R}^n$__

Dados: $f, x_0 \in \mathbb{R}^n,\; \varepsilon>0,\; k_{MAX}>0$ <br>
$k=0$ <br>
REPETIR mientras $\lVert\nabla f(x_{k})\rVert > \varepsilon$ y $k<k_{MAX}$: <br>
&nbsp;&nbsp;&nbsp;&nbsp; Definir $d_{k}$ como la solución de $Hf(x_{k})d_{k} = -\nabla f(x_{k})$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Determinar el tamaño del paso $t_k > 0$ (con sección áurea, Armijo o Wolfe) <br>
&nbsp;&nbsp;&nbsp;&nbsp; Hacer $x_{k+1} = x_{k} + t_kd_{k}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; k = k + 1 <br>
DEVOLVER $x_k$

**Obs.:** para definir $d_k$ utilizar el comando `np.linalg.solve` de la siguiente manera: `dk = np.linalg.solve(H,g)` donde `H `es  $Hf(x_k)$ y `g` es $-\nabla f(x_{k})$.

### Método de Newton para funciones cuadráticas

En el caso de las funciones cuadráticas $f(x)=\frac{1}{2}x^T A x + bx + c$ con $A$ simétrica definida positiva, se tiene que:
$$Hf(x) = A$$

Dados: $A, b, x_0 \in \mathbb{R}^n,\; \varepsilon>0,\; k_{MAX}>0$ <br>
$k=0$ <br>
REPETIR mientras $\lVert Ax + b\rVert > \varepsilon$ y $k<k_{MAX}$: <br>
&nbsp;&nbsp;&nbsp;&nbsp; Definir $d_{k}$ como la solución de $Ad_{k} = -(Ax_k + b)$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Hacer $x_{k+1} = x_{k} + d_{k}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; k = k + 1 <br>
DEVOLVER $x_k$

# Ejercicios

1. Implementar el Método de Newton para funciones cuadráticas.
2. Comparar su desempeño (en términos de cantidad de iteraciones) con el de Método de Gradiente y el de Gradiente Conjugado, para las funciones cuadráticas dadas por $f(x)=\frac{1}{2}x^T A_i x$ para cada una de las $A_i$ que figuran debajo. Probar con puntos iniciales que se encuentren _lejos_ del minimizador $(0,0)$
3. ¿Qué ocurre si hacemos $x_{k+1} = x_k + \gamma d_k$ con $\gamma\in (0, 1]$?

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import plotly
import plotly.express as px
import plotly.graph_objs as go
from plotly.offline import init_notebook_mode, iplot

A1 = np.array([[8, 3, 3, 6, 5, 4, 4, 3, 6, 3],
             [3, 4, 2, 2, 2, 1, 3, 3, 3, 2],
             [3, 2, 5, 2, 1, 2, 4, 2, 4, 1],
             [6, 2, 2, 6, 3, 2, 4, 2, 4, 2],
             [5, 2, 1, 3, 5, 4, 1, 2, 4, 3],
             [4, 1, 2, 2, 4, 5, 1, 2, 5, 2],
             [4, 3, 4, 4, 1, 1, 6, 2, 4, 2],
             [3, 3, 2, 2, 2, 2, 2, 4, 4, 2],
             [6, 3, 4, 4, 4, 5, 4, 4, 8, 3],
             [3, 2, 1, 2, 3, 2, 2, 2, 3, 4]])

A2 = np.array([[2, 0, 1, 0, 1],
               [0, 2, 1, 1, 1],
               [1, 1, 3, 1, 1],
               [0, 1, 1, 1, 0],
               [1, 1, 1, 0, 2]])

A3 = np.diag(np.random.randint(1, 5, 100))

A4 = np.array([[10, 0], [0, 1]])

A5 = np.array([[1, -1], [0, 0.8]])

A6 = np.array([[163., 162., 171.,  -9.,   0.,   0.],
               [162., 163., 171.,  -9.,   0.,   0.],
               [171., 171., 181.,  -9.,   0.,   0.],
               [ -9.,  -9.,  -9.,   1.,   0.,   0.],
               [  0.,   0.,   0.,   0.,   1.,   0.],
               [  0.,   0.,   0.,   0.,   0.,   1.]])

In [None]:
##Ejercicio 1:

def met_newton_fciones_cuadraticas(A, b, x0, eps=1e-8, k_max=1000):
  k=0
  x_k = np.array(x0)
  while np.linalg.norm(A @ x_k + b) > eps  and  k < k_max:
    d_k = np.linalg.solve(A, -A @ x_k - b)
    x_k = x_k + d_k
    k = k + 1
  return x_k, k


In [None]:
##Ejercicio 2:
#Probar con puntos iniciales que se encuentren lejos del minimizador (0,0)
n_A1 = A1[0].shape
x_0_A1 = np.ones(n_A1)
b_A1 = np.zeros(n_A1)
min_newton_cuad_A1, iter_newton_cuad_A1 = met_newton_fciones_cuadraticas(A1, b_A1, x_0_A1)
print(f"Con Newton, A1 realiza {iter_newton_cuad_A1} iteracion/es.")

n_A2 = A2[0].shape
x_0_A2 = np.array([10, 10, 10, 10, 10]) #x_0_A2 = np.ones(n_A2)
b_A2 = np.zeros(n_A2)
min_newton_cuad_A2, iter_newton_cuad_A2 = met_newton_fciones_cuadraticas(A2, b_A2, x_0_A2)
print(f"Con Newton, A2 realiza {iter_newton_cuad_A2} iteracion/es.")

n_A3 = A3[0].shape
x_0_A3 = np.ones(n_A3)
b_A3 = np.zeros(n_A3)
min_newton_cuad_A3, iter_newton_cuad_A3 = met_newton_fciones_cuadraticas(A3, b_A3, x_0_A3)
print(f"Con Newton, A3 realiza {iter_newton_cuad_A3} iteracion/es.")

n_A4 = A4[0].shape
x_0_A4 = np.array([5, 5])
b_A4 = np.zeros(n_A4)
min_newton_cuad_A4, iter_newton_cuad_A4 = met_newton_fciones_cuadraticas(A4, b_A4, x_0_A4)
print(f"Con Newton, A4 realiza {iter_newton_cuad_A4} iteracion/es.")

n_A5 = A5[0].shape
x_0_A5 = np.array([100, 100])
b_A5 = np.zeros(n_A5)
min_newton_cuad_A5, iter_newton_cuad_A5 = met_newton_fciones_cuadraticas(A5, b_A5, x_0_A5)
print(f"Con Newton, A5 realiza {iter_newton_cuad_A5} iteracion/es.")

n_A6 = A6[0].shape
x_0_A6 = np.array([1000, 1000, 1000, 1000, 1000, 1000])
b_A6 = np.zeros(n_A6)
min_newton_cuad_A6, iter_newton_cuad_A6 = met_newton_fciones_cuadraticas(A6, b_A6, x_0_A6)
print(f"Con Newton, A6 realiza {iter_newton_cuad_A6} iteracion/es.")

Con Newton, A1 realiza 1 iteracion/es.
Con Newton, A2 realiza 1 iteracion/es.
Con Newton, A3 realiza 1 iteracion/es.
Con Newton, A4 realiza 1 iteracion/es.
Con Newton, A5 realiza 1 iteracion/es.
Con Newton, A6 realiza 1 iteracion/es.


In [None]:
##Ejercicio 3:
# ¿Qué pasa si hacemos x_k = x_k + γ*d_k con γ∈(0,1] ?

#Si hacemos x_k = x_k + np.random.rand()*d_k, el método de Newton realiza más de 1 iteracion.

## ¿Qué pasa si $Hf(x)$ no es definida positiva o si es singular?


**Recordar:** $A\in\mathbb{R}^{n\times n}$ inversible $\Leftrightarrow$ $0$ no es autovalor de $A$.<br><br>
**Recordar:** $A\in\mathbb{R}^{n\times n}$ simétrica, $A$ es definida positiva $\Leftrightarrow$ todos los autovalores de $A$ son positivos

### Modificación de Levenberg-Marquardt

Considerar
$$x_{k+1} = x_{k} - t_k(Hf(x_{k})+\mu I)^{-1}\nabla f(x_{k})$$

donde $\mu>0$ es lo suficientemente grande como para que $B_{k}= Hf(x_{k})+\mu I$ sea definida positiva.

__Obs:__ si $\mu$ es demasiado grande, $d_{k}$ tiende a estar en la dirección de $-\nabla f(x_{k})$, pues $(Hf(x_{k})+\mu I)^{-1}\nabla f(x_{k}) \approx \frac{1}{\mu}\nabla f(x_{k})$ . En cambio, si $\mu$ es pequeño, $d_{k}$ se parece más a la dirección de descenso del Método de Newton

Con la modificación de L-M, se obtiene un método que utiliza las ventajas del Método del Gradiente y del Método de Newton. Pensándolo con ideas generales:
* cerca del mínimo $\approx$ $Hf(x)$ definida positiva $\approx$ $\mu=0$ o $\mu$ pequeño $\approx$ Método de Newton $\approx$ convergencia rápida cerca de un mínimo
* lejos del mínimo $\approx$ $Hf(x)$ no definida positiva $\approx$ $\mu$ grande $\approx$ Método del gradiente $\approx$ más velocidad de descenso


__Obs:__ Como pedíamos que $f\in C^3$, en particular resulta que $Hf(x)$ es simétrica $\forall x \in \mathbb{R}^n$, entonces los autovalores de $Hf(x)$ son reales $\forall x \in \mathbb{R}^n$.

__Obs:__ Si $\lambda_1, \dots, \lambda_n$ son los autovalores de $Hf(x)$, entonces $\lambda_1+\mu, \dots, \lambda_n+\mu$ son los autovalores de $B=Hf(x)+\mu I$, y $B$ tiene los mismos autovectores que $Hf(x)$. Sea $v_i$ autovector de $Hf(x)$:
$$\begin{array}{rcl} Bv_i &=& (Hf(x)+\mu I)v_i \\ &=& Hf(x)v_i+\mu Iv_i \\ &=& \lambda_iv_i+\mu v_i \\ &=& (\lambda_i+\mu)v_i \end{array}$$
Entonces, en caso de que $Hf(x)$ no sea definida positiva, se puede utilizar su mínimo autovalor como una aproximación a $-\mu$

__Algoritmo del Método de Newton con modificación de Levenberg-Marquardt__

Dados: $f, x_0 \in \mathbb{R}^n,\; k_{MAX}>0,\; \varepsilon>0,\; \gamma>0$ <br>
$k=0$ <br>
REPETIR mientras $\lVert\nabla f(x_{k})\rVert > \varepsilon$ y $k<k_{MAX}$: <br>
&nbsp;&nbsp;&nbsp;&nbsp; $B = Hf(x_{k})$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; $\mu = \min \{ \lambda \colon \lambda \text{ es autovalor de } B\}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Si $\mu \leq 0$: <br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; $B = B+(-\mu+\gamma)I$  
&nbsp;&nbsp;&nbsp;&nbsp; Definir $d_{k}$ como la solución de $Bd_{k} = -\nabla f(x_{k})$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; Determinar el tamaño del paso $t_k > 0$ (con sección áurea, Armijo o Wolfe)<br>
&nbsp;&nbsp;&nbsp;&nbsp; Hacer $x_{k+1} = x_{k} + t_kd_{k}$ <br>
&nbsp;&nbsp;&nbsp;&nbsp; k = k + 1 <br>
DEVOLVER $x_k$

Utilizar la función `np.linalg.eigvals(B)` para calcular los autovalores de $B$

## Aproximando el Hessiano de $f$

Aproximaremos el valor del Hessiano en cierto $x$, teniendo en cuenta que:
$$Hf(x)={\begin{pmatrix}{\frac  {\partial ^{2}f}{\partial x_{1}^{2}}}&{\frac  {\partial ^{2}f}{\partial x_{1}\partial x_{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{1}\partial x_{n}}}\\{\frac  {\partial ^{2}f}{\partial x_{2}\partial x_{1}}}&{\frac  {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{2}\partial x_{n}}}\\\vdots &\vdots &\ddots &\vdots \\{\frac  {\partial ^{2}f}{\partial x_{n}\partial x_{1}}}&{\frac  {\partial ^{2}f}{\partial x_{n}\partial x_{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{n}^{2}}}\end{pmatrix}} = {\begin{pmatrix}{\nabla \frac{\partial f}{\partial x_1}}\\{\vdots}\\{{\nabla \frac{\partial f}{\partial x_n}}}\end{pmatrix}}$$

Algunos hints para implementar:
* Ir definiendo al Hessiano por filas
* Para cada $i$ utilizar `lambda` para definir la función $\frac{\partial f}{\partial x_i}(x)$ (a partir de `derivada direccional`)
* La fila $i$-ésima del Hessiano es aplicar `gradiente` a la función definida en el ítem anterior

## Ejercicios

1. Implementar la función `hessiano` que, dados una función `f` y un punto `x`, aproxime $Hf(x)$.
2. Implementar el Método de Newton con Modificación de Levenberg-Marquardt.
3. Probar el método con la función de Rosenbrock con $x_0=(0,0)$ 😱
4. Probar el método aplicándolo a la función de resta de exponenciales cuyo minimizador es $(1.1, 1.1)$. Comenzar en distintos puntos iniciales:
* $x_0=(1,0)$
* $x_0 =(2, 1.5)$
* $x_0=(0.5, 0.5)$
* $x_0=(0,0)$
* $x_0=(-0.7, -0.2)$ <br>
¿Qué sucede en el último caso? ¿Por qué? (Interpretar a partir del gráfico de la función)

5. ¿Funciona el método si fijamos $t=1$?
6. Comparar con Método del Gradiente y con Gradiente Conjugado

In [None]:
##Ejercicio 1:
#Ir definiendo al Hessiano por filas
#Para cada i utilizar lambda para definir la función  ∂f∂xi(x)  (a partir de derivada direccional)
#La fila i-ésima del Hessiano es aplicar gradiente a la función definida en el ítem anterior

def derivada_direccional(f, x, d, h=1e-5):
  return (f(x + h * d) - f(x - h * d)) / (2 * h)

def gradiente(f, x, h=1e-5):
  n = len(x)
  res = np.zeros(n)
  for i in range(n):
      # Vector unitario en la dirección i
      e_i = np.zeros(n)
      e_i[i] = 1
      # Derivada parcial de f respecto a la variable i
      res[i] = derivada_direccional(f, x, e_i, h)
  return res

def hessiano(f, x, h=1e-8): #Hice modificaciones en H para que tome la fcion rosenbrock
  n = len(x)
  #H = np.array([])
  H = np.zeros((n, n))  # Asegura una matriz 2D, para que no haya problemas al ejecutar rosenbrock
  for i in range(n):
      # Derivada parcial de f respecto a xi
      parcial_f_xi = lambda x_val: derivada_direccional(f, x_val, np.eye(n)[i])
      #H = np.append(H, gradiente(parcial_f_xi, x))
      # Gradiente de la parcial_f_xi para obtener la fila i del Hessiano
      H[i, :] = gradiente(parcial_f_xi, x)
  return H



#def fcion_prueba(x):
#  x1, x2 = x
#  return 2 * x1**2 + x1 * x2

#x_0 = np.array([1, 1])
#res = hessiano(fcion_prueba, x_0)
#print("Hessiano de f en x0:", res)

In [None]:
##Ejercicio 2:

def busqueda_armijo(f, x, d, eta=0.2, betha=2, eps_parada=1e-4): #eta = η  En este ejercicio, eta es el alpha de Armijo de la teorica
  t=1
  gradiente_val = gradiente(f, x)
  if f(x + t*d) <= f(x) + eta * t * np.dot(gradiente_val, d):
    while f(x + t*d) <= f(x) + eta * t * np.dot(gradiente_val, d) and t>eps_parada: #agrego condicion para que t no sea demasiado pequeño
      t = t * betha
    return t / betha # Devuelvo el último paso válido
  else:
     while f(x + t*d) > f(x) + eta * t * np.dot(gradiente_val, d) and t>eps_parada: #agrego condicion para que t no sea demasiado pequeño
      t = t / betha
     return t


def met_newton_modif_levenberg_marquardt(f, x0, eps=1e-8, k_max=1000, gamma=0.1):
  k=0
  x_k = np.array(x0)
  while np.linalg.norm(gradiente(f, x_k)) > eps  and  k < k_max:
    B = hessiano(f, x_k)
    mu = min(np.linalg.eigvals(B))
    if mu <= 0:
      B = B + (-mu + gamma)
    d_k = np.linalg.solve(B, -gradiente(f, x_k))
    t_k = busqueda_armijo(f, x_k, d_k)
    x_k = x_k + t_k * d_k
    k = k + 1
  return x_k, k


In [None]:
##Ejercicio 3: Aplicar el metodo a Rosenbrock en x0=[0,0]

def rosenbrock(x):
    """
    minimiser : x = (1,..., 1)
    """
    x = x.flatten() # Asegura que esté en 1D para el cálculo
    d = np.shape(x)[0]
    return sum(100*(x[i+1]-x[i]**2)**2+(x[i]-1)**2 for i in range(d-1))


x_0 = np.array([0, 0], dtype=float).reshape(-1, 1) # Punto inicial en formato bidimensional
min_newton_modif, iter_newton_modif = met_newton_modif_levenberg_marquardt(rosenbrock, x_0)
print(f"El método de Newton modificado da como minimo {min_newton_modif.flatten()} y realiza {iter_newton_modif} iteraciones")


El método de Newton modificado da como minimo [0.02003667 0.00548376 0.02003667 0.00548376] y realiza 4 iteraciones


In [None]:
##Ejercicio 4: Probar el método aplicándolo a la función de resta de exponenciales cuyo minimizador es (1.1,1.1)
#Comenzar en distintos puntos iniciales:
#x0=(1,0)
#x0=(2,1.5)
#x0=(0.5,0.5)
#x0=(0,0)
#x0=(−0.7,−0.2)
#¿Qué sucede en el último caso? ¿Por qué? (Interpretar a partir del gráfico de la función)

def resta_exponenciales(x):
  x = x.flatten() # Asegura que esté en 1D para el cálculo
  s1 = np.exp(-x[0] ** 2 - x[1] ** 2)
  s2 = np.exp(-(x[0] - 1) ** 2 - (x[1] - 1) ** 2)
  return (s1 - s2) * 2


x_0_i = np.array([1, 0], dtype=float).reshape(-1, 1) # Punto inicial en formato bidimensional
min_newton_modif_i, iter_newton_modif_i = met_newton_modif_levenberg_marquardt(resta_exponenciales, x_0_i)
print(f"El método de Newton modificado en [1,0] da como minimo {min_newton_modif_i.flatten()} y realiza {iter_newton_modif_i} iteraciones")

x_0_ii = np.array([2, 1.5], dtype=float).reshape(-1, 1) # Punto inicial en formato bidimensional
min_newton_modif_ii, iter_newton_modif_ii = met_newton_modif_levenberg_marquardt(resta_exponenciales, x_0_ii)
print(f"El método de Newton modificado en [2, 1.5] da como minimo {min_newton_modif_ii.flatten()} y realiza {iter_newton_modif_ii} iteraciones")

#x_0_iii = np.array([0.5, 0.5], dtype=float).reshape(-1, 1) # Punto inicial en formato bidimensional
#min_newton_modif_iii, iter_newton_modif_iii = met_newton_modif_levenberg_marquardt(resta_exponenciales, x_0_iii)
#print(f"El método de Newton modificado en [0.5, 0.5] da como minimo {min_newton_modif_iii.flatten()} y realiza {iter_newton_modif_iii} iteraciones")
#El error "Singular matrix" aparece cuando el método intenta calcular la inversa de una matriz que no es invertible (singular).
#En el contexto del método de Newton modificado con el ajuste de Levenberg-Marquardt, este problema puede surgir cuando el hessiano en
#algún punto es singular o está cerca de serlo, lo que impide la inversión necesaria para actualizar el punto.

x_0_iv = np.array([0, 0], dtype=float).reshape(-1, 1) # Punto inicial en formato bidimensional
min_newton_modif_iv, iter_newton_modif_iv = met_newton_modif_levenberg_marquardt(resta_exponenciales, x_0_iv)
print(f"El método de Newton modificado en [0, 0] da como minimo {min_newton_modif_iv.flatten()} y realiza {iter_newton_modif_iv} iteraciones")

#x_0_v = np.array([-0.7, -0.2], dtype=float).reshape(-1, 1) # Punto inicial en formato bidimensional
#min_newton_modif_v, iter_newton_modif_v = met_newton_modif_levenberg_marquardt(resta_exponenciales, x_0_v)
#print(f"El método de Newton modificado en [-0.7, -0.2] da como minimo {min_newton_modif_v.flatten()} y realiza {iter_newton_modif_v} iteraciones")


def plot_fun(f, limites, points=None):
    """
    f : función a graficar
    limites : toma una tupla (x1,x2,y1,y2) de los límites del gráfico: grafica en el dominio [x1,x2] x [y1,y2]
    points : lista de puntos a graficar sobre la superficie; se ingresa como una lista de tuplas (x,y,z)
    """
    init_notebook_mode(connected=True)

    x = np.linspace(limites[0], limites[1], 1000)
    y = np.linspace(limites[2], limites[3], 1000)
    X, Y = np.meshgrid(x, y)
    Z = f((X, Y))
    data = [go.Surface(x=x, y=y, z=Z)]
    if points is not None:
        for p in points:
            data.append(go.Scatter3d(x=[p[0]], y=[p[1]], z=[p[2]], mode='markers'))
    fig = go.Figure(data=data)
    iplot(fig)

%matplotlib inline
def graficar_recorrido(f, limites, recorrido=None, levels=10):
    """
    Función que grafica curvas de nivel y, opcionalmente, el recorrido de un método.
    f : es la función a graficar (tiene que ir de R2 en R)
    limites : es una lista o tupla de números: [a,b,c,d]. Va a graficar la función en el cuadrado [a,b] x [c,d]
    recorrido : acepta una lista de arrays bidimensionales para graficar el recorrido de un método
    levels : cantidad de curvas de nivel a graficar
    """
    plt.figure()
    x = np.linspace(limites[0], limites[1], 1000)
    y = np.linspace(limites[2], limites[3], 1000)
    X, Y = np.meshgrid(x, y)
    Z = f((X, Y))
    plt.contour(X,Y,Z, cmap='plasma', levels=levels)
    if recorrido is not None:
        x_coords = [x[0] for x in recorrido]
        y_coords = [x[1] for x in recorrido]
        plt.plot(x_coords, y_coords, marker='o', lw=2, ms=8)
    plt.tight_layout()
    plt.gca().set_aspect('equal', adjustable='box')
    plt.show()

graficar_recorrido(resta_exponenciales, [-1, 2, -1, 2], [min_newton_modif_i, min_newton_modif_ii, min_newton_modif_iv])

El método de Newton modificado en [1,0] da como minimo [1.09983932 1.09983932 0.09983932 0.09983932] y realiza 7 iteraciones
El método de Newton modificado en [2, 1.5] da como minimo [1.09983932 1.09983932 0.59983932 0.59983932] y realiza 5 iteraciones
El método de Newton modificado en [0, 0] da como minimo [5.94877855 5.94877855 5.94877855 5.94877855] y realiza 1 iteraciones


AttributeError: 'tuple' object has no attribute 'flatten'

<Figure size 640x480 with 0 Axes>