# Método simplex

---

<ul>
    <li><strong>Autor:</strong> Jesús Emmanuel Solís Pérez </li>
    <li><strong>Contacto:</strong> <a href="mailto:jsolisp@unam.mx">jsolisp@unam.mx</a>
</ul>

---

# Propósito
El objetivo de este cuaderno es mostrar los fundamentos matemáticos para el método de Gradiente Descendente.

# Preliminares matemáticos

Una notación general para minimizar funciones sujetas a condiciones en las variables está dada como sigue

\begin{equation}
 \label{eqn:fcn_min}
 \underset{x\in \mathbb{R}^{n}}{\min} f(x),
\end{equation}

s.a.

\begin{equation}
 \begin{matrix}
  c_{i}(x) = 0, & i \in \mathcal{E}, \\
  c_{i}(x) \geq 0, i \in \mathcal{I},
 \end{matrix}
\end{equation}

donde $f$ y las funciones $c_{i}$ son suaves, funciones de valor real en un subconjunto de $\mathbb{R}^{n}$ e $\mathcal{I}$, $\mathcal{E}$ son dos conjuntos finitos de índices. Recordemos entonces que, llamamos $f$ a la función *objetivo* o función a minimizar mientras que $c_{i}, i\in \mathcal{E}$ son las *restricciones de igualdad* mientras que $c_{i},i\in\mathcal{I}$ son las *restricciones de desigualdad*.

La función Lagrangiana para el problema dado en la Ec. \eqref{eqn:fcn_min} está dado como sigue

\begin{equation}
 \mathcal{L}(x,\lambda) = f(x) - \sum_{i\in \mathcal{E}\cup\mathcal{I}} \lambda_{i}c_{i}(x).
\end{equation}

Las siguientes condiciones están relacionadas con las propiedades de los gradientes -vectores de primeras derivadas- de la función objetivo y de las restricciones.

## Condiciones de Karush–Kuhn–Tucker (KKT)

**Definición 1.** *El conjunto activo $\mathcal{A}(x)$ en cualquier $x$ factible consiste de los índices de las restricciones de igualdad de  $\mathcal{E}$ junto con los índices de las restricciones de desigualdad $i$ para los cuales $c_{i}(x) = 0$ esto es

\begin{equation}
 \label{eqn:def1}
 \mathcal{A}(x) = \mathcal{E}\cup\{i\in \mathcal{I} | c_{i}(x) = 0\}.
\end{equation}


**Definición 2.** *Dado el punto $x$ y un conjunto activo $\mathcal{A}(x)$ definido en \eqref{eqn:def1}, se dice que la calificación de la restricción de independencia lineal (LICQ) se cumple si el conjunto de gradientes de restricciones $\{ \nabla c_{i}(x)$, $i\in \mathcal{A}(x)\}$ es linealmente independiente.*

**Teorema 1.** *Suponga que $x^{\star}$ es una solución local de \eqref{eqn:fcn_min}, las funciones $f$ y $c_{i}$ en \eqref{eqn:fcn_min} son continuamente diferenciable, y que LICQ mantiene en $x^{\star}$. Entonces existe un vector multiplicador de Lagrange $\lambda^{\star}$, con componentes $\lambda^{\star}_{i}$, $i\in\mathcal{E}\cup\mathcal{I}$ tal que las siguientes condiciones se satisfacen en $(x^{\star},\lambda^{\star})$*

\begin{equation}
 \label{eqn:cond1}
 \nabla_{x}\mathcal{L}(x^{\star},\lambda^{\star}) = 0,
\end{equation}

\begin{equation}
 c_{i}(x^{\star}) = 0, \quad \forall i\in \mathcal{E},
\end{equation}

\begin{equation}
 c_{i}(x^{\star}) \geq 0, \quad \forall i\in \mathcal{I},
\end{equation}

\begin{equation}
 \lambda_{i}^{\star} \geq 0, \quad \forall i\in \mathcal{I},
\end{equation}

\begin{equation}
 \label{eqn:cond5}
 \lambda_{i}^{\star}c_{i}(x^{\star}) = 0, \quad \forall i\in \mathcal{E}.
\end{equation}

**Definición 3.** *Una base $\mathcal{B}$ se dice degenerada si $x_{i}=0$ para cualquier $i\in \mathcal{B}$, donde $x$ es la solución factible base correspondiente a $\mathcal{B}$. Un programa lineal se dice ser degenerado si este tiene al menos una base degenerada.*

De $\mathcal{B}$ y las Ecs. \eqref{eqn:cond1}-\eqref{eqn:cond5}, podemos derivar valores tanto para la variable primaria $x$ como para las variables $(\lambda,s)$. Primero, se define un conjunt de índices no básicos $\mathcal{N}$ como el complemento de $\mathcal{B}$, es decir

\begin{equation}
 \mathcal{N} = \{1,2,3,\dots,n\}\diagdown \mathcal{B}.
\end{equation}

**Observación.** \mathcal{B} es una matriz base cuyas columnas son $A_{i}$ para $i\in \mathcal{B}$. Para denotar una matriz no base $N=[A_{i}]_{i\in\mathcal{N}}$ la denotamos como $N$.

Realizando una división de los vectores de $n$ elementos $x$, $s$ y $c$ de acuerdo con los conjuntos de índices $\mathcal{B}$ y $\mathcal{N}$, se utiliza la siguiente notación

\begin{equation}
 x_{B} = [x_{i}]_{i\in\mathcal{B}}, \quad x_{N} = [x_{i}]_{i\in\mathcal{N}},
\end{equation}

\begin{equation}
 s_{B} = [s_{i}]_{i\in\mathcal{B}}, \quad s_{N} = [s_{i}]_{i\in\mathcal{N}},
\end{equation}

\begin{equation}
 c_{B} = [c_{i}]_{i\in\mathcal{B}}, \quad c_{N} = [c_{i}]_{i\in\mathcal{N}}.
\end{equation}

De las condiciones de KKT \eqref{eqn:cond1}-\eqref{eqn:cond5}, tenemos

\begin{equation}
 Ax = B_{x_{B}} + N_{x_{N}} = b.
\end{equation}

Por consiguiente, la variable primaria $x$ para la iteración simplex está definida como

\begin{equation}
 x_{B} = B^{-1}b, \quad x_{N} = 0,
\end{equation}

donde $B$ es no singular y $x_{B}\geq0$.

Considerando $s_{B} = 0$, los componentes $\lambda$ y $s_{N}$ se pueden encontrar particionando en componentes $c_{B}$ y $c_{N}$ para obtener

\begin{equation}
 B^{T}\lambda = c_{B}, \quad N^{T}\lambda + s_{N} = c_{N}.
\end{equation}

Por lo tanto, $\lambda$ se define como

\begin{equation}
 \lambda = B^{-T}c_{B},
\end{equation}

y por consiguiente 

\begin{equation}
 s_{N} = c_{N} - N^{T}\lambda = c_{N} - \left( B^{-1}N \right)^{T}c_{B},
\end{equation}

donde el cálculo del vector $s_{N}$ se define como *valoración* y los componentes $s_{N}$ como *costos reducidos* de la variable no base $x_{N}$.

Dado la nueva iteración $x^{+}$ y el índice de iteración actual $x$, se debe satisfacer $Ax = b$ dado que $x_{N} = 0$ y $x_{i}^{+} = 0$ para $i\in \mathcal{N}\diagdown\{q\}$ se tiene

\begin{equation}
 \label{eqn:Axplus}
 Ax^{+} = Bx_{B}^{+} + A_{q}x_{q}^{+} = Bx_{B} = Ax.
\end{equation}

Multiplicando la Ec. \eqref{eqn:Axplus} por $B^{-1}$ se tiene

\begin{equation}
 x_{B}^{+} = x_{B} - B^{-1}A_{q}x_{q}^{+}.
\end{equation}

Finalmente, el método simplex está dado por el siguiente algoritmo.

## Simplex Method (SM)

![alg_sim_os.png](../figures/alg_sim_os.png)

## Ejemplo 1
Considere el siguiente problema de optimización

\begin{equation}
 \min -4x_{1} - 2x_{2},
\end{equation}

s.a.

\begin{equation}
 \begin{aligned}
  x_{1} + x_{2} + x_{3} &= 5, \\
  2x_{1} + \frac{1}{2}x_{2} + x_{4} &= 8, \\
  x &\geq 0.
 \end{aligned}
\end{equation}

Además, suponga que se inicia con la base $\mathcal{B} = \{ 3,4\}$.


# Setup

## Library import
We import all the required Python libraries

In [None]:
# Data manipulation
import numpy as np

# Visualizations
import matplotlib.pyplot as plt
from matplotlib import cm
plt.rcParams['figure.figsize'] = [12, 8]
plt.rcParams['figure.dpi'] = 100
plt.rcParams['text.usetex'] = True
plt.rcParams["font.family"] = "serif"
plt.rc('axes', titlesize=20)        # Controls Axes Title
plt.rc('axes', labelsize=20)        # Controls Axes Labels
plt.rc('xtick', labelsize=20)       # Controls x Tick Labels
plt.rc('ytick', labelsize=20)       # Controls y Tick Labels
plt.rc('legend', fontsize=15)       # Controls Legend Font
plt.rc('figure', titlesize=15)      # Controls Figure Title
%matplotlib inline

# Autoreload extension
if 'autoreload' not in get_ipython().extension_manager.loaded:
    %load_ext autoreload
    
%autoreload 2

# Definición de funciones
Definimos todas las funciones que comprenden el método Quasi-Newton.

In [None]:
def gradient_descent(x0, f, gradF, eta = 1e-3, tol = 1e-4):
    """
    Parámetros
    ----------
    x0 : TYPE
        Punto inicial.
    F : TYPE
        Función a minimizar.
    gradF : TYPE
        Gradiente de la función.
    eta: 
        Paso propuesto.
    tol : TYPE, optional
        Tolerancia del algoritmo. The default is 1e-4.

    Returns
    -------
    F(x):
        Función evaluada en el valor mínimo X0.
    Xit:
      Vector de trayectorias de X..
    """
    
    x = x0
    xx = [x]
    
    while (np.linalg.norm(gradF(x))>tol):
        x = x - eta*gradF(x)
        xx.append(x)
        
    return F(x), np.asarray(xx)

# Caso I. Función de dos variables

Sea la función

\begin{equation}
  f\left(x_{1},x_{2}\right) = \left(x_{1} - 2\right)^{4} + x_{2}^{2}\left(x_{1} - 2\right)^{2} + \left(x_{2} + 1\right)^{2},
\end{equation}

encuentre los valores mínimos utilizando el método de Quasi-Newton.

In [None]:
x0 = np.array([7,8]) # Puntos iniciales

tol = 1e-2 # Tolerancia del algoritmo
eta = 1e-2

F = lambda x: (x[0] - 2)**4 + x[1]**2*(x[0] - 2)**2 + (x[1] + 1)**2
gradF = lambda x: np.array([4*(x[0] - 2)**3 + x[1]**2*(2*x[0] - 4),2*x[1] + 2*x[1]*(x[0] - 2)**2 + 2])

Fmin, xk = gradient_descent(x0, F, gradF, eta, tol)

## Graficación de resultados

In [None]:
xmin = -10 # coordenada mínima
xmax =  10 # coordenada máxima
dx = 0.5 # distancia entre coordenadas consecutivas

dom = np.arange(xmin,xmax,dx)
X,Y = np.meshgrid(dom,dom)
F = lambda x1,x2: (x1 - 2)**4 + x2**2*(x1 - 2)**2 + (x2 + 1)**2

In [None]:
fig, ax = plt.subplots(subplot_kw={"projection": "3d"}, figsize=(15,10))
surf = ax.plot_surface(X, Y, F(X,Y), cmap=cm.viridis,linewidth=0, antialiased=False)
plt.title('Función 3D + Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10))
contours = plt.contour(X, Y, F(X,Y), 10)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--k')
plt.title('Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10))
gradx,grady = np.gradient(F(X,Y),dx)
contours = plt.contourf(X,Y,F(X,Y), 10)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--w')
plt.quiver(X,Y,gradx,grady, color = 'red')
plt.title('Curvas de nivel + Campo vectorial')
plt.show()

In [None]:
x1 = np.linspace(min(xk[:,0]-0.5),max(xk[:,0]+0.5),30)
x2 = np.linspace(min(xk[:,1]-0.5),max(xk[:,1]+0.5),30)
X1,X2 = np.meshgrid(x1,x2)
Z = F(X1,X2)

plt.figure(figsize=(15,10))
plt.title('Óptimo en: '+str(xk[-1,:])+'\n en '+str(len(xk))+' iteraciones')
plt.contourf(X1,X2,Z,30,cmap='jet')
plt.colorbar()
plt.plot(xk[:,0],xk[:,1],'o--w')
plt.xlabel('$x_1$'); plt.ylabel('$x_2$')
plt.show()

In [None]:
iterations = np.arange(0,len(xk))

fig, axs = plt.subplots(2, figsize = (15,10))
fig.suptitle('Puntos')
axs[0].plot(iterations,xk[:,0],'o-b', label = '$x_{1_{min}} =$'+str(xk[-1,0]))
# axs[0].plot(iterations,xk[:,0],'o-b', label = '$x_{1_{min}} =$')
axs[0].grid('on')
axs[0].set_ylabel('$x_{1}$')
axs[0].legend()

axs[1].plot(iterations,xk[:,1],'o-b', label = '$x_{2_{min}} =$'+str(xk[-1,1]))
# axs[1].plot(iterations,xk[:,1],'o-b', label = '$x_{2_{min}} =$')
axs[1].grid('on')
axs[1].set_ylabel('$x_{2}$')
axs[1].set_xlabel('Iteraciones')
axs[1].legend()
plt.show()

# Caso II. Función Booth
La función Booth está definida por

\begin{equation}
 f\left(x_{1} , x_{2}\right) = \left(x_{1} + 2x_{2} − 7\right)^{2} + \left(2x_{1} + x_{2} − 5\right)^{2}.
\end{equation}

Utilice el método de Quasi-Newton para minimizar la función de Booth considerando que el espacio de búsqueda está dado por $x_{i} \in [-10,10] \forall i=1,2$. Además, considere como punto inicial

\begin{equation}
 x_{0} = \begin{bmatrix} 10 & 0 \end{bmatrix}^{T}.
\end{equation}

In [None]:
x0 = np.array([10,0]) # Puntos iniciales

tol = 1e-2 # Tolerancia del algoritmo
eta = 1e-2
    
# Función objetivo
F = lambda x: np.power((x[0] + 2*x[1] - 7),2) + np.power((2*x[0] + x[1] - 5),2)
gradF = lambda x: np.array([8*x[1] + 10*x[0] - 34,10*x[1] + 8*x[0] - 38])

Fmin, xk = gradient_descent(x0, F, gradF, eta, tol)

## Graficación de resultados

In [None]:
xmin = -10 # coordenada mínima
xmax =  10 # coordenada máxima
dx = 0.5 # distancia entre coordenadas consecutivas

dom = np.arange(xmin,xmax,dx)
X,Y = np.meshgrid(dom,dom)
F = lambda x1,x2:  (x1 + 2*x2 - 7)**2 + (2*x1 + x2 - 5)**2

In [None]:
fig, ax = plt.subplots(subplot_kw={"projection": "3d"}, figsize=(15,10))
surf = ax.plot_surface(X, Y, F(X,Y), cmap=cm.viridis,linewidth=0, antialiased=False)
plt.title('Función 3D + Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10));
contours = plt.contour(X, Y, F(X,Y), 10)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--k')
plt.title('Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10))
gradx,grady = np.gradient(F(X,Y),dx)
contours = plt.contourf(X,Y,F(X,Y), 10)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--w')
plt.quiver(X,Y,gradx,grady, color = 'red')
plt.title('Curvas de nivel + Campo vectorial')
plt.show()

In [None]:
x1 = np.linspace(min(xk[:,0]-0.5),max(xk[:,0]+0.5),30)
x2 = np.linspace(min(xk[:,1]-0.5),max(xk[:,1]+0.5),30)
X1,X2 = np.meshgrid(x1,x2)
Z = F(X1,X2)

plt.figure(figsize=(15,10))
plt.title('Óptimo en: '+str(xk[-1,:])+'\n en '+str(len(xk))+' iteraciones')
plt.contourf(X1,X2,Z,30,cmap='jet')
plt.colorbar()
plt.plot(xk[:,0],xk[:,1],'o--w')
plt.xlabel('$x_1$'); plt.ylabel('$x_2$')
plt.show()

In [None]:
iterations = np.arange(0,len(xk))
       
fig, axs = plt.subplots(2, figsize=(15,10))
fig.suptitle('Puntos')
axs[0].plot(iterations,xk[:,0],'o-b', label = '$x_{1_{min}} =$'+str(xk[-1,0]))
# axs[0].plot(iterations,xk[:,0],'o-b', label = '$x_{1_{min}} =$')
axs[0].grid('on')
axs[0].set_ylabel('$x_{1}$')
axs[0].legend()

axs[1].plot(iterations,xk[:,1],'o-b', label = '$x_{2_{min}} =$'+str(xk[-1,1]))
# axs[1].plot(iterations,xk[:,1],'o-b', label = '$x_{2_{min}} =$')
axs[1].grid('on')
axs[1].set_ylabel('$x_{2}$')
axs[1].set_xlabel('Iteraciones')
axs[1].legend()
plt.show()

# Caso III. Función de Matyas
La función de Matyas está definida por

\begin{equation}
 f\left(x_{1},x_{2}\right) = 0.26\left(x_{1}^{2} + x_{2}^{2}\right)- 0.48x_{1}x_{2}.
\end{equation}

Utilice el método de Quasi-Newton para minimizar la función de Matyas considerando que el espacio de búsqueda está dado por $x_{i} \in [-10,10] \forall i=1,2$. Además, considere como punto inicial

\begin{equation}
 x_{0} = \begin{bmatrix} 5 & -5 \end{bmatrix}^{T}.
\end{equation}

In [None]:
x0 = np.array([5,-5]) # Puntos iniciales
    
tol = 1e-2 # Tolerancia del algoritmo
eta = 1e-2
    
# Función objetivo
F = lambda x: 0.26*(x[0]**2+x[1]**2)-0.48*x[0]*x[1]
gradF = lambda x: np.array([-(12*x[1]-13*x[0])/25,
                                                           (13*x[1]-12*x[0])/25])

Fmin, xk = gradient_descent(x0, F, gradF, eta, tol)

## Graficación de resultados

In [None]:
xmin = -10 # coordenada mínima
xmax =  10 # coordenada máxima
dx = 0.5 # distancia entre coordenadas consecutivas

dom = np.arange(xmin,xmax,dx)
X,Y = np.meshgrid(dom,dom)
F = lambda x1,x2: (x1 - 2)**4 + x2**2*(x1 - 2)**2 + (x2 + 1)**2

In [None]:
fig, ax = plt.subplots(subplot_kw={"projection": "3d"}, figsize=(15,10))
surf = ax.plot_surface(X, Y, F(X,Y), cmap=cm.viridis,linewidth=0, antialiased=False)
plt.title('Función 3D + Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10));
contours = plt.contour(X, Y, F(X,Y), 10)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--k')
plt.title('Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10))
gradx,grady = np.gradient(F(X,Y),dx)
contours = plt.contourf(X,Y,F(X,Y), 10)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--w')
plt.quiver(X,Y,gradx,grady, color = 'red')
plt.title('Curvas de nivel + Campo vectorial')
plt.show()

In [None]:
x1 = np.linspace(min(xk[:,0]-0.5),max(xk[:,0]+0.5),30)
x2 = np.linspace(min(xk[:,1]-0.5),max(xk[:,1]+0.5),30)
X1,X2 = np.meshgrid(x1,x2)
Z = F(X1,X2)

plt.figure(figsize=(15,10))
plt.title('Óptimo en: '+str(xk[-1,:])+'\n en '+str(len(xk))+' iteraciones')
plt.contourf(X1,X2,Z,30,cmap='jet')
plt.colorbar()
plt.plot(xk[:,0],xk[:,1],'o--w')
plt.xlabel('$x_1$'); plt.ylabel('$x_2$')
plt.show()

In [None]:
iterations = np.arange(0,len(xk))
       
fig, axs = plt.subplots(2,figsize=(15,10))
fig.suptitle('Puntos')
axs[0].plot(iterations,xk[:,0],'o-b', label = '$x_{1_{min}} =$'+str(xk[-1,0]))
axs[0].grid('on')
axs[0].set_ylabel('$x_{1}$')
axs[0].legend(fontsize=18)

axs[1].plot(iterations,xk[:,1],'o-b', label = '$x_{2_{min}} =$'+str(xk[-1,1]))
axs[1].grid('on')
axs[1].set_ylabel('$x_{2}$')
axs[1].set_xlabel('Iteraciones')
axs[1].legend(fontsize=18)
plt.show()

# Caso IV. Función de Beale
La función de Beale está definida por

\begin{equation}
 f\left(x_{1},x_{2}\right) = \left(1.5 - x_{1} + x_{1}x_{2}\right)^{2} + \left(2.25 - x_{1} + x_{1}x_{2}^{2}\right)^{2} + \left(2.62 - x_{1} + x_{1}x_{2}^{3}\right)^{2}.
\end{equation}

Utilice el método de GD para minimizar la función de Beale considerando que el espacio de búsqueda está dado por $x_{i} \in [-4.5,4.5] \forall i=1,2$. Además, considere como punto inicial

\begin{equation}
 x_{0} = \begin{bmatrix} -3 & 3 \end{bmatrix}^{T}.
\end{equation}

# Caso V. Función de dos variables

Sea la función

\begin{equation}
  f\left(x_{1},x_{2}\right) = \left(x_{1}^2+x_{2}-11\right)^2 + \left(x_{1} + x_{2}^2-7\right)^2,
\end{equation}

encuentre los valores mínimos utilizando el algoritmo de GD.

In [None]:
x0 = np.array([-5,5]) # Puntos iniciales
    
tol = 1e-2 # Tolerancia del algoritmo
eta = 1e-3
    
# Función objetivo
F = lambda x: (x[0]**2+x[1]-11)**2 + (x[0] + x[1]**2-7)**2
gradF = lambda x: np.array([2*x[1]**2+4*x[0]*x[1]+4*x[0]**3-42*x[0]-14,
                                                         4*x[1]**3+(4*x[0]-26)*x[1]+2*x[0]**2-22])

Fmin, xk = gradient_descent(x0, F, gradF, eta, tol)

## Graficación de resultados

In [None]:
xmin = -10 # coordenada mínima
xmax =  10 # coordenada máxima
dx = 0.5 # distancia entre coordenadas consecutivas

dom = np.arange(xmin,xmax,dx)
X,Y = np.meshgrid(dom,dom)
F = lambda x1,x2: (x1**2+x2-11)**2 + (x1 + x2**2-7)**2

fig, ax = plt.subplots(subplot_kw={"projection": "3d"}, figsize=(15,10))
surf = ax.plot_surface(X, Y, F(X,Y), cmap=cm.viridis,linewidth=0, antialiased=False)
plt.title('Función 3D + Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10));
contours = plt.contour(X, Y, F(X,Y), 15)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--k')
plt.title('Curvas de nivel')
plt.show()

In [None]:
plt.figure(figsize=(15,10))
gradx,grady = np.gradient(F(X,Y),dx)
contours = plt.contourf(X,Y,F(X,Y), 15)
plt.clabel(contours, inline=True, fontsize=8)
plt.colorbar()
plt.plot(xk[:,0], xk[:,1],'o--w')
plt.quiver(X,Y,gradx,grady, color = 'red')
plt.title('Curvas de nivel + Campo vectorial')
plt.show()

In [None]:
x1 = np.linspace(min(xk[:,0]-0.5),max(xk[:,0]+0.5),30)
x2 = np.linspace(min(xk[:,1]-0.5),max(xk[:,1]+0.5),30)
X1,X2 = np.meshgrid(x1,x2)
Z = F(X1,X2)

plt.figure(figsize=(15,10))
plt.title('Óptimo en: '+str(xk[-1,:])+'\n en '+str(len(xk))+' iteraciones')
plt.contourf(X1,X2,Z,30,cmap='jet')
plt.colorbar()
plt.plot(xk[:,0],xk[:,1],'o--w')
plt.xlabel('$x_1$'); plt.ylabel('$x_2$')
plt.show()

In [None]:
iterations = np.arange(0,len(xk))
       
fig, axs = plt.subplots(2,figsize=(15,10))
fig.suptitle('Puntos')
axs[0].plot(iterations,xk[:,0],'o-b', label = '$x_{1_{min}} =$'+str(xk[-1,0]))
axs[0].grid('on')
axs[0].set_ylabel('$x_{1}$')
axs[0].legend(fontsize=18)

axs[1].plot(iterations,xk[:,1],'o-b', label = '$x_{2_{min}} =$'+str(xk[-1,1]))
axs[1].grid('on')
axs[1].set_ylabel('$x_{2}$')
axs[1].set_xlabel('Iteraciones')
axs[1].legend(fontsize=18)
plt.show()

# Referencias
[1] [6.12].

[2] Ernesto, R. W., Ernesto, L. G., Rafael, B., & Yolanda, G. G. (2016). Perfiles de comportamiento numérico de los métodos de búsqueda immune network algorithm y bacterial foraging optimization algorithm en funciones benchmark. *Ingeniería, investigación y tecnología*, 17(4), 479-490.

