# Busca Linear e as condições de Wolfe

In [None]:
%matplotlib notebook

In [None]:
import numpy as np

Vamos analisar o que acontece na função de Rosenbrock:

In [None]:
def rosenbrock(x):
    return (1-x[0])**2+10*(x[1]-x[0]**2)**2

Agora, defina o raio da busca linear:

In [None]:
def phi(alpha, x, p, fun):
    return fun(x+alpha*p)

Observe:

In [None]:
def grad_rosenbrock(x):
    return np.asarray([2+2*x[0]-40*x[0]*(x[1]-x[0]**2), 20*(x[1]-x[0]**2)])

Partindo, por exemplo, do ponto $x=(0,1)$, temos:

In [None]:
x = np.asarray([0,1])

In [None]:
rosenbrock(x)

In [None]:
p = -grad_rosenbrock(x)

De fato, $p$ é uma direção de descida:

In [None]:
import numpy as np

print(np.dot(grad_rosenbrock(x), p))

Partindo de $\alpha=1$, temos: 

In [None]:
phi(1, x, p, rosenbrock)

Vamos ver $\phi$:

In [None]:
import matplotlib.pyplot as plt

alpha = np.linspace(0, 0.2, 100)
valores_phi = [phi(a, x, p, rosenbrock) for a in alpha]
plt.plot(alpha, valores_phi)

## Condições de Wolfe

In [None]:
from ipywidgets import interact

fig, ax = plt.subplots()
alpha = np.linspace(0, 0.1, 100)
valores_phi = [phi(a, x, p, rosenbrock) for a in alpha]
ax.plot(alpha, valores_phi)
ax.set_ylim(bottom=-10)
ax.legend(['Phi', 'Armijo', 'Curvatura'])

# Condição de Armijo:
def set_armijo(c_1):
    valores_armijo = [rosenbrock(x)+c_1*a*np.dot(grad_rosenbrock(x), p) for a in alpha]
    ax.plot(alpha, valores_armijo)
    plt.show()
    return ax

# Condição de Curvatura:
def set_curvatura(c_2):
    valores_curvatura = [0 if np.dot(grad_rosenbrock(x+a*p), p) >= c_2*np.dot(grad_rosenbrock(x), p) else -100 for a in alpha]
    ax.plot(alpha, valores_curvatura)
    plt.show()
    return ax

interact(set_armijo, c_1=(0, 1.0, 0.1))
interact(set_curvatura, c_2=(0, 1.0, 0.1))