#### Método del gradiente descendente

Sea $f:\mathbb{R} ^{ n} \to \mathbb{R}$ con primera derivada $Df: \mathbb{R} ^{ n} \to \mathbb{R} ^{ n} $. El siguiente método iterativo busca un minimizador local $\textbf{x} ^{*} $ de $f$.

$$\textbf{x}_{k+1} = \textbf{x}_{k} + \alpha_{k} \textbf{p}_{k} $$

Allí $\textbf{x} _{k } $ es la aproximación a $\textbf{x} ^{*} $, $\alpha _{k } $ es el tamaño del paso y $\textbf{p} _{k} $ es la dirección de búsqueda.  

El gradiente $\nabla f(\textbf{x})$ es un vector que apunta en la dirección de mayor crecimiento de $f$ en $\textbf{x}$, luego $-\nabla f(\textbf{x}) $ apunta en la dirección de mayor decrecimiento. Así se toma el proceso iterativo:

$$\textbf{x}_{k+1} = \textbf{x}_{k} - \alpha_{k} \nabla f(\textbf{x} _{k } )$$

In [2]:
import sympy as sy
x, y, z = sy.symbols('x y z')
f = (x-3)**2 + 4*(y+3)**2
# f = x**2 + 4*y**2
# f = (1-x)**2 + 10*(y-x**2)**2
alpha = 1
X0 = sy.Matrix([[10], [10]])
nabla_f = sy.Matrix([[f.diff(x)], 
                     [f.diff(y)]])
for _ in range(4):
    X1 = X0 - alpha * nabla_f.subs({x:X0[0], y:X0[1]})
    alpha = alpha / 2
    X0 = X1

print(X1)

Matrix([[3.00000000000000], [-3.00000000000000]])


In [3]:
import numpy as np
import sympy as sy
x, y, z = sy.symbols('x y z')
# f = x**2 + 4*y**2
f = (x-3)**2 + 4*(y+3)**2
# f = (1-x)**2 + 10*(y-x**2)**2 # función de Rosenbrock
alpha = 0.1
alphas = np.array([0.01 * k for k in range(100)])
X0 = sy.Matrix([[10], [10]])
nabla_f = sy.Matrix([[f.diff(x)], 
                     [f.diff(y)]])
for _ in range(10):
    X1 = X0 - alpha * nabla_f.subs({x:X0[0], y:X0[1]})
    h = lambda a:  X1 - a * nabla_f.subs({x:X1[0], y:X1[1]})
    fs = np.array([f.subs({x:h(a)[0], y:h(a)[1]}) for a in alphas]).astype(np.float16)
    alpha = np.argmin(fs) / 100
    X0 = X1

print(X1)

Matrix([[3.02409451520000], [-3.00319621120000]])
