## Realizar el Descenso de Gradiente en Python

* Se utilizarán funciones $f(\textrm{X})$ definidas.  
* Se calculará el gradiente $\nabla{f(X_k)}$ de forma numérica.  

In [1]:
import numpy as np

#### Definimos las funciones de prueba

In [2]:
def Esfera(x):
    """
    f(x) = \\sum x_i^2
    """
    
    return np.sum(x**2)


def Rosenbrock(x):
    terminos = [
        100 * (x[i + 1] - x[i] ** 2) ** 2 + (1 - x[i]) ** 2
        for i in range(len(x) - 1)
    ]
    terminos = np.array(terminos)
    return np.sum(terminos)


def Beale(x):
    assert len(x) == 2, f"La función Beale es de dos variables, se introdujeron {len(x)}."
    (x1, x2) = x
    return (
        (1.5 - x1 + x1 * x2) ** 2
        + (2.25 - x1 + x1 * x2**2) ** 2
        + (2.625 - x1 + x1 * x2**3) ** 2
    )

#### Cálculo numérico del gradiente

In [3]:
def grad_f(x, f, h):
    """
    Input:
        f: Función.
        x: Punto a evaluar.
        h: Espaciamiento para el cálculo del gradiente.
        
    Output:
        grad: Valor del gradiente.
    """
    
    # Inicializa el gradiente
    grad = np.zeros(len(x))

    # Itera sobre cada componente
    for i in range(len(x)):
        # Copia de x
        x_i = np.copy(x)

        # Se suma el espaciamiento solo en la i-esima componente
        x_i[i] = x_i[i] + h
        
        # Se calcula la i-esima componente del gradiente
        grad[i] = (f(x_i) - f(x)) / h
    return grad

##### Descenso del gradiente

In [4]:
def descenso_gradiente(f, x, alfa, max_iter, epsilon, h):
    """
    Input:
        f: Función objetivo.
        x: Punto inicial x_0.
        alfa: Learning rate.
        max_iter: Número máximo de iteraciones.
        epsilon: Criterio de convergencia.
        h: Espaciamiento para el cálculo del gradiente.
        
    Output:
        x like: Punto solución aproximada.
    """
    
    
    # Inicializacion
    x_k = np.copy(x)
    convergencia = False

    for i in range(max_iter):
        # Actualiza la solucion
        p_k = -grad_f(x_k, f, h)
        x_k = x_k + alfa * p_k 
        
        # Evalua la convergencia
        convergencia = max(abs(p_k)) < epsilon
        if convergencia:
            print(f"La función {f.__name__} converge en la iteracion: {i}")
            break

    if not convergencia:
        print(f"No se cumplio la convergencia en {max_iter} iteraciones.")

    return x_k

#### Probando la función Esfera.

In [9]:
n = 4
x = np.array(n*[4], dtype=float)
alfa = 0.1
max_iter = 15_000
epsilon = 10e-4
h = 10e-6

xsol = descenso_gradiente(Esfera, x, alfa, max_iter, epsilon, h)

# Comparación con resultado real
solucion = np.array(n*[0], dtype=float)

print(f"Magnitud del vector error: {np.linalg.norm(xsol - solucion)}")

La función Esfera converge en la iteracion: 41
Magnitud del vector error: 0.0006705655845385165


#### Probando la función Rosenbrock.

In [6]:
n = 4
x = np.array(4*[2], dtype=float)
alfa = 0.001
max_iter = 15_000
epsilon = 10e-4
h = 10e-6

xsol = descenso_gradiente(Rosenbrock, x, alfa, max_iter, epsilon, h)

# Comparación con resultado real
solucion = np.array(n*[1], dtype=float)

print(f"Magnitud del vector error: {np.linalg.norm(xsol - solucion)}")

La función Rosenbrock converge en la iteracion: 12143
Magnitud del vector error: 0.0068657639510175585


#### Probando la función Beale

In [8]:
x = np.array([2, 2], dtype=float)
alfa = 0.001
max_iter = 15_000
epsilon = 10e-4
h = 10e-6

xsol = descenso_gradiente(Beale, x, alfa, max_iter, epsilon, h)

# Comparación con resultado real
solucion = np.array([3, 0.5], dtype=float)

print(f"Magnitud del vector error: {np.linalg.norm(xsol - solucion)}")

No se cumplio la convergencia en 15000 iteraciones.
Magnitud del vector error: 0.0039409225854905704
