L-BFGS

In [4]:
def grad_rosenbrock(x):
    """Градиент функции Розенброка"""
    return np.array([
        -400 * x[0] * (x[1] - x[0]**2) - 2 * (1 - x[0]),
        200 * (x[1] - x[0]**2)
    ])

In [5]:
from scipy.optimize import minimize
import numpy as np
def rosenbrock(x):
    """Функция Розенброка - тестовая функция для оптимизации"""
    return 100 * (x[1] - x[0]**2)**2 + (1 - x[0])**2
x0 = np.array([-1.5, 1.5])
result = minimize(rosenbrock, x0, method='L-BFGS-B', jac=grad_rosenbrock)
print(result.x)  # [1. 1.]

[0.99999932 0.99999863]


DFP (Davidon–Fletcher–Powell)

In [6]:
import numpy as np
from scipy.optimize import line_search

def dfp(f, grad_f, x0, max_iter=100, tol=1e-6):
    """
    Реализация метода DFP.

    Параметры:
    f - целевая функция
    grad_f - функция градиента
    x0 - начальная точка
    max_iter - максимальное число итераций
    tol - критерий остановки
    """
    n = len(x0)
    H = np.eye(n)  # Начальная аппроксимация обратного Гессиана
    x = x0.copy()
    grad = grad_f(x)
    history = {'x': [], 'f': [], 'grad_norm': []}

    for k in range(max_iter):
        history['x'].append(x.copy())
        history['f'].append(f(x))
        history['grad_norm'].append(np.linalg.norm(grad))

        # Критерий остановки
        if np.linalg.norm(grad) < tol:
            break

        # Направление спуска
        p = -H.dot(grad)

        # Линейный поиск шага
        alpha, _, _, new_f, new_grad, _ = line_search(f, grad_f, x, p, grad)
        if alpha is None:
            alpha = 0.1  # Fallback

        # Обновление точки
        s = alpha * p
        x_new = x + s
        y = new_grad - grad

        # Обновление матрицы H по формуле DFP
        Hy = H.dot(y)
        H = H + np.outer(s, s) / s.dot(y) - np.outer(Hy, Hy) / y.dot(Hy)

        x = x_new
        grad = new_grad

    return x, history

# Пример: Оптимизация функции Розенброка
def rosenbrock(x):
    return 100 * (x[1] - x[0]**2)**2 + (1 - x[0])**2

def grad_rosenbrock(x):
    return np.array([
        -400 * x[0] * (x[1] - x[0]**2) - 2 * (1 - x[0]),
        200 * (x[1] - x[0]**2)
    ])

x0 = np.array([-1.5, 1.5])
x_opt, history = dfp(rosenbrock, grad_rosenbrock, x0)

print(f"Найденный минимум: {x_opt}")
print(f"Значение функции: {rosenbrock(x_opt)}")

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

In [7]:
import matplotlib.pyplot as plt

plt.plot(history['f'], 'b-o')
plt.yscale('log')
plt.xlabel('Итерация')
plt.ylabel('Значение функции')
plt.title('Сходимость метода DFP')
plt.grid()
plt.show()

NameError: name 'history' is not defined