В данном коде использовался метод градиентного спуска с обратным шагом (backtracking line search). 

Градиентный спуск - это метод оптимизации, который итеративно находит минимум функции, двигаясь в направлении противоположном градиенту функции в текущей точке. Backtracking line search является алгоритмом поиска оптимального размера шага для градиентного спуска.

Алгоритм backtracking line search включает в себя следующие шаги:

1. Инициализация начального размера шага (learning rate) `alpha`, параметра уменьшения шага `tau` (0 < `tau` < 1) и коэффициента условия остановки `c` (0 < `c` < 1).

2. Вычисление градиента функции в текущей точке. В данном коде градиент вычисляется с помощью функции `partial_derivatives`, которая возвращает список частных производных функции Розенброка.

3. Проверка условия остановки. Пока условие не выполняется, выполняются следующие действия:

   - Вычисление нового размера шага, умножая текущий размер шага `alpha` на параметр `tau` (уменьшение шага).
   
   - Вычисление новой точки, перемещаясь в направлении противоположном градиенту с использованием нового размера шага. В данном коде новая точка вычисляется как `point[0] + alpha * direction[0]` и `point[1] + alpha * direction[1]`.
   
   - Вычисление значения функции в новой точке и сравнение с оценкой, используя условие для проверки обратного шага. Если условие не выполняется, уменьшаем размер шага и повторяем процесс.

4. Когда условие остановки выполнено (т.е. новая точка удовлетворяет условию обратного шага), размер шага `alpha` считается оптимальным для данной итерации.

5. Возвращение оптимального размера шага `alpha`.

В данном коде функция `backtracking_line_search` реализует алгоритм обратного шага, принимая текущую точку, текущий размер шага `alpha`, параметр `tau`, коэффициент условия остановки `c` и направление `direction`. Она итеративно изменяет размер шага `alpha` и возвращает оптимальный размер шага для данной итерации.

Этот алгоритм позволяет адаптивно выбирать размер шага для градиентного спуска, обеспечивая сходимость к оптимальному решению.

In [3]:
import time

# Функция Розенброка
def rosenbrock_function(point):
    x1 = point[0]
    x2 = point[1]
    return 100*(x2**2 - 2*x2*x1**2 + x1**4) + (1 - x2)**2

# Частные производные функции Розенброка
def partial_derivatives(point, positive_sign):
    x1 = point[0]
    x2 = point[1]
    if positive_sign == 1:
        return [400*x1**3 - 400*x1*x2, 202*x2 - 200*x1**2 - 2]
    return [-400*x1**3 + 400*x1*x2, -202*x2 + 200*x1**2 + 2]

# Квадрат модуля вектора
def magnitude_squared(vector):
    return vector[0]**2 + vector[1]**2

# Метод обратного отслеживания линии
def backtracking_line_search(point, alpha, tau, c, direction):
    gradient = partial_derivatives(point, 1)
    while rosenbrock_function([point[0] + alpha*direction[0], point[1] + alpha*direction[1]]) > rosenbrock_function(point) + c*alpha*(gradient[0]*direction[0] + gradient[1]*direction[1]):
        alpha = tau*alpha
    return alpha

# Инициализация
point = [1.8, 1.8]  # Начальная точка
direction = partial_derivatives(point, -1)  # Инициализация направления
initial_direction = direction
c = 0.5  # Коэффициенты метода обратного отслеживания линии
alpha = 0.5
tau = 0.5
tolerance = 1E-8  # Пороговое значение для критерия останова
iteration = 0  # Счетчик итераций

# Оптимизационный цикл
print("Начало оптимизации...")
start_time = time.time()
while magnitude_squared(direction)/magnitude_squared(initial_direction) > tolerance:
    direction = partial_derivatives(point, -1)
    print(f"Итерация {iteration}: x1 = {point[0]:.4f}, x2 = {point[1]:.4f}, f(x) = {rosenbrock_function(point):.4f}")
    alpha = backtracking_line_search(point, alpha, tau, c, partial_derivatives(point, -1))
    point[0] = point[0] + alpha*direction[0]
    point[1] = point[1] + alpha*direction[1]
    iteration += 1
print(f"Оптимизация завершена за {time.time() - start_time:.4f} секунд, {iteration} итераций.")


Начало оптимизации...
Итерация 0: x1 = 1.8000, x2 = 1.8000, f(x) = 208.0000
Итерация 1: x1 = 1.5469, x2 = 1.8699, f(x) = 28.0992
Итерация 2: x1 = 1.4679, x2 = 1.8950, f(x) = 7.5432
Итерация 3: x1 = 1.4307, x2 = 1.9073, f(x) = 2.7699
Итерация 4: x1 = 1.4112, x2 = 1.9136, f(x) = 1.4394
Итерация 5: x1 = 1.4005, x2 = 1.9170, f(x) = 1.0369
Итерация 6: x1 = 1.3944, x2 = 1.9187, f(x) = 0.9098
Итерация 7: x1 = 1.3909, x2 = 1.9195, f(x) = 0.8683
Итерация 8: x1 = 1.3889, x2 = 1.9198, f(x) = 0.8543
Итерация 9: x1 = 1.3876, x2 = 1.9198, f(x) = 0.8493
Итерация 10: x1 = 1.3868, x2 = 1.9196, f(x) = 0.8471
Итерация 11: x1 = 1.3863, x2 = 1.9194, f(x) = 0.8459
Итерация 12: x1 = 1.3860, x2 = 1.9190, f(x) = 0.8450
Итерация 13: x1 = 1.3857, x2 = 1.9187, f(x) = 0.8442
Итерация 14: x1 = 1.3855, x2 = 1.9183, f(x) = 0.8435
Итерация 15: x1 = 1.3853, x2 = 1.9179, f(x) = 0.8427
Итерация 16: x1 = 1.3852, x2 = 1.9175, f(x) = 0.8420
Итерация 17: x1 = 1.3850, x2 = 1.9171, f(x) = 0.8413
Итерация 18: x1 = 1.3849, x2 = 