# <center>Лабораторная работа 2.</center>
## <center>Многомерная безусловная оптимизация</center>

*Автор материала: к.т.н., доцент кафедры Фундаметальной информатики и оптимального управления ВолГУ Михаил Алексеевич Харитонов*

**Цель работы:** Приобретение практических навыков реализации методов поиска безусловного экстремума в языке Python с использованием Jupyter Notebook.

**Задание:** Заполните ответ в клетках (где написано "Ваш код здесь" или "Ваш ответ здесь"), ответьте на вопросы.



# Часть 1 Python

## 1.1 Метод нулевого порядка (метод Хука-Дживса)


**Шаг 1.** Задать начальную точку $x^0$,число $\varepsilon >0$ для остановки алгоритма, начальные величины шагов по координатным направлениям $\Delta_1,\ldots, \Delta_n>\varepsilon$, ускоряющий множитель       $\lambda>0$, коэффициент уменьшения шага $\alpha > 1$. Положить $y^1=x^0$, $i=1$, $k=0$.

**Шаг 2.** Осуществить исследующий поиск по выбранному координатному направлению:

  a) если  $f(y^i+\Delta_i d_i)<f(y^i)$, шаг считается удачным. В этом случае следует положить $y^{i+1}=y^i+\Delta_i d_i$ и перейти к шагу 3.

  b) если в п. a шаг неудачен, то делается шаг в противоположном направлении. Если $f(y^i-\Delta_i d_i)<f(y^i)$, шаг считается удачным. В этом случае следует положить  $y^{i+1}=y^i-\Delta_i d_i$ и перейти  к шагу 3.

  c) если в пп. a и b шаги неудачны, положить $y^{i+1}=y^i$.

**Шаг 3.** Проверить условия:

  a) если $i<n$, то положить $i=i+1$ и перейти к шагу 2 (продолжить исследующий поиск по оставшимся направлениям);
  b) если $i=n$, проверить успешность исследующего поиска:

   - если $f(y^{n+1})<f(x^k)$, перейти к шагу 4.

   - если $f(y^{n+1})\geq f(x^k)$, перейти к шагу 5.

**Шаг 4.** Провести поиск по образцу. Положить $x^{k+1}=y^{n+1}$, $y^1=x^{k+1}+\lambda(x^{k+1}-x^{k}),i=1,k=k+1$ и перейти к шагу 2.

**Шаг 5.** Проверить условие окончания:

  a) если все $\Delta_i\leq\varepsilon_i$, то поиск закончить: $x^* \cong x^k$.

  b) для тех $i$, для которых $\Delta_i>\varepsilon_i$, уменьшить величину шага: $\Delta_i=\frac{\Delta_i}{\alpha}$ .
            Подожить $y^1=x^k$, $x^{k+1}=x^k$, $k=k+1, i=1$ и перейти к шагу 2.


### Задание 1.1

1) Напишите функцию реализующую алгоритм поиска минимима функции методом метод Хужа-Дживса.  
2) С помощью функции найдите минимальное значение функции $$f_1(x)=x_1^3-x_1x_2+x^2_2-2x_1+3x_2-4.$$
3) С помощью функции найдите минимальное значение функции Розенброка $$f_2(x)=(1-x_1)^{2}+100(x_2-x_1^{2})^{2}.$$

4) С помощью функции найдите максимум функции $$f_3(x)=\frac{10}{30(x_2-x_1^2)^2+5(1.5+x_1)^2+1}.$$

5)  С помощью функции найдите минимальное значение функции  $$f_4(x)=x_1^2+5x_2^2+3x_3^2+4x_1x_2-2x_2x_3-2x_1x_3.$$

In [10]:
import numpy as np

def hooke_jeeves(func, init_point, epsilon=1e-6, step_sizes=None, delta=2.0, alpha=2.0, max_iterations=10000):
    """
    Реализация метода Хука-Дживса для многомерной оптимизации.

    Параметры:
        func (callable): Оптимизируемая функция.
        init_point (array-like): Начальная точка поиска минимума.
        epsilon (float): Точность, при которой поиск прекращается.
        step_sizes (array-like): Начальные шаги для каждого измерения. Если None, устанавливается 0.5 для всех измерений.
        delta (float): Коэффициент масштабирования при движении в направлении уменьшения функции.
        alpha (float): Коэффициент уменьшения шага, если прогресса нет.
        max_iterations (int): Максимальное число итераций алгоритма.

    Возвращает:
        tuple: Точка минимума, значение функции в этой точке, количество выполненных итераций.
    """
    if step_sizes is None:
        step_sizes = np.full_like(init_point, 0.5)  # Устанавливаем шаги по умолчанию

    current_point = np.array(init_point, dtype=float)  # Текущая точка оптимизации
    iter_count = 0

    while iter_count < max_iterations:
        exploratory_point = np.array(current_point)  # Точка для исследования
        
        for i in range(len(current_point)):
            trial_point_plus = exploratory_point.copy()
            trial_point_plus[i] += step_sizes[i]  # Пробуем шаг вперёд
            
            if func(trial_point_plus) < func(exploratory_point):
                exploratory_point[i] += step_sizes[i]  # Если улучшение, сохраняем шаг
            else:
                trial_point_minus = exploratory_point.copy()
                trial_point_minus[i] -= step_sizes[i]  # Пробуем шаг назад
                if func(trial_point_minus) < func(exploratory_point):
                    exploratory_point[i] -= step_sizes[i]  # Если улучшение, сохраняем шаг назад

        if func(exploratory_point) < func(current_point):
            search_direction = exploratory_point - current_point  # Направление движения
            new_point = exploratory_point + delta * search_direction  # Новый базисный шаг
            
            if func(new_point) < func(exploratory_point):
                current_point = new_point  # Принятие нового базиса
            else:
                current_point = exploratory_point
        else:
            step_sizes /= alpha  # Уменьшаем шаги
            if np.all(step_sizes <= epsilon):
                break  # Условие завершения
        
        iter_count += 1

    return current_point, func(current_point), iter_count


In [11]:
def f1(x):
    return x[0] ** 3 - x[0] * x[1] + x[1] ** 2 - 2 * x[0] + 3 * x[1] - 4

init_point_f1 = np.array([3.0, -2.0])
minimum_f1, min_value_f1, iterations_f1 = hooke_jeeves(f1, init_point_f1)

print("Результаты для функции f1:")
print(f"Точка минимума: x = {minimum_f1}")
print(f"Значение функции в точке минимума: f(x) = {min_value_f1}")
print(f"Количество итераций: {iterations_f1}\n")

Результаты для функции f1:
Точка минимума: x = [ 0.5  -1.25]
Значение функции в точке минимума: f(x) = -6.4375
Количество итераций: 22



In [12]:
def f2(x):
    """Функция Розенброка"""
    return (1 - x[0]) ** 2 + 100 * (x[1] - x[0] ** 2) ** 2

init_point_f2 = np.array([-1.2, 1.0])
minimum_f2, min_value_f2, iterations_f2 = hooke_jeeves(f2, init_point_f2)

print("Результаты для функции Розенброка f2:")
print(f"Точка минимума: x = {minimum_f2}")
print(f"Значение функции в точке минимума: f(x) = {min_value_f2}")
print(f"Количество итераций: {iterations_f2}\n")

Результаты для функции Розенброка f2:
Точка минимума: x = [0.9996727  0.99934578]
Значение функции в точке минимума: f(x) = 1.0713348767187923e-07
Количество итераций: 2129



In [13]:
def f3(x):
    return 10 / (30 * (x[1] - x[0] ** 2) ** 2 + 5 * (1.5 + x[0]) ** 2 + 1)

def neg_f3(x):
    """Отрицательная версия функции f3"""
    return -f3(x)

init_point_f3 = np.array([0.0, 0.0])
maximum_f3_point, neg_max_value_f3, iterations_f3 = hooke_jeeves(neg_f3, init_point_f3)
maximum_f3_value = f3(maximum_f3_point)

print("Результаты для функции f3 (максимум):")
print(f"Точка максимума: x = {maximum_f3_point}")
print(f"Значение функции в точке максимума: f(x) = {maximum_f3_value}")
print(f"Количество итераций: {iterations_f3}\n")

Результаты для функции f3 (максимум):
Точка максимума: x = [-1.4999485  2.2498455]
Значение функции в точке максимума: f(x) = 9.999999867395672
Количество итераций: 653



In [14]:
def f4(x):
    return x[0] ** 2 + 5 * x[1] ** 2 + 3 * x[2] ** 2 + 4 * x[0] * x[1] - 2 * x[1] * x[2] - 2 * x[0] * x[2]

init_point_f4 = np.array([0.0, 0.0, 0.0])
minimum_f4, min_value_f4, iterations_f4 = hooke_jeeves(f4, init_point_f4)

print("Результаты для функции f4:")
print(f"Точка минимума: x = {minimum_f4}")
print(f"Значение функции в точке минимума: f(x) = {min_value_f4}")
print(f"Количество итераций: {iterations_f4}")

Результаты для функции f4:
Точка минимума: x = [0. 0. 0.]
Значение функции в точке минимума: f(x) = 0.0
Количество итераций: 18


## 1.2 Метод первого порядка (метод градиентного спуска с постоянным шагом)

**Шаг 1.** Задать $x^0$, $0<\varepsilon < 1$, $\varepsilon_1 >0$, $\varepsilon_2>0$, $M$ предельное число итераций.
Найти градиент функции в произвольной точке $\nabla f(x)=\left ( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n}\right)^T$

**Шаг 2.** Положить $k=0$.

**Шаг 3.** Вычислить $\nabla f\left(x^k\right)$.

**Шаг 4.** Проверить выполнение критерия окончания $\left\|\nabla f\left(x^k\right)\right\|<\varepsilon_1$:

  - если критерий выполнен, расчет закончен, $x^*=~x^k$;
  - если критерий не выполнен, то перейти к шагу 5.


**Шаг 5.** Проверить выполнение неравенства $k\ge M$:

  - если неравенство выполнено, то расчет окончен:  $x^*=~x^k$;
  - если нет, то перейти к шагу 6.

**Шаг 6.**  Задать величину шага $t_k$.

**Шаг 7.**  Вычислить $x^{k+1}=~x^k-~t_k~\nabla f\left(x^k\right)$.

**Шаг 8.**  Проверить выполнение условия $f\left(x^{k+1}\right)-f\left(x^k\right)<0$ (или $f\left(x^{k+1}\right)-f\left(x^k\right)<-\varepsilon \left\|\nabla f(x^k)\right\|^2$):

  - если условие выполнено, то перейти к шагу 9;
  - если условие не выполнено, положить $t^k=~\frac{t^k}{2}$ и перейти к шагу 7.


**Шаг 9.** Проверить выполнение условий
$\|x^{k+1}-~x^k\|<\varepsilon_2$, $\left\|{f(x}^{k+1})-~f(x^k)\right\|<\varepsilon_2$

   - если оба условия выполнены при текущем значении $k$ и $k=~k-1$, то расчет окончен, $x^*=~x^{k+1}$;
   - если хотя бы одно из условий не выполнено, положить $k=~k+1$ и перейти к шагу 3.



### Задание 1.2

1) Напишите функцию реализующую алгоритм поиска минимима функции методом

    a) градиентного спуска с постоянным шагом. 

    б) наискорейшего градиентного спуска, т.е. $t_k = \arg \min\limits_{t_k} f (x^k-t_k\nabla f(x^k))$.
    
    в) [тяжелого шарика Поляка](http://mech.math.msu.su/~vvb/MasterAI/GradientDescent.html), т.е. $x^{k+1}=x^k−t_k\nabla f(x^k)+\beta (x^k−x^{k−1}), 0 < \beta < 1$.
    
    г) [градиентного спуска Нестерова](http://mech.math.msu.su/~vvb/MasterAI/GradientDescent.html), т.е.    
    $x^{k+1}=x^k−t_k\nabla f(y^k)$, $y^{k+1}=x^{k+1}+\beta(x^{k+1}−x^k)$,  $0 < \beta < 1$.
    
2) Сравните результаты методов и количество итераций для функций $f_i(x)$, $i=\overline{1,4}$ из задания 1.1.

**Бонусные баллы**
 - за собственную функцию вычисления $\nabla f(x^k)$.
 - проверку методов на [тестовых функциях](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D0%B5_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D0%B8_%D0%B4%D0%BB%D1%8F_%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8).

In [15]:
import numpy as np
from scipy.optimize import minimize_scalar
import math

def grad_func(f, x, h=1e-8):
    """
    Вычисляет градиент функции f в точке x.

    Параметры:
        f (callable): Функция, для которой вычисляется градиент.
        x (array-like): Точка, в которой вычисляется градиент.
        h (float): Малое значение для численного дифференцирования.

    Возвращает:
        numpy.ndarray: Вектор градиента функции f в точке x.
    """
    n = len(x)
    grad = np.zeros(n)
    for i in range(n):
        x_forward = np.copy(x)
        x_backward = np.copy(x)
        x_forward[i] += h
        x_backward[i] -= h
        grad[i] = (f(x_forward) - f(x_backward)) / (2 * h)
    return grad

In [16]:
def gradient_descent_const_step(func, init_point, step_size, epsilon1=1e-6, epsilon2=1e-6, max_iterations=100000):
    """
    Градиентный спуск с постоянным шагом.

    Параметры:
        func (callable): Оптимизируемая функция.
        init_point (array-like): Начальная точка.
        step_size (float): Постоянный шаг.
        epsilon1 (float): Точность по норме градиента.
        epsilon2 (float): Точность по изменению функции и точек.
        max_iterations (int): Максимальное количество итераций.

    Возвращает:
        tuple: Точка минимума, значение функции в этой точке, количество итераций.
    """
    current_point = np.array(init_point, dtype=float)
    iter_count = 0

    while iter_count < max_iterations:
        grad_current = grad_func(func, current_point)  # Градиент в текущей точке
        norm_grad_current = np.linalg.norm(grad_current)  # Норма градиента
        if norm_grad_current < epsilon1:
            break

        next_point = current_point - step_size * grad_current  # Шаг метода

        if func(next_point) - func(current_point) >= 0:  # Проверка на уменьшение функции
            step_size /= 2
            continue

        if (np.linalg.norm(next_point - current_point) < epsilon2 and
                abs(func(next_point) - func(current_point)) < epsilon2 and iter_count > 0):
            current_point = next_point
            break

        current_point = next_point
        iter_count += 1

    return current_point, func(current_point), iter_count

In [25]:
def phi(t, func, current_point, grad_current):
    return func(current_point - t * grad_current)  # Функция для нахождения оптимального шага

def gradient_descent_optimal_step(func, init_point, epsilon1=1e-6, epsilon2=1e-6, max_iterations=10000):
    """
    Градиентный спуск с оптимальным шагом.

    Параметры:
        func (callable): Оптимизируемая функция.
        init_point (array-like): Начальная точка.
        epsilon1 (float): Точность по норме градиента.
        epsilon2 (float): Точность по изменению функции и точек.
        max_iterations (int): Максимальное количество итераций.

    Возвращает:
        tuple: Точка минимума, значение функции в этой точке, количество итераций.
    """
    current_point = np.array(init_point, dtype=float)
    iter_count = 0

    while iter_count < max_iterations:
        grad_current = grad_func(func, current_point)  # Градиент в текущей точке
        norm_grad_current = np.linalg.norm(grad_current)  # Норма градиента
        if norm_grad_current < epsilon1:
            break

        res = minimize_scalar(lambda t: phi(t, func, current_point, grad_current))  # Минимизируем phi(t)
        current_step_size = res.x

        next_point = current_point - current_step_size * grad_current  # Шаг метода

        if (np.linalg.norm(next_point - current_point) < epsilon2 and
                abs(func(next_point) - func(current_point)) < epsilon2 and iter_count > 0):
            current_point = next_point
            break

        current_point = next_point
        iter_count += 1

    return current_point, func(current_point), iter_count

In [18]:
def gradient_descent_heavy_ball(func, init_point, step_size, beta, epsilon1=1e-6, epsilon2=1e-6, max_iterations=100000):
    """
    Метод тяжелого шарика Поляка для минимизации функции.

    Параметры:
        func (callable): Оптимизируемая функция.
        init_point (array-like): Начальная точка.
        step_size (float): Постоянный шаг градиентного спуска.
        beta (float): Коэффициент инерции (от 0 до 1).
        epsilon1 (float): Точность для нормы градиента.
        epsilon2 (float): Точность для разности между итерациями.
        max_iterations (int): Максимальное число итераций.

    Возвращает:
        tuple: Точка минимума, значение функции в этой точке, количество итераций.
    """
    current_point = np.array(init_point, dtype=float)
    prev_point = current_point.copy()
    iter_count = 0

    while iter_count < max_iterations:
        grad_current = grad_func(func, current_point)
        norm_grad_current = np.linalg.norm(grad_current)

        if norm_grad_current < epsilon1:
            break

        if iter_count == 0:
            next_point = current_point - step_size * grad_current
        else:
            next_point = current_point - step_size * grad_current + beta * (current_point - prev_point)

        if (np.linalg.norm(next_point - current_point) < epsilon2 and
                np.abs(func(next_point) - func(current_point)) < epsilon2):
            current_point = next_point
            break

        prev_point = current_point
        current_point = next_point
        iter_count += 1

    return current_point, func(current_point), iter_count

In [19]:
def gradient_descent_nesterov(func, init_point, step_size, beta, epsilon1=1e-6, epsilon2=1e-6, max_iterations=100000):
    """
    Градиентный спуск Нестерова для минимизации функции.

    Параметры:
        func (callable): Оптимизируемая функция.
        init_point (array-like): Начальная точка.
        step_size (float): Постоянный шаг градиентного спуска.
        beta (float): Коэффициент инерции (от 0 до 1).
        epsilon1 (float): Точность для нормы градиента.
        epsilon2 (float): Точность для разности между итерациями.
        max_iterations (int): Максимальное число итераций.

    Возвращает:
        tuple: Точка минимума, значение функции в этой точке, количество итераций.
    """
    current_point = np.array(init_point, dtype=float)
    current_func_res = current_point.copy()
    iter_count = 0

    while iter_count < max_iterations:
        grad_fy = grad_func(func, current_func_res)
        norm_grad_fy = np.linalg.norm(grad_fy)

        if norm_grad_fy < epsilon1:
            break

        next_point = current_func_res - step_size * grad_fy
        next_func_res = next_point + beta * (next_point - current_point)

        if (np.linalg.norm(next_point - current_point) < epsilon2 and
                np.abs(func(next_point) - func(current_point)) < epsilon2):
            current_point = next_point
            break

        current_point = next_point
        current_func_res = next_func_res
        iter_count += 1

    return current_point, func(current_point), iter_count

In [26]:
def f1(x):
    return x[0] ** 3 - x[0] * x[1] + x[1] ** 2 - 2 * x[0] + 3 * x[1] - 4

def f2(x):
    """Функция Розенброка"""
    return (1 - x[0]) ** 2 + 100 * (x[1] - x[0] ** 2) ** 2

def f3(x):
    return 10 / (30 * (x[1] - x[0] ** 2) ** 2 + 5 * (1.5 + x[0]) ** 2 + 1)

def neg_f3(x):
    return -f3(x)

def f4(x):
    return x[0] ** 2 + 5 * x[1] ** 2 + 3 * x[2] ** 2 + 4 * x[0] * x[1] - 2 * x[1] * x[2] - 2 * x[0] * x[2]


def f5(x):
    """Функция Матьяса.
    min f(0,0) = 0
    -10 <= x,y <= 10"""
    return 0.26 * (x[0]**2 + x[1]**2) - 0.48 * x[0] * x[1]

initial_points = {
    'f1': np.array([0.0, 0.0]),
    'f2': np.array([0.0, 0.0]),
    'f3': np.array([1.0, 1.0]),
    'f4': np.array([0.0, 1.0, 1.0]),
    'f5': np.array([3.0, 7.0])
}

functions = {
    'f1': f1,
    'f2': f2,
    'f3': neg_f3,
    'f4': f4,
    'f5': f5
}

step_const = 0.0001
step_heavy_ball = 0.0001
step_nesterov = 0.0001
momentum_heavy_ball = 0.9
momentum_nesterov = 0.9

for name, func in functions.items():
    print(f"\n{name}:")
    init_point = initial_points[name]

    xmin, fmin, iters = gradient_descent_const_step(func, init_point, step_const)
    print(f"Градиентный спуск с постоянным шагом:")
    print(f"Точка минимума: x = {xmin}")
    print(f"Значение функции в точке минимума: f(x) = {fmin}")
    print(f"Количество итераций: {iters}\n")

    xmin_opt, fmin_opt, iters_opt = gradient_descent_optimal_step(func, init_point)
    print(f"\nГрадиентный спуск с оптимальным шагом:")
    print(f"Точка минимума: x = {xmin_opt}")
    print(f"Значение функции в точке минимума: f(x) = {fmin_opt}")
    print(f"Количество итераций: {iters_opt}\n")

    xmin_hb, fmin_hb, iters_hb = gradient_descent_heavy_ball(func, init_point, step_heavy_ball, momentum_heavy_ball)
    print(f"\nМетод тяжелого шарика Поляка:")
    print(f"Точка минимума: x = {xmin_hb}")
    print(f"Значение функции в точке минимума: f(x) = {fmin_hb}")
    print(f"Количество итераций: {iters_hb}\n")

    xmin_nest, fmin_nest, iters_nest = gradient_descent_nesterov(func, init_point, step_nesterov, momentum_nesterov)
    print(f"\nГрадиентный спуск Нестерова:")
    print(f"Точка минимума: x = {xmin_nest}")
    print(f"Значение функции в точке минимума: f(x) = {fmin_nest}")
    print(f"Количество итераций: {iters_nest}\n")

    print("-" * 80)



f1:
Градиентный спуск с постоянным шагом:
Точка минимума: x = [ 0.50375889 -1.24383822]
Значение функции в точке минимума: f(x) = -6.437463946948725
Количество итераций: 33261


Градиентный спуск с оптимальным шагом:
Точка минимума: x = [ 0.50000011 -1.24999989]
Значение функции в точке минимума: f(x) = -6.437499999999982
Количество итераций: 14


Метод тяжелого шарика Поляка:
Точка минимума: x = [ 0.50037464 -1.24939306]
Значение функции в точке минимума: f(x) = -6.4374996484167575
Количество итераций: 4936


Градиентный спуск Нестерова:
Точка минимума: x = [ 0.50037507 -1.24939236]
Значение функции в точке минимума: f(x) = -6.437499647608557
Количество итераций: 4942

--------------------------------------------------------------------------------

f2:
Градиентный спуск с постоянным шагом:
Точка минимума: x = [0.98891929 0.97791673]
Значение функции в точке минимума: f(x) = 0.00012298134449828478
Количество итераций: 83152


Градиентный спуск с оптимальным шагом:
Точка минимума: x =

# 1.3 Метод второго порядка (метод Ньютона)

**Шаг 1.** Задать $M, \varepsilon_1>0,  \varepsilon_2>0$ и точку начального приближения $x_0$;

**Шаг 2.** Положить $k=0$.

**Шаг 3.** Вычислить $\nabla f(x_k)$.

**Шаг 4.** Проверить выполнение критерия окончания $||\nabla f(x_k)||\leq \varepsilon _1$:

   - если неравествно выполнено, то расчет окончен и $x^*=x^k$;
   - в противном случае перейти к шагу 5.


**Шаг 5.** Проверить выполнение неравенства $k\geq M$:

   - если неравествно выполнено, то расчет окончен и $x^*=x^k$;
   - в противном случае перейти к шагу 6.

**Шаг 6.** Вычислить матрицу $H(x^k)$.

**Шаг 7.** Вычислить матрицу $H^{-1}(x^k)$.

**Шаг 8.** Проверить выполнение условия $H^{-1}(x^k)>0$:

   - если $H^{-1}(x_k)>0$, то перейти к шагу 9;
   - иначе перейти к шагу 10, положив $d^k=-\nabla f(x^k)$.

**Шаг 9.** Определить $d^k=-H^{-1}(x^k)\nabla f(x^k)$.

**Шаг 10.** Найти точку $x^{k+1}=x^k+t_kd^k$, положив $t_k=1$, если $d^k=-H^{-1}(x^k)\nabla f(x^k)$, или выбрав $t_k$ из условия $f(x^{k+1})<f(x^k)$, если $d^k=-\nabla f(x^k)$.

**Шаг 11.** Проверить выполнение условий $||x^{k+1}-x^k||<\varepsilon_1, |f(x^{k+1})-f(x^k)|<\varepsilon_2$:
   - если оба условия выполнены при текущем значение $k$ и $k=k-1$, то расчёт окончен, $x^*=x^{k+1}$;
   - в противном случае положить $k=k+1$ и перейти к шагу 3.



### Задание 1.3

1) Напишите функцию реализующую алгоритм поиска минимима функции методом Ньютона.  
2) С помощью функции найдите минимальное значение функции $$f_1(x)=x_1^3-x_1x_2+x^2_2-2x_1+3x_2-4.$$
3) С помощью функции найдите минимальное значение функции Розенброка $$f_2(x)=(1-x_1)^{2}+100(x_2-x_1^{2})^{2}.$$

4) С помощью функции найдите максимум функции $$f_3(x)=\frac{10}{30(x_2-x_1^2)^2+5(1.5+x_1)^2+1}.$$

5)  С помощью функции найдите минимальное значение функции  $$f_4(x)=x_1^2+5x_2^2+3x_3^2+4x_1x_2-2x_2x_3-2x_1x_3.$$

**Бонусные баллы**
 - за собственную функцию вычисления $H(x^k)$.
 - проверку методов на [тестовых функциях](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D0%B5_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D0%B8_%D0%B4%D0%BB%D1%8F_%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8).

In [13]:
import numpy as np

def compute_hessian(func, point, h=1e-5):
    """Вычисление матрицы Гессе (вторых производных) функции в точке."""
    dim = len(point)
    hessian_matrix = np.zeros((dim, dim))
    for i in range(dim):
        for j in range(dim):
            point_ijp = np.array(point, copy=True)
            point_ijm = np.array(point, copy=True)
            point_ipj = np.array(point, copy=True)
            point_imj = np.array(point, copy=True)

            point_ijp[i] += h; point_ijp[j] += h
            point_ijm[i] += h; point_ijm[j] -= h
            point_ipj[i] -= h; point_ipj[j] += h
            point_imj[i] -= h; point_imj[j] -= h

            hessian_matrix[i, j] = (func(point_ijp) - func(point_ijm) - func(point_ipj) + func(point_imj)) / (4 * h**2)
    return hessian_matrix

In [14]:
def newton_method(func, init_point, epsilon=1e-6, epsilon1=1e-6, max_iterations=100):
    """Оптимизация функции методом Ньютона."""
    current_point = np.array(init_point, dtype=float)
    iteration = 0

    while iteration < max_iterations:
        gradient = grad_func(func, current_point)
        gradient_norm = np.linalg.norm(gradient)
        if gradient_norm <= epsilon:
            break

        hessian = compute_hessian(func, current_point)
        try:
            hessian_inverse = np.linalg.inv(hessian)
            search_direction = -np.dot(hessian_inverse, gradient)
        except np.linalg.LinAlgError:
            search_direction = -gradient

        next_point = current_point + search_direction

        if (np.linalg.norm(next_point - current_point) < epsilon1 and
                abs(func(next_point) - func(current_point)) < epsilon1 and iteration > 0):
            current_point = next_point
            break

        current_point = next_point
        iteration += 1

    return current_point, func(current_point), iteration

In [15]:
def f1(x):
    return x[0] ** 3 - x[0] * x[1] + x[1] ** 2 - 2 * x[0] + 3 * x[1] - 4

init_point = [1.0, 1.0]
min_point, min_value, iterations = newton_method(f1, init_point)
print("Результаты оптимизации для функции 1:")
print(f"Точка минимума: {min_point}")
print(f"Значение функции в минимуме: {min_value}")
print(f"Количество итераций: {iterations}\n")

Результаты оптимизации для функции 1:
Точка минимума: [ 0.50000014 -1.24999992]
Значение функции в минимуме: -6.437499999999975
Количество итераций: 4



In [16]:
def f2(x):
    """Функция Розенброка"""
    return (1 - x[0]) ** 2 + 100 * (x[1] - x[0] ** 2) ** 2

init_point = [-1.2, 1.0]
min_point, min_value, iterations = newton_method(f2, init_point)
print("Результаты оптимизации для функции Розенброка:")
print(f"Точка минимума: {min_point}")
print(f"Значение функции в минимуме: {min_value}")
print(f"Количество итераций: {iterations}\n")

Результаты оптимизации для функции Розенброка:
Точка минимума: [1. 1.]
Значение функции в минимуме: 1.963652286798773e-26
Количество итераций: 6



In [17]:
def f3(x):
    return 10 / (30 * (x[1] - x[0] ** 2) ** 2 + 5 * (1.5 + x[0]) ** 2 + 1)

def neg_f3(x):
    return -f3(x)

init_point = [-1.25, 2.25]
max_point, neg_max_value, iterations = newton_method(neg_f3, init_point)
max_value = -neg_max_value
print("Результаты оптимизации для функции 3:")
print(f"Точка максимума: {max_point}")
print(f"Значение функции в максимуме: {max_value}")
print(f"Количество итераций: {iterations}\n")

Результаты оптимизации для функции 3:
Точка максимума: [ -1.29243027 132.20837832]
Значение функции в максимуме: 1.956157361843369e-05
Количество итераций: 18



In [18]:
def f4(x):
    return x[0] ** 2 + 5 * x[1] ** 2 + 3 * x[2] ** 2 + 4 * x[0] * x[1] - 2 * x[1] * x[2] - 2 * x[0] * x[2]

init_point = [-1.0, -1.0, -1.0]
min_point, min_value, iterations = newton_method(f4, init_point)
print("Результаты оптимизации для функции 4:")
print(f"Точка минимума: {min_point}")
print(f"Значение функции в минимуме: {min_value}")
print(f"Количество итераций: {iterations}\n")

Результаты оптимизации для функции 4:
Точка минимума: [ 1.16036738e-16 -3.83638162e-17  2.38033199e-17]
Значение функции в минимуме: 1.0190354644066938e-33
Количество итераций: 2



In [19]:
def f5(x):
    """Функция Матьяса.
    min f(0,0) = 0
    -10 <= x,y <= 10"""
    return 0.26 * (x[0]**2 + x[1]**2) - 0.48 * x[0] * x[1]

init_point = [4.0, -7.0]
min_point, min_value, iterations = newton_method(f5, init_point)
print("Результаты оптимизации для функции 5:")
print(f"Точка минимума: {min_point}")
print(f"Значение функции в минимуме: {min_value}")
print(f"Количество итераций: {iterations}")

Результаты оптимизации для функции 5:
Точка минимума: [-1.64177482e-13 -1.55063462e-13]
Значение функции в минимуме: 1.0399141476101759e-27
Количество итераций: 2


##Задание 1.4

1) Выбрать функцию поиска минимума из библиотеки SciPy 
 - опишите все входные и выходные параметры функции, типы данных параметров и методы оптимизации, которые применяются в функции
 - С помощью функции найдите минимальное значение функции $$f_1(x)=x_1^3-x_1x_2+x^2_2-2x_1+3x_2-4.$$
 - С помощью функции найдите минимальное значение функции Розенброка $$f_2(x)=(1-x_1)^{2}+100(x_2-x_1^{2})^{2}.$$

 - С помощью функции найдите максимум функции $$f_3(x)=\frac{10}{30(x_2-x_1^2)^2+5(1.5+x_1)^2+1}.$$

 - С помощью функции найдите минимальное значение функции  $$f_4(x)=x_1^2+5x_2^2+3x_3^2+4x_1x_2-2x_2x_3-2x_1x_3.$$

2) Сравнить результаты п. 1 с результами выполнения заданий 1.1, 1.2, 1.3. Ответ обосновать.

Ваш ответ здесь. 

In [2]:
from scipy.optimize import minimize

def f1(x):
    return x[0] ** 3 - x[0] * x[1] + x[1] ** 2 - 2 * x[0] + 3 * x[1] - 4

def f2(x):
    """Функция Розенброка"""
    return (1 - x[0]) ** 2 + 100 * (x[1] - x[0] ** 2) ** 2

def f3(x):
    return 10 / (30 * (x[1] - x[0] ** 2) ** 2 + 5 * (1.5 + x[0]) ** 2 + 1)

def neg_f3(x):
    return -f3(x)

def f4(x):
    return x[0] ** 2 + 5 * x[1] ** 2 + 3 * x[2] ** 2 + 4 * x[0] * x[1] - 2 * x[1] * x[2] - 2 * x[0] * x[2]

def f5(x):
    """Функция Матьяса.
    min f(0,0) = 0
    -10 <= x,y <= 10"""
    return 0.26 * (x[0]**2 + x[1]**2) - 0.48 * x[0] * x[1]


init_point = [0, 0]
result = minimize(f1, init_point)
print("Результаты оптимизации для функции 1:")
print(f"Точка минимума: {result.x}")
print(f"Значение функции в минимуме: {result.fun}")
print(f"Количество итераций: {result.nit}\n")

init_point = [-1.2, 1.0]
result = minimize(f2, init_point)
print("Результаты оптимизации для функции Розенброка:")
print(f"Точка минимума: {result.x}")
print(f"Значение функции в минимуме: {result.fun}")
print(f"Количество итераций: {result.nit}\n")

init_point = [-1.25, 2.25]
result = minimize(neg_f3, init_point)
print("Результаты оптимизации для функции 3:")
print(f"Точка максимума: {result.x}")
print(f"Значение функции в максимуме: {-result.fun}")
print(f"Количество итераций: {result.nit}\n")

init_point = [-1.0, -1.0, -1.0]
result = minimize(f4, init_point)
print("Результаты оптимизации для функции 4:")
print(f"Точка минимума: {result.x}")
print(f"Значение функции в минимуме: {result.fun}")
print(f"Количество итераций: {result.nit}\n")

init_point = [4.0, -7.0]
result = minimize(f5, init_point)
print("Результаты оптимизации для функции 5:")
print(f"Точка минимума: {result.x}")
print(f"Значение функции в минимуме: {result.fun}")
print(f"Количество итераций: {result.nit}")

Результаты оптимизации для функции 1:
Точка минимума: [ 0.50000074 -1.24999965]
Значение функции в минимуме: -6.4374999999993125
Количество итераций: 6

Результаты оптимизации для функции Розенброка:
Точка минимума: [0.99999547 0.99999094]
Значение функции в минимуме: 2.0488413879144732e-11
Количество итераций: 32

Результаты оптимизации для функции 3:
Точка максимума: [-1.50000027  2.25000081]
Значение функции в максимуме: 9.99999999999625
Количество итераций: 8

Результаты оптимизации для функции 4:
Точка минимума: [ 4.23509510e-08  7.78936390e-09 -1.42209876e-09]
Значение функции в минимуме: 3.565197934580198e-15
Количество итераций: 7

Результаты оптимизации для функции 5:
Точка минимума: [-9.23407076e-07  1.13674029e-06]
Значение функции в минимуме: 1.061506907126265e-12
Количество итераций: 6


# Часть 2 Решение задач


1. Найти и классифицировать матрицу Гессе функции $f\left(x\right)=x_{1}^{2} -x_{2}^{2} $
2.   Найти и классифицировать матрицу Гессе функции $f\left(x\right)=x_{1}^{2} -4x_{1} x_{2}$ 
3.  Методом первого порядка решить задачу $$f(x)=4(x_1-5)^2+(x_2-6)^2\to \min, x^0=(8,9)^T, \varepsilon_1=\varepsilon_2=0.1.$$
4.   Методом первого порядка решить задачу $$f(x)=-x_1x_2e^{-x_1-x_2}\to \min, x^0=(0,1)^T, \varepsilon_1=\varepsilon_2=0.1.$$
5.   Методом второго порядка решить задачу $$f(x)=x_1^2+x_1x_2+2x_2\to \min.$$
6.   Методом первого порядка решить задачу $$f(x)=-x_1x_2e^{-x_1-x_2}\to \min, x^0=(0,1)^T, \varepsilon_1=\varepsilon_2=0.1.$$
7.   Методом второго порядка решить задачу $$f(x)=x_1^2+3x_1x_2+2x_2\to \min.$$

8.   Разделить положительное  число на две части так, чтобы произведение произведения этих частей на их разность было максимальным.
9.   На плоскости даны три точки: $x_1$, $x_2$, $x_3$. Найти такую точку $x_0$, чтобы сумма квадратов расстояний от $x_0$ до $x_1$, $x_2$, $x_3$ была минимальной.
10. Найти безусловный экстремум функции $f(x)=4x^2_1+3x^2_2-4x_1x_2+x_1$.
11. Проверить, является ли точка $x^*=(0,0,0)^T$ точкой безусловного экстремума функции $f(x)=x^2_1+2x^2_2-3x^2_3-6x_1x_2+8x_1x_3-4x_2x_3$.
12. Проверить, является ли точка $x^*=(1,1)^T$ точкой безусловного экстремума функции $f(x)=(x_2-x_1^2)^2+(1-x_1)^2+10(x^2-1)^2$.




#Часть 3 Теоретический минимум 

## Теоретический минимум по методам оптимизации

1.   В чем заключается задача многомерной безусловной оптимизации?
2.   Какие условия называются необходимыми и достаточными условиями безусловного экстремума функции?
3.   Что такое точка глобального минимума функции?
4.   Что такое точка локального минимума функции?
5.   Какая функция называется выпуклой?
6.  Что такое матрица Гессе?
7.   В чем заключаются принципы построения численных методов поиска безусловного экстремума?
8.   Чем характеризуется порядок методов поиска безусловного экстремума?
9.   Какой порядок имеет метод градиентного спуска с постоянным шагом?
10.  Какой порядок имеет метод наискорейшего градиентного спуска?
11.  Какой порядок имеет метод Гаусса-Зейделя?
12.  Перечислите методы второго порядка для поиска безусловного экстремума функции нескольких переменных?
13.  Какой порядок имеет метод Ньютона?
14. Что такое градиент?
15.  Какой вид имеет общее правило построения последовательности  ${x^k}$ ? (все переменные пояснить)
16.  Каким свойством должны обладать точки последовательности  ${x^k}$ ?
17.  Какому условию должно удовлетворять направление спуска  $d^k$  при решении задачи безусловной минимизации?
18. Перечислите критерии останова
19. Опишите модельную схему решения задач безусловной минимизации
20. В чем преимущества метода Ньютона?
21. Перечислите недостатки метода Ньютона?
22. В чем заключается дополнительное исследование точки $x^k$, полученной методом градиентного спуска с постоянным шагом?
23. В чем заключается дополнительное исследование точки $x^k$, полученной методомнаискорейшего градиентного спуска?


## Теоретический минимум python

1. Опишите реализацию градиента в python
2. Как реализована матрица вторых производных в python?
3. Опишите реализацию критериев останова?
4. Какими свойствами обладают методы из функции, которую Вы выбрали?
5. Как проводилось дополнительное исследование точки $x^k$ в python, полученной методомнаискорейшего градиентного спуска?
