# <center>Лабораторная работа 2.</center>
## <center>Многомерная безусловная оптимизация</center>

*Автор материала: к.т.н., доцент кафедры Фундаметальной информатики и оптимального управления ВолГУ Михаил Алексеевич Харитонов*

**Цель работы:** Приобретение практических навыков реализации методов поиска безусловного экстремума в языке Python с использованием Jupyter Notebook.

**Задание:** Заполните ответ в клетках (где написано "Ваш код здесь" или "Ваш ответ здесь"), ответьте на вопросы.



# Часть 1 Python

## 1.1 Метод нулевого порядка (метод Хука-Дживса)


**Шаг 1.** Задать начальную точку $x^0$,число $\varepsilon >0$ для остановки алгоритма, начальные величины шагов по координатным направлениям $\Delta_1,\ldots, \Delta_n>\varepsilon$, ускоряющий множитель       $\lambda>0$, коэффициент уменьшения шага $\alpha > 1$. Положить $y^1=x^0$, $i=1$, $k=0$.

**Шаг 2.** Осуществить исследующий поиск по выбранному координатному направлению:

  a) если  $f(y^i+\Delta_i d_i)<f(y^i)$, шаг считается удачным. В этом случае следует положить $y^{i+1}=y^i+\Delta_i d_i$ и перейти к шагу 3.

  b) если в п. a шаг неудачен, то делается шаг в противоположном направлении. Если $f(y^i-\Delta_i d_i)<f(y^i)$, шаг считается удачным. В этом случае следует положить  $y^{i+1}=y^i-\Delta_i d_i$ и перейти  к шагу 3.

  c) если в пп. a и b шаги неудачны, положить $y^{i+1}=y^i$.

**Шаг 3.** Проверить условия:

  a) если $i<n$, то положить $i=i+1$ и перейти к шагу 2 (продолжить исследующий поиск по оставшимся направлениям);
  b) если $i=n$, проверить успешность исследующего поиска:

   - если $f(y^{n+1})<f(x^k)$, перейти к шагу 4.

   - если $f(y^{n+1})\geq f(x^k)$, перейти к шагу 5.

**Шаг 4.** Провести поиск по образцу. Положить $x^{k+1}=y^{n+1}$, $y^1=x^{k+1}+\lambda(x^{k+1}-x^{k}),i=1,k=k+1$ и перейти к шагу 2.

**Шаг 5.** Проверить условие окончания:

  a) если все $\Delta_i\leq\varepsilon_i$, то поиск закончить: $x^* \cong x^k$.

  b) для тех $i$, для которых $\Delta_i>\varepsilon_i$, уменьшить величину шага: $\Delta_i=\frac{\Delta_i}{\alpha}$ .
            Подожить $y^1=x^k$, $x^{k+1}=x^k$, $k=k+1, i=1$ и перейти к шагу 2.


### Задание 1.1

1) Напишите функцию реализующую алгоритм поиска минимима функции методом метод Хужа-Дживса.  
2) С помощью функции найдите минимальное значение функции $$f_1(x)=x_1^3-x_1x_2+x^2_2-2x_1+3x_2-4.$$
3) С помощью функции найдите минимальное значение функции Розенброка $$f_2(x)=(1-x_1)^{2}+100(x_2-x_1^{2})^{2}.$$

4) С помощью функции найдите максимум функции $$f_3(x)=\frac{10}{30(x_2-x_1^2)^2+5(1.5+x_1)^2+1}.$$

5)  С помощью функции найдите минимальное значение функции  $$f_4(x)=x_1^2+5x_2^2+3x_3^2+4x_1x_2-2x_2x_3-2x_1x_3.$$

In [64]:
import numpy as np

def hooke_jeeves(f, x0, epsilon, deltas, lam, alpha, maximize=False):
    """
    Алгоритм Хука-Дживса для оптимизации.

    Параметры:
    f         : функция для оптимизации.
    x0        : начальная точка (вектор).
    epsilon   : точность остановки алгоритма.
    deltas    : начальные величины шагов по координатным направлениям (вектор).
    lam       : ускоряющий множитель.
    alpha     : коэффициент уменьшения шага.
    maximize  : логический флаг, True для максимизации (по умолчанию False).
    
    Возвращает:
    x_star    : найденная точка минимума/максимума.
    """
    # Если задача на максимум, инвертируем функцию (поиск минимума для -f)
    if maximize:
        func = lambda x: -f(x)
    else:
        func = f

    x_k = np.array(x0)
    n = len(x0)
    k = 0

    while True:
        # Шаг 1: инициализация
        y_i = np.array(x_k)
        i = 0

        # Шаг 2: исследующий поиск
        while i < n:
            direction = np.zeros(n)
            direction[i] = 1

            # а) Шаг в положительном направлении
            if func(y_i + deltas[i] * direction) < func(y_i):
                y_i = y_i + deltas[i] * direction
            # б) Шаг в отрицательном направлении
            elif func(y_i - deltas[i] * direction) < func(y_i):
                y_i = y_i - deltas[i] * direction
            # в) Оставить точку неизменной, если шаги неудачны
            i += 1

        # Шаг 3: проверка успешности поиска
        if func(y_i) < func(x_k):
            # Шаг 4: поиск по образцу
            x_next = y_i
            y_i = x_next + lam * (x_next - x_k)
            x_k = x_next
        else:
            # Шаг 5: проверка завершения
            if all(delta <= epsilon for delta in deltas):
                return (x_k, -func(x_k) if maximize else func(x_k))  # Условие окончания
            # Уменьшение шага
            deltas = deltas / alpha
            y_i = x_k

In [65]:
def f1(x):
    x1, x2 = x
    return x1**3 - x1*x2 + x2**2 - 2*x1 + 3*x2 - 4

# Параметры
x0 = [1, 1]  # Начальная точка
epsilon = 1e-6
deltas = np.array([0.5, 0.5])
lam = 2
alpha = 2

# Запуск алгоритма
result, f_value = hooke_jeeves(f1, x0, epsilon, deltas, lam, alpha)
print("Минимум f1 найден в точке:", result)
print("Значение функции f1 в минимуме:", f_value)

Минимум f1 найден в точке: [ 0.5  -1.25]
Значение функции f1 в минимуме: -6.4375


In [66]:
def f2(x):
    x1, x2 = x
    return (1 - x1)**2 + 100 * (x2 - x1**2)**2

# Параметры
x0 = [-1.5, 1.5]  # Начальная точка
epsilon = 1e-6
deltas = np.array([0.5, 0.5])
lam = 2
alpha = 2

# Запуск алгоритма
result, f_value = hooke_jeeves(f2, x0, epsilon, deltas, lam, alpha)
print("Минимум f2 найден в точке:", result)
print("Значение функции f2 в минимуме:", f_value)

Минимум f2 найден в точке: [0.99980164 0.99960327]
Значение функции f2 в минимуме: 3.934853360699521e-08


In [67]:
def f3(x):
    x1, x2 = x
    return 10 / (30 * (x2 - x1**2)**2 + 5 * (1.5 + x1)**2 + 1)

# Параметры
x0 = [0, 0]  # Начальная точка
epsilon = 1e-6
deltas = np.array([0.5, 0.5])
lam = 2
alpha = 2

# Запуск алгоритма
result, f_value = hooke_jeeves(f3, x0, epsilon, deltas, lam, alpha, maximize=True)
print("Максимум f3 найден в точке:", result)
print("Значение функции f3 в максимуме:", f_value)

Максимум f3 найден в точке: [-1.49997425  2.24992275]
Значение функции f3 в максимуме: 9.999999966848918


In [69]:
def f4(x):
    x1, x2, x3 = x
    return x1**2 + 5*x2**2 + 3*x3**2 + 4*x1*x2 - 2*x2*x3 - 2*x1*x3

# Параметры
x0 = [1, 1, 1]  # Начальная точка
epsilon = 1e-6
deltas = np.array([0.5, 0.5, 0.5])
lam = 2
alpha = 2

# Запуск алгоритма
result, f_value = hooke_jeeves(f4, x0, epsilon, deltas, lam, alpha)
print("Минимум f4 найден в точке:", result)
print("Значение функции f4 в минимуме:", f_value)

Минимум f4 найден в точке: [0. 0. 0.]
Значение функции f4 в минимуме: 0.0


## 1.2 Метод первого порядка (метод градиентного спуска с постоянным шагом)

**Шаг 1.** Задать $x^0$, $0<\varepsilon < 1$, $\varepsilon_1 >0$, $\varepsilon_2>0$, $M$ предельное число итераций.
Найти градиент функции в произвольной точке $\nabla f(x)=\left ( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n}\right)^T$

**Шаг 2.** Положить $k=0$.

**Шаг 3.** Вычислить $\nabla f\left(x^k\right)$.

**Шаг 4.** Проверить выполнение критерия окончания $\left\|\nabla f\left(x^k\right)\right\|<\varepsilon_1$:

  - если критерий выполнен, расчет закончен, x^*=~x^k$;
  - если критерий не выполнен, то перейти к шагу 5.


**Шаг 5.** Проверить выполнение неравенства $k\ge M$:

  - если неравенство выполнено, то расчет окончен:  $x^*=~x^k$;
  - если нет, то перейти к шагу 6.

**Шаг 6.**  Задать величину шага $t_k$.

**Шаг 7.**  Вычислить $x^{k+1}=~x^k-~t_k~\nabla f\left(x^k\right)$.

**Шаг 8.**  Проверить выполнение условия $f\left(x^{k+1}\right)-f\left(x^k\right)<0$ (или $f\left(x^{k+1}\right)-f\left(x^k\right)<-\varepsilon \left\|\nabla f(x^k)\right\|^2$):

  - если условие выполнено, то перейти к шагу 9;
  - если условие не выполнено, положить $t^k=~\frac{t^k}{2}$ и перейти к шагу 7.


**Шаг 9.** Проверить выполнение условий
$\|x^{k+1}-~x^k\|<\varepsilon_2$, $\left\|{f(x}^{k+1})-~f(x^k)\right\|<\varepsilon_2$

   - если оба условия выполнены при текущем значении $k$ и $k=~k-1$, то расчет окончен, $x^*=~x^{k+1}$;
   - если хотя бы одно из условий не выполнено, положить $k=~k+1$ и перейти к шагу 3.



### Задание 1.2

1) Напишите функцию реализующую алгоритм поиска минимима функции методом

    a) градиентного спуска с постоянным шагом. 

    б) наискорейшего градиентного спуска, т.е. $t_k = \arg \min\limits_{t_k} f (x^k-t_k\nabla f(x^k))$.
    
    в) [тяжелого шарика Поляка](http://mech.math.msu.su/~vvb/MasterAI/GradientDescent.html), т.е. $x^{k+1}=x^k−t_k\nabla f(x^k)+\beta (x^k−x^{k−1}), 0 < \beta < 1$.
    
    г) [градиентного спуска Нестерова](http://mech.math.msu.su/~vvb/MasterAI/GradientDescent.html), т.е.    
    $x^{k+1}=x^k−t_k\nabla f(y^k)$, $y^{k+1}=x^{k+1}+\beta(x^{k+1}−x^k)$,  $0 < \beta < 1$.
    
2) Сравните результаты методов и количество итераций для функций $f_i(x)$, $i=\overline{1,4}$ из задания 1.1.

**Бонусные баллы**
 - за собственную функцию вычисления $\nabla f(x^k)$.
 - проверку методов на [тестовых функциях](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D0%B5_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D0%B8_%D0%B4%D0%BB%D1%8F_%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8).

In [None]:
# Ваш код здесь

# 1.3 Метод второго порядка (метод Ньютона)

**Шаг 1.** Задать $M, \varepsilon_1>0,  \varepsilon_2>0$ и точку начального приближения $x_0$;

**Шаг 2.** Положить $k=0$.

**Шаг 3.** Вычислить $\nabla f(x_k)$.

**Шаг 4.** Проверить выполнение критерия окончания $||\nabla f(x_k)||\leq \varepsilon _1$:

   - если неравествно выполнено, то расчет окончен и $x^*=x^k$;
   - в противном случае перейти к шагу 5.


**Шаг 5.** Проверить выполнение неравенства $k\geq M$:

   - если неравествно выполнено, то расчет окончен и $x^*=x^k$;
   - в противном случае перейти к шагу 6.

**Шаг 6.** Вычислить матрицу $H(x^k)$.

**Шаг 7.** Вычислить матрицу $H^{-1}(x^k)$.

**Шаг 8.** Проверить выполнение условия $H^{-1}(x^k)>0$:

   - если $H^{-1}(x_k)>0$, то перейти к шагу 9;
   - иначе перейти к шагу 10, положив $d^k=-\nabla f(x^k)$.

**Шаг 9.** Определить $d^k=-H^{-1}(x^k)\nabla f(x^k)$.

**Шаг 10.** Найти точку $x^{k+1}=x^k+t_kd^k$, положив $t_k=1$, если $d^k=-H^{-1}(x^k)\nabla f(x^k)$, или выбрав $t_k$ из условия $f(x^{k+1})<f(x^k)$, если $d^k=-\nabla f(x^k)$.

**Шаг 11.** Проверить выполнение условий $||x^{k+1}-x^k||<\varepsilon_1, |f(x^{k+1})-f(x^k)|<\varepsilon_2$:
   - если оба условия выполнены при текущем значение $k$ и $k=k-1$, то расчёт окончен, $x^*=x^{k+1}$;
   - в противном случае положить $k=k+1$ и перейти к шагу 3.



### Задание 1.3

1) Напишите функцию реализующую алгоритм поиска минимима функции методом Ньютона.  
2) С помощью функции найдите минимальное значение функции $$f_1(x)=x_1^3-x_1x_2+x^2_2-2x_1+3x_2-4.$$
3) С помощью функции найдите минимальное значение функции Розенброка $$f_2(x)=(1-x_1)^{2}+100(x_2-x_1^{2})^{2}.$$

4) С помощью функции найдите максимум функции $$f_3(x)=\frac{10}{30(x_2-x_1^2)^2+5(1.5+x_1)^2+1}.$$

5)  С помощью функции найдите минимальное значение функции  $$f_4(x)=x_1^2+5x_2^2+3x_3^2+4x_1x_2-2x_2x_3-2x_1x_3.$$

**Бонусные баллы**
 - за собственную функцию вычисления $H(x^k)$.
 - проверку методов на [тестовых функциях](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D0%B5_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D0%B8_%D0%B4%D0%BB%D1%8F_%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8).

In [None]:
# Ваш код здесь

##Задание 1.4

1) Выбрать функцию поиска минимума из библиотеки SciPy 
 - опишите все входные и выходные параметры функции, типы данных параметров и методы оптимизации, которые применяются в функции
 - С помощью функции найдите минимальное значение функции $$f_1(x)=x_1^3-x_1x_2+x^2_2-2x_1+3x_2-4.$$
 - С помощью функции найдите минимальное значение функции Розенброка $$f_2(x)=(1-x_1)^{2}+100(x_2-x_1^{2})^{2}.$$

 - С помощью функции найдите максимум функции $$f_3(x)=\frac{10}{30(x_2-x_1^2)^2+5(1.5+x_1)^2+1}.$$

 - С помощью функции найдите минимальное значение функции  $$f_4(x)=x_1^2+5x_2^2+3x_3^2+4x_1x_2-2x_2x_3-2x_1x_3.$$

2) Сравнить результаты п. 1 с результами выполнения заданий 1.1, 1.2, 1.3. Ответ обосновать.

Ваш ответ здесь. 

In [None]:
# Ваш код здесь

# Часть 2 Решение задач


1. Найти и классифицировать матрицу Гессе функции $f\left(x\right)=x_{1}^{2} -x_{2}^{2} $
2.   Найти и классифицировать матрицу Гессе функции $f\left(x\right)=x_{1}^{2} -4x_{1} x_{2}$ 
3.  Методом первого порядка решить задачу $$f(x)=4(x_1-5)^2+(x_2-6)^2\to \min, x^0=(8,9)^T, \varepsilon_1=\varepsilon_2=0.1.$$
4.   Методом первого порядка решить задачу $$f(x)=-x_1x_2e^{-x_1-x_2}\to \min, x^0=(0,1)^T, \varepsilon_1=\varepsilon_2=0.1.$$
5.   Методом второго порядка решить задачу $$f(x)=x_1^2+x_1x_2+2x_2\to \min.$$
6.   Методом первого порядка решить задачу $$f(x)=-x_1x_2e^{-x_1-x_2}\to \min, x^0=(0,1)^T, \varepsilon_1=\varepsilon_2=0.1.$$
7.   Методом второго порядка решить задачу $$f(x)=x_1^2+3x_1x_2+2x_2\to \min.$$

8.   Разделить положительное  число на две части так, чтобы произведение произведения этих частей на их разность было максимальным.
9.   На плоскости даны три точки: $x_1$, $x_2$, $x_3$. Найти такую точку $x_0$, чтобы сумма квадратов расстояний от $x_0$ до $x_1$, $x_2$, $x_3$ была минимальной.
10. Найти безусловный экстремум функции $f(x)=4x^2_1+3x^2_2-4x_1x_2+x_1$.
11. Проверить, является ли точка $x^*=(0,0,0)^T$ точкой безусловного экстремума функции $f(x)=x^2_1+2x^2_2-3x^2_3-6x_1x_2+8x_1x_3-4x_2x_3$.
12. Проверить, является ли точка $x^*=(1,1)^T$ точкой безусловного экстремума функции $f(x)=(x_2-x_1^2)^2+(1-x_1)^2+10(x^2-1)^2$.




#Часть 3 Теоретический минимум 

## Теоретический минимум по методам оптимизации

1.   В чем заключается задача многомерной безусловной оптимизации?
2.   Какие условия называются необходимыми и достаточными условиями безусловного экстремума функции?
3.   Что такое точка глобального минимума функции?
4.   Что такое точка локального минимума функции?
5.   Какая функция называется выпуклой?
6.  Что такое матрица Гессе?
7.   В чем заключаются принципы построения численных методов поиска безусловного экстремума?
8.   Чем характеризуется порядок методов поиска безусловного экстремума?
9.   Какой порядок имеет метод градиентного спуска с постоянным шагом?
10.  Какой порядок имеет метод наискорейшего градиентного спуска?
11.  Какой порядок имеет метод Гаусса-Зейделя?
12.  Перечислите методы второго порядка для поиска безусловного экстремума функции нескольких переменных?
13.  Какой порядок имеет метод Ньютона?
14. Что такое градиент?
15.  Какой вид имеет общее правило построения последовательности  ${x^k}$ ? (все переменные пояснить)
16.  Каким свойством должны обладать точки последовательности  ${x^k}$ ?
17.  Какому условию должно удовлетворять направление спуска  $d^k$  при решении задачи безусловной минимизации?
18. Перечислите критерии останова
19. Опишите модельную схему решения задач безусловной минимизации
20. В чем преимущества метода Ньютона?
21. Перечислите недостатки метода Ньютона?
22. В чем заключается дополнительное исследование точки $x^k$, полученной методом градиентного спуска с постоянным шагом?
23. В чем заключается дополнительное исследование точки $x^k$, полученной методомнаискорейшего градиентного спуска?


## Теоретический минимум python

1. Опишите реализацию градиента в python
2. Как реализована матрица вторых производных в python?
3. Опишите реализацию критериев останова?
4. Какими свойствами обладают методы из функции, которую Вы выбрали?
5. Как проводилось дополнительное исследование точки $x^k$ в python, полученной методомнаискорейшего градиентного спуска?
