---
title: "Лабораторна робота №3. Розв'язання задачі багатовимірної нелінійної  оптимізації"
description:
  Документ зроблено в [Quarto](https://quarto.org/)
author: "&copy; [Valeriy Sydorenko](https://www.linkedin.com/in/valeriy-sydorenko-6782279a/), Hryshchenko Illya, 2023"
date: "22.11.2023"
lang: ukr
format:
  html:
    code-fold: true
    toc: true # меню
    toc_float: # спливаюче меню  
      collapsed: true # авто
      number_sections: true
jupyter: python3
---

__Мета:__ _навчитися розв'язувати задачі одновимірної нелінійної безумовної та умовної оптимізації._

::: callout-note
## Примітка
Перед виконанням лабораторної роботи необхідно опрацювати матеріал лекції 3.
:::

## Що ви будете вміти?
* розв'язувати задачу багатовимірної нелінійної безумовної оптимізації у середовищі Python методами Ньютона, покоординатного та найскорішого спуску за допомогою функцій пакета SciPy.;
* розв'язувати задачу багатовимірної нелінійної умовної оптимізаціїу середовищі Python за допомогою функцій пакета SciPy.

::: callout-important
## Важливо

Повторити матеріал лаб. раб № 0 "Налаштування віртуального середовища `conda`".
:::

## Інсталяція SciPy

Інсталлювати пакет можна як по каналам `conda`, так і з ресурсу PyPi за допмогою менеджера пакетів `pip`. Для 
цього необхідно __активувати відповідне віртуальне середовище__ і в консолі виконати команду пошуку відповідного пакету:

`conda search scypi`

Якщо пакет буде знайдено, встановити потрібну версію. Для встановлення самої останньої версії потрібно виконати команду:

`conda install scipy`

Якщо ми хочемо встановити пакет за допмогою менеджера пакетів `pip`, потрібно виконати наступну команду

`pip install -U scipy`

## Прямі методи розв'язання задачі НЛП без обмежень

### Методо Ньютона

Для розв'язання задачі нелінійної багатовимірної оптимізації методом Ньютона можна використати бібліотеку `SciPy`. Нижче наведений приклад коду на Python, який це демонструє

### Приклад 1

$$f(x_1, x_2) = x_1^2 + x_2^2 \rightarrow min, x_1, x_2 \in R^2.$$  

In [16]:
import numpy as np
from scipy.optimize import minimize

# Визначення функції, яку необхідно оптимізувати
def objective_function(x):
    return x[0]**2 + x[1]**2

# Визначення похідних функції (градієнта та гессіана)
def gradient(x):
    return np.array([2*x[0], 2*x[1]])

def hessian(x):
    return np.array([[2, 0], [0, 2]])

# Початкова точка
x0 = np.array([1, 1])

# Виклик функції minimize з використанням методу Ньютона
result = minimize(objective_function, x0, method='Newton-CG', jac=gradient, hess=hessian)

# Виведення результату
print("Optimization Result:")
print("Minimum found at x =", result.x)
print("Objective function value at minimum =", result.fun)


Optimization Result:
Minimum found at x = [0. 0.]
Objective function value at minimum = 0.0


У цьому прикладі ми спочатку визначаємо функцію `objective_function`, яку необхідно оптимізувати. Далі ми визначаємо похідні цієї функції - градієнт та гессіан.

Потім ми вказуємо початкову точку `x0` і викликаємо функцію minimize з методом 'Newton-CG'. Ми передаємо функцію `objective_function`, градієнт та гессіан через аргументи `ja`c і `hess`. Результат оптимізації зберігається у змінній `result`.

На останок ми виводимо результат, який містить знайдену точку мінімуму `result.x` і значення функції в цій точці `result.fun`.

Будь ласка, зверніть увагу, що для використання методу Ньютона в бібліотеці SciPy необхідно мати градієнт та гессіан функції. 

### Метод найшвидшого спуску


### Приклад 2

В якості прикладу візьмемо задачу з попереднього прикладу.

In [15]:
import numpy as np
from scipy.optimize import minimize

# Визначення функції, яку необхідно оптимізувати
def objective_function(x):
    return x[0]**2 + x[1]**2

# Визначення похідних функції
def gradient(x):
    return np.array([2*x[0], 2*x[1]])

# Початкова точка
x0 = np.array([1, 1])

# Виклик функції minimize з використанням методу найшвидшого спуску (градієнтного спуску)
result = minimize(objective_function, x0, method='CG', jac=gradient)

# Виведення результату
print("Optimization Result:")
print("Minimum found at x =", result.x)
print("Objective function value at minimum =", result.fun)


Optimization Result:
Minimum found at x = [2.85822151e-09 2.85822151e-09]
Objective function value at minimum = 1.6338860400721932e-17


У цьому прикладі ми визначаємо функцію `objective_function`, яку необхідно оптимізувати, і функцію `gradient`, яка обчислює градієнт цієї функції.

Потім ми вказуємо початкову точку x0 і викликаємо функцію minimize з методом 'CG' (метод найшвидшого спуску). Ми передаємо функцію `objective_function` через аргумент `fun` і функцію `gradient` через аргумент `jac`, який вказує, що ми надаємо градієнт функції.

### Метод покоординатного спуску 

### Приклад 3

В якості прикладу візьмемо задачу з попереднього прикладу.

In [14]:
import numpy as np
from scipy.optimize import minimize

# Визначення функції, яку необхідно оптимізувати
def objective_function(x):
    return x[0]**2 + x[1]**2

# Початкова точка
x0 = np.array([1, 1])

# Виклик функції minimize з використанням методу поординатного спуску
result = minimize(objective_function, x0, method='COBYLA')

# Виведення результату
print("Optimization Result:")
print("Minimum found at x =", result.x)
print("Objective function value at minimum =", result.fun)


Optimization Result:
Minimum found at x = [ 2.96677426e-06 -6.83590156e-05]
Objective function value at minimum = 4.681756760285287e-09


У цьому прикладі ми визначаємо функцію `objective_function`, яку необхідно оптимізувати.

Потім ми вказуємо початкову точку `x0` і викликаємо функцію `minimize` з методом 'COBYLA' (метод покординатного спуску). Ми передаємо функцію `objective_function` через аргумент `fun`. Результат оптимізації зберігається у змінній `result`.

На останок ми виводимо результат, який містить знайдену точку мінімуму `result.x` і значення функції в цій точці `result.fun`.

## Прямі методи розв'язання задачі НЛП без обмежень

За допомогою функції `mininmize()` можна розв'язати і задачу умовної оптимізації. Нижче наведено приклад, який це демонструє.

### [Приклад 4](https://soumenatta.medium.com/nonlinear-optimization-made-easy-with-python-ca64c2826d83) 

$$f(x_0, x_1) = (x_0 - 3)^2 + (x_1 - 4)^2 \rightarrow min, x_1, x_2 \in R^2.$$  
$$x_0^2 + x_1^2 \le 10$$

In [19]:
from scipy.optimize import minimize

def objective(x):
    return (x[0] - 3)**2 + (x[1] - 4)**2

def constraint(x):
    return x[0]**2 + x[1]**2 - 10

x0 = [0, 0]

solution = minimize(objective, x0, constraints={'type': 'ineq', 'fun': constraint})

print(solution)


 message: Optimization terminated successfully
 success: True
  status: 0
     fun: 25.0
       x: [ 6.000e+00  8.000e+00]
     nit: 1
     jac: [-6.000e+00 -8.000e+00]
    nfev: 4
    njev: 1


Ось що означають різні поля вихідного повідомлення:

* `Optimization terminated successfully`: це означає, що алгоритм оптимізації знайшов рішення, яке задовольняє вказані обмеження, і оптимізував цільову функцію до її найкращого можливого значення.
* `success: True`: це означає, що оптимізація була успішною.
* `status: 0`: це код стану, який повертає розв’язувач. Код статусу `0` зазвичай означає, що оптимізація пройшла успішно.
* `fun: 25,0`: Це оптимізоване значення цільової функції при оптимальному розв’язанні.
* `x: [6.000e+00 8.000e+00]`: це оптимальне рішення, знайдене розв’язувачем. У цьому випадку оптимальними значеннями для змінних рішення є `x[0] = 6,0` і `x[1] = 8,0`.
* `nit: 1`: це кількість ітерацій, які виконує розв’язувач, щоб знайти оптимальний розв'язок.
* `jac: [-6.000e+00 -8.000e+00]`: це якобіан обмежень оптимального рішення.
* `nfev: 4`: це кількість разів, коли цільова функція була оцінена під час оптимізації.
* `njev: 1`: це кількість разів, коли якобіан оцінювався під час оптимізації.

## Завдання для самостіної роботи

1. Розглянути приклади 1-5, наведені вище у цьому зошиті.

1. Розв'язати задачу __одним з трьох методів__ (поділу навпіл, чисел Фібоначчі, золотого перетину) згідно з варіантом індивідуального завдання РГР.

Метод Ньютона:
Визначення матриці Гессе:
Матриця Гессе складається з других похідних функції. Знайдемо їх:
f''(x1) = 12
f''(x2) = 8
f''(x1, x2) = 2
Тоді матриця Гессе буде мати наступний вигляд:
H = [[f''(x1), f''(x1, x2)],
[f''(x1, x2), f''(x2)]]
= [[12, 2],
[2, 8]]

Початковий вектор:
X0 = [1, 2]

Ітераційна формула:
X(k+1) = X(k) - H^(-1) * ∇f(X(k))

Де ∇f(X(k)) - градієнт функції f(X(k)), а H^(-1) - обернена матриця Гессе.

Обчислення градієнта:
∇f(X) = [∂f/∂x1, ∂f/∂x2]
∂f/∂x1 = 12(2x1 - 1) + 2x1x2
= 24x1 - 12 + 2x1x2

∂f/∂x2 = 8(4x2 - 1) + x1^2
= 32x2 - 8 + x1^2

Підставимо значення x1 = 1, x2 = 2:
∇f(X0) = [24(1) - 12 + 2(1)(2), 32(2) - 8 + (1)^2]
= [24 - 12 + 4, 64 - 8 + 1]
= [16, 57]

Обчислення оберненої матриці Гессе:
H^(-1) = [[f''(x2)/(f''(x1)f''(x2) - f''(x1, x2)^2), -f''(x1, x2)/(f''(x1)f''(x2) - f''(x1, x2)^2)],
[-f''(x1, x2)/(f''(x1)f''(x2) - f''(x1, x2)^2), f''(x1)/(f''(x1)f''(x2) - f''(x1, x2)^2)]]
Підставимо значення:
H^(-1) = [[8/(128 - 2^2), -2/(128 - 2^2)],
[-2/(128 - 2^2), 12/(128 - 2^2)]]

Обчислимо:
H^(-1) = [[8/92, -2/92],
[-2/92, 12/92]]
= [[2/23, -1/23],
[-1/23, 3/23]]

Ітераційний процес:
Застосуємо ітераційну формулу з отриманими значеннями:
X(k+1) = X(k) - H^(-1) * ∇f(X(k))
Підставимо значення:
X1 = X0 - [[2/23, -1/23],
[-1/23, 3/23]] * [16, 57]

Обчислимо:
X1 = [1, 2] - [[2/23, -1/23],
[-1/23, 3/23]] * [16, 57]
= [1, 2] - [32/23 - (-57/23), (-16/23) + (171/23)]
= [1, 2] - [89/23, 155/23]
= [1, 2] - [3.8696, 6.7391]
= [-2.8696, -4.7391]

Перевірка критерію зупинки:
Обчислимо норму різниці між X1 і X0:
||X1 - X0|| = sqrt((-2.8696 - 1)^2 + (-4.7391 - 2)^2)
Обчислимо:
||X1 - X0|| = sqrt((-3.8696)^2 + (-6.7391)^2)
= sqrt(14.9849 + 45.3819)
= sqrt(60.3668)
≈ 7.774

Якщо ||X1 - X0|| > Eps (0.02), то повторюємо ітераційний процес, використовуючи X1 як нове X0.

Продовжуємо ітераційний процес до тих пір, поки не буде досягнута потрібна точність.

В даному випадку, оскільки ||X1 - X0|| = 7.774 > 0.02, потрібно повторити ітераційний процес, використовуючи X1 як нове X0, тобто X0 = [-2.8696, -4.7391].

3. Розв'язати задачу за допомогою функції `minimize()` пакета `SciPy`.

In [1]:
from scipy.optimize import minimize

# Функція цільової оптимізації
def objective(x):
    x1, x2 = x
    return 3*(2*x1 - 1)**2 + (4*x2 - 1)**2 + (x1**2)*x2

# Початковий вектор
x0 = [1, 2]

# Виклик функції minimize()
result = minimize(objective, x0, tol=0.02)

# Виведення результатів
print('Оптимальне значення цільової функції:', result.fun)
print('Значення змінних:')
print('x1 =', result.x[0])
print('x2 =', result.x[1])


Оптимальне значення цільової функції: 0.060324137624217844
Значення змінних:
x1 = 0.4901052021385537
x2 = 0.24249358170024674



4. Створити файл __mo_lab_3_StudentLastName.ipynb__ з написаним кодом. 

5. Відкомпілювати звіт у вигляді __mo_lab_3_StudentLastName.html__.

## Контрольні запитання

1. Чим відрізняють прямі і непрямі методи розв'язання задачі багатовимірної умовної нелінійної оптимізації?

Прямі методи оптимізації працюють без обчислення похідних, використовуючи лише значення функції. Непрямі методи використовують похідні функції для керування пошуком оптимального розв'язку.

2. Сформулюйте необхідну та достатню умови існування екстремуму функції багатьох змінних.

Необхідна умова існування екстремуму функції багатьох змінних полягає в наявності точки, в якій всі часткові похідні функції дорівнюють нулю або не існують. Ця умова називається умовою першого порядку.

Достатня умова існування екстремуму функції багатьох змінних може бути сформульована в різних формах залежно від контексту та типу екстремуму:

Якщо всі часткові похідні другого порядку функції є додатньо (або від'ємними) в точці, де часткові похідні першого порядку дорівнюють нулю, то це свідчить про наявність локального мінімуму (або максимуму). Ця умова називається умовою другого порядку або умовою Сильвестра.

Якщо гессіан (матриця часткових похідних другого порядку) функції є позитивно визначеним (або негативно визначеним) в точці, де часткові похідні першого порядку дорівнюють нулю, то це свідчить про наявність строгого локального мінімуму (або максимуму). Ця умова називається умовою Сильвестра-Гесса.

## References

1. [Anaconda (Python distribution)](https://uk.wikipedia.org/wiki/Anaconda_(Python_distribution)) 
1. [Conda](https://conda.io/en/latest/)  
1. [Научно-издательская система Quarto](https://data-visualization-blog.netlify.app/posts/quarto/)
1. [The Python Standard Library](https://docs.python.org/3/library/index.html)
1. [Callout Blocks. Markdown Syntax](https://quarto.org/docs/authoring/callouts.html)  
1. [Nonlinear Optimization Made Easy with Python](https://soumenatta.medium.com/nonlinear-optimization-made-easy-with-python-ca64c2826d83)