# **Безусловные экстремумы. Функции нескольких переменных**

✍ Теперь, когда мы научились находить частные производные, можно перейти к поиску экстремумов (то есть минимумов и максимумов) для функций нескольких переменных.

Как мы помним из предыдущего модуля, нахождение экстремумов даёт возможность минимизировать функцию, так как в реальных задачах функционал ошибки может быть довольно сложным. Например, он может предстать в таком виде:

![](https://lms.skillfactory.ru/assets/courseware/v1/267ddb27f442169cd423a76033b7bb10/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_3_1.png)

Нам важно найти самую низкую точку (т. е. наименьшее значение функции), чтобы понять, при каких параметрах ошибка будет минимальной, а значит качество модели будет максимально возможным.

Так же, как и у функции одной переменной, у функции нескольких переменных могут быть локальные и глобальные минимумы и максимумы:

![](https://lms.skillfactory.ru/assets/courseware/v1/a0ee522dd9986580a580d451aea28ae3/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_3_2.png)



In [12]:
from sympy import Symbol, symbols, S, solveset, Eq, diff, limit, oo, sin, ln, simplify, exp
from sympy.calculus.util import function_range, continuous_domain

x = Symbol("x") 
f = -2*(x**3)-3*(x**2)+12*x-4
f_diff = f.diff(x)
solveset(Eq(f_diff, 0), x)

{-2, 1}

In [6]:
f_diff.subs(x, -3)

-24

In [7]:
f_diff.subs(x, 0)

12

In [8]:
f_diff.subs(x, 2)

-24

Рассмотрим алгоритм поиска минимумов и максимумов для функции нескольких переменных

![](data/11.PNG)

1. **На первом этапе необходимо найти частные производные этой функции:**

![](data/12.PNG)

2. **На втором этапе мы находим точки, в которых эти производные принимают нулевые значения:**

![](data/13.PNG)

Итак, мы получили точку (5;6) — это стационарная точка.

В этой точке может быть **максимум**,

![](https://lms.skillfactory.ru/assets/courseware/v1/b06738e86b19b36302a2db6e8499ea60/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_3_3.png)

**минимум**

![](https://lms.skillfactory.ru/assets/courseware/v1/ea8bcb2d9d24c6e17f90e38a1ef1c345/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_3_4.png)

или **седловая точка**, в которой производная меняет знак, но которая не является экстремумом:

![](https://lms.skillfactory.ru/assets/courseware/v1/04497fcd3a1391413082f00e210b9bee/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_3_5.png)

3. **Наконец, переходим к третьему шагу — определению того, чем будет являться стационарная точка.**

В одномерном случае нам удалось обойтись только первой производной для определения характера точек экстремума. Для функции двух переменных этого недостаточно — нам понадобится новый инструмент, **матрица Гессе**. Помимо оптимизации, она пригодится для определения характера выпуклости функции многих переменных.
***
* **Матрица Гессе** — это матрица вторых частных производных.
***

Матрица Гессе для функции двух переменных выглядит так:

![](https://lms.skillfactory.ru/assets/courseware/v1/2e04e33673463b6784b339c6c0d209ca/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_3_6.png)

Интересно, что, несмотря на большую важность матрицы Гессе как промежуточного итога в решениях задачи оптимизации, есть и отдельные области, где она применяется как самостоятельный инструмент. Например, она используется в финансовых вычислениях (в риск-менеджменте и для управления портфелями): c её помощью оценивают, насколько опцион подвержен риску. В вычислительной химии матрица Гессе используется для расчётов переходных состояний в химических реакциях.

Рассмотрим пример составления матрицы Гессе для нашей функции:

![](data/15.PNG)

Теперь нам необходимо вспомнить линейную алгебру, так как критерии для максимума и минимума следующие:

* Если матрица Гессе **положительно определена** в этой точке, то в ней находится **минимум**.
* Если матрица Гессе **отрицательно определена** в этой точке, то в ней находится **строгий максимум**.
* В иных случаях точка является седловой.
***
* Напомним, что для того, чтобы матрица была **положительно определённой**, необходимо, чтобы все её угловые миноры либо **все собственные значения были положительными**. А для того, чтобы матрица была **отрицательно определённой**, необходимо, чтобы знаки угловых миноров чередовались, начиная с отрицательного, либо чтобы **все собственные значения были отрицательными**.
***
В нашем случае знак первого углового минора положителен (его значение равно 2), как и знак второго углового минора (его значение равно 4). Оба собственных значения также положительны (оба равны 2). Это значит, что в данной точке находится минимум.

In [18]:
# Найдите матрицу Гессе для функции

x, y = symbols('x y') 
f = exp(x)+5*(y**3)*x
f_diff_xx = f.diff(x,2)
f_diff_xy = f.diff(x,y)
f_diff_yx = f.diff(y,x)
f_diff_yy = f.diff(y,2)
f_diff_xx

exp(x)

Пример № 1

![](data/16.PNG)

![](data/17.PNG)

![](data/18.PNG)

![](data/19.PNG)


Теперь можно, к примеру, выразить x из второй строки через y (или наоборот) и подставить результат в первую либо воспользоваться библиотекой SymPy для решения уравнений:

In [20]:
from sympy import *
 
x, y = symbols('x, y')
eq1 = Eq(3*x**2+3*y**2-15,0)
eq2 = Eq(6*x*y-12, 0)
 
sol = solve([eq1, eq2], [x, y])
sol

[(-2, -1), (-1, -2), (1, 2), (2, 1)]

В итоге получим четыре стационарные точки — . Для нас это нечто новое. Составим матрицу Гессе в общем виде, а затем будем подставлять каждую точку и определять, чем она является.

![](data/20.PNG)

In [24]:
import numpy as np

# создаем матрицу А
A = np.array([
    [-6, -12],
    [-12, -6]
])
# вычисляем собственные числа и собственные векторы
eig_values, eig_vectors = np.linalg.eig(A)
print('Собственные числа: \n', eig_values)

Собственные числа: 
 [  6. -18.]


Итак, мы научились решать задачу поиска безусловного экстремума функции нескольких переменных. Теперь вы сможете исследовать абсолютно любую функцию на максимумы и минимумы.
***
Также иногда мы можем определить, что минимум или максимум являются глобальными. Для этого необходимо помнить следующее:

* Если других экстремумов нет, то экстремум глобальный.
* Если Ef уходит в +oo, глобального максимума не будет.
* Если Ef уходит в -oo, глобального минимума не будет.
* У выпуклых функций локальный экстремум является глобальным.

***
### **ЗАДАЧИ**

In [35]:
# Найдите экстремумы функции 
from sympy import *
import numpy as np
x, y = symbols('x, y')
z = 4*(x**2)-6*x*y-34*x+5*(y**2)+42*y+7
# Находим частные производные
f_diff_x = z.diff(x)
f_diff_y = z.diff(y)
print(f_diff_x)
print(f_diff_y)
sol = solve([f_diff_x, f_diff_y], [x, y])
print(sol)
f_diff_xx = z.diff(x,2)
f_diff_xy = z.diff(x,y)
f_diff_yx = z.diff(y,x)
f_diff_yy = z.diff(y,2)
# создаем матрицу А
A = np.array([
    [f_diff_xx, f_diff_xy],
    [f_diff_yx, f_diff_yy]
]).astype(np.float64)
A
# вычисляем собственные числа и собственные векторы
eig_values, eig_vectors = np.linalg.eig(A)
print('Собственные числа: \n', eig_values)

8*x - 6*y - 34
-6*x + 10*y + 42
{x: 2, y: -3}
Собственные числа: 
 [ 2.91723747 15.08276253]


In [50]:
# Вычислите матрицу Гессе для функции в точке (1,2) и найдите её определитель

x, y = symbols('x, y')
z = x**3-2*x*y-y**6

f_diff_xx = z.diff(x,2).subs([(x,1),(y,2)])
f_diff_xy = z.diff(x,y).subs([(x,1),(y,2)])
f_diff_yx = z.diff(y,x).subs([(x,1),(y,2)])
f_diff_yy = z.diff(y,2).subs([(x,1),(y,2)])
# создаем матрицу А
hesse = np.array([
    [f_diff_xx, f_diff_xy],
    [f_diff_yx, f_diff_yy]
]).astype(np.float64)
print('Определитель матрицы Гессе: \n', np.linalg.det(hesse))

Определитель матрицы Гессе: 
 -2884.0000000000014


In [54]:
# Найдите экстремумы функции 

x, y = symbols('x, y', real=True)
z = x**3+y**3-3*x*y
# Находим частные производные
f_diff_x = z.diff(x)
f_diff_y = z.diff(y)
print(f_diff_x)
print(f_diff_y)
sol = solve([f_diff_x, f_diff_y], [x, y])
print(sol)
# для первой точки
f_diff_xx = z.diff(x,2).subs([(x,1),(y,1)])
f_diff_xy = z.diff(x,y).subs([(x,1),(y,1)])
f_diff_yx = z.diff(y,x).subs([(x,1),(y,1)])
f_diff_yy = z.diff(y,2).subs([(x,1),(y,1)])
# создаем матрицу А
A = np.array([
    [f_diff_xx, f_diff_xy],
    [f_diff_yx, f_diff_yy]
]).astype(np.float64)
A
# вычисляем собственные числа и собственные векторы
eig_values, eig_vectors = np.linalg.eig(A)
print('Собственные числа: \n', eig_values)

# для второй точки
f_diff_xx = z.diff(x,2).subs([(x,0),(y,0)])
f_diff_xy = z.diff(x,y).subs([(x,0),(y,0)])
f_diff_yx = z.diff(y,x).subs([(x,0),(y,0)])
f_diff_yy = z.diff(y,2).subs([(x,0),(y,0)])
# создаем матрицу А
A = np.array([
    [f_diff_xx, f_diff_xy],
    [f_diff_yx, f_diff_yy]
]).astype(np.float64)
A
# вычисляем собственные числа и собственные векторы
eig_values, eig_vectors = np.linalg.eig(A)
print('Собственные числа: \n', eig_values)

3*x**2 - 3*y
-3*x + 3*y**2
[(0, 0), (1, 1)]
Собственные числа: 
 [9. 3.]
Собственные числа: 
 [ 3. -3.]
