# **Условные экстремумы. Метод Лагранжа**

✍ Мы узнали, как в целом формулируется задача оптимизации и из каких элементов она состоит. Теперь настало время познакомиться с наиболее популярными алгоритмами, которые используются для оптимизации функций. Первым будет метод, который подходит для решения задачи условной оптимизации, — **метод Лагранжа**.

Представим, что мы хотим решить задачу классификации и столкнулись с довольно частым случаем, когда наши данные являются линейно неразделимыми, то есть объекты нельзя разделить на классы прямой или гиперплоскостью. Это может выглядеть следующим образом:

![](https://lms.skillfactory.ru/assets/courseware/v1/a19c1279faeb53e4ef7cc2ab351926ec/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_5_1.png)

Как видно по данному графику, точки нельзя явным образом разделить на две группы, а вот на графике ниже такое возможно:

![](https://lms.skillfactory.ru/assets/courseware/v1/112b513e17f97dbab9244cf8a2fea74c/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_5_2.png)

Если для исследуемых данных не существует прямой или плоскости, с помощью которых можно поделить выборку на два класса, хорошим методом для решения задачи считается **метод опорных векторов (SVM)**. Алгоритм SVM подбирает гиперплоскость таким образом, чтобы выполнялось два условия:

* минимальная ошибка разделения на классы;
* максимально возможное расстояние от разделяющей гиперплоскости до ближайшей точки.

Иллюстрацию этой идеи можно увидеть ниже:

![](https://lms.skillfactory.ru/assets/courseware/v1/f6c83f5f2f83eef2be3aa2a14779c49c/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_5_3.png)

Так как данные обычно не так хорошо разделимы, как изображено выше, используется перенос данных в пространство такой размерности, где они становятся разделимыми:

![](https://lms.skillfactory.ru/assets/courseware/v1/9367995bf31a697068c8c87796b62166/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_5_4.png)

Здесь задачей оптимизации является минимизация ошибки разделения выборки, и именно эта задача как раз и может быть решена методом Лагранжа.
***
* **Метод множителей Лагранжа** является стратегией обнаружения минимумов и максимумов дифференцируемых функций (то есть таких функций, для которых можно найти производную) при условии ограничений равенства на его независимые переменные.
***
В случае безусловной оптимизации мы решали задачи, приравнивая к нулю производную функции одной переменной или все частные производные в многомерном случае. Далее мы находили экстремумы и выбирали минимум или максимум. В случае с поиском решения задачи условной оптимизации алгоритм будет похож, но в него будут внесены некоторые коррективы.
***

Давайте перейдём к практике и рассмотрим, как формулируется и решается задача оптимизации, в которой есть ограничения.

Пусть у нас есть функция f(x), для которой мы хотим найти минимум при ограничении фi(x) = 0. Можно записать это следующим образом:

![](data/26.PNG)

Чтобы решить такую задачу, в первую очередь записываем функцию Лагранжа, т. е. объединяем с её помощью саму целевую функцию и функцию ограничений внутри одного выражения:

![](data/27.PNG)
***
* Дополнительные переменные λi, которые появляются при формулировании функции Лагранжа, называются **множителями Лагранжа**.
***

По сути, с помощью создания такой новой функции мы свели задачу к уже известной нам задаче безусловной оптимизации. Вы умеете её решать и можете догадаться, что далее вычисляются частные производные построенной функции Лагранжа по  и дополнительной переменной λ. Затем находятся точки, в которых производные равны нулю, и точки экстремума.

Разберём алгоритм применения метода множителей Лагранжа на конкретном примере. Представим, что мы хотим максимизировать следующую функцию:

![](data/28.PNG)

Однако мы хотим не просто найти её максимально возможное значение (на самом деле оно равно бесконечности, если на x и y не стоит никаких ограничений), а сделать это при условии выполнения следующего равенства:

![](data/29.PNG)

Если представить условие визуально, оно выглядит как окружность на координатной плоскости:

![](https://lms.skillfactory.ru/assets/courseware/v1/2fc89194d63d363dfcf82dbdde28a38e/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_5_5.png)

![](data/30.PNG)

![](data/31.PNG)

![](data/32.PNG)

![](data/33.PNG)



In [14]:
from sympy import *
import numpy as np

x, y, λ = symbols('x y λ',real=True)
z = 4*x+3*y-λ*(x**2+y**2-1)
z_diff_x = z.diff(x)
z_diff_y = z.diff(y)
z_diff_λ = z.diff(λ)


sol = solve([z_diff_x, z_diff_y, z_diff_λ], [x, y, λ])
print(sol)

print((4*x+3*y).subs([(x,-4/5),(y,-3/5)]))
print((4*x+3*y).subs([(x,4/5),(y,3/5)]))

[(-4/5, -3/5, -5/2), (4/5, 3/5, 5/2)]
-5.00000000000000
5.00000000000000


Давайте разберём два примера, в которых необходимо не просто решить задачу оптимизации с помощью метода Лагранжа, а сначала перевести какую-то реальную задачу на язык оптимизации.

**Пример № 1**

Длина забора — 20 метров. Какова максимальная площадь прямоугольного участка, который можно огородить?

Сформулируем задачу оптимизации. Пусть мы будем огораживать прямоугольник со сторонами x1 и x2. Нам необходимо максимизировать площадь при периметре, равном 20 м. Получается, что мы должны максимизировать функцию f(x1,x2) = x1 * x2 при условии 2x1 + 2x2 = 20.

Переформулируем задачу максимизации в задачу минимизации и упростим наше ограничение:

![](data/34.PNG)

Запишем функцию Лагранжа:

![](data/35.PNG)

Найдём частные производные:

![](data/36.PNG)

Приравняем их к нулю:

![](data/37.PNG)

У нас получилась система линейных уравнений, которую мы можем решить, например, с помощью метода Гаусса, который вы изучали в модуле по линейной алгебре. Это отличная возможность увидеть его применение в оптимизации.

![](https://lms.skillfactory.ru/assets/courseware/v1/f773aa178296b3cc21f17ddd533ebc08/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_5_9.png)

![](https://lms.skillfactory.ru/assets/courseware/v1/5c31bc8c5a761cfccdf44d908f8717d1/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_5_10.png)

Получаем искомые x1 и x2, т. е. наибольшая площадь будет у квадрата 5 × 5. Таким образом, максимальная площадь, которую можно огородить, равна 25 м^2.
***

![](data/38.PNG)

![](data/39.PNG)

→ Разумеется, при решении  прикладных задач «красивые» ответы обычно не получаются, поэтому проще решать такие системы с помощью Python или любым удобным для вас способом (чуть далее мы рассмотрим полностью программное решение).

Получаем следующие ответы:

![](data/40.PNG)

Если бы работники выполняли свои обязанности дробное количество часов или если бы мы покупали сталь килограммами, то, в целом, полученные значения уже можно было бы использовать для вычисления итоговой прибыли. Но иногда мы обязаны округлять значения — так и поступим:

![](data/41.PNG)

Таким образом, мы получили максимально возможную прибыль при условии обозначенных затрат.

Итак, мы рассмотрели алгоритм решения задачи оптимизации с помощью метода Лагранжа. Теперь вы можете использовать его для различных задач, которые могут возникнуть в вашей работе.

Но, конечно же, во время рабочих процессов никто не использует «ручные» вычисления — обычно применяются различные функции Python.

Рассмотрим сначала решение задачи «вручную», а затем реализуем его же с помощью библиотеки Python.

### **Пример № 3**

У нас есть два станка для производства пластиковых упаковок. Станки разных моделей, поэтому при их использовании получаются разные издержки, зависящие от произведённых упаковок и выражаемые следующими функциями:

![](data/42.PNG)

Здесь a — это количество упаковок, произведённых на первом станке, а b — количество упаковок, произведённых на втором станке.

Нам заказали 200 упаковок. Мы хотим выполнить заказ, минимизировав расходы на изготовление товаров. Чтобы узнать, как мы можем сэкономить, необходимо решить задачу оптимизации.

Составим нашу целевую функцию:

![](data/43.PNG)

Теперь повторим то же самое с помощью Python.

In [15]:
from sympy import *
a,b,w=symbols(' a b w' )
g = 3*a**2 + a + 4*b + 5*b**2
print('Целевая функция для аргументов a и b :\n f = ', g)
q = a + b - 200
print('Функция ограничений: ', q,'= 0')
f = 3*a**2 + a + 4*b + 5*b**2 + w*(a + b - 200)
print('Функция Лагранжа :\n ',f)
fa = f.diff(a)
print('df/da =',fa,'= 0')
fb = f.diff(b)
print('df/db =',fb,'= 0')
fw = f.diff(w)
print('df/dw =',fw,'= 0')
sols = solve([fa,fb,fw],a,b,w)
print('Стационарная точка M(x,y):\n',float(sols[a]),',',float(sols[b]))

Целевая функция для аргументов a и b :
 f =  3*a**2 + a + 5*b**2 + 4*b
Функция ограничений:  a + b - 200 = 0
Функция Лагранжа :
  3*a**2 + a + 5*b**2 + 4*b + w*(a + b - 200)
df/da = 6*a + w + 1 = 0
df/db = 10*b + w + 4 = 0
df/dw = a + b - 200 = 0
Стационарная точка M(x,y):
 125.1875 , 74.8125


Получился тот же результат, что и при решении «вручную».

Также отметим, что мы говорим здесь о целых предметах (упаковках), поэтому при использовании этого решения в реальной жизни мы округлили бы значения до ближайших целых.