# **Частные производные**

✍ Мы разобрались с тем, что такое функция многих переменных. Теперь давайте научимся дифференцировать такие функции, т. е. находить для них производные.
***
* Производные для функций нескольких переменных называются **частными производными**.
***

На данный момент в машинном обучении очень популярны и эффективны методы **глубокого обучения**, то есть методы, использующие нейронные сети. В обучении нейронных сетей есть два важных этапа:

* **Прямое распространение ошибки** (на этом этапе нейронная сеть предсказывает результат).
* **Обратное распространение ошибки** (на этом этапе нейронная сеть минимизирует разницу между реальным значением и предсказанным).

Именно на втором шаге большую роль играют частные производные, так как позволяют узнать, каков вклад каждого признака в ошибку, и это даёт возможность точно настроить модель.

Представьте, что вы решаете много задач по математике: в каких-то ваш ответ абсолютно верен, в каких-то вы ошиблись на сотые, а в каких-то ошибка довольно значительна. Если теперь посчитать, на сколько в среднем вы ошиблись, и вычесть эту среднюю ошибку из всех ответов, скорее всего, все ответы станут неверными. Почему так? Потому что необходимо рассматривать ответ в каждой задаче независимо от других.

Так же и в построении модели очень важно иметь возможность рассматривать вес каждого признака независимо и настраивать его отдельно — именно за это отвечают частные производные. Без них пришлось бы корректировать все параметры одновременно и одинаково, и мы бы никогда не получили нормальную модель. Если вы захотите углубиться в изучение различных архитектур нейронных сетей и в принцип их работы в целом, то обязательно столкнётесь с математической записью этого процесса, которая будет содержать в себе частные производные.

Итак, мы обсудили, зачем нужны частные производные — теперь можно учиться их находить ↓

Вероятно, вы помните, что обычную производную для функции одной переменной мы обозначали как df/dx. Эту запись можно интерпретировать следующим образом: *«Очень маленькое изменение значения функции f, произошедшее вследствие очень маленького изменения аргумента x»*.

![](https://lms.skillfactory.ru/assets/courseware/v1/a6773e7961da8f513fa54d616f79cbf9/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_1.png)

Важно интуитивно понимать это обозначение, так как оно поможет нам проще разобраться с понятием частных производных.

Давайте перейдём к функциям нескольких переменных и начнём с функции двух переменных. Например, с такой:

![](data/7.PNG)
***

Разумеется, необязательно искать производные в определённых точках — мы можем, как и в случае с одномерными функциями, находить значения производных в общем виде.

Можно сказать, что мы ищем производную для функции f(x,y) = x^2*y^3 именно по x. Таким образом, значение функции будет меняться вследствие изменения значения x, а значение переменной y будет оставаться прежним. Раз значение y не будет изменяться, мы можем воспринимать его как константу.

![](https://lms.skillfactory.ru/assets/courseware/v1/d74a288758a4708aef915412e76b87af/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_3.png)

Иногда для того, чтобы подчеркнуть, что это именно многомерная функция, используют следующую запись:

![](https://lms.skillfactory.ru/assets/courseware/v1/d33f93ae53a9e23cd55fb5ae42c0747c/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_4.png)

Также вы можете встретить (в том числе и в наших юнитах) следующие общепринятые обозначения:

![](https://lms.skillfactory.ru/assets/courseware/v1/ae8e4e20225c7bf3d4410ccfbc8ace01/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_5.png)

Это можно прочитать как «производная от функции f по x» или «производная от функции f по y» (в зависимости от переменной). Вне зависимости от формы записи, читаются они одинаково, и обе являются верными.
***

Конечно, для вывода понятия частной производной можно использовать геометрическую интерпретацию. В предыдущем модуле мы уже выяснили, что значение производной в точке равняется тангенсу угла наклона касательной, проведённой в этой точке к графику функции. Но график функции многих переменных — это поверхность, поэтому у неё таких касательных — целая касательная плоскость. Получается, что у функции есть по касательной для каждого направления, а значит и по своей частной производной, так как внутри плоскости можно провести множество касательных.

![](https://lms.skillfactory.ru/assets/courseware/v1/dbf7658e9ffb1da9e5479473f45bdb8b/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_6.png)

Из всех направлений можно выбрать каноничные — параллельные координатным осям. Для нас это будет оптимальным решением, так как мы хотим рассмотреть изменение функции только в зависимости от изменения одной из переменных (например, только от x или только от y). И если мы, к примеру, берём направление, параллельное оси абсцисс, в таком случае мы фиксируем координату по оси ординат (т. е. воспринимаем её как константу — она одинакова в каждой точке прямой, параллельной оси x). Можно варьировать значение x. Так мы и поступим и посмотрим, как меняется функция вдоль оси x. На рисунке ниже это изменение изображено красной кривой.

![](https://lms.skillfactory.ru/assets/courseware/v1/ad320ef1043b970541a480795283afea/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_7.png)

Отношение приращения вдоль красной кривой к приращению x — и есть значение частной производной по x:

![](data/8.PNG)

Теперь из всей касательной плоскости можно найти прямую, соответствующую этой красной линии. Тангенс её наклона будет равен частной производной по x. 

Итак, можно сказать, что **алгоритм поиска частной производной** аналогичен алгоритму поиска обычной производной для одномерного случая.

Пусть дана функция. Чтобы найти частную производную по переменной xi:

![](data/9.PNG)

В пункте 1 этого алгоритма указано, что мы фиксируем все переменные, кроме одной. Несмотря на то что в разобранных примерах мы рассматривали функции, зависящие от двух аргументов, ровно таким же образом мы можем найти частные производные и для функций трёх, четырёх и более переменных. Такую функцию мы рассмотрим чуть позже.

Разберём ещё несколько примеров нахождения частных производных ↓

... (ничего сложного)

Рассмотрим пример вычисления всех вторых частных производных для функции f(x,y) = sin(x)y^2

Для начала вычислим первые частные производные по x и по y:

![](https://lms.skillfactory.ru/assets/courseware/v1/4d87f68d02066a3999aa3b14ebab2cbf/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_10.png)

Теперь для каждой из двух частных производных возьмём ещё по две частных производных, чтобы получить все четыре возможных частных производных:

![](https://lms.skillfactory.ru/assets/courseware/v1/20a8cb6745d65690c9df4977bdc0d3ae/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_11.png)

Можно заметить, что значения **смешанных производных** (когда ищем производную сначала по одной переменной, а затем — по другой) **совпадают**. Это свойство очень поможет нам при поиске минимумов и максимумов функции, так как сильно упростит расчёты: получается, что для функции с двумя переменными нужно вычислить не четыре производных, а только три. Уже в следующем юните вы сможете по достоинству оценить, как это упростит вам жизнь и сократит длительность вычислений.

![](https://lms.skillfactory.ru/assets/courseware/v1/5f884a606d6bff003f75b99d1a387d93/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md5_2_12.png)

Примеры, которые мы разбирали выше, подразумевали, что переменные, от которых зависит наша функция, являются независимыми. Но что, если они тоже зависят друг от друга?

В таком случае мы можем найти **полную производную**, то есть производную, в которой учитываются зависимости между переменными. По сути, задача поиска полной производной сводится к замене одной из переменных на функциональную зависимость от другой и поиск производной по единственной оставшейся переменной.

![](data/10.PNG)
***

Разумеется, мы можем вычислять частные производные с помощью уже известной нам библиотеки SymPy. По сути, в коде ничего не меняется — надо лишь не забыть указать, по какой переменной вы ищете производную.

Например, попробуем найти производную для функции ![](data/11.PNG) по переменной a:

In [1]:
from sympy import s, cos, diff

a, b, c = symbols('a b c', real=True)
f = 5*a*b - a*cos(c) + a**2 + c**8*b

print(diff(f, a))

2*a + 5*b - cos(c)


In [10]:
# Найдите частные производные:
from sympy import simplify

a, b, c = symbols('a b c', real=True)
f = (5-a-2*b)**2
simplify(diff(f, a))
simplify(diff(f, b))

4*a + 8*b - 20

In [15]:
# Вычислите частные производные для функции в точке (1,1).

x, y = symbols('x y', real=True)
u = x**2+3*x*y+4*(y**2)
u_diff = diff(u, y)
u_diff.subs(y, 1)


3*x + 8

In [17]:
# Найдите частные производные для функции
from sympy import sin
u = y*sin(x) + sin(y)
u_diff = diff(u, y)
u_diff

sin(x) + cos(y)