✍ В предыдущем юните мы научились находить производные простых функций. Однако зачастую функции, для которых нужно найти производные, намного сложнее. Как же быть в такой ситуации? К счастью, существуют **правила дифференцирования**, которые помогают находить производные от сколь угодно громоздких функций.

Разумеется, все вычисления за вас без проблем может реализовать та или иная библиотека Python. Но, умея считать производные, вы даже в уме сможете определять, с какой скоростью растёт та или иная функция.

История знает много примеров, когда люди, компании и даже государства испытывали много проблем из-за отсутствия интуиции к поведению функций. Один из известных — разведение кроликов в Австралии, когда никто не подумал, что производная от экспоненциальной функции больше производной от линейной, и введённые государством меры не смогут остановить взрывной рост популяции грызунов. Это привело к кризису, проблемам для сельского хозяйства и потере большого количества денег. В рамках компаний и различных проектов такие ситуации тоже могут случаться. Чем больше из того, что «под капотом», вы понимаете, тем быстрее и точнее принимаете решения и тем больше у вас развита интуиция, позволяющая подбирать верные алгоритмы.

Кроме примеров из аналитики, можно также вспомнить, что при работе с языками программирования и написании алгоритмов важно понимать, сколько времени займёт реализация той или иной программы. Для определения этого есть сложность алгоритма, описываемая математическими выражениями (например, линейная или экспоненциальная сложность). Разумеется, можно заучить, когда программа работает быстрее, а когда — медленнее, но понимание вычисления производных позволит вам осознавать, почему существует разница во времени работы.

Здесь можно вспомнить забавную ситуацию, когда в 2009 году сотрудники одной компании в Южной Африке решили, что отправить данные в филиал будет быстрее голубиной почтой, чем по интернету. И они оказались правы, ведь голубиная почта работает с константной скоростью, а если говорить про передачу данных по сети, то скорость увеличивается линейно. Производная константы равна нулю, а линейной функции — положительному числу. Вот и вся разгадка успеха голубиной почты.

И, разумеется, вычислять производные разной сложности очень важно для понимания и реализации алгоритмов оптимизации, которые необходимы для машинного обучения.

Но прежде чем перейти правилам вычисления производных, давайте ещё раз **повторим дифференцирование элементарных функций ↓**

Отлично, мы вспомнили вычисление простейших производных и теперь можем перейти к более сложным функциям.


## **<center>ПРОИЗВОДНАЯ СУММЫ**

Начнём с производной суммы, то есть с производной от выражения следующего вида:

$$(f(x) + g(x))’,$$

где $f(x)$ и $g(x)$ — какие-то функции, зависящие от x.

Правило, по которому ищется **производная суммы**, мы уже отчасти рассмотрели в предыдущем юните. По сути, здесь нет никаких дополнительных усложнений.

Для того чтобы найти производную суммы, надо лишь найти производную от каждого слагаемого и затем найти сумму получившихся результатов:

$$(f+g)'(u) = f'(u) + g'(u)$$

?

**Пример № 1**

Вычислить производную для суммы функций $e^x$ и $x^2$.

Так как производная для $e^x$ равна $e^x$, а производная для $$x^2$$ равна $2x$, получаем следующее:

$$(e^x + x^2)' = (e^x)' + (x^2)' = e^x + 2x$$

?

**Пример № 2**

Вычислить производную для разности функций $ln(x)$ и $sin(x)$.

$$(ln(x) - sin(x))' = ?$$

Так как разность всегда можно представить в виде суммы, сведём этот случай к нашему правилу:

$$(ln(x) - sin(x))’ = (ln(x) + (-sin(x))’ = \frac{1}{x} - cos(x)$$

## **<center>ПРОИЗВОДНАЯ ПРОИЗВЕДЕНИЯ**

Следующее правило дифференцирования, с которым нам необходимо разобраться, — правило нахождения производной для произведения функции. К сожалению, здесь всё не так просто, как с суммой.

Для того чтобы вычислить **производную произведения**, необходимо воспользоваться следующей формулой:

$$(f \cdot g)'(u) = f'(u) \cdot g(u) + f(u) \cdot g'(u)$$

Таким образом, нужно:

1. Вычислить производную первого множителя и умножить результат на второй множитель.
2. Вычислить производную второго множителя и умножить результат на первый множитель.
3. Сложить результаты, полученные в пунктах 1 и 2.

**?**
**Пример № 1**

Вычислить производную для произведения функций $e^x$ и $x^2$.

$$(e^x \cdot x^2)' = ?$$

Производная для $e^x$ равна $e^x$, а производная для $x^2$ равна $2x$. Поэтому получаем следующее:

$$(e^x \cdot x^2)' = e^x \cdot x^2 + e^x \cdot 2x$$

**?**

**Пример № 2**

Вычислить производную для произведения функций $x^4$ и $ln(x)$.

Производная для $x^4$ равна $4x^3$, а производная для $ln(x)$ равна $\frac{1}{x}$. Учитывая это, получаем следующее:

$$\begin{aligned} &(f(x))^{\prime}=\left(x^{4}\right)^{\prime} \ln (x)+x^{4}(\ln (x))^{\prime} \\ &=\left(4 x^{3}\right) \ln (x)+x^{4}\left(\frac{1}{x}\right) \\ &=\left(4 x^{3}\right) \ln (x)+x^{3} \\ &=x^{3}(4 \ln (x)+1) \end{aligned}$$

## **<center>ПРОИЗВОДНАЯ ЧАСТНОГО**

Искать производную частного немного сложнее, чем производную произведения.

При **дифференцировании частного** знаменатель возводится в квадрат, а в числителе появляется разница произведения производной числителя на знаменатель и произведения числителя на производную знаменателя:

$$\frac{f}{g}(u) = \frac{f'(u)g(u)  - f(u)g'(u)}{g^2(u)}$$

**?**

**Пример № 1**

Вычислить для функции $f(x) = \frac{x-1}{x+2}$.

Воспользуемся нашей формулой и запишем выражение для вычисления производной:

$$f'(x) = \frac{(x-1)'(x+2) - (x-1)(x+2)'}{(x+2)^2}$$

Теперь вычислим производные от двух множителей в числителе:

$$f'(x) = \frac{(1)(x+2) - (x-1)(1)}{(x+2)^2}$$

Упростим наше выражение с помощью равносильных преобразований, чтобы оно стало более компактным:

$$f'(x) = \frac{(x+2) - (x-1)}{(x+2)^2} = \frac{x+2-x+1}{(x+2)^2} = \frac{3}{(x+2)^2}$$

?

**Пример № 2**

Продифференцировать функцию $y = \frac{ln \ x}{2x^2}$.

Воспользуемся нашей формулой и запишем выражение для вычисления производной:

$$y' = \frac{(ln \ x)'(2x^2) - (ln \ x)(2x^2)'}{(2x^2)^2}$$

Вычислим производные от двух множителей в числителе:

$$y' = \frac{(\frac{1}{x})(2x^2) - (ln \ x)(4x)}{(2x^2)^2}$$

Упростим выражение с помощью равносильных преобразований:

$$y' = \frac{2x - 4x \ ln \ x}{4x^4} = \frac{(2x)(1-2 \ ln \ x)}{4x^4} = \frac{1-2 \ ln \ x}{2x^3}$$

## **<center>ПРОИЗВОДНАЯ КОМПОЗИЦИИ ФУНКЦИЙ**

Нам осталось разобраться с тем, как искать производную для композиции функций (или, как её ещё иногда называют, **производную для сложной функции**). Мы уже изучали, что такое композиция функций — давайте немного освежим знания ↓

Теперь, когда вы вспомнили, что такое композиция функций, давайте научимся её дифференцировать. Это можно сделать по следующей формуле:

$$(f(g(x)))' = [обозначим \,u = g(x)] = (f(u))' = f'(u) \cdot u' = [подставляем \,u = g(x)] = f'(g(x))g'(x)$$

Тогда:

$$(f(g(x)))' = f'(g(x))g'(x)$$

То есть мы ищем производную, как обычно, а затем домножаем результат на производную от той функции, которая выступает в качестве аргумента для внешней функции.

Это может быть сложно понять в теории, поэтому перейдём к разбору **примеров.**

?

**Пример № 1**

Вычислить производную для функции $f(x) = (3x + 1)^5$.

Данную функцию можно представить как композицию функций $u(x) = 3x + 1$ и $g(x) = x^5$. Причём внешней функцией здесь является функция $g(x)$, а $u(x)$ выступает её аргументом. Поэтому изначально мы ищем производную для степенной функции. Выносим вперёд коэффициент и понижаем степень на 1. Затем домножаем результат на производную функции, которая была аргументом:

![MATHML_md3_6_2.png](attachment:MATHML_md3_6_2.png)

Упрощаем результат до максимально компактного вида:

$$5(3x+1)^4 (3) = 15(3x+1)^4$$

**?**
**Пример № 2**

Вычислить производную для функции $f(x) = ln(x^2 - 1)$.

Можно заметить, что данная функция является композицией двух функций: $u(x) = ln(x)$ и $g(x) = x^2 - 1$.

Исходя из этого, ищем производную:

![MATHML_md3_6_3.png](attachment:MATHML_md3_6_3.png)

Представляем результат в более компактном виде:

$$f'(x) = \frac{2x}{x^2 - 1}$$

## **<center>ВЫЧИСЛЕНИЕ ПРОИЗВОДНОЙ С ПОМОЩЬЮ PYTHON**

Разумеется, производные не всегда приходится вычислять вручную. Для этого можно использовать библиотеку SymPy, с которой мы уже сталкивались, когда речь шла о множествах.

Для того чтобы найти производную с помощью SymPy, необходимо лишь указать, какой буквой обозначается переменная, ввести функцию и применить метод diff().

**?**
**Пример № 1**

Вычислить производную для функции .

In [1]:
import sympy
x = sympy.Symbol('x')
expr = x**4 + 3*x**3 + 4*x**2 + 8
expr.diff(x)

4*x**3 + 9*x**2 + 8*x

$4x^3 + 9x^2 + 8x$
>**Примечание.** Если необходимо найти производную, в которой фигурирует, например, логарифмическая, экспоненциальная или тригонометрическая функция, не забывайте импортировать их из библиотеки. Пример — ниже.

**?**
**Пример № 2**

Вычислить производную для функции $f(x) = ln(x^2 + 5x) + e^{sin(x)}$.

In [2]:
from sympy import diff, sin, exp, log, Symbol
x = Symbol('x')
expr = log(x**2 + 5*x) + exp(sin(x))
expr.diff(x)

(2*x + 5)/(x**2 + 5*x) + exp(sin(x))*cos(x)

Задание 6.5 (на самопроверку)
С помощью библиотеки SymPy найдите производную для функции .


In [3]:
x = Symbol('x')
expr = sin(x*3 + log(x))*exp(x)
expr.diff(x)

(3 + 1/x)*exp(x)*cos(3*x + log(x)) + exp(x)*sin(3*x + log(x))



## **<center>ВЫЧИСЛЕНИЕ ВТОРОЙ ПРОИЗВОДНОЙ**

Мы научились вычислять первую производную для функций разной сложности, а теперь попробуем вычислять производные второго порядка или, как их ещё называют, **вторые производные.**

>**Вторая производная** — это производная от производной функции. Чтобы вычислить её, необходимо:

1. Найти производную функции.
2. Найти производную от полученной производной.

Мы уже знаем, что первую производную часто обозначают буквой $f$ со штрихом — $f'(x)$.

Вторая производная обозначается двумя штрихами следующим образом: $f''(x)$.

Вторая производная используется в DS и машинном обучении не меньше первой. Вторая производная позволяет находить так называемые «выпуклости», а также выпуклые функции. Такие функции являются важной частью оптимизации, которая даже выделена в раздел «выпуклая оптимизация» с большой сферой применения.

Многие методы машинного обучения основаны на поиске параметров, которые минимизируют некоторую целевую функцию (например, мы хотим минимизировать затраты на производстве, зная количество сотрудников и возможности компании, или предложить такую транспортную развязку, чтобы минимизировать загруженность на дорогах). Зачастую целевая функция представляет собой выпуклую функцию, поэтому нам нужно знать её особенности.

В следующем юните мы более предметно рассмотрим, как вторая производная используется для исследования функции, а пока давайте разберём простой пример, на котором вы уже сейчас поймёте её смысл.

Представим, что вы участвуете в велогонке и проезжаете десять метров за каждую секунду. Тогда ваша скорость равна $10 \ м/c$, а производная от расстояния по времени также равняется $10 \ м/c$ (так как скорость и производная для расстояния — в данном случае одно и тоже). То есть первая производная показывает скорость изменения расстояния в зависимости от времени — это нам уже известно. Но внезапно вы решаете ускориться, чтобы одержать победу в гонке, и разгоняетесь до скорости $14 \ м/c$ за следующие две секунды. Получается, что прибавка составила четыре метра за две секунды. Это значит, что ваше ускорение равно $4/2 =  2\ м/c^2$ — это и есть вторая производная.

**Обобщим полученную информацию:** во время движения первая производная от расстояния — это скорость, а вторая — это скорость изменения скорости (то есть **ускорение**).

**Интересный факт**

Про то, что первая производная является скоростью, а вторая — ускорением, слышали многие. А что же с третьей? Удивительно, но и у производной этого порядка есть вполне осязаемый смысл. Третья производная называется рывок. По сути, это скорость для ускорения. И вы действительно можете почувствовать рывок, когда начинаете ускоряться, нажимать на тормоза или объезжать повороты, поскольку ваше тело приспосабливается к действию новых физических сил. Для инженеров очень важно исследовать третью производную, так как они стараются уменьшить рывок при проектировании лифтов, железнодорожных путей и т. д.

**?**
**Пример № 1**

Найти вторую производную для функции $y = 3x^4 - 2x^3 + 4x^2 - 5x + 1$.

Для начала вычислим первую производную:

$$y' = 12x^3 - 6x^2 + 8x -5$$

Найдём производную от получившейся первой производной — это как раз и будет вторая производная:

$$y'' = 36x^2 -12x + 8$$

**?**

**Пример № 2**

Найти вторую производную для функции $y = x \ ln \ x$.

Сначала найдём первую производную, воспользовавшись правилом дифференцирования произведений функций:

$$y^{\prime}=(x \ln x)^{\prime}=x^{\prime} \cdot \ln x+x \cdot(\ln x)^{\prime}=1 \cdot \ln x+x \cdot \frac{1}{x}=\ln x+1$$

Теперь, чтобы найти вторую производную, найдём производную от полученного результата:

$$y'' = (ln \ x + 1)' = \frac{1}{x} + 0 = \frac{1}{x}$$

Разумеется, мы можем найти вторую производную (производную второго порядка) с помощью библиотеки SymPy. Надо лишь добавить в метод diff() ещё один аргумент — порядок дифференцирования. Так как мы ищем производную второго порядка, то ставим в качестве аргумента 2:

In [4]:
x = Symbol('x')
expr = log(x**2 + 5*x) + exp(sin(x))
expr.diff(x,2)

-exp(sin(x))*sin(x) + exp(sin(x))*cos(x)**2 + 2/(x*(x + 5)) - (2*x + 5)**2/(x**2*(x + 5)**2)

$$-e^{\sin (x)} \sin (x)+e^{\sin (x)} \cos ^{2}(x)+\frac{2}{x(x+5)}-\frac{(2 x+5)^{2}}{x^{2}(x+5)^{2}}$$

## **НЕМНОГО ПРО ОБОЗНАЧЕНИЯ**

До этого мы всё время обозначали производную как штрих. То есть если сама наша функция обозначена $y$, то её производная — $y'$. Если функция обозначена как $f(x)$, то её производную мы обозначали через $f'(x)$. Для второй производной мы просто увеличивали количество штрихов. На самом деле есть и **другой вариант обозначения производной ↓**

$\frac{dy}{dx}$ — это обозначение говорит нам, что мы ищем производную от $y$ по $x$, то есть что наша функция называется $y$, а в качестве переменной мы берём $x$.

Тогда вторая производная обозначается как $\frac{d^2 y}{d x^2}$. Здесь двойки означают порядок дифференцирования: 2 в числителе обозначает, что мы два раза вычисляем производную, а 2 в знаменателе — что оба раза в качестве переменной выступает $x$.

Итак, теперь вы умеете вычислять абсолютно любые производные! Такое умение позволит вам решать различные задачи, а также намного лучше понимать алгоритмы оптимизации, которые мы вскоре изучим. Далее вас ждёт **практика для тренировки навыков.** Не стоит решать все задачи только вручную или только с помощью SymPy: будет здорово, если вы будете решать задачи двумя способами, сравнивая результаты, или чередовать их — так вы сможете отработать оба навыка.

In [5]:
import sympy
from sympy import diff,log,exp,sin,Symbol,sqrt

expr = log(x ** 2 + 5 * x) + exp(sin(x))
expr.diff(x)

(2*x + 5)/(x**2 + 5*x) + exp(sin(x))*cos(x)

In [6]:
x = Symbol("x")
expr = sin(x*3 + log(x)) * exp(x)
expr.diff(x)

(3 + 1/x)*exp(x)*cos(3*x + log(x)) + exp(x)*sin(3*x + log(x))

In [7]:
x = Symbol("x")
expr = 2* x ** 3 * log(x)
expr.diff(x)

6*x**2*log(x) + 2*x**2

In [8]:
6 * 1** 2 * log(1) + 2 * 1 ** 2

2

In [9]:
x = Symbol("x")
expr = sqrt(1+ x**2)
expr.diff(x)

x/sqrt(x**2 + 1)

In [11]:
import numpy as np
x = Symbol("x")
y = Symbol("y")
expr = np.mean((x.dot(w) - Y)**2)
expr.diff(x)


NameError: name 'X' is not defined