# **Исследование функции с помощью производных**

✍ Нам важно понимать, как ведёт себя функция: где она возрастает, а где убывает, где у неё точки минимума, а где — точки максимума.

Допустим, мы выразили функцию, которая отражает величину ошибки в нашей задаче в зависимости от настраиваемых параметров. У нейронных сетей она может выглядеть следующим образом:

![](https://lms.skillfactory.ru/assets/courseware/v1/23c598ad5beac269dcc12f3b18b141dc/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_1.png)

Как понять, где ошибка будет больше, а где — меньше? Как узнать значение параметра, при котором модель будет наилучшей (т. е. дающей самые точные предсказания)?

→ Ранее мы говорили, что с помощью производной можно находить максимумы и минимумы, и именно производная является фундаментом для реализации известного градиентного спуска. Совсем скоро вы сможете найти минимально возможную ошибку практически для любого такого случая, исследовав функцию.

Или, может быть, вы хотите решить задачу оптимизации? Минимизировать издержки, время в пути или максимизировать прибыль при неких стартовых условиях? Для этого также нужно понимать поведение целевой функции.

На примере кубической параболы f(x) = x^3 - 12x посмотрим, как работает определение промежутков возрастания и убывания функции с помощью производной, а также найдём точки максимума и минимума функции.

Вычисляем производную для функции и приравниваем её к нулю, так как точки, в которых производная равна нулю, разграничивают области возрастания и убывания:

                            f'(x) = 3x^2 - 12 = 3(x - 2)(x + 2) = 0

Отметим эти точки на числовой оси, расставим знаки и найдём, где же функция убывает, а где — возрастает:

![](https://lms.skillfactory.ru/assets/courseware/v1/c6ec613d9272bd07646e1956ef7ca476/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_2.png)

Как мы расставили знаки? Очень просто. Можно вспомнить о том, что на каждом интервале в любой точке производная всегда будет либо только положительной, либо только отрицательной. Значит, можно взять из каждого интервала по одной точке, подставить и посмотреть на знак получившегося значения (в следующем примере мы посмотрим, как это можно сделать).

Можем посмотреть на график нашей функции, чтобы сравнить её вид и то, что мы определили с помощью производной:

![](https://lms.skillfactory.ru/assets/courseware/v1/99b2cf0719dfad28d94dd5e29640779c/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_3.png)

Как можно заметить, функция действительно растёт до -2, убывает от -2 до 2, а после 2 снова возрастает. Точки -2 и 2 являются локальными экстремумами: -2 — это **локальный максимум**, а 2 — **локальный минимум**.

**Резюмируем план исследования функции:**

1. Находим все решения f'(x) = 0.

2. Расставляем их на числовой оси и получаем промежутки.

3. Там, где производная положительная, — область возрастания.

4. Там, где производная отрицательная, — область убывания.

5. Локальный максимум находится на переходе с возрастания на убывание:

![](https://lms.skillfactory.ru/assets/courseware/v1/8ef44026aca665aa38b3fd60d0123235/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_4.png)

6. Локальный минимум находится на переходе с убывания на возрастание:

![](https://lms.skillfactory.ru/assets/courseware/v1/1e8a05cf504b97bbd79eaa8a9db86db2/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_5.png)

***

Бывает, что производная обнуляется в какой-то точке, но не меняет знак, проходя через неё, то есть характер монотонности (постоянного возрастания или постоянного убывания) функции не меняется. Эта точка будет являться **стационарной**, не являясь локальным экстремумом (максимумом или минимумом).

* Такие стационарные точки называют **точками перегиба**, так как в них функция меняет направление выпуклости (про это мы поговорим немного позже).

Сейчас мы искали локальные максимумы и минимумы, но существуют ещё и **глобальные**.

* **Глобальные экстремумы** — это точки, в которых функция достигает максимального или минимального значения на всей области определения или на её подмножестве.

**Свойства глобального экстремума:**

* может не существовать;
* если существует, то единственный.

![](https://lms.skillfactory.ru/assets/courseware/v1/f5681e6edcf66f382016949e2cdd54fb/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_6.png)



### **Примеры**

Исследовать на промежутки возрастания и убывания функцию f(x) = 3x^2 - 12x +1

Найдём точки минимума и максимума функции (если они есть), а также области её возрастания и убывания.

В первую очередь необходимо найти производную функции, а также точку (или точки), в которых она принимает нулевое значение:

f'(x) = 6x - 12

6x - 12 = 0

x = 2

У нас получилось два промежутка: от -∞ до 2 и от 2 до ∞.

Подставим точку из каждого промежутка (сначала из первого, затем из второго), чтобы оценить, какое значение (положительное или отрицательное) принимает производная в рамках рассматриваемого интервала:

f'(1) = 6 * 1 - 12 = -6, f'(1) < 0

f'(3) = 6 * 3 - 12 = 6, f'(3) > 0

Получаем, что производная отрицательная на промежутке левее 2 (т. е. для всех чисел от -∞ до 2), и положительная на промежутке правее 2 (т. е. для всех чисел от 2 до ∞). Таким образом, получаем следующие выводы:

* Функция возрастает на промежутке x ∈ (2; ∞).
* Функция убывает на промежутке x ∈ (-∞; 2).

Напомним, что возрастание и убывание функции мы определили по знаку производной: до 2 производная отрицательная, поэтому можно говорить об убывании, а после 2 — положительная, что является индикатором области возрастания.

А что же с самой точкой 2?

Так как до неё функция убывает, а после неё — возрастает, то она является точкой минимума.

![](data/42.PNG)

![](data/43.PNG)



***
## **ВЫПУКЛЫЕ ФУНКЦИИ. ИССЛЕДОВАНИЕ ФУНКЦИИ НА ВЫПУКЛОСТЬ И ВОГНУТОСТЬ**

Мы рассмотрели, как с помощью первой производной исследовать функцию: находить её экстремумы (точки минимума и максимума), области возрастания и области убывания. В предыдущем юните мы также научились вычислять вторую производную. Давайте выясним, как её можно использовать для определения выпуклости функции.

In [2]:
# для тренировки
import sympy
x = sympy.Symbol("x")
expr = (x**3)/4 - 3*x
expr.diff(x,2)

3*x/2

Давайте разберёмся, что такое **выпуклые** функции. Внимательно посмотрим на графики трёх функций, изображённые ниже:

![](https://lms.skillfactory.ru/assets/courseware/v1/736e9cc3cf1ed9693a818ca81f8ef3ed/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_8.png)

* У функции слева всего одна точка локального минимума. Если мы сможем её найти, она будет глобальным минимумом на всей прямой.
* У функции посередине всего один локальный максимум. Он же является её глобальным максимумом на всей прямой.
* Функция справа имеет как локальный максимум, так и локальный минимум. Ни один из них не является глобальным — глобальных экстремумов на всей числовой прямой у функции нет.

Если мы строим численный алгоритм для поиска глобального экстремума, то с левой и средней функциями делать это гораздо удобнее, чем с правой.

Даже если правая имеет глобальный минимум, найти его не так просто, ведь можно попасть в неправильную «ямку» и вместо глобального минимума найти локальный. Такая проблема может возникнуть, к примеру, при использовании алгоритма градиентного спуска: алгоритм может «застрять» в локальном минимуме.

![](https://lms.skillfactory.ru/assets/courseware/v1/3d05007d26af58a50eff41df543b9dd4/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_9.png)

Разберёмся, **как различать выпуклые и невыпуклые функции** ↓

Ниже можно увидеть два вида выпуклых функций и одну невыпуклую. Давайте узнаем, какие особенности позволяют однозначно их различать.

![](https://lms.skillfactory.ru/assets/courseware/v1/2ba7eb3dec56d7ff3e39fbd36787189e/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_10.png)

* Отметим любые две точки A и B на графике функции слева и проведём хорду — отрезок, который их соединит. Фрагмент графика от A До B всегда расположен ниже хорды (или совпадает с ней, если у графика есть прямые отрезки). Такие функции называют **выпуклыми вниз**.
* У функции посередине есть аналогичное свойство, только её фрагмент графика между любыми двумя точками A и B всегда расположен выше хорды (или совпадает с ней, если у графика есть прямые отрезки). Такие функции называют **выпуклыми вверх**.
* Функции, не являющиеся выпуклыми вверх или вниз, называют **невыпуклыми**. Можно увидеть, что график функции справа сначала расположен выше хорды, а затем — ниже.

Также можно считать последнюю функцию **кусочно-выпуклой**: в левой части прямой она выпукла вверх, а затем — выпукла вниз. Точка смены выпуклости называется **точкой перегиба**. Как видите, слева от неё все хорды расположены ниже графика, а справа — выше.

![](https://lms.skillfactory.ru/assets/courseware/v1/c2d36180ea54422c7ae6a285c29ec98e/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_11.png)

**Свойства выпуклых функций:**

**Идейные:**

* Удобно искать экстремумы.
* Локальный экстремум всегда является глобальным.

**Технические:**

* Сумма выпуклых вверх функций выпукла вверх.
* Сумма выпуклых вниз функций выпукла вниз.
* Композиция одинаково выпуклых функций имеет такую же выпуклость.

Кроме того, выпуклые функции образуют целое семейство. Сумма и композиция одинаково выпуклых вверх функций выпукла в ту же сторону. Разность, произведение и частное, правда, этим свойством не обладают.

Также важно отметить, что часто в литературе можно встретить понятие **выпуклой** и **вогнутой** функций:

**Вогнутая функция = выпуклая вниз** функция

![](https://lms.skillfactory.ru/assets/courseware/v1/ef4384b259e5a8078634631df6aae186/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_12.png)

**Выпуклая** функция = **выпуклая вверх** функция

![](https://lms.skillfactory.ru/assets/courseware/v1/f3711faed02d848d9070f1f3444fb4de/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_13.png)
***

**Как определить характер функции**, если у нас нет её графика и мы хотим сделать это аналитически?

Часто выпуклость можно определить по графику, но если возможности нарисовать график нет, на помощь придут формальные критерии. Для гладких функций (функции, у которых в каждой точке можно найти производную) одной переменной критерием выпуклости является знак второй производной.

![](data/44.PNG)

Исследовать функции на выпуклость очень важно, так как именно в соответствии с этой характеристикой мы будем подбирать нужные методы оптимизации.

→ Различные оптимизационные алгоритмы можно разделить на два класса: «выпуклая оптимизация» и «невыпуклая оптимизация». Без знания этой характеристики для целевой функции вы просто не сможете подобрать нужный алгоритм из всего многообразия и рискуете либо не решить поставленную задачу, либо решить её некорректно.

Разберём на примере, как определить, является функция выпуклой вверх или выпуклой вниз.

![](data/45.PNG)

![](data/46.PNG)

![](https://lms.skillfactory.ru/assets/courseware/v1/8b07354c5471583e37e73deb3beddb21/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md3_7_14.png)

![](data/47.PNG)

In [12]:
# для тренировки
import sympy
from sympy import exp, ln, sqrt
x = sympy.Symbol("x")
expr = x**2 + ln(x)
expr.diff(x,2)

2 - 1/x**2