### 1. Введение

✍ В этом модуле мы познакомимся с огромным разделом высшей математики — **математическим анализом**. Давайте разберёмся, что это и как используется в прикладных задачах, в частности — в задачах Data Science.

**Математический анализ** изучает изменение значений и характер этих изменений.

По сути, это то, с чем мы сталкиваемся постоянно: изменение цен на акции, рост уровня продаж, уменьшение количества клиентов и т. д. До тог, как появился математический анализ, вся математика была статична. И только благодаря ему мы имеем возможность изучать динамические процессы.

Математический анализ используется во многих областях — в физике, инженерных науках, биологии, экономике, статистике, медицине — и имеет множество практических применений в реальной жизни. Например, экономисты используют математический анализ для того, чтобы прогнозировать спрос, предложение и максимальную потенциальную прибыль, архитекторы — чтобы найти площадь даже самых сложных и изогнутых поверхностей, специалисты по аэродинамике — чтобы проанализировать траекторию полёта самолета или ракеты.

Словом, абсолютно все динамические процессы и всё, что можно описать с помощью функциональных зависимостей, можно исследовать с помощью математического анализа.

Если говорить о серьёзных задачах из области Data Science и машинного обучения, то математический анализ уже не может быть прикладным инструментом для решения задач от начала и до конца в силу своей простоты. Но это не значит, что он становится бесполезным. Математический анализ является фундаментом для куда более обширной и важной области — оптимизации — и выполняет важные роли, например:

Лежит в основе важных алгоритмов, таких, как, например, градиентный спуск, который требует вычисления градиента функции и часто необходим для обучения моделей машинного обучения, так как минимизирует функцию ошибки на основе вычисления скорости изменения.
Позволяет изучить внутренние алгоритмы МО.
Помогает понять поведение функций, используемых для прогнозирования значений и преобразования данных.
Понимание внутренней работы алгоритмов позволяет настраивать их более точно и получать более качественные предсказания.

→ Мы будем изучать математический анализ на протяжении трёх модулей: начнём с азов и закончим разбором сложных алгоритмов оптимизации, которые неразрывно связаны с процессом обучения моделей машинного обучения.

**В ДАННОМ МОДУЛЕ ПЕРЕД НАМИ СТОЯТ СЛЕДУЮЩИЕ ЗАДАЧИ:**

- Познакомиться с основными понятиями математического анализа.  
В рамках этой задачи мы узнаем, что такое множество, функция и производная функции и научимся решать задачи, используя их.

- Узнать про основные функциональные зависимости и области их применения.  
Возможно, вы уже знаете, что к целевым переменным при обучении моделей машинного обучения часто применяют логарифмическое преобразование, или что естественные биологические процессы (и не только их) можно предсказывать с помощью экспоненциальной функции. Мы изучим свойства этих (и некоторых других) функциональных зависимостей, чтобы разобраться, какие особенности делают их столь полезными в прикладных задачах.

- Научиться исследовать функцию одной переменной.  
Исследование функции является важной частью математического анализа и широко применяется в аналитике. Предположим, что мы смогли найти функционал, определяющий значение ошибки в нашей модели. Как понять, в какой точке ошибка минимальна? Какова она будет? Сколько будет таких точек? На все эти вопросы можно ответить, если уметь исследовать функцию. Конечно же, в рамках этой цели мы познакомимся с понятием **производной** и сможем применять её для решения конкретных задач.

- Рассмотреть на кейсах применение освоенного материала.  
В рамках данного модуля все изучаемые концепции будут достаточно простыми, но это позволит вам заложить фундамент для дальнейшего изучения и понимания более сложных алгоритмов.
  
В рамках данного модуля все изучаемые концепции будут достаточно простыми, но это позволит вам заложить фундамент для дальнейшего изучения и понимания более сложных алгоритмов.

### ОСНОВЫ МАТЕМАТИЧЕСКОГО ЯЗЫКА. ЧАСТЬ II

В модуле MATH&ML-1 мы уже знакомились с кванторами и символами, которые позволяют записывать математические формулировки. Настало время расширить наши знания.

Поскольку определённые методы часто реализуются для конкретного набора чисел, посмотрим, как можно обозначить разные числовые множества:

$\mathbb{N} = \left\{1,2,3,... \right\}$ — все натуральные числа.
$\mathbb{Z} = \left\{...,-2,-1,0,1,2,... \right\}$ — все целые числа.
$\mathbb{Q} = \left\{\frac{p}{q} \right\}$, $p \in \mathbb{Z}$, $q \in \mathbb{N}$ — все рациональные числа, т. е. такие, которые можно записать в виде дроби, у которой числитель является целым числом, а знаменатель — натуральным.
$\mathbb{R}$ — все вещественные числа, т. е. не только целые, натуральные числа и обыкновенные дроби, но также и иррациональные числа, например $\sqrt{2}$.
Теперь, когда вы знаете все базовые обозначения, рассмотрим **примеры математических записей** ↓

**Пример № 1**

$P(x) = 1, \forall x \in \mathbb{R}$  
«Функция P от аргумента x всегда принимает значение 1 для любого x, которое является вещественным числом».

**Пример № 2**

$\exists x \in \mathbb{N} : x \ \vdots \ 13$
«Существуют такие натуральные числа, которые делятся на 13».

Кроме того, что у нас есть возможность обозначить все числа, обладающие определёнными характеристиками, мы также можем обозначать какие-то небольшие, ограниченные части числовой прямой — **числовые промежутки**.

**Числовые промежутки** — это числовые множества, которые можно изобразить на координатной прямой. К числовым промежуткам относятся **лучи, отрезки, интервалы** и **полуинтервалы**.

**Основные виды числовых промежутков:**

- Открытый луч

Пример: $x < 2 (-\infty; 2)$ — все числа меньше 2.

- Закрытый луч

Пример: $x \geq -5, [-5;+\infty)$ — все числа больше или равны -5.

- Отрезок

Пример: $-5 \leq x \leq 2, [-5;2]$ — все числа больше или равны -5 и одновременно с этим меньше или равны 2.

- Интервал

Пример: $(-5;2)$ — все числа больше -5 и одновременно с этим меньше 2.

- Полуинтервал

Пример: $(-5;2]$ — все числа больше -5 и одновременно с этим меньше или равны 2.

Используя обозначения для числовых промежутков, мы можем обозначать наборы чисел в более краткой, математической форме.

_______________________

### 2. Множества. Операции над множествами

### ПОНЯТИЕ МНОЖЕСТВА

✍ Математика — точная наука, в которой принято давать чёткие и строгие определения всем используемым понятиям. Однако существуют исключения. Иногда мы сталкиваемся с фундаментальными неопределяемыми понятиями, на основе которых определяются все остальные. Одним из таких понятий является **множество** — у него нет чёткого определения. Но, несмотря на это, мы всё равно попробуем разобраться в том, что в математике понимается под множеством.

Важно отметить, что теория множеств входит во многие разделы математики как одна из основных частей. Для нас множества важны по той причине, что мы будем регулярно исследовать функциональные зависимости, а понятие функции базируется именно на теории множеств. Также эта часть математики понадобится вам в будущем в том числе и для понимания теории вероятностей.

Под множеством мы обычно понимаем совокупность (или иногда ещё говорят «семейство» или «класс») объектов, объединённых по какому-то признаку. Например, это могут быть все клиенты какой-то компании, все женщины, проживающие в данной стране, или все учащиеся определённой школы. Разумеется, этими объектами могут быть не только живые существа, но также, например, дома, предметы, натуральные числа или все решения какого-то уравнения — словом, всё, что только можно придумать. 

Если подытожить, то можно сказать, что:

**Множество** — это объединение различных объектов, обладающих каким-то общим признаком или совокупностью признаков.

Множество состоит из **элементов**. Их может быть любое количество, вплоть до бесконечности. Но важно, что все элементы уникальны, они не повторяются. Количество элементов множества называется **мощностью множества**.

Множество, не имеющее элементов, называется **пустым** и обозначается как $\varnothing$.

Можно задать множество через условия и кванторы (рассмотрим такой вариант чуть позже), но также и простым перечислением элементов. Например, если мы хотим задать множество из трёх статусов, которые могут быть присвоены клиентам в ходе маркетинговой кампании, мы можем сделать это следующим образом:

$W  = \left\{'успешно','неопределенный','отказ' \right\}$
Мы можем обозначить, что элемент входит во множество: 'успешно' $\in W$ (статус успешно входит во множество $W$ возможных статусов клиентов при проведении маркетинговой кампании).

Если элемент не входит во множество, используется тот же символ, но уже в зачёркнутом формате: 'неуспешно' $\notin W$ (статус неуспешно не входит во множество W возможных статусов клиентов при проведении маркетинговой кампании).

Также мы можем определять **отношения между множествами**. Например, пусть у нас есть множество W, состоящее из чисел $\left\{1,2,3,4 \right\}$, и множество $B$, состоящее из чисел $\left\{2,3 \right\}$. Абсолютно все элементы, которые находятся во множестве B, находятся и во множестве W. Поэтому мы можем сказать, что множество B является **подмножеством** множества $W$. Символьно мы можем обозначить это следующим образом: $B \subset W$ (множество B является подмножеством множества $W$).

Разумеется, может быть такое, что одно множество не является подмножеством другого. Допустим, мы можем придумать ещё одно множество C, не все элементы которого являются элементами $W: C = \left\{4,5,6,7 \right\}$. Такое множество $C$ не является подмножеством W. В такой ситуации используется перечёркнутый знак $\not\subset$.

Важно подчеркнуть, что для любого множества пустое множество и само множество также являются подмножествами. Например, все возможные подмножества для множества $\left\{1,3,5 \right\}$ следующие:

$\left\{\varnothing  \right\}, \left\{1  \right\}, \left\{3  \right\}, \left\{5  \right\},
\left\{1,3  \right\}, \left\{1,5  \right\}, \left\{5,3  \right\},
\left\{1,3,5  \right\}$

### ОПЕРАЦИИ НАД МНОЖЕСТВАМИ И СВЯЗАННЫЕ С НИМИ ОБОЗНАЧЕНИЯ

Теперь, когда мы немного познакомились с темой, нам необходимо разобраться с некоторыми часто используемыми операциями над множествами.

**ОБЪЕДИНЕНИЕ МНОЖЕСТВ**

Объединением множеств A и B называют множество C, состоящее из элементов, принадлежащих множествам $A$ или $B$:

$C = A \cup B$

То есть во множество С помещаются абсолютно все элементы из двух множеств (но без повторений).

Чтобы было понятнее, можно обратить внимание на схему ниже. Такое представление отношений множеств называют **кругами Эйлера** (для следующих операций мы также будем прикладывать аналогичные иллюстрации). Нас интересует закрашенная область.

Можем представить, что множество $A$ — это множество людей, у которых дома живут кошки, а множество $В$ — люди, у которых дома живут собаки. Тогда их объединение — это все люди, у которых живут кошки или собаки (или и кошки, и собаки сразу).

<img src="data\MATHML_md3_2_1.png" alt="drawing" width="300"/>

**ПЕРЕСЕЧЕНИЕ МНОЖЕСТВ**

**Пересечением** множеств A и B называют множество C, состоящее из элементов, которые являются общими для множеств A и B:

$C = A \cap B$  
Если мы рассматриваем пересечение множеств, то ищем все объекты, которые одновременно принадлежат и первому , и второму множествам. Например, если есть множество людей, знающих французский, и множество людей, знающих немецкий, их пересечением будет группа людей, владеющих обоими этими языками.

<img src="data\MATHML_md3_2_2.png" alt="drawing" width="300"/>

**Интересный факт**

На основе таких простых операций, как пересечение и объединение множеств, создана очень важная метрика **IoU (Intersection-over-Union)** — это метрика степени пересечения между двумя ограничивающими рамками. Она используется в задаче детекции объектов: мы пытаемся обвести в прямоугольные рамки те места на картинке, где может находиться объект, а затем считаем для них эту метрику.


<img src="data\MATHML_md3_2_3.png" alt="drawing" width="800"/>


Если значение $IoU$ слишком большое, это значит, что, скорее всего, рамки обвели один и тот же объект, просто по-разному, и нужно оставить только одну рамку. Такое можно видеть на этой фотографии:

<img src="data\MATHML_md3_2_4.png" alt="drawing" width="300"/>

→ Вы ещё узнаете об этом подробнее, но пока можно отметить, что даже расчёты в сложных алгоритмах, где используются нейронные сети, задействуют самые простые операции со множествами — т. е. это действительно настолько важная часть, что она пронизывает все области математики и DS.

**РАЗНОСТЬ МНОЖЕСТВ**

Разностью множеств A и B называют множество C, состоящее из таких элементов множества A, которые не являются элементами множества B:

**C = A \ B**

Возвращаясь к предыдущему примеру с языками: если знающие французский находятся во множестве A, а знающие немецкий — во множестве B, то в C остаются те, кто знает французский, но совершенно не знаком с немецким.

<img src="data\MATHML_md3_2_5.png" alt="drawing" width="300"/>

**СИММЕТРИЧЕСКАЯ РАЗНОСТЬ МНОЖЕСТВ**

**Симметрическая разность двух множеств** — это группа всех тех объектов, которые принадлежат только одному множеству:

$C = A \Delta B$

Если, например, при предыдущей операции мы получали людей, которые знают только французский,  то в данном случае в симметрической разности оказываются люди, которые владеют только немецким или только французским

<img src="data\MATHML_md3_2_6.png" alt="drawing" width="300"/>

**ДОПОЛНЕНИЕ МНОЖЕСТВ**

**Дополнением** множества A называют множество $\overline{A}$, которое является разностью универсального множества $U$ и множества $A$:

**$\overline{A}$ = U \ A**

Под **универсальным множеством** в математике понимается совокупность всех существующих в этом мире объектов. То есть если мы ищем дополнение ко множеству, то получаем абсолютно все объекты, кроме элементов данного множества.

Зачастую под универсальным множеством понимают не вообще все возможные объекты, а объекты в контексте рассматриваемой задачи. Например, это могут быть все люди. Тогда, если во множестве A находятся люди, знающие немецкий, то в дополнении ко множеству A будут все остальные люди — то есть те, кто не знаком с немецким.

<img src="data\MATHML_md3_2_7.png" alt="drawing" width="300"/>

**ОПЕРАЦИИ НАД МНОЖЕСТВАМИ В PYTHON**

В языке Python реализованы все перечисленные операции над множествами. Для каждой из них есть свой символ и метод. Рассмотрим их все.

Для тренировки создадим два множества:

- Во множестве A будут храниться уникальные ID клиентов компании, которые пользуются мобильной связью.
- Во множестве B — уникальные ID клиентов компании, которые используют домашний интернет.

In [1]:
A = {'ID453', 'ID312', 'ID41', 'ID3', 'ID500', 'ID920', 'ID36', 'ID27'}
B = {'ID41', 'ID36', 'ID27', 'ID124', 'ID7', 'ID501', 'ID91' }

**ОБЪЕДИНЕНИЕ МНОЖЕСТВ**

Для того чтобы найти объединение множеств, можно использовать метод union(). В качестве результата мы получим тех клиентов, которые используют хотя бы одну из двух услуг компании:

In [2]:
union_AB = A.union(B)
print(union_AB)
#{'ID500', 'ID27', 'ID41', 'ID3', 'ID501', 'ID453', 'ID312', 'ID124', 'ID920', 'ID91', 'ID7', 'ID36'}

{'ID41', 'ID27', 'ID3', 'ID36', 'ID312', 'ID124', 'ID501', 'ID91', 'ID920', 'ID7', 'ID453', 'ID500'}


**Обратите внимание**, что по результатам применения данного методы мы получили новое множество.

Метод union() можно заменить простой вертикальной чертой:

In [3]:
union_AB = A | B
print(union_AB)
#{'ID500', 'ID27', 'ID41', 'ID3', 'ID501', 'ID453', 'ID312', 'ID124', 'ID920', 'ID91', 'ID7', 'ID36'}

{'ID41', 'ID27', 'ID3', 'ID36', 'ID312', 'ID124', 'ID501', 'ID91', 'ID920', 'ID7', 'ID453', 'ID500'}


**ПЕРЕСЕЧЕНИЕ МНОЖЕСТВ**

Для нахождения пересечения множеств используется метод intersection(). В контексте нашего примера мы получим клиентов, которые пользуются обеими услугами:

In [4]:
inter_AB = A.intersection(B)
print(inter_AB)
#{'ID27', 'ID41', 'ID36'}

{'ID41', 'ID27', 'ID36'}


Также мы можем заменить метод intersection() на амперсанд (&) — результат будет идентичным:

In [5]:
inter_AB = A & B
print(inter_AB)
#{'ID27', 'ID41', 'ID36'}

{'ID41', 'ID27', 'ID36'}


**РАЗНОСТЬ МНОЖЕСТВ**

Для того чтобы получить разность между двумя множествами, применим метод difference(). В данном случае мы получим перечень тех клиентов, которые используют мобильную связь, однако не используют домашний интернет.

In [6]:
diff_AB = A.difference(B)
print(diff_AB)
#{'ID500', 'ID3', 'ID453', 'ID312', 'ID920'}

{'ID3', 'ID500', 'ID920', 'ID453', 'ID312'}


Здесь также есть вариант замены метода символом — в данном случае это знак «минус»:

In [7]:
diff_AB = A - B
print(diff_AB)
#{'ID500', 'ID3', 'ID453', 'ID312', 'ID920'}

{'ID3', 'ID500', 'ID920', 'ID453', 'ID312'}


Важно отметить, что если поменять два множества местами при выполнении операции разности, результат изменится. В нашем примере результатом будут клиенты, которые пользуются только домашним интернетом:

In [8]:
diff_BA = B - A
print(diff_BA)
#{'ID124', 'ID7', 'ID501', 'ID91'}

{'ID501', 'ID91', 'ID7', 'ID124'}


Разность можно также использовать для нахождения дополнения ко множеству, если заранее задать универсальное множество для задачи.

**СИММЕТРИЧЕСКАЯ РАЗНОСТЬ**

Для вывода симметрической разности можно использовать метод symmetric_difference() или оператор ^. В качестве результата получим клиентов, которые пользуются только какой-то одной из услуг:

In [9]:
symmAB = A.symmetric_difference(B)
print(symmAB)
#{ID124', 'ID91', 'ID7', 'ID312', 'ID500', 'ID453', 'ID3', 'ID501', 'ID920'}


symmAB = A ^ B
print(symmAB)
#{ID124', 'ID91', 'ID7', 'ID312', 'ID500', 'ID453', 'ID3', 'ID501', 'ID920'}

{'ID124', 'ID3', 'ID500', 'ID501', 'ID91', 'ID7', 'ID920', 'ID453', 'ID312'}
{'ID124', 'ID3', 'ID500', 'ID501', 'ID91', 'ID7', 'ID920', 'ID453', 'ID312'}


### БИБЛИОТЕКА SYMPY, СИМВОЛЬНЫЕ ВЫЧИСЛЕНИЯ И МНОЖЕСТВА

Познакомимся с важной библиотекой, которая будет нам полезна.

**SymPy** — это библиотека Python для выполнения символьных вычислений. Это система компьютерной алгебры, которая может выступать как отдельное приложение, так и в качестве библиотеки для других приложений (как это реализовано, например, в Python).

Такие системы, как SymPy, помогают выполнять вычисления разного рода (производные, интегралы, пределы, решение уравнений, работа с матрицами) в символьном виде. Это значит, что получаемые результаты будут понятны и хорошо читаемы, так как будут выводиться в привычном для нас виде. Например, если в результате вычислений получится $\sqrt{12}$, то это будет выглядеть следующим образом:

<img src="data\MATHML_md3_2_8.png" alt="drawing" width="300"/>

В пакете SymPy есть разные модули, которые помогают строить графики, выводить результат (LaTeX), заниматься физикой, статистикой, комбинаторикой, числовой теорией, геометрией, логикой и так далее.

Нам данная библиотека поможет нам реализовывать различные математические операции в более аккуратном виде и получать результат, который будет легко читаем и понятен.

С её помощью можно работать и со множествами. Для этого нам необходимо импортировать из неё функцию FiniteSet, а объединение обозначается уже знакомой нам функцией Union:

In [10]:
pip install sympy

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip available: 22.3 -> 23.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [11]:
from sympy import FiniteSet, Union
l1 = [1, 3, 7, 10] 
l2 = [9, 7, 1] 
a = FiniteSet(*l1) 
b = FiniteSet(*l2) 
Union(a, b)

{1, 3, 7, 9, 10}

В результате получаем красиво оформленное объединение двух множеств:

$\left\{1,3,7,9,10 \right\}$   
Также с помощью этой библиотеки можно задать множество не прямым перечислением элементов, а с помощью условий и математических выражений (это то, о чём мы говорили ранее). Интересно то, что мы получим не прямое перечисление элементов, а именно математическую запись.

In [12]:
from sympy import ConditionSet, Eq, Symbol, Interval
x=Symbol('x')
s=ConditionSet(x, Eq(x**2-5*x,0), Interval(2,9))
s

ConditionSet(x, Eq(x**2 - 5*x, 0), Interval(2, 9))

$\left\{x | x \in [2,9] \wedge x^2 - 5x = 0 \right\}$
В данном примере мы задали множество, в котором находятся все числа из интервала от 2 до 9, для которых верно, что они являются корнями уравнения $x^2 - 5x = 0$.

→ Для простых операций со множествами эта библиотека может показаться слишком сложной, но совсем скоро вы оцените её пользу при работе с производными — там она является поистине незаменимой даже в простых операциях. Через несколько уроков мы познакомимся с ней более подробно.

**УСЛОВИЕ ДЛЯ ЗАДАНИЙ 2.6-2.8**

Представьте, что вы являетесь куратором образовательной программы, на которой будет два вебинара: по программированию и по машинному обучению.

На вебинар по программированию записались потенциальные слушатели со следующими электронными адресами:

bennet@xyz.com  
darcy@abc.com  
margaret@xyz.com  
pa@hhh.com  
marimari@xyz.com  
mallika@yahoo.com  
abc@xyz.com  
0071235@gmail.ru  

На вебинар по машинному обучению записались потенциальные слушатели со следующими электронными адресами:

marimari@xyz.com  
darcy@abc.com  
0071235@gmail.ru  
darcy@abc.com  
petr44@xyz.com  
katrin@ya.com  
Оформите множества в Python для обоих списков слушателей.

**Задание 2.6**

С помощью операций множеств в Python определите, сколько слушателей записалось на оба вебинара.

In [13]:
set1 = {'bennet@xyz.com', 'darcy@abc.com', 'margaret@xyz.com' , 'pa@hhh.com',
'marimari@xyz.com' , 'mallika@yahoo.com' ,'abc@xyz.com' ,'0071235@gmail.ru'}
set2 = {'marimari@xyz.com', 'darcy@abc.com', '0071235@gmail.ru', 'darcy@abc.com',
'petr44@xyz.com', 'katrin@ya.com'}
len(set1&set2)

3

**Задание 2.7**

Сколько человек заинтересованы в посещении хотя бы одного вебинара?

In [14]:
set1 = {'bennet@xyz.com', 'darcy@abc.com', 'margaret@xyz.com' , 'pa@hhh.com',
'marimari@xyz.com' , 'mallika@yahoo.com' ,'abc@xyz.com' ,'0071235@gmail.ru'}
set2 = {'marimari@xyz.com', 'darcy@abc.com', '0071235@gmail.ru', 'darcy@abc.com',
'petr44@xyz.com', 'katrin@ya.com'}
len(set1|set2)

10

**Задание 2.8**

Сколько человек заинтересованы в посещении только одного вебинара из двух?

In [15]:
set1 = {'bennet@xyz.com', 'darcy@abc.com', 'margaret@xyz.com' , 'pa@hhh.com',
'marimari@xyz.com' , 'mallika@yahoo.com' ,'abc@xyz.com' ,'0071235@gmail.ru'}
set2 = {'marimari@xyz.com', 'darcy@abc.com', '0071235@gmail.ru', 'darcy@abc.com',
'petr44@xyz.com', 'katrin@ya.com'}
len(set1^set2)

7

______________________________

### 3. Функция. Элементарные функции

### ПОНЯТИЕ ФУНКЦИИ

✍ В этой части модуля мы познакомимся с понятием функции, а также рассмотрим основные функциональные зависимости, с которыми вы уже встречались и не раз встретитесь в будущем.

Из школьного курса алгебры вы можете помнить следующее определение для функции:

**Функциональная зависимость**, или **функция** — это такая зависимость между двумя переменными, при которой каждому значению независимой переменной соответствует единственное значение зависимой переменной.

То есть, например, для кубической функции $y = x^3$ значению независимой переменной $х = 2$ мы сопоставляем значение зависимой переменной $y = 8$.

Это справедливое определение, однако теперь, зная основы теории множеств, мы можем определить функцию более грамотно:

**Функцией** в математике называется правило, по которому можно сопоставить элементы двух множеств.

Можно отобразить это графически. У каждого элемента $x$ из $X$ должна быть пара $y$ в $Y$. То есть под действием функции $f$ каждому элементу из множества $X$ сопоставляется элемент из множества $Y$.

<img src="data\MATHML_md3_3_1.png" alt="drawing" width="500"/>

Например, если это квадратичная функция, то такое соотношение элементов двух множеств будет выглядеть следующим образом:

<img src="data\MATHML_md3_3_2.png" alt="drawing" width="500"/>

Здесь вы можете видеть, что некоторым разным элементам, которые принадлежат множеству $X$, соответствует один и тот же элемент множества $Y$. Например, для $x= - 4$ мы получаем $y = 16$, как и для $x = 4$.

Важно понимать, что одному x нельзя поставить в соответствие два разных $y$, а вот ставить один $y$ в соответствие двум $x$ можно.

<img src="data\MATHML_md3_3_3.png" alt="drawing" width="700"/>

Также мы можем привести более формальное определение функции. Запишем его также на математическом языке, который вы теперь без проблем сможете прочитать.

Для любого элемента x из множества X существует единственный элемент $y$ из множества $Y$, такой, что $f(x) = y$:

$\forall x \ \in \ X \ \exists ! \ y \ \in \ Y : f(x) = y$
Подводя итог, важно обозначить, что, по сути, у любой функции есть три основных составляющих:

- действия, которые она выполняет;
- аргументы (объекты, к которым применяются действия);
- значения функции (результаты, которые получаются по итогам выполнения действий).  

Обозначение $y = f(x)$ как раз и содержит в себе все три этих составляющих. Величина y (значение функции) зависит от величины $x$ (аргумента) по определённому закону или правилу, обозначаемому $f$.

**ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ**

При решении различных задач мы будем сталкиваться с так называемыми элементарными функциями.

**Элементарные функции** — это функции, которые являются суммой, произведением или композицией функций следующих трёх видов:

- степенные функции

$f(x): kx+b, \ x^2, \ x^3, \ \frac{1}{x}, \ P_n(x), \ x^{\alpha}, \ \alpha \in \mathbb{R}$

- тригонометрические функции

$f(x): sin \ x, \ cos \ x, \ tg \ x, \ ctg \ x, \ arctg \ x$

- показательные и логарифмические функции

$f(x): e^x, \ a^x, ln \ x, \ log_a \ x, log_x \ a$

Элементарные функции можно записать понятной формулой из элементов-«кирпичиков». Это значит, что, зная свойства этих «кирпичиков», такие функции легко анализировать:

$f(x) = x^2 \cdot e^{cos \ x + ln(5x-9)}$

→ Подробнее о том, какие могут быть свойства у функций и как их исследовать, мы поговорим немного позже. Но для начала нам надо познакомиться с некоторыми полезными функциями из элементарных, которые достаточно часто встречаются при решении различных задач, в прогнозировании значений, для машинного обучения и т. д.

### ЭКСПОНЕНЦИАЛЬНАЯ ФУНКЦИЯ

Экспоненциальная функция имеет следующий вид:

\($f(x) = e^x = exp(x)$\) (оба варианта записи равноправны)

Здесь \($e$\) — это экспонента, важная константа в математике, которая равна примерно \($2.71828$\).

Мы очень часто сталкиваемся с экспоненциальными функциями в реальной жизни.

- Например, если вы открываете вклад в банке, то чем дальше, тем больше денег вам начисляется, и с каждым периодом сумма растёт всё быстрее.
- Если в какой-то населённый пункт приходит эпидемия, то количество заболевших тоже растёт экспоненциально, так как чем больше заболевших, тем больше людей могут заразиться от них. Если мы вводим какие-то противоэпидемические меры, то при сравнении с экспоненциальной кривой мы можем анализировать, насколько успешны наши действия.
- Или, к примеру, если вы разводите каких-то животных, то их количество тоже будет расти по такой зависимости. Например, в Австралии в какой-то момент случился кризис, связанный с тем, что количество кроликов росло экспоненциально, и австралийские фермеры не успевали принимать меры против них.
- Также экспоненциальная функция как нельзя лучше описывает механизм действия вирусного маркетинга в его количественном аспекте. Конечно, чистая экспоненциальная кривая достигается редко, однако успешная вирусная кампания вполне может быть описана как постепенное нарастание «снежного кома».  
На рисунке ниже можно увидеть графическое представление этой функции:

<img src="data\MATHML_md3_3_4.png" alt="drawing" width="400"/>

Значением экспоненциальной функция может быть любое число больше нуля, а в качестве аргумента может выступать любое вещественное число.

Для того чтобы преобразовывать экспоненциальные функции, используют следующие свойства:

\($e^a \cdot e^b = e^{a+b}$\);
\($(e^a)^b = e^{ab}$\);
\($e^{-a} = \frac{1}{e^a}$\).

### ЛОГАРИФМИЧЕСКАЯ ФУНКЦИЯ

Логарифмическая функция также часто встречается как прикладной инструмент для аналитики. Во многом это обусловлено тем, что натуральный логарифм является обратной функцией для такой полезной экспоненциальной:

<img src="data\MATHML_md3_3_5.png" alt="drawing" width="400"/>

Если понять это соотношение, то станет очевидным, что натуральный логарифм — это время, необходимое для того, чтобы вырасти до определённого уровня.

Например, представьте, что вы делаете инвестиции в суперприбыльные акции, у которых непрерывная годовая доходность 100 %. Вам нужно понять, спустя какой время вы достигнете десятикратного роста вклада (т. е. увеличения вложенной суммы в десять раз). Чтобы это посчитать, вам необходимо всего лишь вычислить **натуральный логарифм**:

\[ln(10) = 2.3 \ года\]

Всего-то два с небольшим года — довольно неплохо.

Как вы можете видеть, логарифмическая функция отлично подходит для прогнозирования сроков достижения определённых показателей.

Однако и сама по себе логарифмическая функция пронизывает практически все явления нашей жизни, и с логарифмами работают во многих областях:

- Громкость звука измеряют в децибелах, пропорциональных логарифму мощности звука, воздействующего на ухо. Использование логарифмических шкал продиктовано особенностями наших органов чувств: зрения, слуха и т. д.
- Логарифмическая шкала используется при анализе различных исторических событий для простоты восприятия очень больших промежутков времени. Такая система называется **логарифмической шкалой времени**.
- В физике логарифмы используются в описании многих процессов. Например, формула Циолковского определяет скорость, которую развивает летательный аппарат под воздействием тяги ракетного двигателя: логарифмическая функция сыграла очень важную роль в освоении космоса.

Подобные примеры можно перечислять бесконечно. В какой бы области знаний вы ни работали, велика вероятность столкнуться с логарифмической функцией.

Но на самом деле вы уже сталкивались с ней, когда работали с трансформацией признаков в машинном обучении. Напомним, что:

**Логарифмическое преобразование** — один из самых популярных методов преобразования. В этом преобразовании мы берём логарифм значений признака вместо самих значений.

Освежить знания можно здесь. https://lms.skillfactory.ru/courses/course-v1:SkillFactory+DSPR-2.0+14JULY2021/jump_to_id/35a9c2d0bf0242f6bf4285d9f5b05aef

Визуальное представление логарифмической функции вы можете видеть ниже:

<img src="data\MATHML_md3_3_6.png" alt="drawing" width="400"/>

Логарифмическая функция может принимать любое значение, но в качестве аргумента ей можно передать только положительные числа.

Для того чтобы преобразовывать логарифмические функции, используют следующие **свойства**:

- \($ln \ (ab) = ln \left|a \right| + ln \left|b \right|$\);
- \($ln \ \frac{a}{b} = ln \left| a \right| - ln \left| b \right|$\);
- \($ln \ a^b = b \cdot ln \ a$\).  
Разумеется, логарифмическая функция может быть и с другим основанием, не только с экспонентой. Однако мы рассматриваем именно такую вариацию как наиболее используемую в различных задачах машинного обучения.

### СИГМОИДАЛЬНАЯ ФУНКЦИЯ

Очень интересной и, возможно, уже известной вам функцией является сигмоидальная:

\[$f(x) = \frac{1}{1+e^{-ax}}$\]

Она выглядит следующим образом:

<img src="data\MATHML_md3_3_7.png" alt="drawing" width="800"/>

Сигмоидальная функция широко используется в машинном обучении: например, она применяется в нейронных сетях в качестве функции активации, которая позволяет как усиливать слабые сигналы, так и не насыщаться от сильных сигналов. Одна из вариаций сигмоидальной функции, логистическая функция, используется для решения задачи классификации.

Сигмоидальная функция строго больше нуля и строго меньше единицы, то есть, она целиком находится внутри диапазона от 0 до 1. Именно это свойство позволяет использовать её для предсказания вероятностей (что может быть очень полезно при решении задачи классификации), т. к. значение вероятности тоже может быть от 0 до 1.

Ещё одним важным свойством сигмоидальной функции является то, что при отрицательных значениях аргумента она принимает значения меньше 0.5 , а при положительных — больше:

<img src="data\MATHML_md3_3_8.png" alt="drawing" width="250"/>

### КОМПОЗИЦИЯ ФУНКЦИЙ

Мы рассмотрели некоторые элементарные функции, и теперь пришло время поговорить о сложных функциях или, как их называют более формально, **композициях функций**.

**Композицией функций** называют функцию, если она задана в виде $y=f(g(x))$.

Из самого определения этой функции ясно, что для вычисления значения сложной функции к значению аргумента $x$ сначала применяется функция $g$, а затем к полученному значению $g(x)$ применяется функция $f$ — тогда и получается значение $f(g(x))$.

→ Владение этим термином и умение видеть сложную функцию очень важно для математического анализа: для вычислений хоть сколько-то сложных производных важно уметь раскладывать функцию на её составляющие.

Например, пусть у нас есть функция $f(x) = 2x + x^2$ и функция $g(x) = ln(x)$. Если мы хотим составить композицию $g(f(x))$ из этих двух функций, то вместо аргумента в функцию $g$ (т. е. вместо $x$) нам надо подставить функцию $f(x)$. Получится следующее:

$ln(2x+x^2)$  
Также композицию функций можно обозначать следующим образом:

$(f \circ g)(x) = f(g(x))$

**? Пример**

Пусть у нас есть функции $g(x) =  2x – 1$ и $f(x) = x^2 + 6$.

Распишем их композицию:

$(f \circ g)(x) = (2x - 1)^2 + 6 = (2x - 1)(2x - 1) + 6
= 4x^2 - 4x + 1 +6
= 4x^2 - 4x + 7$

________________________________________________________

### 4. Исследование функции

✍ Мы познакомились с понятием функции и рассмотрели несколько популярных функций, которые широко используются в машинном обучении. Но нам важно не только знать, что такое функция, но и уметь исследовать любую функцию, с которой мы можем столкнуться.

- Представьте, что вы работаете в крупном магазине и вам надо оптимизировать количество работников (например, количество специалистов колл-центра или курьеров может постоянно варьироваться), чтобы не было ни их избытка, ни недостатка. Вы можете рассчитать множество показателей, но какие-то тренды можно отметить, только если понять вид и поведение функции. Допустим, при анализе временных рядов можно отметить сезонность спроса на определённые товары.
- Или, предположим, у вас есть признак с очень далёким от нормального распределением, который вы хотите использовать для обучения модели. Вам необходимо понять, какая функция сможет трансформировать этот признак так, чтобы распределение стало более подходящим для того, чтобы предиктор был включён в модель. Правильно найти такое преобразование можно только в том случае, если вы очень хорошо понимаете и знаете свойства различных функциональных зависимостей.
- Также можно привести совсем уж неожиданный пример из области анализа звуковых сигналов. Для того чтобы корректно обрабатывать сигналы (например, человеческую речь или музыку), используют преобразования Фурье. Однако преобразования Фурье работают по-разному для чётных и нечётных функций - вот здесь и пригодится исследование на чётность, с которым мы познакомимся в этом юните.
План исследования функции выглядит следующим образом:

1. Нахождение области определения и области значений  функции.
2. Нахождение точек пересечения графика функции с осями координат.
3. Исследование функции на чётность и нечётность.
4. Нахождение точек минимума и максимума функции, а также  промежутков возрастания и убывания.
5. Нахождение промежутков выпуклости и вогнутости функции и точек перегиба.
6. Нахождение асимптот функции.
7. Пока мы с вами можем выполнить первые три пункта.

Чтобы осуществить оставшуюся часть анализа функции, нам понадобятся производные — с ними мы познакомимся уже совсем скоро. А пока давайте рассмотрим все аспекты, которые можем исследовать на данный момент.

### ОБЛАСТЬ ОПРЕДЕЛЕНИЯ ФУНКЦИИ

Возможно, из школьной программы вы помните, что в математике строго запрещено делить на 0 или, например, извлекать корень из отрицательного числа. Именно из таких «запретов» возникает понятие «области определения».

По сути, **область определения** — это множество всех значений аргументов, к которым мы можем применять рассматриваемую функциональную зависимость и с точки зрения математики это будет «разрешено».

Например, пусть у нас есть функция:

$f(x) = \frac{1}{x}$
Мы можем использовать в качестве аргумента для этой функции любое число, кроме нуля, так как на ноль делить нельзя. Это значит, что областью определения нашей функции является **множество всех вещественных чисел за исключением нуля**.

Более строго, математически, это утверждение можно записать следующим образом:

$D(f(x)): x \in (-\infty; 0) \ \cup \ (0; + \infty)$
$D(f(x))$ здесь читается как «область определения функции f(x)».

В качестве  примера также можно рассмотреть график для функции

$f(x) = \sqrt{x+4}$  
Мы видим, что график начинается из точки -4 и идёт вправо. Левее точки -4 мы не наблюдаем никаких частей графика функции, т. к. область определения этой функции не включает значения меньше -4.

<img src="data\MATHML_md3_4_1.png" alt="drawing" width="600"/>

**? Пример № 1**
Найти область определения для функции $\frac{x^2}{(x-3)(x-5)}$.

Можно заметить, что в числителе данной функции мы можем использовать любое значение $x$, а в знаменателе есть два значения, при которых возникнет деление на 0.

**? Пример № 2**

Найти область определения для функции $f(x) = \frac{\sqrt{x+2}}{x^2 - 9}$.

В данном примере нам необходимо обратить внимание как на числитель, так и на знаменатель.

В числителе находится квадратный корень от $x + 2$. Корень мы можем извлекать только из неотрицательных чисел, поэтому x должен быть больше или равен -2.

В знаменателе у нас выражение, которое принимает нулевое значение при $x = 3$ и при $x = -3$.

Таким образом, получаем следующую область определения:

$D(f(x)): [-2;3) \ \cup \ (3; \infty)$

Мы рассмотрели ограничения для знаменателя дроби и квадратного корня. Но есть также ограничения, которые касаются логарифма. В основании логарифма не может быть неположительное число или единица, а показателем логарифма должно быть положительное число:

<img src="data\MATHML_md3_4_2.png" alt="drawing" width="100"/>

Ограничения на показатель логарифма наглядно видно на графике логарифмической функции:

<img src="data\MATHML_md3_4_3.png" alt="drawing" width="400"/>

Отметим, что график не пересекает ось ординат, а лишь бесконечно близко приближается к ней.

Здесь уместно вспомнить про логарифмическое преобразование асимметрично распределённых признаков, с которым вы сталкивались ранее. Теперь мы явно видим, что область определения логарифмической функции — $(0; \infty)$, а значит мы не можем применять это преобразование к признакам, среди которых есть отрицательные значения.

Таким образом, если вы понимаете, какая у функции область определения, вы всегда сможете отследить, по какой причине некорректно сработал метод, или заранее оценить, можно ли использовать те или иные данные в качестве аргумента для какой-то функции.

Разумеется, мы можем вычислять область определения и с помощью библиотеки Python для символьных вычислений, с которой мы познакомились ранее — SymPy.

Например, рассчитаем область определения для функции $f(x) = \frac{1}{x}$:

In [16]:
from sympy import Symbol, S #импортируем нужные функции для обозначения переменных
from sympy.calculus.util import function_range #импортируем функцию для поиска области значения
from sympy.calculus.util import continuous_domain #импортируем функцию для поиска области определения
x = Symbol("x") #определяем нашу переменную
f = 1/x #определяем нашу функцию
continuous_domain(f, x, S.Reals) #вычисляем область определения

Union(Interval.open(-oo, 0), Interval.open(0, oo))

$(- \infty; 0) \ \cup \ (0; \infty)$
Для функции $f(x) = \frac{log(x)}{x}$:

In [17]:
from sympy import log
x = Symbol("x")
f = log(x)/x
continuous_domain(f, x, S.Reals)

Interval.open(0, oo)

$(0; \infty)$

### ОБЛАСТЬ ЗНАЧЕНИЙ ФУНКЦИИ

Теперь, когда мы разобрались с областью определения функции, мы можем перейти к поиску области значений функции.

Под **областью значений** функции понимаются все значения, которые она может принимать.

Например, возможно, вы помните, что синус или косинус никогда не могут быть меньше -1 или больше 1. Это очень хорошо видно на графике:

<img src="data\MATHML_md3_4_4.png" alt="drawing" width="500"/>

Видно, что область значений — от -1 до 1 включительно. Формально это можно записать следующим образом:

$E(f(x)): f(x) \in [-1;1]$  
$E(f(x))$ читается как «область значений функции $f(x)$».

<img src="data\MATHML_md3_4_5.png" alt="drawing" width="500"/>

**? Пример № 1**

Найти область значений для функции $f(x) = \frac{15}{x^2 + 1}$.

Видно, что числитель здесь фиксированный (равен константе, а значит не изменяется), а знаменатель равен 1, если $x = 0$. Если же $x$ принимает любое другое значение, то знаменатель становится больше 1, причём чем $x$ больше по модулю, тем больше значение $x^2 + 1$. Если $x$ примет бесконечно большое значение, то значение всей дроби будет очень маленьким, бесконечно близким к нулю. Наибольшее из возможных значений дроби будет равно 15, если знаменатель равен 1. Таким образом, получаем следующую область значений:

$E(f(x)): f(x) \in (0;15]$

**? Пример № 2**

Найти область значений для функции $f(x) = \frac{2}{\sqrt{2x-1}} + 3$.

Изменим знаменатель, заменив арифметический корень на степень, равную $-\frac{1}{2}$:

$f(x) = 2 \cdot (2x-1)^{-\frac{1}{2}} + 3$
Степенная функция в математике всегда имеет область значений $(0; + \infty)$. Поэтому область значений для $(2x-1)^{-\frac{1}{2}}$ будет равна $(0; + \infty)$. Если мы домножим её значение на 2, то ноль останется нулём, а остальные значения перейдут в какие-то другие, но область значений также останется $(0; + \infty)$. Осталось только добавить обратно 3:

$2 \cdot (2x-1)^{-\frac{1}{2}} + 3$
Прибавляем 3 и к области значений, так как все возможные значения функции увеличились на 3. Получаем:

$E(f(x)): f(x) \in (3; + \infty)$

Разумеется, область значений мы также можем найти с помощью библиотеки SymPy. Например, сделаем это для функции $sin(x$:

In [18]:
from sympy import Symbol, S, sin #импортируем нужные функции для обозначения переменных
from sympy.calculus.util import function_range #импортируем функцию для поиска области значений
x = Symbol("x")
f = sin(x)
function_range(f, x, S.Reals)

Interval(-1, 1)

Или для более сложной функции $f(x) = \frac{x^2 - 3}{e^x}$:

In [19]:
from sympy import Symbol, S #импортируем нужные функции для обозначения переменных
from sympy.calculus.util import function_range #импортируем функцию для поиска области значений
from sympy import exp #добавляем функцию для вычисления экспоненциальной функции
x = Symbol("x")
f = (x*x-3)/(exp(x))
function_range(f, x, S.Reals)

Interval(-2*E, oo)

### ТОЧКИ ПЕРЕСЕЧЕНИЯ С ОСЯМИ АБСЦИСС И ОРДИНАТ

Следующий важный шаг в исследовании функции — это поиск точек, в которых функция пересекает ось абсцисс (горизонтальная ось) и ось ординат (вертикальная ось).

Давайте посмотрим на график ниже. Можно отметить, что в точках, где график пересекает ось x, координата по y равна нулю. И наоборот — в точках пересечения с осью ординат уже координаты по x принимают значение 0.

<img src="data\MATHML_md3_4_6.png" alt="drawing" width="400"/>

Эта удобная особенность позволяет без проблем находить пересечения с осями.

Например, пусть у нас есть функция $f(x) = \frac{x^2 - 2x}{x-1}$. 

Для начала найдём точки пересечения с осью ординат. Для этого нам просто нужно подставить 0 вместо $x$:

$f(0) = \frac{0^2 - 2*0}{0-1}$
Таким образом, пересечение с осью ординат находится в точке (0;0).

Теперь найдём пересечение с осью $x$. Для этого заменим значение функции на ноль:

$0 = \frac{x^2 - 2x}{x-1}$     
$\left\{\begin{matrix} x^2 - 2x = 0 \\ x-1 \neq 0 \end{matrix}\right.$   
$x^2 - 2x = 0$  
$x(x-2) = 0$  
$x = 0$ или $x = 2$  
Получаем, что пересечения с осью абсцисс находятся в точках (0,0) и (2,0).

Для того чтобы найти эти точки пересечения, мы также можем использовать библиотеку SymPy. Например, найдём точки пересечения для функции:

$f(x) = x^2 + 5x + 4$  
Сначала найдём точку пересечения с осью ординат. Для этого просто подставим 0 вместо значения x:

In [20]:
x = Symbol("x")
f = x*x+5*x+4
f.subs(x, 0)

4

Теперь найдём точку пересечения с осью абсцисс. Для этого решим уравнение, в котором приравняем нашу функцию к нулю:

In [21]:
from sympy import solveset, Eq
solveset(Eq(x*x+5*x+4, 0), x)

{-4, -1}

Итак, мы получили, что наша функция $f(x) = x^2 + 5x + 4$ пересекается с осью ординат в точке (0; 4) , а с осью абсцисс — в точках (-4; 0) и (-1; 0).

### ИССЛЕДОВАНИЕ ФУНКЦИИ НА ЧЁТНОСТЬ И НЕЧЁТНОСТЬ

В нашем исследовании остался ещё один пункт — исследование на чётность и нечётность. Давайте разберёмся, какие функции называют чётными, а какие — нечётными.

Функция является **чётной**, если $f(x) = f(-x)$ для всех значений x. Это означает, что функция одинакова для оси $х$, и на положительной и отрицательной полуплоскостях она симметрична относительно оси у.

Например, функция $y = x^2$ является примером чётной функции:

<img src="data\MATHML_md3_4_7.png" alt="drawing" width="500"/>

Можно заметить, что функция симметрична относительно оси у, а также, что её значения в точках x и  -x равны. Она принимает одно и то же значение для 3 и -3, для 2 и -2, для 4 и -4 и так далее.

Ещё одним примером чётной функции является функция $f(x) = \left|x \right|$, так как функция модуля принимает одинаковое значение для x и -x.

Функция является **нечётной**, если $−f(x) = f(−x)$ для всех $x$.

График нечётной функции будет симметричен относительно начала координат. Например, функция $f(x) = x^3$ является нечётной:

<img src="data\MATHML_md3_4_8.png" alt="drawing" width="400"/>

Давайте попробуем исследовать несколько функций на чётность и нечётность.

**? Пример № 1**

$f(x) = 5 * x^2 - 4 * \left|x \right|$  
Подставим в функцию -x вместо x. Получаем:

$f(-x) = 5 * (-x)^2 - 4 * \left|-x \right|$  
По правилам математических преобразований, это выражение равняется исходному:

$5 * (-x)^2 -4 * \left|-x \right| = 5 * x^2 - 4 * \left|x \right|$  
Таким образом, функция является чётной.

**? Пример № 2**

$f(x) = x - 4 * (x)^3$  
Подставим в функцию $-x$ вместо $x$. Получаем:

$f(-x) = -x - 4 * (-x)^3 = -(x - 4 * x^3)$  
Мы получили равенство $f(-x) = - f(x)$. Значит, функция является нечётной.

**? Пример № 3**

$f(x) = x^2 - x$
Подставим в функцию $-x$ вместо $x$. Получаем:

$f(-x) = (-x)^2 + x = x^2 + x$  
Данный результат не удовлетворяет ни условиям чётности, ни условиям нечётности.

→ Мы рассмотрели, какие функции являются чётными, а какие — нечётными. Важно отметить, что эта информация нужна не только для исследования конкретной функции. Подобная классификация функций важна в ряде областей математики, например в анализе Фурье, которые широко используется для анализа сигналов.

✍ Итак, теперь мы можем найти для любой функции область определения и область значений, точки пересечения с осями и узнать, является функция чётной или нечётной. Уже в следующем юните вы познакомитесь с производными и приблизитесь к полному подробному анализу функции.

**Задание 4.2**

Найдите область определения и область значений функции $f(x) = x^2 + 1:$

In [22]:
from sympy import log
x = Symbol("x")
f = x*x + 1
continuous_domain(f, x, S.Reals)

Reals

In [23]:
x = Symbol("x")
f = x*x + 1
function_range(f, x, S.Reals)

Interval(1, oo)

**Задание 4.6**

Найдите координаты пересечения с осью x для функции $y = x^2 + 2x - 8$:

In [24]:
from sympy import solveset, Eq
solveset(Eq(x*x+2*x-8, 0), x)

{-4, 2}

**Задание 4.7**

Найдите область значений для функции $f(x) = \frac{3}{x^2 - 10}$  
Для решения задачи воспользуйтесь библиотекой SymPy.

In [25]:
x = Symbol("x")
f = 3/(x*x - 10)
function_range(f, x, S.Reals)

Union(Interval(-oo, -3/10), Interval.open(0, oo))

____________________________________________

### 5. Производная

### ЧТО ТАКОЕ ПРОИЗВОДНАЯ?

✍ Мы уже познакомились с функциями и научились немного их исследовать. Теперь пришло время познакомиться с действительно мощным инструментом для изучения поведения функции — с **производной**.

Представим, что мы решаем какую-то практическую задачу: предсказываем цену за квартиру, классифицируем фотографии, ищем оптимальное расположение для магазина. Что мы хотим получить в итоге? Максимально точный результат. Спрогнозировать нужные нам данные с минимальной ошибкой. В сложном алгоритме функция, которая выражает ошибку, может быть очень громоздкой в визуальном плане: например, она может быть представлена следующим образом:

<img src="data\MATHML_md3_5_1.png" alt="drawing" width="600"/>

? Мы видим, что есть точка, в которой ошибка достаёт практически до нуля (синий пик внизу), но как найти её? Как туда попасть? Перебирать все точки слишком долго, определить по графику мы также не сможем, если речь будет идти о большом количестве признаков.

Именно **производная** является ключом к решению этой задачи. Дело в том, что благодаря производной мы можем понять, как найти самую низкую точку, не обходя при этом все точки.

Представьте, что вы находитесь в местности с большим количеством оврагов. Вам нужно найти самый глубокий и спуститься на его дно — это как раз и делает наш алгоритм, когда пытается попасть в самую низкую точку. Как и куда идти, чтобы попасть туда за меньшее число шагов? Нам нужно** направление**. Это направление и показывает производная, что делает её поистине незаменимой. То есть если вы сможете рассчитать значение производной, вы сможете получить координату вектора, по которому надо будет двигаться.

Это не единственное применение производной. Например, в задачах компьютерного зрения с помощью производных можно вычислять изменения интенсивности пикселей. Таким образом можно идентифицировать границы объекта — места, где блёклые пиксели сменяются яркими. Это используется буквально в каждой задаче сегментации изображения или детекции объектов.

Прежде чем перейти к таким сложным задачам, нам необходимо разобраться с тем, что такое производная и откуда она возникает.

Рассмотрим **пример**. Предположим, что вы решили ехать из Москвы в Казань. Расстояние между городами — около 800 км (мы округлим его до 800 для задачи). Вы доехали за восемь часов. Таким образом, ваша средняя скорость составляет 100 км/ч. Но, разумеется, скорость не всегда была одинаковой. Возможно, на свободной дороге вы разгонялись и до 150 км/ч, а когда ехали по населённым пунктам, снижали скорость до разрешённой ПДД. Также вы где-то останавливались, чтобы перекусить.

Давайте изобразим вашу поездку на графике таким образом, чтобы по оси абсцисс (горизонтальная ось) было время в часах, а по оси ординат (вертикальная ось) располагалось расстояние в километрах. У точки Москва в таком случае будут координаты \($(0; 0)$\), а у точки Казань — \($(8; 800)$\).

<img src="data\MATHML_md3_5_2.png" alt="drawing" width="600"/>

Чтобы определить среднюю скорость, необходимо просто найти так называемый уклон — поделить изменение расстояния на изменение во времени:

\[$Средняя \ скорость \ = \ \frac{Итоговое \ расстояние - начальное \ расстояние}{Итоговое \ время - начальное \ время} = \frac{800-0}{8-0} = 100 \ км/ч $\]

Но заметьте, что среднюю скорость мы можем искать не только для всего расстояния, но и, например, для какого-то конкретного отрезка пути. Допустим, мы можем выбрать две точки с координатами:

\($(2; 120)$\) — эта точка показывает, что через два часа после начала мы проехали 120 км.
\($(4; 400)$\) — эта точка показывает, что через четыре часа после начала мы были на расстоянии 400 км от Москвы.

<img src="data\MATHML_md3_5_3.png" alt="drawing" width="600"/>

Здесь средняя скорость будет следующей:

\[$Средняя \ скорость \ = \ \frac{400-120}{4-2} = \frac{280}{2} = 140 \ км/ч $\]

Таким образом, мы всегда можем найти среднюю скорость для двух точек \($(x_1; y_1)$\) и \($(x_2; y_2)$\):

\[$\frac{y_2 - y_1}{x_2 - x_1}$\]

Иначе в математике это записывается следующим образом:

\[$\frac{y_2 - y_1}{x_2 - x_1} = \frac{f(x+h) - f(x)}{(x+h) - x} = \frac{f(x+h) - f(x)}{h}$\]

Здесь \($f(x)$\) — это значение функции в начальной точке \($x$\) (в нашем случае это значение расстояния для некоторой точки времени), а \($f(x+h)$\) — это значение функции в конечной точке \($x + h$\) (то есть в точке, которая получилась, когда к начальной что-то прибавили — в нашем случае это увеличение количества часов в пути).

В математическом анализе выражение \($\frac{f(x+h) - f(x)}{h}$\) называют **разностным коэффициентом**. Его можно использовать для того, чтобы искать среднюю скорость изменения какого-то значения (в нашем случае расстояния).

Но, кроме средней скорости на каком-то большом промежутке, нас может интересовать средняя скорость на очень-очень маленьком отрезке времени: по сути, это будет моментальная точная скорость в конкретный момент времени. Именно эта моментальная скорость является **производной от расстояния по времени**. Математически это определяется следующим образом:

\[$f'(x) = lim_{\rightarrow 0} \frac{f(x+h) - f(x)}{h}$\]

Это значит, что мы берём предельно маленький отрезок времени (\($h$\) стремится к нулю, но при этом никогда им не станет — то есть это самый короткий отрезок времени, который только может существовать) и находим для него разностный коэффициент. В левой части функции можно увидеть штрих \($'$\) — это обозначение производной.

Иногда разницы между значениями аргумента \($(x)$\) и значениями функции \($(f(x))$\) обозначают через символ \($\Delta$\)  (дельта):

<img src="data\MATHML_md3_5_4.png" alt="drawing" width="400"/>

In [26]:
1.6

1.6

На самом деле с помощью подобного алгоритма можно также искать приближённые значения функции в некоторой точке. Например, мы знаем значение \($\sqrt{1} = 1$\), а хотим найти \($\sqrt{1.1}$\).

Оказывается, если функция достаточно «хорошая» (т. е. легко вычисляемая) рядом с известной нам точкой (как в примере выше точка 1.1 близка к известной нам 1), то к ней можно провести касательную. Если не отходить слишком далеко от той точки, которую мы хотим искать, то график функции будет очень близок к касательной:

<img src="data\MATHML_md3_5_6.png" alt="drawing" width="600"/>

→ Другими словами, в небольшой окрестности наша функция будет почти прямой. Это значит, что её приращение (увеличение значения) можно считать как приращение линейной функции.

Давайте рассмотрим эту задачу подробнее и посмотрим на изображение поближе:

<img src="data\MATHML_md3_5_7.png" alt="drawing" width="800"/>

На данном графике синяя прямая — это касательная к нашему графику \($x$\) в точке \($A$\) (в которой \($x = 1$\)). Также у нас есть угол наклона касательной. Красной точкой обозначена точка, для которой мы хотим найти значение функции: координата \($x$\) у неё равна \($1.1$\), а координата \($y$\) нам неизвестна. Точкой \($B$\) обозначена точка, в которую бы мы попали, если бы пошли из точки \($A$\) вправо не по графику функции \($x$\), а по проведённой к нему касательной. За \($b$\) на графике обозначено линейное приращение.

Треугольник \($ABC$\) прямоугольный, а значит \($b$\) можно вычислить как \($\Delta x \cdot tg \alpha$\). Таким образом, нужное нам значение \($y_1$\) приближённо равно \($y_0 + \Delta x \cdot tg \alpha$\).

<img src="data\MATHML_md3_5_8.png" alt="drawing" width="800"/>

В данном случае мы ищем самую близкую точку к той, для которой нам необходимо приблизительное значение. Получаем, что тангенс угла \($\alpha$\) равен отношению приращения \($y$\) к приращению \($x$\), где приращение \($x$\) бесконечно малое.

Отсюда вытекает ещё одно понимание производной — через **тангенс наклона касательной**. Теперь мы можем вывести полное определение ↓

**Производная** — это предел отношения приращения функции к приращению аргумента при стремлении приращения аргумента к нулю. Графически это тангенс угла наклона касательной в точке \($x_0$\) к кривой, изображающей функцию.

Задача о приближении, с помощью которой мы только что ввели понятие производной в графическом восприятии, называется **линеаризацией**. Рассмотрим, как мы можем её решить↓

У нас есть значение функции в точке \($x_0$\), и мы хотим узнать её приближённое значение в точке \($x_1$\):

\($y_0 = f(x_{0}) $\) \($y_1 = f(x_{1}) $\)

Мы показали, что если \($x_1$\) находится не очень далеко от \($x_0$\), то отношение приращений примерно равно производной в точке \($x_0$\).

\[$\frac{y_1 - y_0}{x_1 - x_0} \approx  y' (x_0)$\]

\[$y_1 - y_0 \approx (x_1 - x_0) y' (x_0) $\]

<img src="data\MATHML_md3_5_9.png" alt="drawing" width="600"/>

Чем ближе новая точка расположена к старой, тем точнее приближение.

На идее линеаризации основываются **marginal effects**.

**Marginal effects (предельные эффекты)** показывают вклад определённых предикторов в значение целевой переменной.

Например, вы хотите создать модель, которая будет предсказывать, стоит ли давать человеку ипотеку, то есть решаете задачу кредитного скоринга. Вам хочется понять, как эта вероятность будет зависеть от, к примеру, небольшого изменения дохода. Допустим, если предельный эффект для заработной платы, которая исчисляется в тысячах рублей, будет равен 0.03 , то мы сможем сделать вывод, что при изменении дохода на тысячу рублей вероятность меняется на три процентных пункта.

Чуть позже в этом юните мы научимся считать самые элементарные производные и сможем сами вычислить приближённое значение для нескольких точек.

### ВЗАИМОСВЯЗЬ ФУНКЦИИ И ПРОИЗВОДНОЙ

? Мы разобрались с тем, что такое производная и как она вычисляется. Теперь нам важен другой вопрос — для чего она нужна и как используется?

Производная — одна из важнейших концепций, ведь именно она является тем инструментом математического анализа, который позволяет  анализировать и предсказывать изменение различных величин, причём совершенно не важно, что это будут за величины: скорость, физический импульс, цена на акции или формирование сигнала в головном мозге — производная является универсальным инструментом.

Но как нам перейти от возможности её вычисления к возможности формирования выводов о поведении нашей величины?

Представим, что мы хотим составить инвестиционный план, и для этого нам нужно понять, когда наступают наиболее удачные моменты для покупки акций, а когда, наоборот, акции покупать не стоит. Нас будут интересовать следующие аспекты поведения функции цены:

- промежутки времени, в которые цена растёт;
- промежутки времени, в которые цена падает;
- точки минимума (точки, где цена достигает своей нижней точки и начинает расти);
- точки максимума (точки, где цена достигает своей верхней точки и начинает падать).
Оказывается, все эти области и точки можно легко найти, если вычислить производную для интересующей нас функции.

Так как производная характеризует скорость изменения функции, то, разумеется, когда цена растёт, производная будет положительной, когда цена падает, производная будет отрицательной.

Точки минимума и максимума (их ещё называют **экстремумами**) — это те точки, где поведение функции меняется с падения на рост или с роста на падение. В этих местах значение производной меняется с отрицательного на положительное или с положительного на отрицательное, то есть она равна нулю (т. к. чтобы перейти из положительной полуплоскости в отрицательную или наоборот, надо обязательно перейти через 0).

Обобщим эту информацию в таблице:

<img src="data\pic-1.png" alt="drawing" width="900"/>

Также посмотрим на график, на котором изображена производная функции, чтобы оценить поведение самой функции:

<img src="data\MATHML_md3_5_10.png" alt="drawing" width="600"/>

Также в качестве примера приведём сравнение графиков функций (верхний ряд) и графиков их производных (нижний ряд):

<img src="data\MATHML_md3_5_11.png" alt="drawing" width="800"/>

### ВЫЧИСЛЕНИЕ ПРОИЗВОДНЫХ

Мы разобрались в том, что такое производная и как именно она связана с поведением функции. До того момента, как мы сможем полноценно исследовать функцию, осталось совсем немного — нам необходимо научиться вычислять производные (или, как это ещё называют, **дифференцировать функции**).

Для начала нам необходимо познакомиться с дифференцированием простейших функций.

Самая простая функция — это **константа**, функция вида \($y = const$\), например \($y = 5$\) или \($y = -34$\).

Разумеется, если функция является константой, она никогда не изменяется, и скорость её роста равна 0. Поэтому и производная для любой константы равна 0.

С **линейной функцией** всё тоже достаточно просто. За скорость роста линейной функции вида \($y = kx + b$\) отвечает коэффициент \($k$\), а значит, если у нас есть функция вида \($a * x$\), то её производная будет равна просто \($а$\).

С другими функциями так же просто разобраться не получится. Однако это и не нужно. Для того чтобы искать производные элементарных функций, мы будем пользоваться специальной таблицей:


ФУНКЦИЯ	                                       ПРОИЗВОДНАЯ  
\($y = C$\), \($y = Const$\)	               \($0$\)  
\($y = Cx$\)	                               \($y' = C$\)  
\($y = x^n$\)	                               \($y' = n \cdot x^{n-1}$\)  
\($y = e^{nx}$\)	                           \($y' = ne^{nx}$\)  
\($y = a^x$\)	                               \($y' = a^x \ ln \ a$\)  
\($y = ln \ x$\)	                           \($y' = \frac{1}{x}$\)  
\($y = sin \ x$\)	                           \($y' = cos \ x$\)  
\($y = cos \ x$\)	                           \($y' = -sin \ x$\)  
\($y = tgx$\)	                               \($y' = \frac{1}{cos^2 \ x}$\)  
\($y = ctgx$\)	                               \($y' = -\frac{1}{sin^2 \ x}$\)  

Например, нам надо рассчитать производную от \($x^4$\). Мы видим, что производная от \($x^n$\) равняется \($n*x^{n-1}$\). Значит, производная от \($x^4 = 4*x^{4-1} = 4*x^3$\).

Или, к примеру, если дана функция \($5*e^x$\), её производная останется такой же, так как коэффициент сохраняется при дифференцировании функций, а производная \($e^x$\), согласно таблице, равна \($e^x$\).

Если у нас есть сумма функций, то производная суммы будет равна сумме производных:

\[$(sin(x) + 3x^2)’ = cos(x) + 6x$\]

Ранее мы обсудили задачу линеаризации, и теперь, когда мы умеем вычислять простые производные, мы можем разобрать пример для вычисления приблизительных значений.

? Вычислить приближённое значение функции \($y(x) = \sqrt{x}$\) в точках \($x_1 = 1.1$\), \($x_2 = 1.001$\) и \($x_3 = 2$\).

Для начала разберём пример для точки \($x_1 = 1.1$\).

Найдём ближайшую «удобную» для нас точку и значение функции в ней:

\[$x_0 = 1$\]

\[$y_0 = \sqrt{1} = 1$\]

Также найдём значение производной интересующей нас функции в этой точке:

\[$y'(x_0) = \frac{1}{2 \sqrt{x}} |_{x = x_{0}} = \frac{1}{2 \cdot 1} = \frac{1}{2}$\]

Найдём приращение аргумента:

\[$\Delta x = 0.1$\]

Теперь вычислим результат:

\[$y(1.1)=\sqrt{1.1} \approx y_{0}+\left.\left(x_{1}-x_{0}\right) y^{\prime}\right|_{x=x_{0}}=1+0.1 \cdot \frac{1}{2}=1.05$\]

Посмотрим, насколько сильной получилась погрешность относительно настоящего значения:

\($1.05^2 = 1.1025$\) \($\sqrt{1.1} \approx 1.0488088$\)

В целом можно отметить, что получились довольно близкие значения.

Повторим наши вычисления для двух оставшихся значений аргументов по тому же алгоритму:

<img src="data\MATHML_md3_5_12.png" alt="drawing" width="450"/>

→ Пока мы научились считать только самые простые производные, но это не проблема — в следующем юните мы рассмотрим производные для функций любой сложности, и вы сможете хорошо потренироваться в их вычислении.

Также важно отметить, что, как и у любого инструмента, у производной есть свои ограничения. **У некоторых функций не существует производной**. Это важно помнить, так как методы, подразумевающие дифференцирование, из-за этого не могут быть применены ко всем функциям.

1. Такое происходит, если касательных бесконечно много, как, например, у функции  в нуле. Тем не менее, у этой функции есть однозначная касательная, а значит, и производная слева от нуля и справа от нуля. Просто в нуле они не совпадают:

<img src="data\MATHML_md3_5_13.png" alt="drawing" width="450"/>

2. Бывает также, что функция разрывается в какой-либо точке. Здесь можно вспомнить про область определения функции: если функция не существует в какой-то точке, то и производную в ней найти нельзя:

<img src="data\MATHML_md3_5_14.png" alt="drawing" width="350"/>

3. И, наконец, бывают случаи, когда касательная вертикальна, как, например, у функции на графике ниже в нуле. В таком случае для одной точки аргумента существует бесконечно много отображений во множестве значений производной, а значит нет корректной функциональной зависимости. Таким образом, найти производную нельзя.

<img src="data\MATHML_md3_5_15.png" alt="drawing" width="450"/>

______________________________________

**Задание 5.9**

Известно, что \($\sqrt{9} = 3$\). При помощи линеаризации найдите приближённые значения \($\sqrt{10}$\) и \($\sqrt{8}$\). Ответ округлите до двух знаков после точки-разделителя.


$x_0 = 9$  
$y(x_0) = 3$  
$y'(x_0) = 1/2 * (1/\sqrt{x}) = 1/2 * 1/3 =1/6$  
$\Delta x_1 = 10 - 9 = 1$  
$\Delta x_2 = 8 - 9 = -1$  
$y_1 = 3 + 1/6*(1) = 3.17$  
$y_2 = 3 + 1/6*(-1) = 2.83$  

**Задание 5.10**

Рассмотрим функцию \($y = f(x) = ln(x)$\). Известно, что \($ln(1) = 0$\). Вычислите приближённое значение \($ln(1.02)$\), используя линеаризацию

\[$y_1 = y_0 + y'(x_0) \Delta x$\]

$y_1 = 0 + 1/1 (1.02 - 1) = 0.02$

_______________________________________

### 6. Вычисление производных

✍ В предыдущем юните мы научились находить производные простых функций. Однако зачастую функции, для которых нужно найти производные, намного сложнее. Как же быть в такой ситуации? К счастью, существуют правила дифференцирования, которые помогают находить производные от сколь угодно громоздких функций.

Разумеется, все вычисления за вас без проблем может реализовать та или иная библиотека Python. Но, умея считать производные, вы даже в уме сможете определять, с какой скоростью растёт та или иная функция.

История знает много примеров, когда люди, компании и даже государства испытывали много проблем из-за отсутствия интуиции к поведению функций. Один из известных — разведение кроликов в Австралии, когда никто не подумал, что производная от экспоненциальной функции больше производной от линейной, и введённые государством меры не смогут остановить взрывной рост популяции грызунов. Это привело к кризису, проблемам для сельского хозяйства и потере большого количества денег. В рамках компаний и различных проектов такие ситуации тоже могут случаться. Чем больше из того, что «под капотом», вы понимаете, тем быстрее и точнее принимаете решения и тем больше у вас развита интуиция, позволяющая подбирать верные алгоритмы.

Кроме примеров из аналитики, можно также вспомнить, что при работе с языками программирования и написании алгоритмов важно понимать, сколько времени займёт реализация той или иной программы. Для определения этого есть сложность алгоритма, описываемая математическими выражениями (например, линейная или экспоненциальная сложность). Разумеется, можно заучить, когда программа работает быстрее, а когда — медленнее, но понимание вычисления производных позволит вам осознавать, почему существует разница во времени работы.

Здесь можно вспомнить забавную ситуацию, когда в 2009 году сотрудники одной компании в Южной Африке решили, что отправить данные в филиал будет быстрее голубиной почтой, чем по интернету. И они оказались правы, ведь голубиная почта работает с константной скоростью, а если говорить про передачу данных по сети, то скорость увеличивается линейно. Производная константы равна нулю, а линейной функции — положительному числу. Вот и вся разгадка успеха голубиной почты.

И, разумеется, вычислять производные разной сложности очень важно для понимания и реализации алгоритмов оптимизации, которые необходимы для машинного обучения.

### ПРОИЗВОДНАЯ СУММЫ

Начнём с производной суммы, то есть с производной от выражения следующего вида:

\[$(f(x) + g(x))’,$\]

где \($f(x)$\) и \($g(x)$\) — какие-то функции, зависящие от x.

Правило, по которому ищется производная суммы, мы уже отчасти рассмотрели в предыдущем юните. По сути, здесь нет никаких дополнительных усложнений.

Для того чтобы найти **производную суммы**, надо лишь найти производную от каждого слагаемого и затем найти сумму получившихся результатов:

\[$(f+g)'(u) = f'(u) + g'(u)$\]

**? Пример № 1**

Вычислить производную для суммы функций \($e^x$\) и \($x^2$\).

Так как производная для \($e^x$\) равна \($e^x$\), а производная для \($x^2$\) равна \($2x$\), получаем следующее:

\[$(e^x + x^2)' = (e^x)' + (x^2)' = e^x + 2x$\]

**? Пример № 2**

Вычислить производную для разности функций \($ln(x)$\) и \($sin(x)$\).

\[$(ln(x) - sin(x))' = ?$\]

Так как разность всегда можно представить в виде суммы, сведём этот случай к нашему правилу:

\[$(ln(x) - sin(x))’ = (ln(x) + (-sin(x))’ = \frac{1}{x} - cos(x)$\]

### ПРОИЗВОДНАЯ ПРОИЗВЕДЕНИЯ

Следующее правило дифференцирования, с которым нам необходимо разобраться, — правило нахождения производной для произведения функции. К сожалению, здесь всё не так просто, как с суммой.

Для того чтобы вычислить производную произведения, необходимо воспользоваться следующей формулой:

\[$(f \cdot g)'(u) = f'(u) \cdot g(u) + f(u) \cdot g'(u)$\]

Таким образом, нужно:

1. Вычислить производную первого множителя и умножить результат на второй множитель.
2. Вычислить производную второго множителя и умножить результат на первый множитель.
3. Сложить результаты, полученные в пунктах 1 и 2.

**? Пример № 1**

Вычислить производную для произведения функций \($e^x$\) и \($x^2$\).

\[$(e^x \cdot x^2)' = ?$\]

Производная для \($e^x$\) равна \($e^x$\), а производная для \($x^2$\) равна \($2x$\). Поэтому получаем следующее:

\[$(e^x \cdot x^2)' = e^x \cdot x^2 + e^x \cdot 2x$\]

**? Пример № 2**

Вычислить производную для произведения функций \($x^4$\) и \($ln(x)$\).

Производная для \($x^4$\) равна \($4x^3$\), а производная для \($ln(x)$\) равна \($\frac{1}{x}$\). Учитывая это, получаем следующее:

\[$\begin{aligned} &(f(x))^{\prime}=\left(x^{4}\right)^{\prime} \ln (x)+x^{4}(\ln (x))^{\prime} \\ &=\left(4 x^{3}\right) \ln (x)+x^{4}\left(\frac{1}{x}\right) \\ &=\left(4 x^{3}\right) \ln (x)+x^{3} \\ &=x^{3}(4 \ln (x)+1) \end{aligned}$\]

### ПРОИЗВОДНАЯ ЧАСТНОГО

Искать производную частного немного сложнее, чем производную произведения.

При дифференцировании частного знаменатель возводится в квадрат, а в числителе появляется разница произведения производной числителя на знаменатель и произведения числителя на производную знаменателя:

\[$\frac{f}{g}(u) = \frac{f'(u)g(u)  - f(u)g'(u)}{g^2(u)}$\]

**? Пример № 1**

Вычислить для функции \($f(x) = \frac{x-1}{x+2}$\).

Воспользуемся нашей формулой и запишем выражение для вычисления производной:

\[$f'(x) = \frac{(x-1)'(x+2) - (x-1)(x+2)'}{(x+2)^2} $\]

Теперь вычислим производные от двух множителей в числителе:

\[$f'(x) = \frac{(1)(x+2) - (x-1)(1)}{(x+2)^2}$\]

Упростим наше выражение с помощью равносильных преобразований, чтобы оно стало более компактным:

\[$f'(x) = \frac{(x+2) - (x-1)}{(x+2)^2} = \frac{x+2-x-1}{(x+2)^2} = \frac{3}{(x+2)^2}$\]

**? Пример № 2**

Продифференцировать функцию \($y = \frac{ln \ x}{2x^2}$\).

Воспользуемся нашей формулой и запишем выражение для вычисления производной:
\[$y' = \frac{(ln \ x)'(2x^2) - (ln \ x)(2x^2)'}{(2x^2)^2}$\]

Вычислим производные от двух множителей в числителе:

\[$y' = \frac{(\frac{1}{x})(2x^2) - (ln \ x)(4x)}{(2x^2)^2}$\]

Упростим выражение с помощью равносильных преобразований:

\[$y' = \frac{2x - 4x \ ln \ x}{4x^4} = \frac{(2x)(1-2 \ ln \ x)}{4x^4} = \frac{1-2 \ ln \ x}{2x^3}$\]

### ПРОИЗВОДНАЯ КОМПОЗИЦИИ ФУНКЦИЙ

Нам осталось разобраться с тем, как искать производную для композиции функций (или, как её ещё иногда называют, **производную для сложной функции**). 

Теперь, когда вы вспомнили, что такое композиция функций, давайте научимся её дифференцировать. Это можно сделать по следующей формуле:

\[$(f(g(x)))' = [обозначим \,u = g(x)] = (f(u))' = f'(u) \cdot u' = [подставляем \,u = g(x)] = f'(g(x))g'(x)$\]

Тогда:

\[$(f(g(x)))' = f'(g(x))g'(x)$\]

То есть мы ищем производную, как обычно, а затем домножаем результат на производную от той функции, которая выступает в качестве аргумента для внешней функции.

Это может быть сложно понять в теории, поэтому перейдём к разбору **примеров**.

**? Пример № 1**

Вычислить производную для функции \($f(x) = (3x + 1)^5$\).

Данную функцию можно представить как композицию функций \($u(x) = 3x + 1$\) и \($g(x) = x^5$\). Причём внешней функцией здесь является функция \($g(x)$\), а \($u(x)$\) выступает её аргументом. Поэтому изначально мы ищем производную для степенной функции. Выносим вперёд коэффициент и понижаем степень на 1. Затем домножаем результат на производную функции, которая была аргументом:

<img src="data\MATHML_md3_6_2.png" alt="drawing" width="500"/>

Упрощаем результат до максимально компактного вида:

\[$5(3x+1)^4 (3) = 15(3x+1)^4$\]

**? Пример № 2**

Вычислить производную для функции \($f(x) = ln(x^2 - 1)$\).

Можно заметить, что данная функция является композицией двух функций: \($u(x) = ln(x)$\) и \($g(x) = x^2 - 1$\).

Исходя из этого, ищем производную:

<img src="data\MATHML_md3_6_3.png" alt="drawing" width="500"/>

Представляем результат в более компактном виде:

\[$f'(x) = \frac{2x}{x^2 - 1}$\]

### ВЫЧИСЛЕНИЕ ПРОИЗВОДНОЙ С ПОМОЩЬЮ PYTHON

Разумеется, производные не всегда приходится вычислять вручную. Для этого мы можно использовать библиотеку SymPy, с которой мы уже сталкивались, когда речь шла о множествах.

Для того чтобы найти производную с помощью SymPy, необходимо лишь указать, какой буквой обозначается переменная, ввести функцию и применить метод diff().

**? Пример № 1**

Вычислить производную для функции \($f(x) = x^4 +3x^3+4x^2+8$\).

In [27]:
import sympy
x = sympy.Symbol("x")
expr = x**4 + 3*x**3 + 4*x**2 + 8
expr.diff(x)

4*x**3 + 9*x**2 + 8*x

Примечание. Если необходимо найти производную, в которой фигурирует, например, логарифмическая, экспоненциальная или тригонометрическая функция, не забывайте импортировать их из библиотеки. Пример — ниже.

**? Пример № 2**

Вычислить производную для функции \($f(x) = ln(x^2 + 5x) + e^{sin(x)}$\).

In [28]:
import sympy
from sympy import diff, sin, exp, log, Symbol
x = sympy.Symbol("x")
expr = log(x**2 + 5*x) + exp(sin(x))
expr.diff(x)

(2*x + 5)/(x**2 + 5*x) + exp(sin(x))*cos(x)

**Задание 6.5 (на самопроверку)**  
С помощью библиотеки SymPy найдите производную для функции \($y = sin(x*3 + log(x))*exp((x))$\).

In [29]:
import sympy
from sympy import diff, sin,exp, log, Symbol
x = sympy.Symbol("x")
expr = sin(x*3 + log(x))*exp((x))
expr.diff(x)

(3 + 1/x)*exp(x)*cos(3*x + log(x)) + exp(x)*sin(3*x + log(x))

### ВЫЧИСЛЕНИЕ ВТОРОЙ ПРОИЗВОДНОЙ

Мы научились вычислять первую производную для функций разной сложности, а теперь попробуем вычислять производные второго порядка или, как их ещё называют, **вторые производные**.

**Вторая производная** — это производная от производной функции. Чтобы вычислить её, необходимо:

1. Найти производную функции.
2. Найти производную от полученной производной.
Мы уже знаем, что первую производную часто обозначают буквой \($f$\) со штрихом — \($f'(x)$\).

Вторая производная обозначается двумя штрихами следующим образом: \($f''(x)$\).

Вторая производная используется в DS и машинном обучении не меньше первой. Вторая производная позволяет находить так называемые «выпуклости», а также выпуклые функции. Такие функции являются важной частью оптимизации, которая даже выделена в раздел «выпуклая оптимизация» с большой сферой применения.

Многие методы машинного обучения основаны на поиске параметров, которые минимизируют некоторую целевую функцию (например, мы хотим минимизировать затраты на производстве, зная количество сотрудников и возможности компании, или предложить такую транспортную развязку, чтобы минимизировать загруженность на дорогах). Зачастую целевая функция представляет собой выпуклую функцию, поэтому нам нужно знать её особенности.

В следующем юните мы более предметно рассмотрим, как вторая производная используется для исследования функции, а пока давайте разберём простой пример, на котором вы уже сейчас поймёте её смысл.

Представим, что вы участвуете в велогонке и проезжаете десять метров за каждую секунду. Тогда ваша скорость равна \($10 \ м/c$\), а производная от расстояния по времени также равняется \($10 \ м/c$\) (так как скорость и производная для расстояния — в данном случае одно и тоже). То есть первая производная показывает скорость изменения расстояния в зависимости от времени — это нам уже известно. Но внезапно вы решаете ускориться, чтобы одержать победу в гонке, и разгоняетесь до скорости \($14 \ м/c$\) за следующие две секунды. Получается, что прибавка составила четыре метра за две секунды. Это значит, что ваше ускорение равно \($4/2 =  2\ м/c^2$\) — это и есть вторая производная.

**Обобщим полученную информацию**: во время движения первая производная от расстояния — это скорость, а вторая — это скорость изменения скорости (то есть **ускорение**).

**Интересный факт**

Про то, что первая производная является скоростью, а вторая — ускорением, слышали многие. А что же с третьей? Удивительно, но и у производной этого порядка есть вполне осязаемый смысл. Третья производная называется рывок. По сути, это скорость для ускорения. И вы действительно можете почувствовать рывок, когда начинаете ускоряться, нажимать на тормоза или объезжать повороты, поскольку ваше тело приспосабливается к действию новых физических сил. Для инженеров очень важно исследовать третью производную, так как они стараются уменьшить рывок при проектировании лифтов, железнодорожных путей и т. д.

**? Пример № 1**

Найти вторую производную для функции \($y = 3x^4 - 2x^3 + 4x^2 - 5x + 1$\).

Для начала вычислим первую производную:

\[$y' = 12x^3 - 6x^2 + 8x -5$\]

Найдём производную от получившейся первой производной — это как раз и будет вторая производная:

\[$y'' = 36x^2 -12x + 8$\]

**? Пример № 2**

Найти вторую производную для функции \($y = x \ ln \ x$\).

Сначала найдём первую производную, воспользовавшись правилом дифференцирования произведений функций:

\[$y^{\prime}=(x \ln x)^{\prime}=x^{\prime} \cdot \ln x+x \cdot(\ln x)^{\prime}=1 \cdot \ln x+x \cdot \frac{1}{x}=\ln x+1$\]

Теперь, чтобы найти вторую производную, найдём производную от полученного результата:

\[$y'' = (ln \ x + 1)' = \frac{1}{x} + 0 = \frac{1}{x}$\]

Разумеется, мы можем найти вторую производную (производную второго порядка) с помощью библиотеки SymPy. Надо лишь добавить в метод diff() ещё один аргумент — порядок дифференцирования. Так как мы ищем производную второго порядка, то ставим в качестве аргумента 2:

In [30]:
import sympy
from sympy import diff, sin,exp, log, Symbol
x = sympy.Symbol("x")
expr = log(x**2 + 5*x) + exp(sin(x))
expr.diff(x,2)

-exp(sin(x))*sin(x) + exp(sin(x))*cos(x)**2 + 2/(x*(x + 5)) - (2*x + 5)**2/(x**2*(x + 5)**2)

**НЕМНОГО ПРО ОБОЗНАЧЕНИЯ**

До этого мы всё время обозначали производную как штрих. То есть если сама наша функция обозначена \($y$), то её производная — \($y'$\). Если функция обозначена как \($f(x)$\), то её производную мы обозначали через \($f'(x)$\). Для второй производной мы просто увеличивали количество штрихов. На самом деле есть и **другой вариант обозначения производной** ↓

\($\frac{dy}{dx}$\) — это обозначение говорит нам, что мы ищем производную от \($y$\) по \($x$\), то есть что наша функция называется \($y$\), а в качестве переменной мы берём \($x$\).

Тогда вторая производная обозначается как \($\frac{d^2 y}{d x^2}$\). Здесь двойки означают порядок дифференцирования: 2 в числителе обозначает, что мы два раза вычисляем производную, а 2 в знаменателе — что оба раза в качестве переменной выступает \($x$\).

Итак, теперь вы умеете вычислять абсолютно любые производные! Такое умение позволит вам решать различные задачи, а также намного лучше понимать алгоритмы оптимизации, которые мы вскоре изучим. Далее вас ждёт **практика для тренировки навыков**. Не стоит решать все задачи только вручную или только с помощью SymPy: будет здорово, если вы будете решать задачи двумя способами, сравнивая результаты, или чередовать их — так вы сможете отработать оба навыка.

_________________________________

✍ Нам важно понимать, как ведёт себя функция: где она возрастает, а где убывает, где у неё точки минимума, а где — точки максимума.

Допустим, мы выразили функцию, которая отражает величину ошибки в нашей задаче в зависимости от настраиваемых параметров. У нейронных сетей она может выглядеть следующим образом:

<img src="data\MATHML_md3_7_1.png" alt="drawing" width="550"/>

? Как понять, где ошибка будет больше, а где — меньше? Как узнать значение параметра, при котором модель будет наилучшей (т. е. дающей самые точные предсказания)?

→ Ранее мы говорили, что с помощью производной можно находить максимумы и минимумы, и именно производная является фундаментом для реализации известного градиентного спуска. Совсем скоро вы сможете найти минимально возможную ошибку практически для любого такого случая, исследовав функцию.

Или, может быть, вы хотите решить задачу оптимизации? Минимизировать издержки, время в пути или максимизировать прибыль при неких стартовых условиях? Для этого также нужно понимать поведение целевой функции.

Теперь мы знаем всё необходимое для того, чтобы исследовать функцию с помощью первой производной:

- знаем, как связано поведение функции и значение производной;  
- знаем, как искать производную.  
→ Рассмотрим, как мы можем применить эти знания для формирования выводов о поведении функции.

На примере **кубической параболы** $f(x) = x^3 -12x$ посмотрим, как работает определение промежутков возрастания и убывания функции с помощью производной, а также найдём точки максимума и минимума функции.

Вычисляем производную для функции и приравниваем её к нулю, так как точки, в которых производная равна нулю, разграничивают области возрастания и убывания:

$f'(x) = 3x^2 -12 = 3(x-2)(x+2) = 0$  
Отметим эти точки на числовой оси, расставим знаки и найдём, где же функция убывает, а где — возрастает:

<img src="data\MATHML_md3_7_2.png" alt="drawing" width="550"/>

Как мы расставили знаки? Очень просто. Можно вспомнить о том, что на каждом интервале в любой точке производная всегда будет либо только положительной, либо только отрицательной. Значит, можно взять из каждого интервала по одной точке, подставить и посмотреть на знак получившегося значения (в следующем примере мы посмотрим, как это можно сделать).

Можем посмотреть на график нашей функции, чтобы сравнить её вид и то, что мы определили с помощью производной:

<img src="data\MATHML_md3_7_3.png" alt="drawing" width="350"/>

Как можно заметить, функция действительно растёт до -2, убывает от -2 до 2, а после 2 снова возрастает. Точки -2 и 2 являются локальными экстремумами: -2 — это **локальный максимум**, а 2 — **локальный минимум**.

Резюмируем план исследования функции:

1. Находим все решения $f'(x) = 0$.

2. Расставляем их на числовой оси и получаем промежутки.

3. Там, где производная положительная, — область возрастания.

4. Там, где производная отрицательная, — область убывания.

5. Локальный максимум находится на переходе с возрастания на убывание:

<img src="data\MATHML_md3_7_4.png" alt="drawing" width="250"/>

6. Локальный минимум находится на переходе с убывания на возрастание:

<img src="data\MATHML_md3_7_5.png" alt="drawing" width="250"/>

Бывает, что производная обнуляется в какой-то точке, но не меняет знак, проходя через неё, то есть характер монотонности (постоянного возрастания или постоянного убывания) функции не меняется. Эта точка будет являться **стационарной**, не являясь локальным экстремумом (максимумом или минимумом).

Такие стационарные точки называют **точками перегиба**, так как в них функция меняет направление выпуклости (про это мы поговорим немного позже).

Сейчас мы искали локальные максимумы и минимумы, но существуют ещё и **глобальные**.

**Глобальные экстремумы** — это точки, в которых функция достигает максимального или минимального значения на всей области определения или на её подмножестве.

**Свойства глобального экстремума**:

- может не существовать;
- если существует, то единственный.

<img src="data\MATHML_md3_7_6.png" alt="drawing" width="350"/>

**? Пример № 1**

Исследовать на промежутки возрастания и убывания функцию $f(x) = 3x^2 -12x + 1$.

Найдём точки минимума и максимума функции (если они есть), а также области её возрастания и убывания.

В первую очередь необходимо найти производную функции, а также точку (или точки), в которых она принимает нулевое значение:

$f'(x) = 6x - 12$  
$6x - 12 = 0$  
$x = 2$  
У нас получилось два промежутка: от $- \infty$ до $2$ и от $2$ до $\infty$.

Подставим точку из каждого промежутка (сначала из первого, затем из второго), чтобы оценить, какое значение (положительное или отрицательное) принимает производная в рамках рассматриваемого интервала:

$f'(1) = 6(1) -12 = -6, f'(1) < 0$  
$f'(3) = 6(3) -12 = 6, f'(3) > 0$  
Получаем, что производная отрицательная на промежутке левее 2 (т. е. для всех чисел от $- \infty$ до $2$), и положительная на промежутке правее 2 (т. е. для всех чисел от $2 до \infty$). Таким образом, получаем следующие выводы:

Функция возрастает на промежутке $x \in (2; \infty$).
Функция убывает на промежутке $x \in (-\infty; 2$).
Напомним, что возрастание и убывание функции мы определили по знаку производной: до 2 производная отрицательная, поэтому можно говорить об убывании, а после 2 — положительная, что является индикатором области возрастания.

А что же с самой точкой 2?

Так как до неё функция убывает, а после неё — возрастает, то она является точкой минимума.

**? Пример № 2**

Исследовать на промежутки возрастания и убывания функцию $f(x) = - \frac{1}{3} x^3 + 3x^2 - 5x - 1$.

Начнём с поиска производной:

$f'(x)= (- \frac{1}{3} x^3 + 3x^2 - 5x - 1)' = - \frac{1}{3} \cdot 3x^2 + 3 \cdot 2x - 5 - 0 = -x^2 +6x -5$    
После того как нашли производную, приравниваем её к нулю:

$f'(x) = -x^2 +6x -5 = 0$  
Теперь нам осталось найти точки, в которых производная принимает нулевое значение. Это будут точки $x = 1$ и $x = 5$.

Отметим их на числовой прямой и расставим знаки производной:

<img src="data\MATHML_md3_7_7.png" alt="drawing" width="350"/>

Получаем, что от $-\infty$ до $1$ функция убывает, от $1$ до $5$ — возрастает и от $5$ до$+ \infty$ — снова убывает.

Точка $1$ здесь — минимум, а точка $5$ — максимум.

### ВЫПУКЛЫЕ ФУНКЦИИ. ИССЛЕДОВАНИЕ ФУНКЦИИ НА ВЫПУКЛОСТЬ И ВОГНУТОСТЬ

Мы рассмотрели, как с помощью первой производной исследовать функцию: находить её экстремумы (точки минимума и максимума), области возрастания и области убывания. В предыдущем юните мы также научились вычислять вторую производную. Давайте выясним, как её можно использовать для определения выпуклости функции.

**Задание 7.2**

Найдите вторую производную для функции $f(x) = \frac{x^3}{4} - 3x$ в точке 4:

In [31]:
import sympy
from sympy import diff, sin,exp, log, Symbol
x = sympy.Symbol("x")
expr = (x**3)/4 - 3*x
expr.diff(x,2)

3*x/2

Давайте разберёмся, что такое выпуклые функции. Внимательно посмотрим на графики трёх функций, изображённые ниже:

<img src="data\MATHML_md3_7_8.png" alt="drawing" width="650"/>

- У функции слева всего одна точка локального минимума. Если мы сможем её найти, она будет глобальным минимумом на всей прямой.
- У функции посередине всего один локальный максимум. Он же является её глобальным максимумом на всей прямой.
- Функция справа имеет как локальный максимум, так и локальный минимум. Ни один из них не является глобальным — глобальных экстремумов на всей числовой прямой у функции нет.
  
Если мы строим численный алгоритм для поиска глобального экстремума, то с левой и средней функциями делать это гораздо удобнее, чем с правой.

Даже если правая имеет глобальный минимум, найти его не так просто, ведь можно попасть в неправильную «ямку» и вместо глобального минимума найти локальный. Такая проблема может возникнуть, к примеру, при использовании алгоритма градиентного спуска: алгоритм может «застрять» в локальном минимуме.

<img src="data\MATHML_md3_7_9.png" alt="drawing" width="650"/>

Разберёмся, **как различать выпуклые и невыпуклые функции** ↓

Ниже можно увидеть два вида выпуклых функций и одну невыпуклую. Давайте узнаем, какие особенности позволяют однозначно их различать.

<img src="data\MATHML_md3_7_10.png" alt="drawing" width="750"/>

- Отметим любые две точки A и B на графике функции слева и проведём хорду — отрезок, который их соединит. Фрагмент графика от A До B всегда расположен ниже хорды (или совпадает с ней, если у графика есть прямые отрезки). Такие функции называют **выпуклыми вниз**.
- У функции посередине есть аналогичное свойство, только её фрагмент графика между любыми двумя точками A и B всегда расположен выше хорды (или совпадает с ней, если у графика есть прямые отрезки). Такие функции называют **выпуклыми вверх**.
- Функции, не являющиеся выпуклыми вверх или вниз, называют **невыпуклыми**. Можно увидеть, что график функции справа сначала расположен выше хорды, а затем — ниже.
Также можно считать последнюю функцию **кусочно-выпуклой**: в левой части прямой она выпукла вверх, а затем — выпукла вниз. Точка смены выпуклости называется **точкой перегиба**. Как видите, слева от неё все хорды расположены ниже графика, а справа — выше.

<img src="data\MATHML_md3_7_11.png" alt="drawing" width="350"/>

**Свойства выпуклых функций:**

**Идейные:**

- Удобно искать экстремумы.
- Локальные экстремум всегда является глобальным.


**Технические:**

- Сумма выпуклых вверх функций выпукла вверх.
- Сумма выпуклых вниз функций выпукла вниз.
- Композиция одинаково выпуклых функций имеет такую же выпуклость.

Кроме того, выпуклые функции образуют целое семейство. Сумма и композиция одинаково выпуклых вверх функций выпукла в ту же сторону. Разность, произведение и частное, правда, этим свойством не обладают.

Также важно отметить, что часто в литературе можно встретить понятие **выпуклой** и **вогнутой функций**:

**Вогнутая** функция = выпуклая **вниз** функция

<img src="data\MATHML_md3_7_12.png" alt="drawing" width="350"/>


**Выпуклая** функция = выпуклая **вверх** функция

<img src="data\MATHML_md3_7_13.png" alt="drawing" width="350"/>

? Как определить характер функции, если у нас нет её графика и мы хотим сделать это аналитически?

Часто выпуклость можно определить по графику, но если возможности нарисовать график нет, на помощь придут формальные критерии. Для гладких функций одной переменной критерием выпуклости является знак второй производной.

$f'' > 0$ — выпукла **вниз**

$f'' < 0$ — выпукла **вверх**

Исследовать функции на выпуклость очень важно, так как именно в соответствии с этой характеристикой мы будем подбирать нужные методы оптимизации.

→ Различные оптимизационные алгоритмы можно разделить на два класса: «выпуклая оптимизация» и «невыпуклая оптимизация». Без знания этой характеристики для целевой функции вы просто не сможете подобрать нужный алгоритм из всего многообразия и рискуете либо не решить поставленную задачу, либо решить её некорректно.

Разберём на **примере**, как определить, является функция выпуклой вверх или выпуклой вниз.

**? Пример № 1**

Исследовать выпуклость функции $f(x) = \frac{1}{4} x^3 - 3x$.

Найдём первую производную функции:

$f'(x) = \frac{3}{4} x^2 - 3$  
Теперь найдём производную от первой производной, т. е. найдём вторую производную изначальной функции:

$f''(x) = \frac{3}{2} x$  
Далее нам необходимо определить, в каких точках вторая производная равна 0:

$\frac{3}{2} x = 0$  
$x = 0$  
Теперь определим, значения с каким знаком принимает вторая производная на получившихся двух интервалах. Сделаем это с помощью подстановки точек из этих интервалов:

$f''(-1) = \frac{3}{2} (-1) = - \frac{3}{2} < 0$   
$f''(1) = \frac{3}{2} (1) = \frac{3}{2} > 0$  
Как видно, знаки разные и мы не можем сделать однозначный вывод о выпуклости функции. Однако мы можем сказать, что до точки 0 функция является выпуклой вверх, а после точки 0 — выпуклой вниз. Постарайтесь увидеть это и на графике данной функции:

<img src="data\MATHML_md3_7_14.png" alt="drawing" width="350"/>

**? Пример № 2**

Исследовать выпуклость функции $f(x) = 5x^2 + 7x - 25$.

Найдём первую производную:

$y' = 10x + 7$  

Найдём вторую производную:

$y'' = 10$

Можно увидеть, что вторая производная данной функции всегда положительная, а значит функция является выпуклой вниз.

✍ Мы разобрались с тем, как применяются на практике первая и вторая производные для исследования функции. В следующем юните мы объединим все полученные за этот модуль знания, а пока давайте закрепим их

__________________________

### 8. Практика: исследование функции с помощью производных

✍ В предыдущих юнитах мы познакомились со всеми этапами изучения функции, и теперь настало время обобщить полученные знания. Для этого мы возьмём функцию и полностью исследуем её.

Пройдёмся последовательно по всем этапам.

Будем исследовать функцию $y = \frac{x^3}{x^2 - 1}$.

**ОБЛАСТЬ ОПРЕДЕЛЕНИЯ**

Начнём с области определения, то есть с поиска таких возможных значений аргументов, для которых существует данная функция.

В знаменателе стоит выражение $x^2 - 1$. Мы помним, что в знаменателе может быть любое значение, кроме нуля. Таким образом, это выражение никогда не может быть равно нулю. Других ограничений у нас нет. Получаем, что x может быть любым, кроме - 1 и 1:

$D(f(x)): x \in (- \infty; -1) \cup (-1;1) \cup (1; + \infty)$  
С помощью Python мы могли бы вычислить это следующим образом:

In [32]:
from sympy import Symbol, S
from sympy.calculus.util import continuous_domain 
x = Symbol("x") 
f = (x**3)/(x**2-1) 
continuous_domain(f, x, S.Reals)

Union(Interval.open(-oo, -1), Interval.open(-1, 1), Interval.open(1, oo))

**ОБЛАСТЬ ЗНАЧЕНИЙ ФУНКЦИИ**

Мы выяснили, для каких аргументов существует наша функция. Теперь давайте изучим, какие значения она может принимать.

В числителе может быть абсолютно любое вещественное число, а в знаменателе — число не меньше -1. Так как в функции $x^2 - 1$ первое слагаемое $(x^2)$ никогда не может быть отрицательным, то оно равно либо нулю, либо больше нуля. То есть мы из неотрицательного числа вычитаем единицу. Если $x^2$ равен нулю, то ($x^2 - 1 = -1$\). А если $x^2$ больше нуля, то $x^2 - 1$ больше, чем -1. Получается, что в знаменателе должно быть значение -1 или больше при любых значениях аргумента.

Несмотря на ограничения в знаменателе, за счёт числителя функция может принимать абсолютно любое значение.

$E(f(x)): (- \infty; + \infty)$  
С помощью Python это можно вычислить следующим образом:

In [33]:
from sympy import Symbol, S
from sympy.calculus.util import function_range
x = Symbol("x") 
f = (x**3)/(x**2-1) 
function_range(f, x, S.Reals)

Interval(-oo, oo)

**ТОЧКИ ПЕРЕСЕЧЕНИЯ С ОСЯМИ КООРДИНАТ**

Теперь, когда область значений и область определения функции найдены, мы можем найти, в каких точках функция пересекает координатные оси.

Начнём с точек пересечения с осью х. Для этого просто приравняем функцию к нулю:

$y = \frac{x^3}{x^2 - 1} = 0$    
Для того чтобы дробь была равна 0, необходимо, чтобы числитель был равен 0. Значит, $x = 0$. То есть с осью абсцисс функция пересекается в точке (0;0).

Также это можно было бы найти с помощью Python:

In [34]:
from sympy import solveset, Eq
f = (x**3)/(x**2-1) 
solveset(Eq(f, 0), x)

{0}

Если нам нужна точка пересечения с осью у, то мы просто можем поставить 0 вместо x. Тогда вся функция обнулится и мы получим, что точка пересечения с осью ординат — также (0;0).

С помощью Python это вычисляется следующим образом:

In [35]:
x = Symbol("x")
f = (x**3)/(x**2-1)
f.subs(x, 0)

0

**ИССЛЕДОВАНИЕ ФУНКЦИИ НА ЧЁТНОСТЬ И НЕЧЁТНОСТЬ**

Переходим к следующему пункту исследования: узнаем, чётная перед нами функция или нечётная.

Подставим в функцию вместо аргумента x аргумент -x и посмотрим, как она изменится:

$y(-x) = \frac{(-x)^3}{(-x)^2 - 1} = - \frac{x^3}{x^2 - 1} = -y(x)$  
Мы видим, что выполняется условие $f(-x) = - f(x)$, а значит функция является нечётной и её график симметричен относительно начала координат.

**НАХОЖДЕНИЕ ТОЧЕК ЭКСТРЕМУМА, ОБЛАСТЕЙ ВОЗРАСТАНИЯ И УБЫВАНИЯ**

Перейдём к исследованию функции на предмет наличия точек максимума и минимума, а также найдём, где она возрастает, а где — убывает. Алгоритм решения такой задачи нам уже знаком, так что просто реализуем его.

Найдём производную для нашей функции:

$y'(x) = \left ( \frac{x^3}{x^2 - 1} \right )'
= \frac{3x^2 (x^2 - 1) - x^3 \cdot 2x}{(x^2 - 1)^2}
= \frac{3x^4 - 3x^2 - 2x^4}{(x^2 - 1)^2}
= \frac{x^4 - 3x^2}{(x^2 - 1)^2} = \frac{x^2 (x^2 - 3)}{(x^2 - 1)^2}
= \frac{x^2 (x- \sqrt{3})(x+ \sqrt{3})}{(x-1)^2 (x+1)^2}$  
Также это можно сделать с помощью библиотеки SymPy:

In [36]:
import sympy
from sympy import diff
x = sympy.Symbol("x")
expr = (x**3)/(x**2-1)
expr.diff(x)

-2*x**4/(x**2 - 1)**2 + 3*x**2/(x**2 - 1)

**Примечание**. Обратите внимание, что ответы, полученные вручную и с помощью SymPy, на первый взгляд разнятся. Однако если присмотреться, можно заметить, что при приведении к общему знаменателю выражения, полученного с помощью SymPy, мы получим ровно то же самое, что и при ручном счёте.

Итак, мы нашли первую производную. Теперь найдём точки, в которых она может менять знак:

In [37]:
y = expr.diff(x)
solveset(Eq(y, 0), x)

{0, -sqrt(3), sqrt(3)}

Не забываем о том, что помимо найденных точек, есть также и точки, в которых обнуляется знаменатель. Это точки -1 и 1, которые тоже стоит учитывать при поиске интервалов смены знака.

Расставляем их на числовой оси и определяем знаки на каждом промежутке:

<img src="data\MATHML_md3_8_1.png" alt="drawing" width="650"/>

Итак, мы получили, что функция возрастает на интервалах $(- \infty; - \sqrt{3})$ и $(\sqrt{3}; + \infty)$ и убывает на интервалах $(- \sqrt{3}; -1)$, $(-1;0)$, $(0;1)$ и $(1; \sqrt{3})$.

Также мы видим, что в точке $- \sqrt{3}$ возрастание сменяется убыванием — это точка максимума. В точке $\sqrt{3}$ убывание сменяется возрастанием — это точка минимума.

**ИССЛЕДОВАНИЕ ФУНКЦИИ НА ВЫПУКЛОСТИ**

Время перейти к поиску выпуклостей функции. Для того чтобы это сделать, найдём вторую производную функции и приравняем её к нулю:

$y''(x) = \left (\frac{x^4 - 3x^2}{(x^2 - 1)^2}  \right )'
= \frac{(4x^3 - 6x) (x^2 - 1)^2 - (x^4 - 3x^2) 2x2 (x^2 - 1)}{(x^2 - 1)^4}
= x\frac{(4x^2 - 6)(x^2 - 1) -4(x^4 - 3x^2)}{x^2 - 1)^3}
= x \frac{4x^4 - 6x^2 - 4x^2 + 6 -4x^4 + 12x^2}{(x^2 - 1)^3} = x \frac{6 + 2x^2}{(x^2 - 1)^3}$
Также можно вычислить это значение с помощью библиотеки SymPy:

In [38]:
import sympy
from sympy import diff
x = sympy.Symbol("x")
expr = (x**3)/(x**2-1)
expr.diff(x,2)

2*x*(x**2*(4*x**2/(x**2 - 1) - 1)/(x**2 - 1) - 6*x**2/(x**2 - 1) + 3)/(x**2 - 1)

Точки, в которых функция меняет знак: -1, 0, 1.

Расставим данные точки на числовой оси, определим знаки второй производной и отметим промежутки, где мы можем наблюдать выпуклости вниз, а где — выпуклости вверх.

<img src="data\MATHML_md3_8_2.png" alt="drawing" width="650"/>

Получаем, что функция выпукла вверх на интервалах $(- \infty; -1)$ и $(0;1)$ и выпукла вниз на интервалах $(-1;0)$ и $(1; + \infty)$.

Также мы можем увидеть точку — перегиба 0 (-1 и 1 не являются точками перегиба, так как в них функция не существует).

**НАХОЖДЕНИЕ АСИМПТОТ ГРАФИКА**

В одном из предыдущих юнитов мы упоминали, что в исследовании функции необходимо находить асимптоты графика, но не говорили о том, что это такое.

**Асимптота** — это линия, к которой бесконечно приближается график, но так её никогда и не пересекает.

Асимптоты бывают **трёх видов**:

<img src="data\MATHML_md3_8_3.png" alt="drawing" width="750"/>

Для поиска асимптот используют пределы, но их изучение не входит в наши задачи (но если вам очень интересно, можно почитать про них тут https://математика24.рф/kak-reshat-predely-dlya-chajnikov.html). Однако чтобы исследование функции было полным, мы всё равно найдём асимптоты с помощью библиотеки SymPy, которая прекрасно умеет считать любые пределы.

**ГОРИЗОНТАЛЬНАЯ АСИМПТОТА**

In [39]:
from sympy import Symbol, limit, oo
x = Symbol("x")
f = (x**3)/(x**2-1)
limit(f,x,oo)

oo

Получаем $\infty$ — значит, горизонтальной асимптоты нет (по сути, здесь мы всегда получаем значение $k$ для функции $y = k$).

**ВЕРТИКАЛЬНАЯ АСИМПТОТА**

В качестве вертикальных асимптот могут выступать точки, не вошедшие в область определения. Если предел функции в них равен бесконечности, то они являются асимптотами. Проверим:

In [40]:
from sympy import Symbol, limit, oo
x = Symbol("x")
f = (x**3)/(x**2-1)
limit(f,x,1)

oo

Получаем $\infty$.

In [41]:
from sympy import Symbol, limit, oo
x = Symbol("x")
f = (x**3)/(x**2-1)
limit(f,x,-1)

oo

Получаем $\infty$.

Можно сделать вывод, что x = 1 и x = -1 — вертикальные асимптоты.

**НАКЛОННАЯ АСИМПТОТА**

Для поиска наклонной асимптоты нам необходимо найти коэффициенты $k$ и $b$ для функции $y = kx + b$.

Для поиска коэффициента $k$ ищем предел функции, делённой на $x$:

In [42]:
from sympy import Symbol, limit, oo
x = Symbol("x")
f = (x**3)/((x**2-1)*x)
limit(f,x,oo)

1

Получаем 1 — это значит, что $k = 1$.

Теперь ищем $b$. Для этого нужно найти предел для разности функции и произведения $kx$:

In [43]:
from sympy import Symbol, limit, oo
x = Symbol("x")
f = (x**3)/((x**2-1)) - 1*x
limit(f,x,oo)

0

Получаем 0 — это значит, что наклонная асимптота задаётся уравнением $y = x$

Итак, мы провели полное исследование, узнали, как выглядит наша функция, и могли бы изобразить её следующим образом:

<img src="data\MATHML_md3_8_4.png" alt="drawing" width="400"/>

Мы видим точки максимума и минимума в точках $-\sqrt{3}$ и $\sqrt{3}$:

<img src="data\MATHML_md3_8_5.png" alt="drawing" width="300"/>

Кроме того, мы видим точку пересечения с осями:

<img src="data\MATHML_md3_8_6.png" alt="drawing" width="300"/>

Асимптоты, к которым стремятся части графика:

<img src="data\MATHML_md3_8_7.png" alt="drawing" width="300"/>

Также можно увидеть области выпуклости вверх

<img src="data\MATHML_md3_8_8.png" alt="drawing" width="300"/>

и области выпуклости вниз

<img src="data\MATHML_md3_8_9.png" alt="drawing" width="300"/>

Также мы можем отметить, что график симметричен относительно начала координат, так как функция нечетная.

Таким образом, собрав всю информацию о графике, мы всегда можем сделать его «эскиз» на бумаге, и он будет достаточно точен. А вот построить такой график с помощью библиотеки Matplotlib в одно действие не получится, так как функция построения графиков попытается собрать весь график в одну линию, и результат будет далёк от истины.

Конечно, можно разделить график на несколько частей и построить все части отдельно, но ведь сначала надо осознать, что график будет состоять из нескольких частей, а также понять, что это будут за части.

Несмотря на огромное количество продвинутых функций и инструментов для построения графиков, очень сложно пользоваться ими, не понимая, как должна выглядеть функция — в таком случае можно принять за истину абсолютно неверный ответ. Умение самостоятельно исследовать функцию от начала и до конца даёт вам огромный бонус в плане понимания алгоритмов и оценки правильности выполняемых в Python действий.

В виде функциональной зависимости можно выразить практически всё:

- Временной ряд (можно понять, какой тренд у процесса, есть ли сезонность, предсказать будущие значения).
- Функционал ошибки (можно понять, какие параметры лучше взять, чтобы модель была как можно эффективнее).
- Различные биологические, экономические, физические процессы.  
- 
Возможно, вы слышали о так называемом **техническом анализе**, который используют трейдеры для того, чтобы определять наилучшие моменты покупки или продажи акций. Если говорить упрощённо, это анализ графика функции, отражающей изменение цены. Считается, что изменения цен происходят по определённым паттернам, и для их изучения есть ряд приёмов: например, можно найти минимумы и максимумы и провести через них линии определённым образом. Такая манипуляция покажет, какой тренд на изменение цены можно наблюдать. Разумеется, есть целый ряд таких приёмов для изучения динамики цен, и для того, чтобы их использовать и получать доход, специалисты по инвестированию должны очень хорошо уметь исследовать функции.

**УСЛОВИЕ ДЛЯ ЗАДАНИЙ 8.1-8.11**

Исследуемая функция: $y = \frac{x^3}{2(x+5)^2}$.

**Задание 8.1**

Найдите область определения функции:

In [44]:
from sympy import Symbol, S
from sympy.calculus.util import continuous_domain 
x = Symbol("x") 
y = (x**3)/(2*((x + 5)**2))
continuous_domain(y, x, S.Reals)

Union(Interval.open(-oo, -5), Interval.open(-5, oo))

**Задание 8.2**

Найдите область значений функции:

In [45]:
from sympy import Symbol, S
from sympy.calculus.util import function_range
x = Symbol("x") 
y = (x**3)/(2*((x + 5)**2))
function_range(y, x, S.Reals)

Interval(-oo, oo)

**Задание 8.3**

Исследуйте функцию на чётность. Какой она является?

$y(-x) = \frac{(-x)^3}{2*(-x + 5)^2} = - \frac{x^3}{2*(-x + 5)^2}$   
Мы видим, что функция является не является не четной, ни нечётной и её график не симметричен относительно начала координат.

**Задание 8.4**

В какой точке график пересекает ось абсцисс? В качестве ответа введите координату по х.

In [46]:
from sympy import solveset, Eq
y = (x**3)/(2*((x + 5)**2))
solveset(Eq(y, 0), x)

{0}

**Задание 8.5**

В какой точке график пересекает ось ординат? В качестве ответа введите координату по y.

In [47]:
x = Symbol("x")
y = (x**3)/(2*((x + 5)**2))
f.subs(x, 0)

0

**Задание 8.6**

Найдите производную от функции:

In [48]:
import sympy
from sympy import diff
x = sympy.Symbol("x")
expr = (x**3)/(2*((x + 5)**2))
expr.diff(x)

-x**3/(x + 5)**3 + 3*x**2/(2*(x + 5)**2)

**Задание 8.7**

Найдите точку максимума. Если её нет, введите в качестве ответа слово нет.

In [49]:
expr = (x**3)/(2*((x + 5)**2))
y = expr.diff(x)
solveset(Eq(y, 0), x)

{-15, 0}

**Задание 8.8**

Найдите точку минимума. Если её нет, введите в качестве ответа слово нет.

In [50]:
import sympy
from sympy import diff
x = sympy.Symbol("x")
expr = (x**3)/(2*((x + 5)**2))
y = expr.diff(x,2)
display(y)
solveset(Eq(y, 0), x)

3*x*(x**2/(x + 5)**2 - 2*x/(x + 5) + 1)/(x + 5)**2

{0}

____________________________________________________

###  9. Итоги

✍ В данном модуле мы познакомились с основными понятиями, составляющими фундамент математического анализа:

- изучили понятие **множества** и научились реализовывать операции над множествами;
- познакомились с определением** функции** и узнали, какие функции чаще всего используются в аналитике и машинном обучении;
- разобрались с основой математического анализа — **производной**, а также научились дифференцировать даже самые сложные функции;
- обобщили все полученные знания для решения глобальной задачи — **исследования функции** одной переменной, начиная с азов и заканчивая подробным описанием её поведения.

Всё это мы будем использовать в следующем модуле: мы сможем углубить полученные знания и навыки для исследования функций, зависящих от нескольких переменных, и для решения самых простых оптимизационных задач.

**ДОПОЛНИТЕЛЬНО**:

**Литература**:

- Задачник для дополнительной практики https://www.coursehero.com/file/20159815/calculus/  
- Задачник по математическому анализу (на английском) https://lms.skillfactory.ru/assets/courseware/v1/d3e18a7bad318185d27b193f08c069d3/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/Jeffrey_Lockshin_Calculus_-_theory__examples__exercises.pdf

**Видеоролики**:

- Достаточное глубокое погружение в математический анализ с разбором истоков всех концепций (на английском) https://youtube.com/playlist?list=PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr   
- Русскоязычный вариант предыдущих видео https://youtube.com/playlist?list=PLVjLpKXnAGLVbrcJdDb0a2RS6MmRCgxJz  

Чтобы удостовериться, что вы готовы к освоению следующего модуля, давайте повторим самые важные моменты из пройденного материала ↓

**Задание 9.3**

На каком(-их) интервале(-ах) убывает функция $h(x) = -x^3 + 3x^2 + 9?$

In [53]:
import sympy
from sympy import diff
x = sympy.Symbol("x")
expr = - x**3 + 3*x**2 + 9
y = expr.diff(x)
y

-3*x**2 + 6*x

In [54]:
from sympy import solveset, Eq
solveset(Eq(y, 0), x)

{0, 2}

**Задание 9.5**

Найдите точку минимума для функции $y = -\frac{x^2 + 1}{x}$:

In [55]:
import sympy
from sympy import diff
x = sympy.Symbol("x")
expr = - (x**2 + 1)/x
y = expr.diff(x)
y

-2 - (-x**2 - 1)/x**2

In [56]:
from sympy import solveset, Eq
solveset(Eq(y, 0), x)

{-1, 1}

_________________________________________________