# MATH&ML-4. Математический анализ в контексте задачи оптимизации. Часть I

## 1. Введение

✍ В этом модуле мы познакомимся с огромным разделом высшей математики — математическим анализом. Давайте разберёмся, что это и как используется в прикладных задачах, в частности — в задачах Data Science.

**Математический анализ** изучает изменение значений и характер этих изменений.

По сути, это то, с чем мы сталкиваемся постоянно: изменение цен на акции, рост уровня продаж, уменьшение количества клиентов и т. д. До того, как появился математический анализ, вся математика была статична. И только благодаря ему мы имеем возможность изучать динамические процессы.

Математический анализ используется во многих областях — в физике, инженерных науках, биологии, экономике, статистике, медицине — и имеет множество практических применений в реальной жизни. Например, экономисты используют математический анализ для того, чтобы прогнозировать спрос, предложение и максимальную потенциальную прибыль, архитекторы — чтобы найти площадь даже самых сложных и изогнутых поверхностей, специалисты по аэродинамике — чтобы проанализировать траекторию полёта самолета или ракеты.

Словом, абсолютно все динамические процессы и всё, что можно описать с помощью функциональных зависимостей, можно исследовать с помощью математического анализа.

Если говорить о серьёзных задачах из области Data Science и машинного обучения, то математический анализ уже не может быть прикладным инструментом для решения задач от начала и до конца в силу своей простоты. Но это не значит, что он становится бесполезным. Математический анализ является фундаментом для куда более обширной и важной области — **оптимизации** — и выполняет важные роли, например:

- Лежит в основе важных алгоритмов, таких, как, например, градиентный спуск, который требует вычисления градиента функции и часто необходим для обучения моделей машинного обучения, так как минимизирует функцию ошибки на основе вычисления скорости изменения.
- Позволяет изучить внутренние алгоритмы МО.
- Помогает понять поведение функций, используемых для прогнозирования значений и преобразования данных.

Понимание внутренней работы алгоритмов позволяет настраивать их более точно и получать более качественные предсказания.

→ Мы будем изучать математический анализ на протяжении трёх модулей: начнём с азов и закончим разбором сложных алгоритмов оптимизации, которые неразрывно связаны с процессом обучения моделей машинного обучения.

В данном модуле перед нами стоят следующие задачи:

- **Познакомиться с основными понятиями математического анализа.**
В рамках этой задачи мы узнаем, что такое множество, функция и производная функции и научимся решать задачи, используя их.

- **Узнать про основные функциональные зависимости и области их применения.**
Возможно, вы уже знаете, что к целевым переменным при обучении моделей машинного обучения часто применяют логарифмическое преобразование, или что естественные биологические процессы (и не только их) можно предсказывать с помощью экспоненциальной функции. Мы изучим свойства этих (и некоторых других) функциональных зависимостей, чтобы разобраться, какие особенности делают их столь полезными в прикладных задачах.

- **Научиться исследовать функцию одной переменной.**
Исследование функции является важной частью математического анализа и широко применяется в аналитике. Предположим, что мы смогли найти функционал, определяющий значение ошибки в нашей модели. Как понять, в какой точке ошибка минимальна? Какова она будет? Сколько будет таких точек? На все эти вопросы можно ответить, если уметь исследовать функцию. Конечно же, в рамках этой цели мы познакомимся с понятием производной и сможем применять её для решения конкретных задач.

- **Рассмотреть на кейсах применение освоенного материала.**
Разумеется, абсолютно все понятия и изучаемые операции мы будем подкреплять действиями: решать прикладные задачи и изучать функции Python, которые используются для реализации изученных концепций. Уже к концу этого модуля вы сможете полностью исследовать функцию одной переменной и,  например, оценить, в какой точке функционал ошибки (т. е. функция, которая выражает величину ошибки в вашей модели) достигает минимума.

В рамках данного модуля все изучаемые концепции будут достаточно простыми, но это позволит вам заложить фундамент для дальнейшего изучения и понимания более сложных алгоритмов.

### Основы математического языка. Часть II

В модуле MATH&ML-1 мы уже знакомились с кванторами и символами, которые позволяют записывать математические формулировки. Настало время расширить наши знания.

Поскольку определённые методы часто реализуются для конкретного набора чисел, посмотрим, как можно обозначить разные числовые множества:

![image.png](attachment:image.png)

Кроме того, что у нас есть возможность обозначить все числа, обладающие определёнными характеристиками, мы также можем обозначать какие-то небольшие, ограниченные части числовой прямой — **числовые промежутки**.

**Числовые промежутки** — это числовые множества, которые можно изобразить на координатной прямой. К числовым промежуткам относятся **лучи, отрезки, интервалы и полуинтервалы**.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

# 2. Множества. Операции над множествами

### Понятие множества

![image.png](attachment:image.png)

✍ Математика — точная наука, в которой принято давать чёткие и строгие определения всем используемым понятиям. Однако существуют исключения. Иногда мы сталкиваемся с фундаментальными неопределяемыми понятиями, на основе которых определяются все остальные. Одним из таких понятий является **множество** — у него нет чёткого определения. Но, несмотря на это, мы всё равно попробуем разобраться в том, что в математике понимается под множеством.

Важно отметить, что теория множеств входит во многие разделы математики как одна из основных частей. Для нас множества важны по той причине, что мы будем регулярно исследовать функциональные зависимости, а понятие функции базируется именно на теории множеств. Также эта часть математики понадобится вам в будущем в том числе и для понимания теории вероятностей.

Под множеством мы обычно понимаем совокупность (или иногда ещё говорят «семейство» или «класс») объектов, объединённых по какому-то признаку. Например, это могут быть все клиенты какой-то компании, все женщины, проживающие в данной стране, или все учащиеся определённой школы. Разумеется, этими объектами могут быть не только живые существа, но также, например, дома, предметы, натуральные числа или все решения какого-то уравнения — словом, всё, что только можно придумать. 

Если подытожить, то можно сказать, что:

**Множество** — это объединение различных объектов, обладающих каким-то общим признаком или совокупностью признаков.

Множество состоит из **элементов**. Их может быть любое количество, вплоть до бесконечности. Но важно, что все элементы уникальны, они не повторяются. Количество элементов множества называется **мощностью множества**.

Множество, не имеющее элементов, называется пустым и обозначается как ![image.png](attachment:image.png)

![image.png](attachment:image.png)

### Операции над множествами и связанные с ними обозначения

Теперь, когда мы немного познакомились с темой, нам необходимо разобраться с некоторыми часто используемыми операциями над множествами.

### Объединение множеств

![image.png](attachment:image.png)

То есть во множество 'С' помещаются абсолютно все элементы из двух множеств (но без повторений).

Чтобы было понятнее, можно обратить внимание на схему ниже. Такое представление отношений множеств называют **кругами Эйлера** (для следующих операций мы также будем прикладывать аналогичные иллюстрации). Нас интересует закрашенная область.

![image.png](attachment:image.png)

### Пересечение множеств

![image.png](attachment:image.png)

![image.png](attachment:image.png)

→ Вы ещё узнаете об этом подробнее, но пока можно отметить, что даже расчёты в сложных алгоритмах, где используются нейронные сети, задействуют самые простые операции со множествами — т. е. это действительно настолько важная часть, что она пронизывает все области математики и DS.

### Разность множеств

![image.png](attachment:image.png)

### Симметрическая разность множеств

![image.png](attachment:image.png)

### Дополнение множеств

![image.png](attachment:image.png)

Под **универсальным множеством** в математике понимается совокупность всех существующих в этом мире объектов. То есть если мы ищем дополнение ко множеству, то получаем абсолютно все объекты, кроме элементов данного множества.

![image.png](attachment:image.png)

### Операции над множествами в Python

В языке Python реализованы все перечисленные операции над множествами. Для каждой из них есть свой символ и метод. Рассмотрим их все.

Для тренировки создадим два множества:

Во множестве 'A' будут храниться уникальные ID клиентов компании, которые пользуются мобильной связью.
Во множестве 'B' — уникальные ID клиентов компании, которые используют домашний интернет.

In [2]:
A = {'ID453', 'ID312', 'ID41', 'ID3', 'ID500', 'ID920', 'ID36', 'ID27'}
B = {'ID41', 'ID36', 'ID27', 'ID124', 'ID7', 'ID501', 'ID91' }

**ОБЪЕДИНЕНИЕ МНОЖЕСТВ**

Для того чтобы найти объединение множеств, можно использовать метод union(). В качестве результата мы получим тех клиентов, которые используют хотя бы одну из двух услуг компании:

In [3]:
union_AB = A.union(B)
print(union_AB)
#{'ID500', 'ID27', 'ID41', 'ID3', 'ID501', 'ID453', 'ID312', 'ID124', 'ID920', 'ID91', 'ID7', 'ID36'}

{'ID7', 'ID453', 'ID124', 'ID920', 'ID27', 'ID312', 'ID41', 'ID500', 'ID3', 'ID501', 'ID36', 'ID91'}


Обратите внимание, что по результатам применения данного методы мы получили новое множество.

Метод union() можно заменить простой вертикальной чертой:

In [4]:
union_AB = A | B
print(union_AB)
#{'ID500', 'ID27', 'ID41', 'ID3', 'ID501', 'ID453', 'ID312', 'ID124', 'ID920', 'ID91', 'ID7', 'ID36'}

{'ID7', 'ID453', 'ID124', 'ID920', 'ID27', 'ID312', 'ID41', 'ID500', 'ID3', 'ID501', 'ID36', 'ID91'}


**ПЕРЕСЕЧЕНИЕ МНОЖЕСТВ**

Для нахождения пересечения множеств используется метод intersection(). В контексте нашего примера мы получим клиентов, которые пользуются обеими услугами:

In [5]:
inter_AB = A.intersection(B)
print(inter_AB)
#{'ID27', 'ID41', 'ID36'}

{'ID41', 'ID36', 'ID27'}


Также мы можем заменить метод intersection() на амперсанд (&) — результат будет идентичным:

In [6]:
inter_AB = A & B
print(inter_AB)
#{'ID27', 'ID41', 'ID36'}

{'ID41', 'ID36', 'ID27'}


**РАЗНОСТЬ МНОЖЕСТВ**

Для того чтобы получить разность между двумя множествами, применим метод difference(). В данном случае мы получим перечень тех клиентов, которые используют мобильную связь, однако не используют домашний интернет.

In [7]:
diff_AB = A.difference(B)
print(diff_AB)
#{'ID500', 'ID3', 'ID453', 'ID312', 'ID920'}

{'ID453', 'ID920', 'ID312', 'ID3', 'ID500'}


Здесь также есть вариант замены метода символом — в данном случае это знак «минус»:

In [8]:
diff_AB = A - B
print(diff_AB)
#{'ID500', 'ID3', 'ID453', 'ID312', 'ID920'}

{'ID453', 'ID920', 'ID312', 'ID3', 'ID500'}


Важно отметить, что если поменять два множества местами при выполнении операции разности, результат изменится. В нашем примере результатом будут клиенты, которые пользуются только домашним интернетом:

In [9]:
diff_BA = B - A
print(diff_BA)
#{'ID124', 'ID7', 'ID501', 'ID91'}

{'ID124', 'ID7', 'ID501', 'ID91'}


Разность можно также использовать для нахождения дополнения ко множеству, если заранее задать универсальное множество для задачи.

**СИММЕТРИЧЕСКАЯ РАЗНОСТЬ**

Для вывода симметрической разности можно использовать метод symmetric_difference() или оператор ^. В качестве результата получим клиентов, которые пользуются только какой-то одной из услуг:

In [10]:
symmAB = A.symmetric_difference(B)
print(symmAB)
#{ID124', 'ID91', 'ID7', 'ID312', 'ID500', 'ID453', 'ID3', 'ID501', 'ID920'}


symmAB = A ^ B
print(symmAB)
#{ID124', 'ID91', 'ID7', 'ID312', 'ID500', 'ID453', 'ID3', 'ID501', 'ID920'}

{'ID453', 'ID920', 'ID312', 'ID501', 'ID91', 'ID7', 'ID124', 'ID3', 'ID500'}
{'ID453', 'ID920', 'ID312', 'ID501', 'ID91', 'ID7', 'ID124', 'ID3', 'ID500'}


### Библиотека Sympy, символьные вычисления и множества

Познакомимся с важной библиотекой, которая будет нам полезна.

![image.png](attachment:image.png)

**SymPy** — это библиотека Python для выполнения символьных вычислений. Это система компьютерной алгебры, которая может выступать как отдельное приложение, так и в качестве библиотеки для других приложений (как это реализовано, например, в Python).

![image.png](attachment:image.png)

В пакете SymPy есть разные модули, которые помогают строить графики, выводить результат (LaTeX), заниматься физикой, статистикой, комбинаторикой, числовой теорией, геометрией, логикой и так далее.

Данная библиотека поможет нам реализовывать различные математические операции в более аккуратном виде и получать результат, который будет легко читаем и понятен.

С её помощью можно работать и со множествами. Для этого нам необходимо импортировать из неё функцию FiniteSet, а объединение обозначается уже знакомой нам функцией Union:

In [15]:
#%pip install sympy
from sympy import FiniteSet, Union
l1 = [1, 3, 7, 10] 
l2 = [9, 7, 1] 
a = FiniteSet(*l1) 
b = FiniteSet(*l2) 
Union(a, b)

{1, 3, 7, 9, 10}

![image.png](attachment:image.png)

Также с помощью этой библиотеки можно задать множество не прямым перечислением элементов, а с помощью условий и математических выражений (это то, о чём мы говорили ранее). Интересно то, что мы получим не прямое перечисление элементов, а именно математическую запись.

In [16]:
from sympy import ConditionSet, Eq, Symbol, Interval
x=Symbol('x')
s=ConditionSet(x, Eq(x**2-5*x,0), Interval(2,9))
s

ConditionSet(x, Eq(x**2 - 5*x, 0), Interval(2, 9))

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [18]:
set1 = {'bennet@xyz.com', 'darcy@abc.com', 'margaret@xyz.com' , 'pa@hhh.com', 'marimari@xyz.com' , 'mallika@yahoo.com' ,'abc@xyz.com' ,'0071235@gmail.ru'}
set2 = {'marimari@xyz.com', 'darcy@abc.com', '0071235@gmail.ru', 'darcy@abc.com', 'petr44@xyz.com', 'katrin@ya.com'}

len(set1&set2)

3

![image.png](attachment:image.png)

In [19]:
set1 = {'bennet@xyz.com', 'darcy@abc.com', 'margaret@xyz.com' , 'pa@hhh.com', 'marimari@xyz.com' , 'mallika@yahoo.com' ,'abc@xyz.com' ,'0071235@gmail.ru'}
set2 = {'marimari@xyz.com', 'darcy@abc.com', '0071235@gmail.ru', 'darcy@abc.com', 'petr44@xyz.com', 'katrin@ya.com'}

len(set1 | set2)

10

![image.png](attachment:image.png)

In [20]:
set1 = {'bennet@xyz.com', 'darcy@abc.com', 'margaret@xyz.com' , 'pa@hhh.com', 'marimari@xyz.com' , 'mallika@yahoo.com' ,'abc@xyz.com' ,'0071235@gmail.ru'}
set2 = {'marimari@xyz.com', 'darcy@abc.com', '0071235@gmail.ru', 'darcy@abc.com', 'petr44@xyz.com', 'katrin@ya.com'}

len(set1 ^ set2)

7

# 3. Функция. Элементарные функции

### Понятие функции

✍ В этой части модуля мы познакомимся с понятием **функции**, а также рассмотрим основные функциональные зависимости, с которыми вы уже встречались и не раз встретитесь в будущем.

![image.png](attachment:image.png)

Из школьного курса алгебры вы можете помнить следующее определение для функции:

**Функциональная зависимость**, или **функция** — это такая зависимость между двумя переменными, при которой каждому значению независимой переменной соответствует единственное значение зависимой переменной.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

### Элементарные функции

При решении различных задач мы будем сталкиваться с так называемыми элементарными функциями.

**Элементарные функции** — это функции, которые являются суммой, произведением или композицией функций следующих трёх видов:

![image.png](attachment:image.png)

Элементарные функции можно записать понятной формулой из элементов-«кирпичиков». Это значит, что, зная свойства этих «кирпичиков», такие функции легко анализировать:

![image.png](attachment:image.png)

### Экспоненциальная функция

![image.png](attachment:image.png)

Значением экспоненциальной функция может быть любое число больше нуля, а в качестве аргумента может выступать любое вещественное число.

Для того чтобы преобразовывать экспоненциальные функции, используют следующие **свойства**:

![image.png](attachment:image.png)

### Логарифмическая функция

Логарифмическая функция также часто встречается как прикладной инструмент для аналитики. Во многом это обусловлено тем, что натуральный логарифм является обратной функцией для такой полезной экспоненциальной:



![image.png](attachment:image.png)

Если понять это соотношение, то станет очевидным, что **натуральный логарифм** — это время, необходимое для того, чтобы вырасти до определённого уровня.

Например, представьте, что вы делаете инвестиции в суперприбыльные акции, у которых непрерывная годовая доходность 100 %. Вам нужно понять, спустя какой время вы достигнете десятикратного роста вклада (т. е. увеличения вложенной суммы в десять раз). Чтобы это посчитать, вам необходимо всего лишь вычислить натуральный логарифм:

![image.png](attachment:image.png)

Как вы можете видеть, логарифмическая функция отлично подходит для прогнозирования сроков достижения определённых показателей.

Однако и сама по себе логарифмическая функция пронизывает практически все явления нашей жизни, и с логарифмами работают во многих областях:

- Громкость звука измеряют в децибелах, пропорциональных логарифму мощности звука, воздействующего на ухо. Использование логарифмических шкал продиктовано особенностями наших органов чувств: зрения, слуха и т. д.

- Логарифмическая шкала используется при анализе различных исторических событий для простоты восприятия очень больших промежутков времени. Такая система называется **логарифмической шкалой времени.**

- В физике логарифмы используются в описании многих процессов. Например, формула Циолковского определяет скорость, которую развивает летательный аппарат под воздействием тяги ракетного двигателя: логарифмическая функция сыграла очень важную роль в освоении космоса.

Подобные примеры можно перечислять бесконечно. В какой бы области знаний вы ни работали, велика вероятность столкнуться с логарифмической функцией.

Но на самом деле вы уже сталкивались с ней, когда работали с трансформацией признаков в машинном обучении. Напомним, что:

**Логарифмическое преобразование** — один из самых популярных методов преобразования. В этом преобразовании мы берём логарифм значений признака вместо самих значений.

Освежить знания можно здесь. https://apps.skillfactory.ru/learning/course/course-v1:SkillFactory+DSPR-2.0+14JULY2021/block-v1:SkillFactory+DSPR-2.0+14JULY2021+type@sequential+block@4bfc5a15528b45908ed0fe84c81ea4f2/block-v1:SkillFactory+DSPR-2.0+14JULY2021+type@vertical+block@35a9c2d0bf0242f6bf4285d9f5b05aef

Визуальное представление логарифмической функции вы можете видеть ниже:

![image.png](attachment:image.png)

Логарифмическая функция может принимать любое значение, но в качестве аргумента ей можно передать только положительные числа.

![image.png](attachment:image.png)

Разумеется, логарифмическая функция может быть и с другим основанием, не только с экспонентой. Однако мы рассматриваем именно такую вариацию как наиболее используемую в различных задачах машинного обучения.

### Сигмоидальная функция

Очень интересной и, возможно, уже известной вам функцией является сигмоидальная:

![image.png](attachment:image.png)

Сигмоидальная функция широко используется в машинном обучении: например, она применяется в нейронных сетях в качестве функции активации, которая позволяет как усиливать слабые сигналы, так и не насыщаться от сильных сигналов. Одна из вариаций сигмоидальной функции, логистическая функция, используется для решения задачи классификации.

Сигмоидальная функция строго больше нуля и строго меньше единицы, то есть, она целиком находится внутри диапазона от 0 до 1. Именно это свойство позволяет использовать её для предсказания вероятностей (что может быть очень полезно при решении задачи классификации), т. к. значение вероятности тоже может быть от 0 до 1.

Ещё одним важным свойством сигмоидальной функции является то, что при отрицательных значениях аргумента она принимает значения меньше 0.5 , а при положительных — больше:

![image.png](attachment:image.png)

### Композиция функций

![image.png](attachment:image.png)

Мы рассмотрели некоторые элементарные функции, и теперь пришло время поговорить о сложных функциях или, как их называют более формально, **композициях функций**.

![image.png](attachment:image.png)

# 4. Исследование функции

![image.png](attachment:image.png)

✍ Мы познакомились с понятием функции и рассмотрели несколько популярных функций, которые широко используются в машинном обучении. Но нам важно не только знать, что такое функция, но и уметь исследовать любую функцию, с которой мы можем столкнуться.