In [6]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import math

### Экзаменационное задание по курсу «Математический анализ и теория вероятностей»

**Задание 1**

Найдите производные функций. Подробно распишите решение. Задание должно быть решено без использования Python.

а)
$$
y=e^{x \ln(3x + 1)}
$$

**РЕШЕНИЕ:**

Обозначим $u = x \ln(3x + 1)$, функция примет вид $y = e^{u}$, по правилам дифференцирования сложной функции производная будет вычисляться следующим образом: $y' = e^{u} u'$

Вычислим $ u' $, для этого используем правило произведения:

$u' = \frac{d}{dx}(x) \cdot \ln(3x + 1) + x \cdot \frac{d}{dx}\left(\ln(3x + 1)\right)$

Вычисляем $\frac{d}{dx}\left(\ln(3x+1)\right)$

$\frac{d}{dx}\left(\ln(3x + 1)\right) = \frac{3}{3x + 1} \quad $

Следовательно:

$u' = \ln(3x + 1) + x \cdot \frac{3}{3x + 1}$
$= \ln(3x + 1) + \frac{3x}{3x + 1}$

Таким образом, значение производной заданной функции:
$y' = e^{x \ln(3x + 1)} \left( \ln(3x + 1) + \frac{3x}{3x + 1} \right)$

б)
$$
y = e^{x^2} \sqrt{x^3 + 4x^2 - 7} 
$$

**РЕШЕНИЕ:**

По правилу произведения:

$y=uv$, $y' = u'v + uv'$ 

Для нашего примера $u = e^{x^2}$, $v = \sqrt{x^3 + 4x^2 - 7}$:

Проводим вычисление $u'$

$u' = e^{x^2} \cdot 2x$

Находим $v'$

$v' = \frac{1}{2} (x^3 + 4x^2 - 7)^{-1/2} \cdot (3x^2 + 8x)$

Производим расчет значения производной заданной функции, подставляя полученные значения $u$, $v$, $u'$ и $v'$:

$y' = (2xe^{x^2})\sqrt{x^3 + 4x^2 - 7} + e^{x^2} \cdot \frac{1}{2} (x^3 + 4x^2 - 7)^{-1/2} \cdot (3x^2 + 8x)$

Упрощаем выражение, итого получается:

$y' = e^{x^2} \cdot (2x\cdot\sqrt{x^3 + 4x^2 - 7}\frac{3x^2 + 8x}{2\cdot\sqrt(x^3 + 4x^2 - 7)}) \quad$

в)
$$
y = \frac{x \sqrt{1 - x^2}}{1 + x^2}
$$

**РЕШЕНИЕ:**

Примененим правило частного, из которого $y = \frac{u}{v}$, а $y' = \frac{u'v - uv'}{v^2}$ тогда:

$u = x \sqrt{1 - x^2}$

$v = 1 + x^2$:

Далее находим $u'$, используя правило произведения:

$u' = \frac{d}{dx}(x)\sqrt{1 - x^2} + x \frac{d}{dx}(\sqrt{1 - x^2}) = \sqrt{1 - x^2} + x \cdot \frac{-x}{\sqrt{1 - x^2}} = \sqrt{1 - x^2} - \frac{x^2}{\sqrt{1 - x^2}} = \frac{(1 - x^2) - x^2}{\sqrt{1 - x^2}} = \frac{1 - 2x^2}{\sqrt{1 - x^2}}$

Следующим шагом находим $v'$:

$v' = 2x$

Производим расчет значения производной заданной функции, подставляя полученные значения $u$, $v$, $u'$ и $v'$:

$y' = \frac{\left(\frac{1 - 2x^2}{\sqrt{1 - x^2}}\right)(1 + x^2) - (x \sqrt{1 - x^2})(2x)}{(1 + x^2)^2}$

Упрощаем выражение, итого получается:

$y' = \frac{(1 - x^2 - 2x^4) - 2x^2\sqrt{1 - x^2}}{(1 + x^2)^2 \sqrt{1 - x^2}}$

**Задание 2**

Найдите безусловные экстремумы функции:

$$ 
u = 3x^3 + y^2 + z^2 + 6xy - 2z + 1 
$$

Подробно распишите решение. Задание должно быть решено без использования Python.

**Балл: 3**

**РЕШЕНИЕ:**

Найдем критические точки, для этого вычислим производную от заданной функции:
- **Производная по $ x $**:

   $
   \frac{\partial u}{\partial x} = 9x^2 + 6y
   $
- **Производная по $ y $**:

   $
   \frac{\partial u}{\partial y} = 2y + 6x
   $
- **Производная по $ z $**:

   $
   \frac{\partial u}{\partial z} = 2z - 2
   $
Приравниваем производные к нулю и решаем систему получившихся уравнений:

$ 
9x^2 + 6y = 0 
$

$ 
2y + 6x = 0 
$

$ 
2z - 2 = 0 
$

Из третьего уравнения $ z=1 $. Из второго уравнения $ y=-3x $, данное значение подставим в первое уравнение, откуда:

$
3x^2-6x=0
$

Откуда в свою очередь: $x1=0$ и $x2=2$

Подставляем найденные значения $x1$ и $x2$ в уравнение $ y=-3x $, откуда получаем $y1=0$, $y2=-6$

Таким образом, мы нашли две критические точки:
- $ (0, 0, 1) $

- $ (2, -6, 1) $

Далее вычисляем вторые производные и строим матрицу Гессе.

**Вторые производные:**

$
\frac{\partial^2 u}{\partial x^2} = 18x
$

$
\frac{\partial^2 u}{\partial y^2} = 2
$

$
\frac{\partial^2 u}{\partial z^2} = 2
$

$
\frac{\partial^2 u}{\partial x \partial y} = 6
$

$
\frac{\partial^2 u}{\partial y \partial z} = 0
$

$
\frac{\partial^2 u}{\partial z \partial x} = 0
$

Матрица Гессе $ H $ будет иметь следующий вид:

$
H = \begin{bmatrix}
\frac{\partial^2 u}{\partial x^2} & \frac{\partial^2 u}{\partial x \partial y} & \frac{\partial^2 u}{\partial x \partial z} \\
\frac{\partial^2 u}{\partial y \partial x} & \frac{\partial^2 u}{\partial y^2} & \frac{\partial^2 u}{\partial y \partial z} \\
\frac{\partial^2 u}{\partial z \partial x} & \frac{\partial^2 u}{\partial z \partial y} & \frac{\partial^2 u}{\partial z^2}
\end{bmatrix}
=
\begin{bmatrix}
18x & 6 & 0 \\
6 & 2 & 0 \\
0 & 0 & 2
\end{bmatrix} 
$

1) Подставляем в матрицу Гессе $x1=0$, получаем следующую матрицу:
$
H1 = \begin{bmatrix}
0 & 6 & 0 \\
6 & 2 & 0 \\
0 & 0 & 2
\end{bmatrix}
$

Находим ее определитель:
$det(H1)=0\cdot2\cdot2+0\cdot6\cdot0+6\cdot0\cdot0-(0\cdot2\cdot0+6\cdot6\cdot2+0\cdot0\cdot0)=0-72=-72$

Далее находим собственные значения матрицы $H1$:

$
H1\lambda = \begin{bmatrix}
0-\lambda & 6 & 0 \\
6 & 2-\lambda & 0 \\
0 & 0 & 2-\lambda
\end{bmatrix}
$

$(2-\lambda)(-1)^6(-\lambda(2-\lambda)-36)=0$

Получаем систему:

$(2-\lambda)=0$

$((-\lambda(2-\lambda)-36))=0$

Откуда находим $\lambda$:

Из первого уравнени $\lambda1=2$

Из второго уравнения:

$\lambda^2-2\lambda-36=0$

$D=4+4*36=148$

$\lambda2,3=(2+/-\sqrt148)/2$, из данного выражения видно, что одно значение $\lambda$ получится отрицательным.

Таким образом, для точки **$(0,0,1)$** можно сделать следующие выводы: определитель матрицы Гессе отрицательный, одно из собственных значений матрицы отрицательно, матрица Гессе отрицательно определена, следовательно данная критическая точка **является седловой и не является экстремумом**.

2) Подставляем в матрицу Гессе $x2=2$, получаем следующую матрицу:
$
H2 = \begin{bmatrix}
36 & 6 & 0 \\
6 & 2 & 0 \\
0 & 0 & 2
\end{bmatrix}
$

Находим ее определитель:
$det(H2)=36\cdot2\cdot2+0\cdot6\cdot0+0\cdot6\cdot0-(0\cdot2\cdot0+6\cdot6\cdot2+36\cdot0\cdot0)=144-72=72$

Далее находим собственные значения матрицы $H2$:

$
H2\lambda = \begin{bmatrix}
36-\lambda & 6 & 0 \\
6 & 2-\lambda & 0 \\
0 & 0 & 2-\lambda
\end{bmatrix}
$

$(2-\lambda)(-1)^6((36-\lambda)(2-\lambda)-36)=0$

Получаем систему:

$(2-\lambda)=0$

$((36-\lambda)(2-\lambda)-36)=0$

Откуда находим $\lambda$:

Из первого уравнени $\lambda1=2$

Из второго уравнения:

$\lambda^2-38\lambda+36=0$

$D=1444-4*36=1300$

$\lambda2,3=(38+/-\sqrt1300)/2$

Следовательно, все значения $\lambda$ получаются положительными.

Таким образом, для точки **$(2,-6,1)$** можно сделать следующие выводы: определитель матрицы Гессе положительный, все собственные значения матрицы положительны, матрица Гессе положительно определена, следовательно данная критическая точка является **точкой экстремума (локального минимума)**.

**ОТВЕТ:** Функция $u = 3x^3 + y^2 + z^2 + 6xy - 2z + 1$ имеет локальный минимум в точке **$(2,-6,1)$**.

**Задание 3**

Найдите условный экстремум функции:

$$
z = e^{-x - y} 
$$

Если задано следующее условие:

$$
\frac{x^2}{4} + y^2 = 5
$$

Подробно распишите решение. Задание должно быть решено без использования Python.

**Балл: 5**

**РЕШЕНИЕ:**

Для решения задачи составим функцию Лагранжа, которая будет выглядеть следующим образом:

$
\mathcal{L}(x, y, \lambda) = e^{-x - y} + \lambda \left(\frac{x^2}{4} + y^2 - 5\right)
$

Далее находим производные из функции Лагранжа:

- Производная по $x$:

   $
   \frac{\partial \mathcal{L}}{\partial x} = -e^{-x - y} + \lambda \frac{x}{2} = 0
   $
- Производная по $y$:

   $
   \frac{\partial \mathcal{L}}{\partial y} = -e^{-x - y} + 2\lambda y = 0
   $
- Производная по $\lambda$:

   $
   \frac{\partial \mathcal{L}}{\partial \lambda} = \frac{x^2}{4} + y^2 - 5 = 0
   $

Необходимо решить систему уравнений. Для этого выражаем $\lambda$ из первого, а затем из второго уравнений, получаем:

Из первого:    
$\lambda = \frac{2e^{-x - y}}{x} \quad (x \neq 0)$

Из второго:
$\lambda = \frac{e^{-x - y}}{2y} \quad (y \neq 0)$

Приравниваем получившиеся уравнения, откуда пролучаем:
$x=4y$ при $e^{-x - y} \neq 0$

Подставляем получившееся уравнение в третье уравнение получившейся ранее системы для нахождения $y$:

$
\frac{16y^2}{4} + y^2 = 5
$

$y^2-1=0$

$y1=1$, $y2=-1$

Подставляем получившиеся значения $y$ в уравнение $x=4y$, откуда получаем:

$x1=4$, $x2=-4$

Таким образом, мы получили две точки:
$(4, 1)$
$(-4, -1)$

Далее вычисляем значение функции $ z = e^{-x - y} $ в обеих получившихся точках:

- Для точки $ (4, 1) $:

   $
   z(4, 1) = e^{-4 - 1} = e^{-5}
   $
- Для точки $ (-4, -1) $:

   $
   z(-4, -1) = e^{-(-4) - (-1)} = e^{4 + 1} = e^{5}
   $

Значение $ z(4, 1) = e^{-5} $ — минимальное значение.

Значение $ z(-4, -1) = e^{5} $ — максимальное значение.

**ОТВЕТ:** Условный экстремум функции $ z = e^{-x - y} $ при условии $ \frac{x^2}{4} + y^2 = 5 $:

 - Минимум в точке $ (4, 1) $ со значением $ z = e^{-5} $.

 - Максимум в точке $ (-4, -1) $ со значением $ z = e^{5} $.

**Задание 4**

Вам предоставлены данные о людях с наличием или отсутствием заболевания.

Признаки:

- Age - возрастная группа.
- Test - позитивный или негативный тест на заболевание.
- Status - целевая переменная, есть инфекция или нет.

Необходимо реализовать алгоритм Наивного Байеса для решения задачи классификации. Обязательно оцените качество полученного результата по итогу.

**РЕШЕНИЕ:**

In [24]:
# Данные из файла и выводим на экран первые значения
data = pd.read_csv('exam.csv')
data.head()

Unnamed: 0,Test,Age_Group,Status
0,Positive,Young,Infected
1,Positive,Young,Infected
2,Positive,Young,Infected
3,Positive,Old,Infected
4,Positive,Old,Infected


In [26]:
# Преобразуем категориальных переменные, которые представлены в датасете, в числовые
data['Age_Group'] = data['Age_Group'].astype('category').cat.codes
data['Test'] = data['Test'].astype('category').cat.codes
data['Status'] = data['Status'].astype('category').cat.codes

X = data[['Age_Group', 'Test']] # Признаки
Y = data['Status'] # Целевая переменная

# Разделение на обучающую и тестовую выборки
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=42)

mod = GaussianNB() # Создание модели Наивного Байеса
mod.fit(X_train, Y_train) # обучение модели

# Прогнозирование на тестовой выборке
Y_pred = mod.predict(X_test)

# Оценка качества модели
quality = accuracy_score(Y_test, Y_pred)
matrix = confusion_matrix(Y_test, Y_pred)
report = classification_report(Y_test, Y_pred)

# Результаты
print(f'Доля правильных предсказаний, точность (Accuracy): {quality}')
print('Confusion Matrix:')
print(matrix)
print('Classification Report:')
print(report)

Доля правильных предсказаний, точность (Accuracy): 0.6666666666666666
Confusion Matrix:
[[18 25]
 [ 3 38]]
Classification Report:
              precision    recall  f1-score   support

           0       0.86      0.42      0.56        43
           1       0.60      0.93      0.73        41

    accuracy                           0.67        84
   macro avg       0.73      0.67      0.65        84
weighted avg       0.73      0.67      0.64        84



**ВЫВОДЫ:** 

Из всех предсказаний модель правильно классифицировала $66.67$ процентов объектов - умеренный результат. Исходя из матрицы: модель предсказала $18$ объектов как класс $0$ (истинно положительные) - модель правильно предсказала класс $0$; $25$ объектов как класс $1$ (ложно положительные) - модель предсказала класс $1$, но объект на самом деле принадлежит классу $0$; $3$ объекта как класс $0$ (ложно отрицательные) - модель предсказала класс $0$, но объект на самом деле принадлежит классу $1$; $38$ объектов как класс $1$ (истинно отрицательные) - модель правильно предсказала класс $1$.

**Задание 5**

Дана функция:

$$
f(x)=x^4+3x^3-12x^2+7x-2
$$

Оптимизируйте ее с помощью метода Ньютона, используя язык программирования Python.

За начальную точку возьмите $х=10$, необходимую точность $0.0001$.

**Балл: 5**

**РЕШЕНИЕ:**

In [28]:
def f(x):
    return x**4 + 3*x**3 - 12*x**2 + 7*x - 2

# Первая производная
def func1(x):
    return 4*x**3 + 9*x**2 - 24*x + 7
# Вторая производная
def func2(x):
    return 12*x**2 + 18*x - 24

# Метод Ньютона
def newtons_method(f, fprime, x0, tol=0.0001):
    iter_count = 0
    x_curr = x0
    f_val = f(x_curr)
    while (abs(f_val) > tol):
        f_val = f(x_curr)
        f_prime_val = fprime(x_curr)
        x_curr = x_curr - (f_val)/(f_prime_val)
        iter_count += 1
    return x_curr

optimal_x = newtons_method(f=func1, fprime=func2, x0=10, tol=0.0001)

print(f"Оптимальное значение x: {optimal_x}")
print(f"Значение функции f(x) в оптимальной точке: {f(optimal_x)}")

Оптимальное значение x: 1.310135602950187
Значение функции f(x) в оптимальной точке: -3.733927975515112


**Задание 6**

Дано распределение случайной величины, которая отражает вероятность получения разного количества спам-писем в течение дня:

$$
\begin{array}{|c|c|c|c|c|c|c|с|}
\hline \text  0 & 1 & 2 & 3 & 4 & 5 & 6 & 7\\
\hline \text  0,1 & 0,3 & 0,1 & 0,25 & 0,05 & 0,05 & 0,1 & ? \\
\hline
\end{array}
$$

1) Найдите вероятность получения 7 спам-писем.
2) Найдите математическое ожидание для количества полученных писем.
3) Найдите дисперсию для количества полученных писем. Ответ округлите до сотых.

Задание должно быть решено без использования готовых функций Python.

**РЕШЕНИЕ:**

Пропущенную вероятность для Х=7 вычисляем следующим образом (так как общая вероятность равна 1):

$P(X = 7) = 1 - (0,1 + 0,3 + 0,1 + 0,25 + 0,05 + 0,05 + 0,01) = 1 - 0,95 = 0,05$

По формуле вычисляем математическое ожидание (сумма произведений числа спам-писем на вероятность их получения):

$Е(Х) = 0\cdot0,1 + 1\cdot0,3 + 2\cdot0,1 + 3\cdot0,25 + 4\cdot0,05 + 5\cdot0,05 + 6\cdot0,1 + 7\cdot0,05 = 2,65$

Дисперсия по формуле вычисляется следующим образом: $D(X) = E(X^2) - (E(X))^2$, следовательно, нужно сначала вычислить $E(X^2)$:

$E(X^2) = 0^2\cdot0,1 + 1^2\cdot0,3 + 2^2\cdot0,1 + 3^2\cdot0,25 + 4^2\cdot0,05 + 5^2\cdot0,05 + 6^2\cdot0,1 + 7^2\cdot0,05 = 11,05$

Отсюда находим дисперсию:

$D(X) = 11,05 - 2,65^2 = 11,05 - 7,0225 = 4,03$

**ОТВЕТ:** $P(X = 7) = 0,05$, $Е(Х) = 2,65$, $D(X) = 4,03$

**РЕШЕНИЕ НА PYTHON БЕЗ ИСПОЛЬЗОВАНИЯ ГОТОВЫХ ФУНКЦИЙ:**

In [32]:
x = [0, 1, 2, 3, 4, 5, 6, 7]
p_x = [0.1, 0.3, 0.1, 0.25, 0.05, 0.05, 0.1]  

# Вероятность получения 7 спам-писем
sum_p_x = sum(p_x)
letter7 = 1 - sum_p_x 
p_x.append(letter7) 

# Математическое ожидание
e_x = sum(x_i * p for x_i, p in zip(x, p_x))

# E(X^2)
e_x2 = sum(x_i**2 * p for x_i, p in zip(x, p_x))

# Дисперсия
d_x = e_x2 - e_x**2

print("Пропущенная вероятность P(X = 7) =", round(p_x[7], 2))
print("Математическое ожидание E(X):", round(e_x, 2))
print("Дисперсия D(X):", round(d_x, 2))

Пропущенная вероятность P(X = 7) = 0.05
Математическое ожидание E(X): 2.65
Дисперсия D(X): 4.03


**Задание 7**

За 8 часов рабочего дня в колл-центр поступает в среднем 16 звонков. Найдите вероятность, что за час в колл-центр поступит не более 4 и не менее 2 звонков. Ответ округлите до тысячных. Задание должно быть решено без использования готовых функций Python.

**РЕШЕНИЕ:**

Для решения данной задачи будем использовать распределение Пуассона, так как события происходят за фиксированный промежуток времени - час.

Находим среднее количество звонков за 1 час (параметр $\lambda$ - среднее количество событий):

$\lambda = \frac{16}{8} = 2$

Вероятность получения $k$ событий (в данном случае - звонков) за фиксированный интервал времени определяется формулой Пуассона:

$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}$

Так как нам нужно найти вероятность того, что за час в колл-центр поступит не более 4 и не менее 2 звонков, вычисляем вероятностьи для $k=2,3,4$:

 - Для $k=2$:

$P(X = 2) = \frac{2^2 e^{-2}}{2!} = \frac{4 e^{-2}}{2} = 2 e^{-2}$

 - Для $k=3$:

$P(X = 3) = \frac{2^3 e^{-2}}{3!} = \frac{8 e^{-2}}{6} = \frac{4 e^{-2}}{3}$

 - Для $k=4$:

$P(X = 4) = \frac{2^4 e^{-2}}{4!} = \frac{16 e^{-2}}{24} = \frac{2 e^{-2}}{3}$

Далее находим сумму вероятностей и округляем полученное значение до тысячных:

$P(2 \leq X \leq 4) = P(X = 2) + P(X = 3) + P(X = 4) = 2 e^{-2} + \frac{4 e^{-2}}{3} + \frac{2 e^{-2}}{3} = 2 e^{-2} + \frac{6 e^{-2}}{3} = 2 e^{-2} + 2 e^{-2} = 4 e^{-2} = 4\cdot2,71828^{-2} \approx 0,541$

**ОТВЕТ:** Вероятность того, что за час в колл-центр поступит не более 4 и не менее 2 звонков $\approx 0,541$.

**РЕШЕНИЕ НА PYTHON БЕЗ ИСПОЛЬЗОВАНИЯ ГОТОВЫХ ФУНКЦИЙ:**

In [34]:
n = 16  # количество звонков за 8 часов
t = 8  # часов в рабочем дне
lambda_parametr = n / t  # среднее количество звонков за 1 час

# вероятность того, что за час в колл-центр поступит 2,3,4 звонка - для расчета используем формулу 
# вероятности для распределения Пуассона, что за период времени произойдет k событий
k1 = 2
p_k1 = (lambda_parametr ** k1 * math.exp(-lambda_parametr)) / math.factorial(k1)

k2 = 3
p_k2 = (lambda_parametr ** k2 * math.exp(-lambda_parametr)) / math.factorial(k2)

k3 = 4
p_k3 = (lambda_parametr ** k3 * math.exp(-lambda_parametr)) / math.factorial(k3)

# вероятность того, что за час в колл-центр поступит не более 4 и не менее 2 звонков - складываем вероятности для k=2,3,4
p_2_4 = round((p_k1+p_k2+p_k3),3)
print("Вероятность того, что за час в колл-центр поступит не более 4 и не менее 2 звонков:", p_2_4)

Вероятность того, что за час в колл-центр поступит не более 4 и не менее 2 звонков: 0.541
