В цьому домашньому завданні ми реалізуємо логістичну регресію на `numpy`.
Ці завдання допоможуть вам ґрунтовно засвоїти основні концепції логістичної регресії та реалізувати їх на практиці 🔥

#### Завдання 1: Реалізація функції сигмоїди
1. З використанням `numpy` напишіть функцію `sigmoid(z)` для обчислення значення сигмоїди згідно з формулою:
   $$
   \sigma(z) = \frac{1}{1 + e^{-z}}
   $$
2. Використовуючи цю функцію, обчисліть значення сигмоїди для наступних даних: $ z = [-2, -1, 0, 1, 2] $. Виведіть результат обчислень.


In [134]:
import math
import numpy as np
import pandas as pd

In [135]:
def sigmoid(z):
    return 1/(1 + math.e**(-z))

In [136]:
z = [-2, -1, 0, 1, 2]
z_sigm = []
for num in z:
    z_sigm.append(sigmoid(num))
print(z_sigm)

[0.11920292202211757, 0.2689414213699951, 0.5, 0.7310585786300049, 0.8807970779778823]




#### Завдання 2: Реалізація функції гіпотези для логістичної регресії
1. Напишіть функцію `hypothesis(theta, X)`, яка обчислює гіпотезу для логістичної регресії, використовуючи функцію сигмоїди. Формула гіпотези:
   $$
   h_\theta(x) = \sigma(\theta^T x) = \frac{1}{1 + e^{-\theta^T x}}
   $$
2. Використайте функцію `hypothesis` для обчислення значень гіпотези для наступних даних:
   
   $\theta = [0.5, -0.5]$
   
   $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  Виведіть результат обчислень.


In [143]:
def hypothesis(theta, X):
    power = np.dot(theta.T, X)
    return sigmoid(power)
theta = np.array([0.5, -0.5])
X = np.array([[1, 2], [1, -1], [1, 0], [1, 1]])
hypothesis(theta, X.T)

array([0.37754067, 0.73105858, 0.62245933, 0.5       ])

#### Завдання 3: Реалізація функції для підрахунку градієнтів фукнції втрат
1. Напишіть функцію `compute_gradient(theta, X, y)`, яка обчислює градієнти функції втрат для логістичної регресії. Формула для обчислення градієнта:
   $$
   \frac{\partial L(\theta)}{\partial \theta_j} = \frac{1}{m} \sum_{i=1}^{m} \left[ (h_\theta(x^{(i)}) - y^{(i)}) x_j^{(i)} \right]
   $$
2. Використайте функцію `compute_gradient` для обчислення градієнтів для наступних даних:

  $\theta = [0.5, -0.5]$

  $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  $y = [1, 0, 1, 0]$

  Виведіть результат обчислень.

In [144]:
y = [1, 0, 1, 0]
def compute_gradient(theta, X, y):
    m = X.shape[0]
    q1 = 0;
    q2 = 0;
    for i in range(m):
        q1 += (hypothesis(theta, X[i]) - y[i]) * X[i][0]
        q2 += (hypothesis(theta, X[i]) - y[i]) * X[i][1]
    return (q1/m, q2/m)

In [145]:
grad = compute_gradient(theta, X, y)
grad

(0.057764644657501224, -0.36899431025842855)


#### Завдання 4: Реалізація повного батч градієнтного спуску

**Задача:**
1. Напишіть функцію `full_batch_gradient_descent(X, y, lr=0.1, epochs=100)`, яка реалізує алгоритм Full градієнтного спуску для логістичної регресії. Використовуйте такі формули:
   - Гіпотеза: $ h_\theta(x) = \sigma(\theta^T x) $
   - Оновлення параметрів: $ \theta_j := \theta_j - \alpha \frac{\partial L(\theta)}{\partial \theta_j} $
2. Використайте функцію `full_batch_gradient_descent` для обчислення параметрів моделі на наступних даних:

  $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  $y = [1, 0, 1, 0]$

  Увага! Матриця $X$ вже має стовпець одиниць і передбачається, що це. - стовпець для intercept - параметра зсуву.

  Виведіть результат обчислень.


In [146]:
def full_batch_gradient_descent(X, y, lr = 0.1, epochs = 100):
    q0 = 0
    q1 = 0
    for i in range(epochs):
        theta = np.array([q0, q1])
        grad0, grad1 = compute_gradient(theta, X, y)
        q0 -= lr * grad0
        q1 -= lr * grad1
    return (q0, q1)


In [147]:
Q = full_batch_gradient_descent(X, y)
Q

(-0.2893693041626858, 0.7765512544925173)

#### Завдання 5. Обчислення точності моделі

1. Напишіть функцію `predict_proba(theta, X)`, яка використовує знайдені параметри $\theta$ для обчислення ймовірностей належності поточного прикладу з даних до класу $y=1$ на основі значень $\sigma(\theta^T x)$.

2. Напишіть функцію `predict(theta, X, threshold=0.5)`, яка обчислює клас з передбаченої імовірності належності екземпляра до класу 1 з порогом 0.5. Тобто якщо ймовірність менше 0.5, то передбачаємо клас 0, інакше клас 1.

3. Напишіть функцію `accuracy(y_true, y_pred)`, яка обчислює точність моделі, визначивши частку правильно передбачених класів.

  Формула метрики Accuracy:
  $$
  \text{Accuracy} = \frac{\sum_{i=1}^{m} I(\hat{{y}^{(i)}} = y^{(i)})}{m}
  $$

  де $\hat{{y}^{(i)}}$ - передбачене значення класу, $I$ - індикаторна функція (яка дорівнює 1, якщо умова виконується, і 0 - якщо ні), $m$ - кількість прикладів.

4. Обчисліть з використанням даних в завданні 4 $X$, $y$ та обчислених коефіцієнтах $\theta$ та виведіть на екран:
  - передбачені моделлю імовірності належності кожного з екземплярів в матриці `X` до класу 1
  - класи кожного екземпляра з матриці `X`
  - точність моделі.

In [161]:
theta_calc = np.array([Q[0], Q[1]])

In [180]:
def predict(theta, X, threshold = 0.5):
    h = hypothesis(theta_calc, X.T)
    result = []
    for val in h:
        result.append(int(val >= threshold))
    return result


In [181]:
y_predicted = predict(theta_calc, X, threshold = 0.5)
y_predicted

[1, 0, 0, 1]

In [186]:
def accuracy(y, y_predicted):
    m = y.shape[0]
    result = 0
    for i in range(m):
        result += int(y[i] == y_predicted[i])   
    return result/m

In [191]:
print("Predicted values ",y_predicted)
print("Actual values",y)
model_accuracy = accuracy(np.array(y), np.array(y_predicted))
print("Model acturacy {}".format(model_accuracy))

Predicted values  [1, 0, 0, 1]
Actual values [1, 0, 1, 0]
Model acturay 0.5
