В цьому домашньому завданні ми реалізуємо логістичну регресію на `numpy`.
Ці завдання допоможуть вам ґрунтовно засвоїти основні концепції логістичної регресії та реалізувати їх на практиці 🔥

#### Завдання 1: Реалізація функції сигмоїди
1. З використанням `numpy` напишіть функцію `sigmoid(z)` для обчислення значення сигмоїди згідно з формулою:
   $$
   \sigma(z) = \frac{1}{1 + e^{-z}}
   $$
2. Використовуючи цю функцію, обчисліть значення сигмоїди для наступних даних: $ z = [-2, -1, 0, 1, 2] $. Виведіть результат обчислень.


Завдання 1.1

In [4]:
import numpy as np

In [5]:
def sigmoid(z):
   return 1 / (1 + np.exp(-z))

Завдання 1.2

In [15]:
print(sigmoid(np.array([-2,-1,0,1,2])))

[0.11920292 0.26894142 0.5        0.73105858 0.88079708]




#### Завдання 2: Реалізація функції гіпотези для логістичної регресії
1. Напишіть функцію `hypothesis(theta, X)`, яка обчислює гіпотезу для логістичної регресії, використовуючи функцію сигмоїди. Формула гіпотези:
   $$
   h_\theta(x) = \sigma(\theta^T x) = \frac{1}{1 + e^{-\theta^T x}}
   $$
2. Використайте функцію `hypothesis` для обчислення значень гіпотези для наступних даних:
   
   $\theta = [0.5, -0.5]$
   
   $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  Виведіть результат обчислень.


Завдання 2.1

In [50]:
def sigmoid(z):
   return 1 / (1 + np.exp(-z))

def hypothesis(X, theta):
    return sigmoid(np.dot(X, theta)) #скалярний добуток кожного рядка ознак на вектор параметрів

Завдання 2.2

In [51]:
X = np.array([
    [1, 2],
    [1, -1],
    [1, 0],
    [1, 1]
])
theta = np.array([0.5, -0.5])

probabilities = hypothesis(X, theta)

print(probabilities)

[0.37754067 0.73105858 0.62245933 0.5       ]


#### Завдання 3: Реалізація функції для підрахунку градієнтів фукнції втрат
1. Напишіть функцію `compute_gradient(theta, X, y)`, яка обчислює градієнти функції втрат для логістичної регресії. Формула для обчислення градієнта:
   $$
   \frac{\partial L(\theta)}{\partial \theta_j} = \frac{1}{m} \sum_{i=1}^{m} \left[ (h_\theta(x^{(i)}) - y^{(i)}) x_j^{(i)} \right]
   $$
2. Використайте функцію `compute_gradient` для обчислення градієнтів для наступних даних:

  $\theta = [0.5, -0.5]$

  $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  $y = [1, 0, 1, 0]$

  Виведіть результат обчислень.

Завдання 3.1

In [52]:
def compute_gradient(theta, X, y):
    m = len(y)  # кількість спостережень
    predictions = hypothesis(X, theta)
    error = predictions - y
    gradient = (1 / m) * np.dot(X.T, error)

    return(gradient)

Завдання 3.2

In [53]:
y = np.array([1, 0, 1, 0])

gradient = compute_gradient(theta, X, y)
print(gradient)

[ 0.05776464 -0.36899431]



#### Завдання 4: Реалізація повного батч градієнтного спуску

**Задача:**
1. Напишіть функцію `full_batch_gradient_descent(X, y, lr=0.1, epochs=100)`, яка реалізує алгоритм Full градієнтного спуску для логістичної регресії. Використовуйте такі формули:
   - Гіпотеза: $ h_\theta(x) = \sigma(\theta^T x) $
   - Оновлення параметрів: $ \theta_j := \theta_j - \alpha \frac{\partial L(\theta)}{\partial \theta_j} $
2. Використайте функцію `full_batch_gradient_descent` для обчислення параметрів моделі на наступних даних:

  $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  $y = [1, 0, 1, 0]$

  Увага! Матриця $X$ вже має стовпець одиниць і передбачається, що це. - стовпець для intercept - параметра зсуву.

  Виведіть результат обчислень.


In [56]:
def full_batch_gradient_descent(X, y, lr=0.1, epochs=100):
    # Ініціалізація параметрів нулями
    theta = np.zeros(X.shape[1])

    # Для збереження історії помилок (опціонально)
    loss_history = []

    for epoch in range(epochs):
        # Передбачення
        predictions = hypothesis(X, theta)

        # Функція втрат (log loss) для моніторингу
        loss = -(1/len(y)) * np.sum(
            y * np.log(predictions + 1e-15) + (1 - y) * np.log(1 - predictions + 1e-15)
        )
        loss_history.append(loss)

        # Оновлення параметрів
        theta = theta - lr * gradient

        # Виведемо інформацію кожні 10 ітерацій (опціонально)
        if epoch % 10 == 0 or epoch == epochs - 1:
            print(f"Epoch {epoch+1}: Loss = {loss:.4f}")

    return theta, loss_history

In [57]:
theta_final, loss_history = full_batch_gradient_descent(X, y, lr=0.1, epochs=100)

print(theta_final)

Epoch 1: Loss = 0.6931
Epoch 11: Loss = 0.6239
Epoch 21: Loss = 0.5970
Epoch 31: Loss = 0.6040
Epoch 41: Loss = 0.6359
Epoch 51: Loss = 0.6850
Epoch 61: Loss = 0.7459
Epoch 71: Loss = 0.8148
Epoch 81: Loss = 0.8892
Epoch 91: Loss = 0.9675
Epoch 100: Loss = 1.0403
[-0.57764645  3.6899431 ]


#### Завдання 5. Обчислення точності моделі

1. Напишіть функцію `predict_proba(theta, X)`, яка використовує знайдені параметри $\theta$ для обчислення ймовірностей належності поточного прикладу з даних до класу $y=1$ на основі значень $\sigma(\theta^T x)$.

2. Напишіть функцію `predict(theta, X, threshold=0.5)`, яка обчислює клас з передбаченої імовірності належності екземпляра до класу 1 з порогом 0.5. Тобто якщо ймовірність менше 0.5, то передбачаємо клас 0, інакше клас 1.

3. Напишіть функцію `accuracy(y_true, y_pred)`, яка обчислює точність моделі, визначивши частку правильно передбачених класів.

  Формула метрики Accuracy:
  $$
  \text{Accuracy} = \frac{\sum_{i=1}^{m} I(\hat{{y}^{(i)}} = y^{(i)})}{m}
  $$

  де $\hat{{y}^{(i)}}$ - передбачене значення класу, $I$ - індикаторна функція (яка дорівнює 1, якщо умова виконується, і 0 - якщо ні), $m$ - кількість прикладів.

4. Обчисліть з використанням даних в завданні 4 $X$, $y$ та обчислених коефіцієнтах $\theta$ та виведіть на екран:
  - передбачені моделлю імовірності належності кожного з екземплярів в матриці `X` до класу 1
  - класи кожного екземпляра з матриці `X`
  - точність моделі.

In [62]:
#1
def predict_proba(theta, X):
    return sigmoid(np.dot(X, theta))

proba = predict_proba(theta, X)
print(proba)

[0.37754067 0.73105858 0.62245933 0.5       ]


In [69]:
#2
def predict(theta, X, threshold=0.5):
    probabilities = sigmoid(np.dot(X, theta))  # обчислюємо ймовірності
    return (probabilities >= threshold).astype(int)  # повертаємо класи 0 або 1

predict_1 = predict(theta, X, threshold=0.5)

print(predict_1)

[0 1 1 1]


До 1-го класу в нас відносяться обєкти, а саме [1, -1],
    [1, 0],
    [1, 1]

In [72]:
#3
def accuracy(y_true, y_pred):
  return np.mean(y_true == y_pred)

In [74]:
y_true = np.array([1, 0, 1, 0])
y_pred = predict_1

accurancy = accuracy(y_true, y_pred)
print(accurancy)

0.25


у завданні 5 я додала розв'язок одразу під функціями