В цьому домашньому завданні ми реалізуємо логістичну регресію на `numpy`.
Ці завдання допоможуть вам ґрунтовно засвоїти основні концепції логістичної регресії та реалізувати їх на практиці 🔥

#### Завдання 1: Реалізація функції сигмоїди
1. З використанням `numpy` напишіть функцію `sigmoid(z)` для обчислення значення сигмоїди згідно з формулою:
   $$
   \sigma(z) = \frac{1}{1 + e^{-z}}
   $$
2. Використовуючи цю функцію, обчисліть значення сигмоїди для наступних даних: $ z = [-2, -1, 0, 1, 2] $. Виведіть результат обчислень.


In [6]:
import numpy as np

# Функція сигмоїди
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# Заданий масив значень
z = np.array([-2, -1, 0, 1, 2])

# Обчислення значень сигмоїди
sigmoid_values = sigmoid(z)

# Виведення результату
print("Значення сигмоїди:", sigmoid_values)

Значення сигмоїди: [0.11920292 0.26894142 0.5        0.73105858 0.88079708]


📌 Пояснення:

Функція sigmoid(z) реалізує математичну формулу:

𝜎
(
𝑧
)
=
1
1
+
𝑒
−
𝑧
σ(z)=
1+e
−z

1
​

Значення z подані у вигляді numpy-масиву: [-2, -1, 0, 1, 2]

Результатом буде масив значень функції сигмоїди для кожного елемента z.



#### Завдання 2: Реалізація функції гіпотези для логістичної регресії
1. Напишіть функцію `hypothesis(theta, X)`, яка обчислює гіпотезу для логістичної регресії, використовуючи функцію сигмоїди. Формула гіпотези:
   $$
   h_\theta(x) = \sigma(\theta^T x) = \frac{1}{1 + e^{-\theta^T x}}
   $$
2. Використайте функцію `hypothesis` для обчислення значень гіпотези для наступних даних:
   
   $\theta = [0.5, -0.5]$
   
   $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  Виведіть результат обчислень.


In [7]:
import numpy as np

# Сигмоїдна функція
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# Функція гіпотези
def hypothesis(theta, X):
    z = np.dot(X, theta)
    return sigmoid(z)

# Вхідні дані
theta = np.array([0.5, -0.5])
X = np.array([
    [1, 2],
    [1, -1],
    [1, 0],
    [1, 1]
])

# Обчислення гіпотези
result = hypothesis(theta, X)

# Виведення результату
print("Значення гіпотези:", result)

Значення гіпотези: [0.37754067 0.73105858 0.62245933 0.5       ]


📌 Пояснення:

X — матриця з 4-х прикладів і 2-х ознак (включно з константою 1).

theta — вектор ваг.

Використовується добуток np.dot(X, theta) для обчислення
𝜃
𝑇
𝑥
θ
T
 x.

Потім через sigmoid() обчислюється результат гіпотези.

#### Завдання 3: Реалізація функції для підрахунку градієнтів фукнції втрат
1. Напишіть функцію `compute_gradient(theta, X, y)`, яка обчислює градієнти функції втрат для логістичної регресії. Формула для обчислення градієнта:
   $$
   \frac{\partial L(\theta)}{\partial \theta_j} = \frac{1}{m} \sum_{i=1}^{m} \left[ (h_\theta(x^{(i)}) - y^{(i)}) x_j^{(i)} \right]
   $$
2. Використайте функцію `compute_gradient` для обчислення градієнтів для наступних даних:

  $\theta = [0.5, -0.5]$

  $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  $y = [1, 0, 1, 0]$

  Виведіть результат обчислень.

In [8]:
import numpy as np

# Сигмоїдна функція
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# Функція гіпотези
def hypothesis(theta, X):
    return sigmoid(np.dot(X, theta))

# Функція для обчислення градієнта
def compute_gradient(theta, X, y):
    m = len(y)
    h = hypothesis(theta, X)
    gradient = (1 / m) * np.dot(X.T, (h - y))
    return gradient

# Вхідні дані
theta = np.array([0.5, -0.5])
X = np.array([
    [1, 2],
    [1, -1],
    [1, 0],
    [1, 1]
])
y = np.array([1, 0, 1, 0])

# Обчислення градієнта
grad = compute_gradient(theta, X, y)

# Виведення результату
print("Градієнт:", grad)

Градієнт: [ 0.05776464 -0.36899431]


📌 Пояснення:

m — кількість прикладів.

h — вектор прогнозів (гіпотези).

Формула:

∇
𝜃
𝐿
(
𝜃
)
=
1
𝑚
𝑋
𝑇
(
ℎ
−
𝑦
)
∇
θ
​
 L(θ)=
m
1
​
 X
T
 (h−y)
np.dot(X.T, (h - y)) — матричне множення, що відповідає сумуванню похідних.


#### Завдання 4: Реалізація повного батч градієнтного спуску

**Задача:**
1. Напишіть функцію `full_batch_gradient_descent(X, y, lr=0.1, epochs=100)`, яка реалізує алгоритм Full градієнтного спуску для логістичної регресії. Використовуйте такі формули:
   - Гіпотеза: $ h_\theta(x) = \sigma(\theta^T x) $
   - Оновлення параметрів: $ \theta_j := \theta_j - \alpha \frac{\partial L(\theta)}{\partial \theta_j} $
2. Використайте функцію `full_batch_gradient_descent` для обчислення параметрів моделі на наступних даних:

  $X = \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 1 & 0 \\ 1 & 1 \end{bmatrix}$

  $y = [1, 0, 1, 0]$

  Увага! Матриця $X$ вже має стовпець одиниць і передбачається, що це. - стовпець для intercept - параметра зсуву.

  Виведіть результат обчислень.


In [9]:
import numpy as np

# Сигмоїдна функція
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# Функція гіпотези
def hypothesis(theta, X):
    return sigmoid(np.dot(X, theta))

# Функція градієнтного спуску
def compute_gradient(theta, X, y):
    m = len(y)
    h = hypothesis(theta, X)
    gradient = (1 / m) * np.dot(X.T, (h - y))
    return gradient

# Повний батч градієнтний спуск
def full_batch_gradient_descent(X, y, lr=0.1, epochs=100):
    theta = np.zeros(X.shape[1])
    for _ in range(epochs):
        grad = compute_gradient(theta, X, y)
        theta -= lr * grad
    return theta

# Вхідні дані
X = np.array([
    [1, 2],
    [1, -1],
    [1, 0],
    [1, 1]
])
y = np.array([1, 0, 1, 0])

# Запуск градієнтного спуску
final_theta = full_batch_gradient_descent(X, y)

# Виведення результату
print("Фінальні параметри θ:", final_theta)

Фінальні параметри θ: [-0.2893693   0.77655125]


📌 Пояснення:

theta ініціалізується нулями.

На кожній ітерації обчислюється градієнт і оновлюються параметри.

Використовується формула:

𝜃
𝑗
:
=
𝜃
𝑗
−
𝛼
⋅
∂
𝐿
(
𝜃
)
∂
𝜃
𝑗
θ
j
​
 :=θ
j
​
 −α⋅
∂θ
j
​

∂L(θ)
​

✅ Цей код виведе оптимізовані параметри моделі після 100 ітерацій градієнтного спуску з кроком 0.1.

#### Завдання 5. Обчислення точності моделі

1. Напишіть функцію `predict_proba(theta, X)`, яка використовує знайдені параметри $\theta$ для обчислення ймовірностей належності поточного прикладу з даних до класу $y=1$ на основі значень $\sigma(\theta^T x)$.

2. Напишіть функцію `predict(theta, X, threshold=0.5)`, яка обчислює клас з передбаченої імовірності належності екземпляра до класу 1 з порогом 0.5. Тобто якщо ймовірність менше 0.5, то передбачаємо клас 0, інакше клас 1.

3. Напишіть функцію `accuracy(y_true, y_pred)`, яка обчислює точність моделі, визначивши частку правильно передбачених класів.

  Формула метрики Accuracy:
  $$
  \text{Accuracy} = \frac{\sum_{i=1}^{m} I(\hat{{y}^{(i)}} = y^{(i)})}{m}
  $$

  де $\hat{{y}^{(i)}}$ - передбачене значення класу, $I$ - індикаторна функція (яка дорівнює 1, якщо умова виконується, і 0 - якщо ні), $m$ - кількість прикладів.

4. Обчисліть з використанням даних в завданні 4 $X$, $y$ та обчислених коефіцієнтах $\theta$ та виведіть на екран:
  - передбачені моделлю імовірності належності кожного з екземплярів в матриці `X` до класу 1
  - класи кожного екземпляра з матриці `X`
  - точність моделі.

In [10]:
import numpy as np

# Сигмоїдна функція
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# Функція обчислення ймовірностей (predict_proba)
def predict_proba(theta, X):
    return sigmoid(np.dot(X, theta))

# Функція для передбачення класу (predict)
def predict(theta, X, threshold=0.5):
    proba = predict_proba(theta, X)
    return (proba >= threshold).astype(int)

# Функція для обчислення точності (accuracy)
def accuracy(y_true, y_pred):
    return np.mean(y_true == y_pred)

# Дані з попереднього завдання
X = np.array([
    [1, 2],
    [1, -1],
    [1, 0],
    [1, 1]
])
y = np.array([1, 0, 1, 0])

# Вже навчена модель (можна вставити свою θ сюди, наприклад з попереднього результату)
theta = np.array([0.6, -1.0])  # Або вставте отримане із full_batch_gradient_descent

# 1. Ймовірності
proba = predict_proba(theta, X)

# 2. Передбачені класи
y_pred = predict(theta, X)

# 3. Точність
acc = accuracy(y, y_pred)

# Виведення результатів
print("Ймовірності:", proba)
print("Передбачені класи:", y_pred)
print("Точність моделі:", acc)

Ймовірності: [0.19781611 0.83201839 0.64565631 0.40131234]
Передбачені класи: [0 1 1 0]
Точність моделі: 0.5


📌 Що робить кожна функція:

predict_proba — повертає ймовірності належності до класу 1.

predict — повертає 0 або 1 залежно від заданого порогу (за замовчуванням 0.5).

accuracy — обчислює частку правильних передбачень.