## 1. Імпорт бібліотек

У цій комірці ми імпортуємо необхідні бібліотеки для нашої роботи:

*   **`tensorflow` (`tf`):** Основна бібліотека для глибокого навчання, яка надає інструменти для створення та навчання нейронних мереж.
*   **`tensorflow.keras` (`keras`):** Високорівневий API для TensorFlow, що спрощує процес побудови та навчання моделей.
*   **`sklearn.datasets.make_regression`:** Функція для генерації синтетичного набору даних для задачі регресії.
*   **`sklearn.datasets.make_classification`:** Функція для генерації синтетичного набору даних для задачі класифікації.
*   **`sklearn.model_selection.train_test_split`:** Функція для розділення даних на тренувальний та тестовий набори.
*   **`matplotlib.pyplot` (`plt`):** Бібліотека для створення графіків та візуалізації даних.
*   **`numpy` (`np`):** Бібліотека для роботи з числовими масивами та математичними операціями.
*   **`sklearn.metrics.mean_squared_error`:** Функція для розрахунку середньоквадратичної помилки (MSE), яка використовується для оцінки моделей регресії.
*   **`sklearn.metrics.accuracy_score`:** Функція для розрахунку точності (accuracy), яка використовується для оцінки моделей класифікації.
*   **`sklearn.metrics.confusion_matrix`:** Функція для побудови матриці плутанини (confusion matrix), яка використовується для оцінки моделей класифікації.
*   **`seaborn` (`sns`):** Бібліотека для візуалізації статистичних даних, зокрема, зручно використовувати для візуалізації матриці плутанини.

Ці бібліотеки надають нам всі необхідні інструменти для створення, навчання, оцінки та візуалізації моделей машинного навчання в даному Jupyter Notebook.


In [1]:
import tensorflow as tf  # Імпортуємо бібліотеку TensorFlow для роботи з нейронними мережами
from tensorflow import keras  # Імпортуємо Keras, високорівневий API для TensorFlow
from sklearn.datasets import make_regression, make_classification  # Імпортуємо функції для генерації даних
from sklearn.model_selection import train_test_split  # Імпортуємо функцію для розділення даних на тренувальні та тестові
import matplotlib.pyplot as plt  # Імпортуємо бібліотеку для візуалізації даних
import numpy as np  # Імпортуємо бібліотеку NumPy для роботи з масивами
from sklearn.metrics import mean_squared_error, accuracy_score, confusion_matrix  # Імпортуємо метрики для оцінки моделей
import seaborn as sns  # Імпортуємо бібліотеку Seaborn для візуалізації матриці плутанини

## 2. Ініціалізація змінної `student_id`

У цій комірці ми ініціалізуємо змінну `student_id`, яка буде використовуватись протягом усього ноутбука для налаштування параметрів генерації даних та конфігурації моделей.

**Значення `student_id` повинно відповідати вашому номеру за журналом.** Це дозволить персоналізувати завдання та отримати результати, що відповідають нашому варіанту.

In [None]:

student_id = 3  # Мій номер а журналом

## 3. Генерація даних

У цьому розділі ми генеруємо синтетичні дані, які будуть використовуватись для навчання та тестування моделей машинного навчання. Ми створимо два набори даних: один для задачі **регресії**, а інший - для задачі **класифікації**.

### 3.1. --- Регресія ---

Для генерації даних для регресії ми використовуємо функцію `make_regression` з бібліотеки `sklearn.datasets`. Ця функція створює дані з лінійною залежністю між вхідними ознаками та вихідною змінною, додаючи при цьому певний рівень шуму.

In [None]:
# 1. Генерація даних

# --- Регресія ---
X_reg, y_reg = make_regression(
    n_samples=1000 * student_id,  # Кількість зразків даних (1000 помножено на номер за журналом)
    n_features=1,  # Кількість ознак (вхідних змінних) для кожного зразка (в даному випадку 1)
    noise=10,  # Стандартне відхилення Гаусівського шуму, доданого до вихідних даних
    # --- інші параметри ---
    # bias=0.0,  # Зсув лінії регресії
    # coef=False,  # Чи повертати коефіцієнти регресії (True/False)
    # effective_rank=None,  # Ефективний ранг матриці ознак
    # tail_strength=0.5,  # Сила "хвостів" розподілу помилок
    # random_state=None  # Фіксоване значення для генератора випадкових чисел
)  

### 3.2. --- Класифікація ---

Для генерації даних для класифікації ми використовуємо функцію `make_classification` з бібліотеки `sklearn.datasets`. Ця функція створює дані з декількома класами, де кожен клас може бути представлений одним або декількома кластерами точок у багатовимірному просторі ознак.

**Параметри функції `make_classification`:**

*   **`n_samples`:** Кількість зразків даних. Як і для регресії, ми генеруємо `1000 * student_id` зразків.
*   **`n_features`:** Кількість ознак (вхідних змінних) для кожного зразка. Ми встановили значення `n_features=4`, тобто кожен зразок буде мати 4 ознаки.
*   **`n_informative`:** Кількість інформативних ознак. Це ті ознаки, які дійсно впливають на приналежність зразка до певного класу. Ми встановили `n_informative=4`, тобто всі згенеровані ознаки є інформативними.
*   **`n_redundant`:** Кількість надлишкових ознак. Це ознаки, які є лінійними комбінаціями інформативних ознак. Ми встановили `n_redundant=0`, тобто надлишкових ознак немає.
*   **`n_repeated`:** Кількість повторюваних ознак. Це ознаки, які є точними копіями інших ознак. Ми встановили `n_repeated=0`, тобто повторюваних ознак немає.
*   **`n_classes`:** Кількість класів. Ми генеруємо `student_id + 2` класів, тобто кількість класів залежить від вашого номера за журналом.
*   **`n_clusters_per_class`:** Кількість кластерів на кожен клас. Ми встановили `n_clusters_per_class=1`, тобто кожен клас буде представлений одним кластером.
*   **`weights`:** Список ваг для кожного класу. Якщо `None`, всі класи мають однакову вагу. Ми встановили `weights=None`.
*   **`flip_y`:** Відсоток міток, які будуть випадково змінені. Це додає шум у дані і робить задачу класифікації складнішою. Ми встановили `flip_y=0.01`, тобто 1% міток буде змінено.
*   **`class_sep`:** Коефіцієнт, що контролює відстань між кластерами. Більше значення `class_sep` призводить до більш чітко розділених класів. Ми встановили `class_sep=1.0`.
*   **`hypercube`:** Якщо `True`, кластери будуть розташовані у вершинах гіперкуба. Якщо `False`, кластери будуть розташовані у вершинах випадкового багатогранника. Ми встановили `hypercube=True`.
*   **`shift`:** Зсуває значення ознак на задане значення. Ми встановили `shift=0.0`.
*   **`scale`:** Масштабує значення ознак на задане значення. Ми встановили `scale=1.0`.
*   **`shuffle`:** Якщо `True`, зразки та ознаки будуть перемішані. Ми встановили `shuffle=True`.
*   **`random_state`:** Фіксоване значення для генератора випадкових чисел. Забезпечує відтворюваність результатів при повторному запуску коду. Ми встановили `random_state=42`.

**Результат:**

Функція `make_classification` повертає два масиви:

*   **`X_class`:** Масив NumPy розміром `(n_samples, n_features)`, що містить вхідні ознаки.
*   **`y_class`:** Масив NumPy розміром `(n_samples,)`, що містить мітки класів (цілочисельні значення від 0 до `n_classes - 1`).

In [None]:
# --- Класифікація ---
X_class, y_class = make_classification(
    n_samples=1000 * student_id,  # Кількість зразків даних (1000 помножено на номер за журналом)
    n_features=4,  # Кількість ознак (вхідних змінних) для кожного зразка (в даному випадку 4)
    n_informative=4,  # Кількість інформативних ознак, які фактично використовуються для генерації даних
    n_redundant=0,  # Кількість надлишкових ознак, які є лінійними комбінаціями інформативних ознак
    n_repeated=0,  # Кількість повторюваних ознак, які є дублікатами інформативних або надлишкових ознак
    n_classes=student_id + 2,  # Кількість класів (номер за журналом + 2)
    n_clusters_per_class=1,  # Кількість кластерів на клас
    class_sep=1.0,  # Відстань між кластерами
    flip_y=0.01,  # Відсоток міток, які будуть випадково змінені
    random_state=42  # Фіксоване значення для генератора випадкових чисел
    # weights=None,  # Список ваг для кожного класу (None - рівні ваги) - значення за замовчуванням
    # hypercube=True,  # Чи генерувати дані в гіперкубі - значення за замовчуванням
    # shift=0.0,  # Зсув даних - значення за замовчуванням
    # scale=1.0,  # Масштабування даних - значення за замовчуванням
    # shuffle=True,  # Чи перемішувати дані - значення за замовчуванням
)

In [None]:
# --- Візуалізація ---
plt.figure(figsize=(12, 5))  # Створюємо фігуру для графіків розміром 12x5 дюймів

plt.subplot(1, 2, 1)  # Створюємо перший підграфік (1 рядок, 2 стовпці, 1-й графік)
plt.scatter(
    X_reg,  # Дані для осі X
    y_reg,  # Дані для осі Y
    s=10,  # Розмір точок
    c='blue',  # Колір точок
    marker='o',  # Форма маркерів (точки)
    alpha=0.5  # Прозорість точок
)  
plt.title('Дані для регресії')  # Додаємо заголовок
plt.xlabel('X')  # Додаємо підпис осі X
plt.ylabel('y')  # Додаємо підпис осі Y

plt.subplot(1, 2, 2)  # Створюємо другий підграфік (1 рядок, 2 стовпці, 2-й графік)
plt.scatter(
    X_class[:, 0],  # Дані для осі X (перша ознака)
    X_class[:, 1],  # Дані для осі Y (друга ознака)
    c=y_class,  # Колір точок залежить від класу
    s=10,  # Розмір точок
    cmap='viridis',  # Кольорова шкала
    marker='o',  # Форма маркерів (точки)
    alpha=0.5  # Прозорість точок
)  
plt.title('Дані для класифікації')  # Додаємо заголовок
plt.xlabel('X1')  # Додаємо підпис осі X
plt.ylabel('X2')  # Додаємо підпис осі Y

plt.show()  # Відображаємо графіки

In [None]:
# 2. Побудова та навчання моделей

# --- Регресія ---
X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(  # Розділяємо дані на тренувальні та тестові
    X_reg,  # Вхідні дані
    y_reg,  # Вихідні дані
    test_size=0.2,  # Розмір тестової вибірки (20%)
    train_size=None,  # Розмір тренувальної вибірки (None - автоматично)
    random_state=42,  # Фіксоване значення для генератора випадкових чисел
    shuffle=True,  # Чи перемішувати дані перед розділенням
    stratify=None  # Розподіл класів (для класифікації)
)  

In [None]:
model_reg = keras.Sequential([  # Створюємо послідовну модель
    keras.layers.Dense(
        64,  # Кількість нейронів у шарі
        activation='relu',  # Функція активації - ReLU
        input_shape=(X_train_reg.shape[1],),  # Розмірність вхідних даних
        # --- інші параметри ---
        # use_bias=True,  # Чи використовувати зсув
        # kernel_initializer='glorot_uniform',  # Ініціалізація ваг
        # bias_initializer='zeros',  # Ініціалізація зсувів
        # kernel_regularizer=None,  # Регуляризація ваг
        # bias_regularizer=None,  # Регуляризація зсувів
        # activity_regularizer=None,  # Регуляризація активацій
        # kernel_constraint=None,  # Обмеження на ваги
        # bias_constraint=None  # Обмеження на зсуви
    ),  
    keras.layers.Dense(32, activation='relu'),  # Другий шар з 32 нейронами, функція активації ReLU
    keras.layers.Dense(1)  # Вихідний шар з 1 нейроном (для регресії)
])

In [None]:
model_reg.fit(
    X_train_reg,  # Тренувальні вхідні дані
    y_train_reg,  # Тренувальні вихідні дані
    batch_size=None,  # Розмір пакету даних (None - весь набір)
    epochs=100,  # Кількість епох навчання
    verbose=0,  # 0 - приховати інформацію про процес навчання, 1 - показувати прогрес, 2 - показувати лише епохи
    callbacks=None,  # Список функцій зворотного виклику
    validation_split=0.0,  # Частина тренувальних даних для валідації
    validation_data=None,  # Дані для валідації
    shuffle=True,  # Чи перемішувати дані перед кожною епохою
    class_weight=None,  # Ваги для різних класів (для класифікації)
    sample_weight=None,  # Ваги для різних зразків
    initial_epoch=0,  # Початкова епоха
    steps_per_epoch=None,  # Кількість кроків за епоху
    validation_steps=None,  # Кількість кроків валідації
    validation_batch_size=None,  # Розмір пакету даних для валідації
    validation_freq=1,  # Частота валідації (кожні N епох)
    #max_queue_size=10,   Максимальний розмір черги даних
    #workers=1,   Кількість процесів для завантаження даних
    #use_multiprocessing=False   Чи використовувати багатопроцесорність
)  

In [None]:
# --- Класифікація ---
X_train_class, X_test_class, y_train_class, y_test_class = train_test_split(  # Розділяємо дані на тренувальні та тестові
    X_class, y_class, test_size=0.2, random_state=42
)

In [None]:
model_class = keras.Sequential([  # Створюємо послідовну модель
    keras.layers.Dense(64, activation='relu', input_shape=(X_train_class.shape[1],)),  # Перший шар з 64 нейронами, функція активації ReLU
    keras.layers.Dense(32, activation='relu'),  # Другий шар з 32 нейронами, функція активації ReLU
    keras.layers.Dense(student_id + 2, activation='softmax')  
    # Вихідний шар з кількістю нейронів, що дорівнює кількості класів, функція активації softmax (для класифікації)
])

In [None]:
model_class.compile(
    loss='sparse_categorical_crossentropy',  # Функція втрат для класифікації з цілочисельними мітками класів
    optimizer='adam',  # Оптимізатор - Adam
    metrics=['accuracy']  # Метрика для оцінки - точність (accuracy)
) 

In [None]:
model_class.fit(
    X_train_class,  # Тренувальні вхідні дані
    y_train_class,  # Тренувальні вихідні дані
    epochs=100,  # Кількість епох навчання
    verbose=1  # 0 - приховати інформацію про процес навчання
) 

In [None]:
# 3. Оцінка моделей

# --- Регресія ---
y_pred_reg = model_reg.predict(X_test_reg)  # Робимо передбачення на тестових даних
mse = mean_squared_error(
    y_test_reg,  # Справжні значення
    y_pred_reg,  # Передбачені значення
    # --- інші параметри ---
    # sample_weight=None,  # Ваги для різних зразків
    # multioutput='uniform_average'  # Як обробляти багатовимірні вихідні дані
)  
print(f'Mean Squared Error (Регресія): {mse}')  # Виводимо результат

In [None]:
# --- Класифікація ---
y_pred_class = np.argmax(
    model_class.predict(X_test_class),  # Передбачені ймовірності для кожного класу
    axis=1  # Вісь, по якій визначається клас з найбільшою ймовірністю
)  
accuracy = accuracy_score(y_test_class, y_pred_class)  # Обчислюємо точність
print(f'Accuracy (Класифікація): {accuracy}')  # Виводимо результат

In [None]:
cm = confusion_matrix(
    y_test_class,  # Справжні мітки класів
    y_pred_class,  # Передбачені мітки класів
    # --- інші параметри ---
    # labels=None,  # Список міток класів
    # sample_weight=None,  # Ваги для різних зразків
    # normalize=None  # Нормалізація матриці (None, 'true', 'pred', 'all')
)  

In [None]:
plt.figure(figsize=(8, 6))  # Створюємо фігуру для графіка розміром 8x6 дюймів
sns.heatmap(
    cm,  # Матриця плутанини
    annot=True,  # Показувати значення в комірках
    fmt='d',  # Формат значень (цілі числа)
    cmap='Blues',  # Кольорова шкала
    # --- інші параметри ---
    # linewidths=0,  # Ширина ліній між комірками
    # linecolor='white',  # Колір ліній між комірками
    # cbar=True,  # Показувати кольорову шкалу
    # square=False,  # Чи робити комірки квадратними
    # xticklabels='auto',  # Мітки для осі X
    # yticklabels='auto',  # Мітки для осі Y
    # mask=None  # Маска для приховування деяких комірок
)  
plt.title('Матриця плутанини')  # Додаємо заголовок
plt.xlabel('Передбачені класи')  # Додаємо підпис осі X
plt.ylabel('Справжні класи')  # Додаємо підпис осі Y
plt.show()  # Відображаємо графік