### 1. Вступна Частина

#### Пояснення теми заняття:
Моделі регресії та класифікації є двома основними типами задач, які вирішуються за допомогою машинного навчання. 

- **Моделі регресії** використовуються для прогнозування неперервних значень. Наприклад, прогнозування цін на нерухомість, попиту на продукцію, або показників якості виробництва. Ці моделі знаходять залежності між змінними та передбачають значення однієї змінної на основі інших.

- **Моделі класифікації** використовуються для визначення категорії, до якої належить об'єкт. Наприклад, класифікація електронних листів на спам та не спам, визначення типу рослини за її характеристиками, або діагностика захворювань за медичними даними.

Ці моделі широко застосовуються в різних галузях, від фінансів до охорони здоров'я, вносячи значний вклад у прийняття рішень, оптимізацію процесів та покращення якості послуг.

#### Огляд необхідних бібліотек:
Для побудови та аналізу моделей регресії та класифікації ми будемо використовувати наступні Python бібліотеки:

- **Pandas:** Бібліотека для маніпуляції та аналізу даних. Вона надає швидкі, гнучкі та експресивні структури даних, розроблені для роботи з "реляційними" або "міченими" даними, які є інтуїтивно зрозумілими.

- **NumPy:** Бібліотека для підтримки великих масивів та матриць, разом з великою колекцією математичних функцій для роботи з цими масивами.

- **Scikit-learn:** Одна з найпопулярніших бібліотек машинного навчання. Вона надає простий та ефективний інструментарій для аналізу даних та моделювання, включаючи різноманітні алгоритми класифікації, регресії, кластеризації та зниження розмірності.

Ці бібліотеки є фундаментальними для будь-якого проекту з машинного навчання та дадуть змогу ефективно обробляти дані, виконувати аналітичні операції та побудовув

### 2. Практична Побудова Моделей Регресії

#### Приклад Коду з Коментарями:

```python
# Імпорт необхідних бібліотек
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Завантаження та попередній аналіз даних
data = pd.read_csv('path_to_dataset.csv')  # замініть 'path_to_dataset.csv' на шлях до вашого набору даних
print(data.head())  # Виведення перших рядків датасету

# Вибір змінних для моделі
X = data[['feature1', 'feature2']]  # замініть 'feature1', 'feature2' на назви вашої функції
y = data['target']  # замініть 'target' на назву цільової змінної

# Розділення даних на тренувальний та тестовий набори
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# Створення та тренування моделі лінійної регресії
model = LinearRegression()
model.fit(X_train, y_train)

# Передбачення на тестових даних
y_pred = model.predict(X_test)

# Оцінка моделі
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f'Mean Squared Error: {mse}')
print(f'R^2 Score: {r2}')

# Візуалізація результатів
plt.scatter(y_test, y_pred)
plt.xlabel('Actual Values')
plt.ylabel('Predicted Values')
plt.title('Actual vs Predicted Values')
plt.show()
```

#### Завдання для Практичної Роботи:
1. **Зміна Датасету:** Використайте інший набір даних для побудови моделі регресії. Аналізуйте результати.

2. **Регресія з Більшою Кількістю Змінних:** Побудуйте модель лінійної регресії, використовуючи більшу кількість змінних. Оцініть, як змінюється точність моделі.

3. **Поліноміальна Регресія:** Спробуйте поліноміальну регресію на ваших даних. Порівняйте результати з лінійною регресією.

4. **Перевірка Різних Метрик Оцінки:** Використайте різні метрики для оцінки вашої моделі (наприклад, середня абсолютна помилка).

5. **Вплив Розміру Тестової Вибірки:** Експериментуйте з різними розмірами тестової вибірки (наприклад, 10%, 30%, 50%) та аналізуйте, як це впливає на точність моделі.


### 3. Практична Побудова Моделей Класифікації

#### Приклад Коду з Коментарями:

```python
# Імпорт необхідних бібліотек
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns

# Завантаження та попередній аналіз даних
data = pd.read_csv('path_to_classification_dataset.csv')  # Замініть шлях до вашого датасету
print(data.head())  # Показати перші рядки даних

# Вибір змінних для моделі
X = data.drop('target_column', axis=1)  # Вибрати всі стовпці, крім цільового
y = data['target_column']  # Вибрати цільовий стовпець

# Розділення даних на тренувальний та тестовий набори
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Нормалізація даних
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Створення та тренування моделі логістичної регресії
model = LogisticRegression()
model.fit(X_train, y_train)

# Передбачення та оцінка моделі
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))

# Матриця помилок
conf_matrix = confusion_matrix(y_test, y_pred)
sns.heatmap(conf_matrix, annot=True, fmt='g')
plt.xlabel('Predicted')
plt.ylabel('True')
plt.show()
```

#### Завдання для Практичної Роботи:
1. **Зміна Класифікатора:** Спробуйте використовувати різні алгоритми класифікації (наприклад, K-найближчих сусідів, дерева рішень) замість логістичної регресії.

2. **Балансування Класів:** Дослідіть вплив балансування класів на точність вашої моделі.

3. **Крос-валідація:** Використайте крос-валідацію для оцінки стабільності моделі.

4. **Оптимізація Гіперпараметрів:** Спробуйте тюнінг гіперпараметрів моделі (наприклад, використання GridSearchCV або RandomizedSearchCV).

5. **Аналіз Особливостей (Feature Importance):** Визначте, які ознаки найбільше впливають на передбачення моделі.

### Завдання на Регресію з Використанням `make_regression` з scikit-learn

#### 1. Порівняння Різних Типів Регресії
   - Використовуйте `make_regression` для створення набору даних.
   - Побудуйте та порівняйте різні типи регресійних моделей (наприклад, лінійна регресія, Ridge, Lasso).
   - Оцініть їх ефективність за допомогою відповідних метрик.

#### 2. Аналіз Впливу Шуму
   - Генеруйте датасети з різними рівнями шуму за допомогою параметра `noise`.
   - Аналізуйте, як шум впливає на точність моделі.

#### 3. Вивчення Впливу Кількості Ознак
   - Створіть набори даних з різною кількістю ознак (`n_features`).
   - Дослідіть, як зміна кількості ознак впливає на модель.

#### 4. Використання Поліноміальних Особливостей
   - Згенеруйте набір даних для регресії.
   - Додайте поліноміальні особливості (наприклад, використовуючи `PolynomialFeatures` з scikit-learn) та побудуйте модель.

#### 5. Оцінка Впливу Розміру Тренувального Набору
   - Створіть набір даних і розділіть його на тренувальний та тестовий набори в різних пропорціях.
   - Дослідіть, як зміна розміру тренувального набору впливає на точність моделі.

### Завдання на Класифікацію з Використанням `make_classification` з scikit-learn

#### 1. Порівняння Різних Моделей Класифікації
   - Використовуйте `make_classification` для створення набору даних.
   - Порівняйте різні алгоритми класифікації (наприклад, логістична регресія, SVM, дерева рішень).
   - Оцініть їх ефективність за допомогою метрик класифікації.

#### 2. Аналіз Впливу Незбалансованих Класів
   - Створіть набір даних з незбалансованими класами.
   - Використовуйте різні техніки для балансування класів і оцініть вплив на модель.

#### 3. Вивчення Впливу Кількості Інформативних Ознак
   - Генеруйте датасети з різною кількістю інформативних ознак (`n_informative`).
   - Аналізуйте вплив кількості інформативних ознак на точність моделі.

#### 4. Використ

ання Крос-Валідації
   - Створіть класифікаційний набір даних.
   - Виконайте крос-валідацію на різних моделях і оцініть їх стабільність.

#### 5. Оптимізація Гіперпараметрів
   - Використовуйте набір даних для класифікації.
   - Застосуйте техніки оптимізації гіперпараметрів, такі як GridSearchCV або RandomizedSearchCV, для покращення точності моделі.