# **Розширений план з контентом та кодом для практичного заняття**  
## **Тема 3. Заняття 3. Практична побудова моделей регресії та класифікації**  
### **1. Практична побудова моделей регресії**  
### **2. Практична побудова моделей класифікації**  

---

## **1. Вступ (10 хв)**  

### **1.1. Мета заняття**  
- Ознайомити слухачів із побудовою та використанням моделей регресії та класифікації.  
- Освоїти основні алгоритми машинного навчання для аналізу даних.  
- Виконати практичну реалізацію моделей на реальних наборах даних.  

### **1.2. Очікувані результати**  
Після заняття слухачі зможуть:  
- Виконувати передобробку даних для регресійного та класифікаційного аналізу.  
- Будувати та оцінювати якість моделей регресії (`Linear Regression`, `Random Forest Regressor`).  
- Будувати та оцінювати якість моделей класифікації (`Logistic Regression`, `Random Forest Classifier`).  
- Використовувати метрики оцінки якості моделей.  

---

## **2. Практична побудова моделей регресії (60 хв)**  

### **2.1. Основи регресії**  
**Регресія** – це метод машинного навчання для прогнозування числових значень.  
Приклади застосування:  
- Прогнозування цін на ринку.  
- Оцінка ефективності військових операцій.  
- Аналіз споживання ресурсів у бойових умовах.  

### **2.2. Передобробка даних**  
📌 **Кроки передобробки**:
1. Видалення пропущених значень.
2. Перетворення категоріальних змінних у числові (one-hot encoding).
3. Масштабування числових змінних.

```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Завантаження даних
df = pd.read_csv("data_regression.csv")

# Видалення пропущених значень
df.dropna(inplace=True)

# Перетворення категоріальних змінних
df = pd.get_dummies(df, columns=["category"], drop_first=True)

# Визначення X (ознаки) та y (цільова змінна)
X = df.drop(columns=["target"])
y = df["target"]

# Розбиття на тренувальний та тестовий набір
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Масштабування ознак
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
```

---

### **2.3. Лінійна регресія (Linear Regression)**  
📌 **Основна ідея**:  
- Визначає лінійну залежність між вхідними змінними та вихідною змінною.  
- Функція має вигляд:  
  \[
  y = w_1x_1 + w_2x_2 + ... + w_nx_n + b
  \]

```python
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error

# Створення моделі
model_lr = LinearRegression()

# Навчання моделі
model_lr.fit(X_train, y_train)

# Прогнозування
y_pred_lr = model_lr.predict(X_test)

# Оцінка якості моделі
mae = mean_absolute_error(y_test, y_pred_lr)
mse = mean_squared_error(y_test, y_pred_lr)

print(f"MAE: {mae}")
print(f"MSE: {mse}")
```

🔹 **Обмеження лінійної регресії**:
- Погано працює з нелінійними залежностями.
- Чутлива до мультиколінеарності.

---

### **2.4. Дерева рішень та Random Forest для регресії**  
📌 **Random Forest Regressor** – ансамблева модель, яка використовує кілька дерев для прогнозування.

```python
from sklearn.ensemble import RandomForestRegressor

# Створення та навчання моделі
model_rf = RandomForestRegressor(n_estimators=100, random_state=42)
model_rf.fit(X_train, y_train)

# Прогнозування
y_pred_rf = model_rf.predict(X_test)

# Оцінка якості
mae_rf = mean_absolute_error(y_test, y_pred_rf)
mse_rf = mean_squared_error(y_test, y_pred_rf)

print(f"MAE (Random Forest): {mae_rf}")
print(f"MSE (Random Forest): {mse_rf}")
```

🔹 **Переваги Random Forest**:
- Менше чутливий до шуму.
- Добре працює з нелінійними залежностями.

---

## **3. Практична побудова моделей класифікації (60 хв)**  

### **3.1. Основи класифікації**  
📌 **Класифікація** – це метод машинного навчання для передбачення категорійних змінних.  
Приклади застосування:
- Виявлення ризиків на полі бою.
- Класифікація військових операцій.
- Розпізнавання об'єктів на супутникових знімках.

---

### **3.2. Передобробка даних для класифікації**  
📌 Використання тих самих методів передобробки, що і для регресії.  

```python
df = pd.read_csv("data_classification.csv")
df.dropna(inplace=True)
df = pd.get_dummies(df, columns=["category"], drop_first=True)

X = df.drop(columns=["target"])
y = df["target"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```

---

### **3.3. Логістична регресія (Logistic Regression)**  
📌 **Основна ідея**:  
- Визначає ймовірність приналежності об'єкта до певного класу.  
- Функція активації:  
  \[
  P(Y=1) = \frac{1}{1 + e^{-(wX + b)}}
  \]

```python
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

# Створення та навчання моделі
model_logreg = LogisticRegression()
model_logreg.fit(X_train, y_train)

# Прогнозування
y_pred_logreg = model_logreg.predict(X_test)

# Оцінка якості
accuracy = accuracy_score(y_test, y_pred_logreg)
print(f"Accuracy: {accuracy}")
print(classification_report(y_test, y_pred_logreg))
```

🔹 **Обмеження**:
- Погано працює з нелінійними класами.

---

### **3.4. Random Forest Classifier**  
📌 **Основна ідея**:
- Використання ансамблевого навчання для підвищення точності класифікації.

```python
from sklearn.ensemble import RandomForestClassifier

# Створення та навчання моделі
model_rf_clf = RandomForestClassifier(n_estimators=100, random_state=42)
model_rf_clf.fit(X_train, y_train)

# Прогнозування
y_pred_rf = model_rf_clf.predict(X_test)

# Оцінка якості
accuracy_rf = accuracy_score(y_test, y_pred_rf)
print(f"Accuracy (Random Forest): {accuracy_rf}")
print(classification_report(y_test, y_pred_rf))
```

🔹 **Переваги**:
- Підвищена точність.
- Менш схильний до перенавчання.

---

## **4. Практичне завдання (30 хв)**  
1. **Побудувати модель лінійної регресії для передбачення цільового показника.**  
2. **Розробити модель логістичної регресії для класифікації даних.**  
3. **Використати Random Forest для регресії та класифікації, порівняти результати.**  

---

## **5. Висновки та підсумки (20 хв)**  
✅ **Основні висновки**:
- **Лінійна регресія** добре підходить для прогнозування залежностей.  
- **Логістична регресія** ефективна для класифікації, якщо класи лінійно відокремлені.  
- **Random Forest** універсальний для регресії та класифікації.  

🚀 **Ключовий меседж**: **Застосування машинного навчання для аналізу даних забезпечує ефективніший підхід до прийняття рішень у військовій сфері та аналітичних системах.**