# **Розширений план-контент групового заняття**  
## **Тема 3. Заняття 2. Аналіз даних з використанням технологій штучного інтелекту**  
### **1. Основи використання штучного інтелекту для аналізу даних**  
### **2. Використання технологій машинного навчання для аналізу даних**  

---

## **1. Вступ (10 хв)**  

### **1.1. Мета заняття**  
- Ознайомити слухачів з основами штучного інтелекту (ШІ) у сфері аналізу даних.  
- Навчити використовувати алгоритми машинного навчання для аналізу даних.  
- Виконати практичні завдання з використанням Python та бібліотек машинного навчання.  

### **1.2. Очікувані результати**  
Після заняття слухачі зможуть:  
✅ Розуміти базові концепції ШІ та машинного навчання.  
✅ Використовувати алгоритми **класифікації, регресії та кластеризації** для аналізу даних.  
✅ Виконувати практичний аналіз бойових звітів або інших військових даних за допомогою Python.  

---

## **2. Основи використання штучного інтелекту для аналізу даних (40 хв)**  

### **2.1. Що таке штучний інтелект та його роль в аналізі даних?**  
📌 **Штучний інтелект (ШІ)** – це здатність систем виконувати завдання, що зазвичай потребують людського інтелекту, такі як:  
- Аналіз великих обсягів інформації  
- Виявлення закономірностей у даних  
- Автоматичне ухвалення рішень  

📌 **Основні підходи в ШІ для аналізу даних:**  
1️⃣ **Машинне навчання (ML)** – навчання системи на основі історичних даних.  
2️⃣ **Глибоке навчання (DL)** – нейромережі для обробки складних даних (зображення, текст).  
3️⃣ **Обробка природної мови (NLP)** – аналіз текстів, чат-боти, розпізнавання мовлення.  

---

### **2.2. Де ШІ застосовується у військовій аналітиці?**  
🔹 **Прогнозування атак** – аналіз минулих даних для оцінки можливих загроз.  
🔹 **Розпізнавання об'єктів** – ідентифікація військової техніки та цілей.  
🔹 **Кластеризація інформації** – групування бойових зіткнень за типами.  
🔹 **Аналіз бойових звітів** – автоматична обробка текстової інформації.  

📌 **Приклад SQL-запиту для підготовки бойових даних:**  
```sql
SELECT region, attack_type, COUNT(*) AS num_attacks
FROM CombatReports
GROUP BY region, attack_type
ORDER BY num_attacks DESC;
```

📌 **Приклад обробки цих даних у Python:**  
```python
import pandas as pd

df = pd.read_csv("combat_reports.csv")
df_grouped = df.groupby(["region", "attack_type"]).size().reset_index(name="num_attacks")
print(df_grouped.head())
```

---

## **3. Використання технологій машинного навчання для аналізу даних (50 хв)**  

### **3.1. Основні алгоритми машинного навчання**  
📌 **Типи задач машинного навчання:**  
1️⃣ **Класифікація** – визначення класу об’єкта (наприклад, тип атаки).  
2️⃣ **Регресія** – прогноз числових значень (наприклад, кількість втрат).  
3️⃣ **Кластеризація** – автоматичне групування схожих об'єктів.  

📌 **Основні алгоритми**  
- **Logistic Regression, Random Forest, SVM** – для класифікації.  
- **Linear Regression, XGBoost** – для прогнозування.  
- **K-Means, DBSCAN** – для кластеризації.  

---

### **3.2. Практичний аналіз бойових звітів: Класифікація типів атак**  
📌 **Завдання:** Передбачити тип атаки за характеристиками бойового зіткнення.  

**Крок 1. Завантаження даних**  
```python
import pandas as pd

df = pd.read_csv("combat_reports.csv")
df["date"] = pd.to_datetime(df["date"])
df["month"] = df["date"].dt.month
df["year"] = df["date"].dt.year
```

**Крок 2. Підготовка ознак та міток**  
```python
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

X = df[["month", "year", "num_casualties"]]
y = df["attack_type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```

**Крок 3. Навчання моделі**  
```python
model = RandomForestClassifier(n_estimators=100)
model.fit(X_train, y_train)

accuracy = model.score(X_test, y_test)
print(f"Точність моделі: {accuracy:.2f}")
```

📌 **Очікуваний результат:**  
```
Точність моделі: 0.85
```

---

### **3.3. Прогнозування кількості атак у наступному місяці (Регресія)**  
📌 **Завдання:** Прогноз кількості атак на основі минулих даних.  

```python
from sklearn.linear_model import LinearRegression

# Формування вибірки
X = df.groupby(["year", "month"]).size().reset_index(name="num_attacks")
y = X["num_attacks"]
X = X[["year", "month"]]

# Навчання моделі
model = LinearRegression()
model.fit(X, y)

# Прогноз на березень 2024
next_month = pd.DataFrame({"year": [2024], "month": [3]})
predicted_attacks = model.predict(next_month)

print(f"Прогнозована кількість атак у березні 2024: {int(predicted_attacks[0])}")
```

📌 **Очікуваний результат:**  
```
Прогнозована кількість атак у березні 2024: 15
```

---

### **3.4. Кластеризація бойових зіткнень за регіонами**  
📌 **Визначення груп регіонів з подібною активністю атак**  

```python
from sklearn.cluster import KMeans

# Групування за регіоном
df_grouped = df.groupby("region")["num_casualties"].sum().reset_index()

# Кластеризація
kmeans = KMeans(n_clusters=3)
df_grouped["cluster"] = kmeans.fit_predict(df_grouped[["num_casualties"]])

print(df_grouped)
```

📌 **Очікуваний результат:**  
```
   region   num_casualties  cluster
0   Схід           50          1
1   Південь        30          0
2   Захід          10          2
```

---

## **4. Практичні завдання (30 хв)**  
✅ **Завдання 1:** Навчити модель класифікації для визначення типу атаки.  
✅ **Завдання 2:** Виконати прогноз кількості атак у квітні 2024.  
✅ **Завдання 3:** Виконати кластеризацію бойових регіонів.  
✅ **Завдання 4:** Побудувати графік прогнозованих атак у часі.  

---

## **5. Висновки та підсумки заняття (10 хв)**  
✅ **Основні висновки**:  
- **Машинне навчання** допомагає аналізувати військові дані.  
- **Класифікація, регресія, кластеризація** корисні для військової аналітики.  
- **Python + ML-алгоритми** дозволяють автоматизувати аналіз бойових звітів.  

🚀 **Ключовий меседж:**  
**Використання ШІ та ML дає можливість швидко аналізувати дані та приймати стратегічні рішення.**

[Приклад коду](https://www.kaggle.com/code/dnkumars/date-fruit-classifier-eda)