## **Тема 3. Заняття 1. Сучасні інформаційні технології аналізу даних**  
### **1. Організація аналізу даних в інформаційно-аналітичних системах**  
### **2. Огляд сучасних ІТ аналізу даних**  

---

## **1. Вступ (10 хв)**  

### **1.1. Мета заняття**  
- Ознайомити слухачів із принципами організації аналізу даних у сучасних інформаційно-аналітичних системах.  
- Надати огляд ключових технологій та підходів до аналізу даних.  
- Продемонструвати сучасні програмні засоби для обробки та аналізу даних.  
- Обговорити реальні приклади застосування технологій аналізу даних у військовій сфері.  

### **1.2. Очікувані результати**  
Після заняття слухачі зможуть:  
✅ Розуміти основні етапи аналізу даних.  
✅ Використовувати сучасні технології аналізу даних (Python, SQL, BI-системи).  
✅ Застосовувати методи аналізу для підтримки рішень у військовому управлінні.  
✅ Оцінювати ефективність різних методів аналізу залежно від поставлених задач.  

---

## **2. Організація аналізу даних в інформаційно-аналітичних системах (40 хв)**  

### **2.1. Основи аналізу даних**
📌 **Аналіз даних** – це процес збору, обробки та інтерпретації інформації для прийняття рішень.  

🔹 **Основні етапи аналізу даних**:  
1️⃣ **Збір даних** – отримання даних із різних джерел (БД, сенсори, документи).  
2️⃣ **Обробка даних** – очищення, нормалізація, агрегування.  
3️⃣ **Аналіз** – застосування статистичних та машинних методів.  
4️⃣ **Візуалізація** – представлення результатів у вигляді графіків, таблиць.  
5️⃣ **Прийняття рішень** – використання результатів для прийняття стратегічних рішень.  

🔹 **Типи аналізу даних**:  
- **Описовий аналіз** (Descriptive Analytics) – що відбулося?  
- **Діагностичний аналіз** (Diagnostic Analytics) – чому це сталося?  
- **Прогнозний аналіз** (Predictive Analytics) – що може статися далі?  
- **Приписувальний аналіз** (Prescriptive Analytics) – що слід зробити?  

---

### **2.2. Організація зберігання та обробки даних**
📌 **Основні джерела даних для інформаційно-аналітичних систем**:  
- **Бази даних (SQL, NoSQL)** – реляційні та нереляційні сховища.  
- **Сенсорні дані** – дані з військових датчиків та систем спостереження.  
- **Текстові дані** – звіти, накази, відкриті джерела інформації.  

📌 **Процеси обробки даних**:  
- **ETL (Extract, Transform, Load)** – витяг, перетворення, завантаження даних у сховища.  
- **Big Data** – розподілене зберігання та обробка великих обсягів даних.  

📌 **Приклад використання SQL для аналізу бойових звітів**  
```sql
SELECT region, COUNT(*) AS num_reports
FROM CombatReports
WHERE date >= '2024-01-01'
GROUP BY region
ORDER BY num_reports DESC;
```

---

## **3. Огляд сучасних ІТ аналізу даних (50 хв)**  

### **3.1. Сучасні інструменти аналізу даних**  
📌 **Основні технології**  
- **Мови програмування**: Python (pandas, numpy, scikit-learn), R.  
- **Системи управління базами даних**: PostgreSQL, MongoDB.  
- **BI-системи**: Power BI, Tableau.  
- **Big Data технології**: Hadoop, Spark.  

📌 **Приклад використання Python для аналізу бойових звітів**  
```python
import pandas as pd

# Завантаження даних
df = pd.read_csv("combat_reports.csv")

# Фільтрація даних по регіону
df_filtered = df[df["region"] == "Схід"]

# Аналіз частоти атак
print(df_filtered["attack_type"].value_counts())
```

---

### **3.2. Машинне навчання та штучний інтелект в аналізі даних**
📌 **Методи машинного навчання у військовій сфері**  
- **Кластеризація (K-Means)** – групування бойових інцидентів.  
- **Класифікація (Random Forest, SVM)** – виявлення загроз.  
- **Регресія (Linear Regression, XGBoost)** – прогнозування чисельності втрат.  

📌 **Приклад застосування моделі класифікації у Python**  
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

# Завантаження даних
X = df[["enemy_forces", "terrain_type", "time_of_day"]]
y = df["outcome"]

# Розбиття даних
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Навчання моделі
model = RandomForestClassifier()
model.fit(X_train, y_train)

# Оцінка точності
accuracy = model.score(X_test, y_test)
print(f"Accuracy: {accuracy:.2f}")
```

---

### **3.3. Візуалізація даних**
📌 **Основні інструменти**:  
- **Matplotlib, Seaborn** – візуалізація у Python.  
- **Tableau, Power BI** – інтерактивні дашборди.  

📌 **Приклад побудови графіка у Python**  
```python
import matplotlib.pyplot as plt

# Побудова графіка атак у регіонах
df.groupby("region")["attack_type"].count().plot(kind="bar")
plt.title("Кількість атак за регіонами")
plt.show()
```

---

## **4. Практичні завдання (30 хв)**  
✅ **Завдання 1**: **Створити SQL-запит для підрахунку бойових зіткнень за типом атаки.**  
✅ **Завдання 2**: **Проаналізувати в Python дані про атаки ворога у конкретному регіоні.**  
✅ **Завдання 3**: **Розрахувати прогноз можливих атак за допомогою лінійної регресії.**  
✅ **Завдання 4**: **Створити дашборд у Power BI/Tableau з даними бойової активності.**  

📌 **Приклад SQL-запиту для виконання завдання 1**  
```sql
SELECT attack_type, COUNT(*) AS num_attacks
FROM CombatReports
GROUP BY attack_type
ORDER BY num_attacks DESC;
```

📌 **Приклад коду для виконання завдання 2**  
```python
df_filtered = df[df["region"] == "Схід"]
print(df_filtered["attack_type"].value_counts())
```



# **Детальний розбір практичних завдань**

## **Завдання 1: SQL-запит для підрахунку бойових зіткнень за типом атаки**
### **Умова:**  
Необхідно підрахувати кількість бойових зіткнень за типом атаки та відсортувати їх у порядку зменшення.

### **Рішення:**  
📌 **Припустимо, що є таблиця `CombatReports` зі структурою:**  
| report_id | region   | attack_type   | date       |
|-----------|---------|--------------|-----------|
| 1         | Схід    | Артобстріл    | 2024-02-10 |
| 2         | Захід   | ДРГ           | 2024-02-12 |
| 3         | Схід    | Танкова атака | 2024-02-15 |
| 4         | Південь | Артобстріл    | 2024-02-17 |

📌 **Запит для підрахунку кількості атак за типом:**  
```sql
SELECT attack_type, COUNT(*) AS num_attacks
FROM CombatReports
GROUP BY attack_type
ORDER BY num_attacks DESC;
```

📌 **Очікуваний результат:**  
| attack_type    | num_attacks |
|---------------|------------|
| Артобстріл    | 2          |
| Танкова атака | 1          |
| ДРГ          | 1          |

🔹 **Пояснення:**  
1. `COUNT(*)` підраховує кількість записів у кожній групі.  
2. `GROUP BY attack_type` групує записи за типом атаки.  
3. `ORDER BY num_attacks DESC` сортує результат у порядку спадання.  

---

## **Завдання 2: Аналіз у Python даних про атаки ворога у конкретному регіоні**
### **Умова:**  
Проаналізувати дані про атаки у конкретному регіоні та визначити найпоширеніший тип атаки.

### **Рішення:**  
📌 **Завантажимо дані в Pandas та виконаємо аналіз:**  
```python
import pandas as pd

# Завантаження даних
df = pd.read_csv("combat_reports.csv")

# Фільтрація даних по регіону "Схід"
df_filtered = df[df["region"] == "Схід"]

# Підрахунок кількості атак за типом
attack_counts = df_filtered["attack_type"].value_counts()

# Виведення результатів
print("Кількість атак у регіоні Схід:")
print(attack_counts)
```

📌 **Очікуваний результат:**  
```
Кількість атак у регіоні Схід:
Артобстріл    2
Танкова атака 1
```

🔹 **Пояснення:**  
1. `pd.read_csv("combat_reports.csv")` – зчитує дані з файлу.  
2. `df[df["region"] == "Схід"]` – відбирає записи, де регіон = "Схід".  
3. `df_filtered["attack_type"].value_counts()` – підраховує кількість атак кожного типу.  

---

## **Завдання 3: Прогноз можливих атак за допомогою лінійної регресії**
### **Умова:**  
На основі історичних даних передбачити кількість атак у наступному місяці.

### **Рішення:**  
📌 **Використаємо бібліотеку `sklearn` для побудови регресійної моделі:**  
```python
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

# Завантаження даних
df = pd.read_csv("combat_reports.csv")

# Перетворення дати у числовий формат
df["date"] = pd.to_datetime(df["date"])
df["month"] = df["date"].dt.month
df["year"] = df["date"].dt.year

# Групування даних за місяцями
df_grouped = df.groupby(["year", "month"]).size().reset_index(name="num_attacks")

# Формування ознак і цільової змінної
X = df_grouped[["year", "month"]]
y = df_grouped["num_attacks"]

# Розділення вибірки на тренувальну та тестову
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Створення моделі та навчання
model = LinearRegression()
model.fit(X_train, y_train)

# Прогноз на наступний місяць (березень 2024)
next_month = np.array([[2024, 3]])
predicted_attacks = model.predict(next_month)

print(f"Прогнозована кількість атак у березні 2024: {int(predicted_attacks[0])}")
```

📌 **Очікуваний результат:**  
```
Прогнозована кількість атак у березні 2024: 15
```

🔹 **Пояснення:**  
1. `pd.to_datetime(df["date"])` – перетворює дати у формат datetime.  
2. `.dt.month` і `.dt.year` – виділяють рік і місяць.  
3. `df.groupby(["year", "month"]).size()` – підраховує кількість атак за кожен місяць.  
4. `LinearRegression()` – навчає модель прогнозу.  
5. `model.predict([[2024, 3]])` – передбачає кількість атак у березні 2024.  

---

## **Завдання 4: Дашборд у Power BI/Tableau з бойовою активністю**
### **Умова:**  
Створити дашборд, який відображає розподіл бойових зіткнень за регіонами та типами атак.

### **Рішення:**  

🔹 **Крок 1: Підготовка даних**  
📌 **Експорт даних для використання у Power BI/Tableau:**  
```python
df_grouped = df.groupby(["region", "attack_type"]).size().reset_index(name="num_attacks")
df_grouped.to_csv("combat_data_summary.csv", index=False)
```
📌 **Очікуваний CSV-файл:**
| region | attack_type   | num_attacks |
|--------|--------------|------------|
| Схід   | Артобстріл   | 10         |
| Південь | Танкова атака | 5          |

---

🔹 **Крок 2: Завантаження в Power BI/Tableau**  
1️⃣ **Відкрити Power BI/Tableau**  
2️⃣ **Імпортувати `combat_data_summary.csv`**  
3️⃣ **Створити візуалізації:**  
   - Діаграма **"Кількість атак за регіонами"**  
   - Стовпчикова діаграма **"Тип атак у кожному регіоні"**  

📌 **Очікуваний вигляд дашборду:**  
✔ **Географічна карта з позначками атак у регіонах**  
✔ **Гістограма кількості атак за типом**  
✔ **Динаміка атак у часі (лінійний графік)**  

---

## **Висновки**
- **Завдання 1:** SQL-запит дозволяє швидко аналізувати типи атак.  
- **Завдання 2:** Python (pandas) використовується для фільтрації та аналізу бойових звітів.  
- **Завдання 3:** Лінійна регресія допомагає прогнозувати майбутні атаки.  
- **Завдання 4:** Power BI/Tableau забезпечують інтерактивний аналіз даних.  

🚀 **Ключовий висновок:**  
**Поєднання SQL, Python та BI-платформ дозволяє ефективно аналізувати бойову активність і приймати стратегічні рішення.**

# **Перероблене Завдання 4: Веб-додаток для інтерактивного аналізу бойової активності**  

## **Опис завдання:**  
Розробити **інтерактивний веб-додаток** для аналізу бойової активності за регіонами та типами атак **без використання спеціальних BI-програм** (Power BI, Tableau).  
Використовуємо **тільки Python та веб-технології** (`Flask`, `Pandas`, `Plotly`, `Dash`).  

---

## **Рішення:**  

### 🔹 **1. Підготовка середовища**
📌 **Встановлення необхідних бібліотек (якщо вони не встановлені)**  
```bash
pip install flask pandas plotly dash gunicorn
```

---

### 🔹 **2. Підготовка даних у Python**  

Створимо **файл `combat_reports.csv`** із бойовими звітами.  

📌 **Формат файлу `combat_reports.csv`**  
| report_id | region  | attack_type   | date       | num_casualties |
|-----------|--------|--------------|------------|--------------|
| 1         | Схід   | Артобстріл    | 2024-02-10 | 5            |
| 2         | Захід  | ДРГ           | 2024-02-12 | 2            |
| 3         | Схід   | Танкова атака | 2024-02-15 | 8            |
| 4         | Південь| Артобстріл    | 2024-02-17 | 3            |

---

### 🔹 **3. Створення веб-додатку для аналізу бойових дій**  
📌 **Файл `app.py` – серверна частина на Flask + Dash**  

```python
import pandas as pd
import dash
from dash import dcc, html
import plotly.express as px
from flask import Flask

# Завантаження бойових звітів
df = pd.read_csv("combat_reports.csv")
df["date"] = pd.to_datetime(df["date"])  # Конвертуємо дату у відповідний формат

# Створення Flask-сервера
server = Flask(__name__)

# Ініціалізація Dash
app = dash.Dash(__name__, server=server)

# Побудова графіків
fig_attacks_by_region = px.bar(df.groupby("region")["attack_type"].count().reset_index(),
                               x="region", y="attack_type",
                               title="Кількість атак за регіонами",
                               labels={"attack_type": "Кількість атак", "region": "Регіон"},
                               color="region")

fig_attacks_by_type = px.pie(df, names="attack_type", title="Розподіл атак за типами")

fig_attacks_over_time = px.line(df.groupby("date")["num_casualties"].sum().reset_index(),
                                x="date", y="num_casualties",
                                title="Динаміка бойових втрат у часі")

# Структура веб-інтерфейсу
app.layout = html.Div(children=[
    html.H1(children="Аналіз бойової активності", style={"textAlign": "center"}),

    dcc.Graph(id="attacks_by_region", figure=fig_attacks_by_region),
    dcc.Graph(id="attacks_by_type", figure=fig_attacks_by_type),
    dcc.Graph(id="attacks_over_time", figure=fig_attacks_over_time),
])

# Запуск веб-сервера
if __name__ == "__main__":
    app.run_server(debug=True)
```

---

### 🔹 **4. Запуск веб-додатку**  
📌 **Команда для запуску у терміналі:**  
```bash
python app.py
```
📌 **Перейти у браузері за адресою:**  
```
http://127.0.0.1:8050/
```

---

### 🔹 **5. Що отримаємо?**
При відкритті веб-інтерфейсу буде відображено три графіки:
1. **Кількість атак за регіонами** (стовпчикова діаграма)  
2. **Розподіл атак за типами** (кругова діаграма)  
3. **Динаміка втрат у часі** (лінійний графік)  

---

## **Підсумки**
✅ **Що ми зробили?**  
1. Завантажили бойові звіти у `Pandas`.  
2. Використали `Dash` та `Plotly` для візуалізації.  
3. Запустили **веб-додаток**, доступний у браузері **без спеціального BI-софту**.  

🚀 **Ключовий висновок:**  
**Python + Dash дозволяє швидко створити веб-аналітику без використання спеціалізованих BI-платформ!**



## **5. Висновки та підсумки заняття (10 хв)**  
✅ **Основні висновки**:
- **Аналіз даних** є ключовим елементом військового управління.  
- **Сучасні ІТ** (SQL, Python, BI-системи) значно покращують швидкість аналізу.  
- **Машинне навчання** може використовуватися для прогнозування загроз.  

🚀 **Ключовий меседж**:  
**Сучасні інформаційні технології аналізу даних дозволяють ефективно обробляти великі масиви інформації, що критично важливо для військової аналітики та стратегічного планування.**