#🧩**Звіт проведення Етапу 4: "Інтеграція та Виведення Результатів"**

**Project:** Прогнозування Відтоку Клієнтів  
**Author:** Natalia Kalashnikova  
**Team Lead:** Vitalii Subbotin  
**Date:** 2025-10-18
---

## 🎯 **Мета етапу**

---

**Мета проєкту:** прогноз відтоку клієнтів (**churn**) на основі історичних даних телекомунікаційної компанії.  
**Поточний етап:** Інтеграція та Виведення Результатів — створення кінцевого користувацького інтерфейсу (Streamlit-додаток) для впровадження моделі в робочі процеси бізнесу.

## 🔍 **Опис етапів проведення обробки даних**
---

На етапі інтеграції було розроблено повноцінний веб-додаток на базі **Streamlit**, що забезпечує взаємодію бізнес-користувачів з моделлю LightGBM в реальному часі.

### **1. Розробка Веб-Додатку (Streamlit)**

Розроблений додаток структурований на чотири основні розділи (сторінки/вкладки) для забезпечення комплексного функціоналу:

1.  **Індивідуальне Прогнозування (Ручний Ввід):**
    * Створено форму для ручного введення всіх необхідних 19 ознак клієнта.
    * **Процедура опрацювання:** Дані клієнта проходять через функцію попередньої обробки `align_features()`, що гарантує коректне масштабування та відповідність формату ознак, очікуваному моделлю.
    * **Вивід Результатів:** Миттєве відображення прогнозу "Клієнт має високу/низьку ймовірність відтоку" з числовою оцінкою ймовірності (%).

2.  **Пакетне Прогнозування (CSV-завантаження):**
    * Інтерфейс для завантаження файлів `.csv` з даними нових клієнтів.
    * Обробка всього масиву даних моделю, генерація прогнозу відтоку для кожного клієнта та завантаження оновленого файлу для подальшої роботи.

3.  **Аналітика Факторів Відтоку (Feature Importance):**
    * Візуалізація важливості ознак (Feature Importance) від моделі LightGBM.
    * Це дозволяє бізнесу розуміти, **чому** клієнти йдуть, і на які параметри слід звертати увагу в першу чергу.

4.  **Оцінка Ефективності Моделі (Performance Metrics):**
    * Візуалізація ключових метрик LightGBM (Accuracy, F1-score, ROC-AUC).
    * Порівняння ефективності LightGBM з іншими тестованими моделями (наприклад, Logistic Regression, Random Forest), що підтверджує обґрунтованість остаточного вибору.

### **2. Забезпечення Надійності та Швидкодії**

* **Кешування Моделі:** Використано декоратор `st.cache_resource` для одноразового завантаження та кешування навченої моделі LightGBM.
* **Кастомний Дизайн:** Застосовано кастомні CSS-стилі для підвищення візуальної привабливості та професійного вигляду додатку.


## 🛠️ **Аргументація вибору методів**
---

| Метод / Інструмент | Мета | Аргументація Вибору |
| :--- | :--- | :--- |
| **Streamlit** | Створення інтерактивного веб-додатку. | **Швидкість розробки та простота інтеграції Python.** Дозволяє швидко перетворити ML-скрипти на функціональний веб-додаток. |
| **LightGBM** | Фінальна модель прогнозування. | Обрана через високу продуктивність (F1-score $\approx 96-97\%$) та швидкість прогнозування. Забезпечує **найкращий баланс** між точністю та швидкістю. |
| **Функція `align_features()`** | Корекція нових вхідних даних. | **Критично важливе рішення для продакшну.** Гарантує, що вхідні дані мають такий самий порядок та набір ознак, як і дані, на яких навчалася модель. |
| **Візуалізація Feature Importance** | Пояснюваність моделі (XAI). | Надання бізнес-користувачам не просто прогнозу, а й **причини** такого прогнозу, що дозволяє створювати таргетовані стратегії утримання. |

## 💡 **3. Ключові Знахідки**
---

* **Успішна Продуктивність:** Фінальна модель LightGBM демонструє **високі метрики** (F1-score $\approx 96-97\%$ на валідаційному наборі).
* **Інтуїтивний Інтерфейс:** Розроблений Streamlit-додаток є інтуїтивно зрозумілим і дозволяє нетехнічним користувачам легко виконувати прогнози та отримувати аналітику.
* **Найважливіші Фактори Відтоку (з аналітики):** Ключовими факторами, які найбільше впливають на відтік, є: **Тривалість Контракту (tenure)**, **Середній Місячний Рахунок (bill\_avg)** та **Середнє Споживання Завантажень/Вивантажень (download\_avg/upload\_avg)**.


## 💼 **4. Аналітичний Висновок Результатів (Що означає для бізнесу)**
---
Інтеграція моделі в Streamlit-додаток є **трансформаційним кроком** для телекомунікаційної компанії:

| Аспект | Результат Впровадження | Бізнес-Значення |
| :--- | :--- | :--- |
| **Раннє Визначення** | Модель прогнозує відтік із точністю до $\approx 97\%$. | Це дозволяє **своєчасно ідентифікувати клієнтів із високою ймовірністю відтоку** та переводити їх до спеціалізованого відділу утримання. |
| **Персоналізація Утримання** | Візуалізація Feature Importance. | Менеджери отримують інформацію про **конкретні чинники ризику** для кожного клієнта, що дозволяє пропонувати індивідуальні пакети послуг, **підвищуючи ROI** зусиль по утриманню. |
| **Масштабованість** | Підтримка пакетного завантаження CSV. | Можливість щотижневої або щомісячної **пакетної оцінки** всієї клієнтської бази, забезпечуючи проактивне управління відтоком на рівні всієї компанії. |
| **Прозорість Рішень** | Аналітичні вкладки (Feature Importance, Метрики). | Бізнес-підрозділи можуть **довіряти моделі**, оскільки її ефективність та логіка прийняття рішень є прозорими та візуалізованими. |

**Загальний Висновок:** Розроблений Streamlit-додаток перетворює модель машинного навчання з теоретичної розробки на **практичний, оперативний інструмент** для відділів маркетингу та утримання клієнтів, який безпосередньо впливає на підвищення Retention Rate та оптимізацію витрат на залучення нових клієнтів.

## 🚀 **Готовність до наступного етапу**

---

**Рекомендація:**

- Проєкт **повністю готова** до етапу **Containerization:** Створення Dockerfile для пакування застосунку та моделі в ізольований контейнер.