<center><font size="6"><b>Комп'ютерний практикум 8.

<center><b> Створення дашборду за допомогою Streamlit </font>



<center><img src="https://blog.streamlit.io/content/images/size/w2000/2024/01/streamlit-dashboard-python.png" width="600"></center>



# __Streamlit__
__Streamlit__ - це безкоштовна і відкрита бібліотека Python для створення і розповсюдження веб-додатків для машинного навчання та аналізу даних. Streamlit дає  змогу перетворити свої скрипти з даними на інтерактивні веб-додатки за кілька хвилин.

### Можливості Streamlit:

*   Створити привабливий і функціональний інтерфейс для алгоритмів, моделей, візуалізацій, дашбордів та інших продуктів з даними.
*   Робити експерименти та ітерації з даними і кодом, використовуючи  простий API, який автоматично оновлює ваш застосунок під час збереження вихідного файлу.
*   Додавати взаємодію з вашими даними і додатком, використовуючи різні віджети, такі як слайдери, кнопки, чекбокси, радіокнопки, випадаючі списки та інші.
* Ділитися своїми додатками з колегами, клієнтами, спільнотою або всім світом, використовуючи  платформу Community Cloud або свій власний сервер.






In [None]:
# Завантажимо Streamlit (не додавати в .py файл додатку)
pip install streamlit

**Python-бібліотеки**, які можуть використовуються у створеному Streamlit-додатку:

| Бібліотека            | Призначення                                                                 |
|-----------------------|------------------------------------------------------------------------------|
| **`streamlit`**       | Основна бібліотека для створення **інтерактивного вебдодатку**. Створює інтерфейс, фільтри, графіки, карту. |
| **`pandas`**          |  Робота з табличними даними (DataFrame) — читання, фільтрація, обчислення нових змінних. |
| **`matplotlib.pyplot`** |  Побудова класичних графіків (гістограми, scatter, лінійні графіки, heatmap). |
| **`seaborn`**         |  Стилізовані графіки на основі matplotlib — barplot, boxplot, heatmap з анотаціями. |
|**`altair`**|Декларативна система побудови інтерактивних графіків, яка працює особливо добре в Streamlit. Підходить для побудови інтерактивних діаграм, фільтрації та дослідження взаємозв’язків у даних|
| **`numpy`**           |  Математичні операції, генерація випадкових чисел для симуляцій (Монте-Карло). |
| **`plotly.express`**  |  Інтерактивні графіки: scatter з підказками, інтерактивні осі, кольори, розміри. |
| **`sklearn.linear_model`** | Лінійна регресія — побудова моделі для оцінки залежності ROI від AdBudget. |
| **`sklearn.cluster`** |  Кластеризація (алгоритм KMeans) для групування компаній за економічними показниками. |



In [None]:
import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import altair as alt
import numpy as np
import plotly.express as px
from sklearn.linear_model import LinearRegression
from sklearn.cluster import KMeans

__Завантажимо дані__

Маємо датасет **`streamlit_dataset.xlsx`**:

| Назва змінної        | Тип             | Опис |
|----------------------|------------------|------|
| **Company**          | `str`            | Назва компанії (`Company_1`, `Company_2`, ...). Унікальний ідентифікатор суб’єкта аналізу. |
| **Year**             | `int`            | Рік, за який наведені фінансові показники (2022, 2023, 2024). |
| **Region**           | `str`            | Географічний регіон діяльності компанії: `North`, `South`, `East`, `West`. |
| **Industry**         | `str`            | Галузь економіки: `Finance`, `Tech`, `Retail`, `Manufacturing`. |
| **Revenue**          | `int`            | Загальний дохід компанії за відповідний рік. |
| **Expenses**         | `int`            | Загальні витрати компанії за відповідний рік. |
| **Investment**       | `int`            | Обсяг інвестицій у розвиток або рекламу. |
| **Customers**        | `int`            | Кількість клієнтів, яких обслуговувала компанія. |
| **ConversionRate**   | `float`          | Частка клієнтів, які здійснили цільову дію (наприклад, купівлю). Є пропущені значення. |
| **Profit**           | `int`            | Прибуток компанії = Revenue − Expenses. |
| **ROI**              | `float`          | Рентабельність інвестицій = Profit / Investment. |
| **RevenuePerCustomer** | `float`        | Дохід на одного клієнта = Revenue / Customers. |
| **Latitude**         | `float`          | Географічна широта для відображення компанії на мапі. |
| **Longitude**        | `float`          | Географічна довгота для мапи. |
| **Scenario**         | `str`            | Бізнес-сценарій, в рамках якого оцінюються показники: `Baseline`, `Optimistic`, `Pessimistic`. |
| **MarketGrowth**     | `float`          | Темп зростання ринку (в %) — умовна макроекономічна змінна для моделювання. |
| **AdBudget**         | `float`          | Бюджет на рекламу або маркетинг. Використовується для аналізу ефективності. |



___Застосування змінних:___

- **Кількісні змінні** (`Revenue`, `Expenses`, `Profit`, `ROI`, `Customers`, `AdBudget`) — підходять для **графіків, регресій, кластеризацій**.
- **Категоріальні змінні** (`Region`, `Industry`, `Scenario`) — для **групування, фільтрації, аналізу розподілів**.
- **Просторові змінні** (`Latitude`, `Longitude`) — для **інтерактивної карти**.
- **ConversionRate** — підходить для демонстрації **роботи з пропущеними даними**.


In [None]:
df = pd.read_csv('streamlit_dataset.csv')

## __Розвідувальний аналіз даних (EDA)__
Для якісної роботи з даними та їх представленням, використанням для моделювання, їх необхідно попередньо опрацювати. Тому етап препроцесінгу та розвідувального аналізу є ключовим в підготовці даних.

In [None]:
df.info()

In [None]:
df.describe()

In [None]:
missing_data = df.isnull()
for column in missing_data.columns.values.tolist():
    print(column)
    print (missing_data[column].value_counts())
    print("")

## __Конфігурація сторінки__


Визначимо налаштування програми, надавши їй заголовок сторінки та значок, які відображаються в браузері. Це також визначає вміст сторінки, який буде відображатися в широкому макеті, який вписується в ширину сторінки, а також відображає бічну панель у розгорнутому стані.

`st.set_page_config(...)` у Streamlit — задає загальні параметри зовнішнього вигляду сторінки Streamlit-додатку. Її потрібно викликати одразу після імпорту `streamlit`, до будь-якого іншого коду Streamlit.

___Синтаксис:___

```python
st.set_page_config(
    page_title=None,
    page_icon=None,
    layout="centered",
    initial_sidebar_state="auto",
    menu_items=None
)
```

| Параметр                | Тип      | Опис |
|-------------------------|----------|------|
| `page_title`            | `str`    | Назва сторінки (відображається у вкладці браузера) |
| `page_icon`             | `str` або `Image` | Емодзі або шлях до файлу з іконкою (favicon) |
| `layout`                | `str`    | `'centered'` (стандарт) або `'wide'` (повна ширина) |
| `initial_sidebar_state` | `str`    | `'auto'`, `'expanded'`, `'collapsed'` — як відкривається бокове меню |
| `menu_items`            | `dict`   | Налаштування меню у правому верхньому куті: `{ 'Get Help', 'Report a bug', 'About' }` |






In [None]:
st.set_page_config(
    page_title="Економічний дашборд",
    page_icon="📊",
    layout="wide",
    initial_sidebar_state="expanded",
    menu_items={
        'Get Help': 'https://docs.streamlit.io/',
        'Report a bug': 'https://github.com/streamlit/streamlit/issues',
        'About': 'Інтерактивна панель для економічного аналізу підприємств'
    }
)

## __Бічна панель (**`st.sidebar`**)__

у Streamlit — це окрема область інтерфейсу, яка розташовується ліворуч і використовується для фільтрів, параметрів, налаштувань, навігації.

Вона дозволяє розділити логіку:
- зліва — керування
- справа — результати, графіки, аналітика


| Компонент   `sidebar`            | Опис                                              |
|-------------------------|---------------------------------------------------|
| `st.sidebar.title()`    | Заголовок                                         |
| `st.sidebar.markdown()` | Текстовий опис / інструкції                       |
| `st.sidebar.selectbox()`| Один вибір зі списку                              |
| `st.sidebar.multiselect()`| Кілька виборів                                   |
| `st.sidebar.slider()`   | Слайдер для чисел або дат                         |
| `st.sidebar.radio()`    | Вибір одного варіанту з декількох (радіо-кнопки)  |
| `st.sidebar.checkbox()` | Прапорець                                |
| `st.sidebar.file_uploader()` | Завантаження CSV, Excel, зображень             |
| `st.sidebar.button()`   | Кнопка, яка реагує на клік                        |
| `st.sidebar.info()` / `warning()` | Інформаційні повідомлення         |



## __Створимо наступну бічну панель (`st.sidebar`):__

```python
st.sidebar.title("Панель фільтрації")
```
> Створює заголовок в лівій боковій панелі

***Фільтри:***

```python
st.sidebar.selectbox("Рік", sorted(df["Year"].unique()))
```
> Випадаючий список із доступних років  
Користувач обирає один рік для фільтрації.


```python
st.sidebar.multiselect("Регіон", df["Region"].unique(), default=df["Region"].unique())
```
> Список із можливістю вибору декількох регіонів. По замовчуванню обрані всі регіони.


```python
st.sidebar.multiselect("Галузь", df["Industry"].unique(), default=df["Industry"].unique())
```
> Вибір однієї або кількох галузей. По замовчуванню обрані всі галузі.


```python
st.sidebar.radio("Сценарій", df["Scenario"].unique())
```
> Вибір одного варіанту зі сценаріїв розвитку подій (наприклад: Optimistic, Baseline, Pessimistic)


```python
st.sidebar.slider(
    "Максимальний рекламний бюджет",
    min_value=int(df["AdBudget"].min()),
    max_value=int(df["AdBudget"].max()),
    value=int(df["AdBudget"].max()),
    step=1000
)
```
> Слайдер, який дозволяє обмежити максимальний рекламний бюджет


***Чекбокс***

```python
show_map = st.sidebar.checkbox("🗺 Показати мапу компаній")
```
> Дозволяє увімкнути або вимкнути мапу на головній панелі.



***Перемикач типу графіка***

```python
chart_option = st.sidebar.radio(
    "Оберіть графік для перегляду:",
    [...]
)
```

Користувач може обрати один із шести графіків:

| Варіант                                      | Що показує                                  |
|----------------------------------------------|----------------------------------------------|
| `Доходи на клієнта vs Витрати`               | Scatter-графік між `Expenses` і `RevenuePerCustomer` |
| `Boxplot прибутку по галузях`                | Розподіл прибутку в різних галузях           |
| `Scatter: Прибуток vs Інвестиції`            | Залежність прибутку від інвестицій           |
| `Гістограма конверсії по галузях`            | Середній рівень `ConversionRate` у галузях   |
|`Теплова карта кореляцій`|Візуалізує кореляції між числовими змінними у відфільтрованій таблиці|
|`Кластеризація компаній (KMeans)`|Кластеризація за `ROI` та `Investment`|



***Інформаційний блок***

```python
st.sidebar.markdown(" **Інструкція**: ...")
```
> Виводить просту текстову інструкцію, яка допомагає користувачу зрозуміти, як користуватись фільтрами і навігацією. Використовується мова розмітки markdown

---


Ця бокова панель забезпечує:

|  Компонент         | Призначення                        |
|----------------------|-------------------------------------|
|  Selectbox         | Обрати 1 рік                       |
|  Multiselect        | Обрати кілька регіонів/галузей     |
|  Radio             | Обрати сценарій і тип графіка      |
|  Слайдер           | Обмежити за рекламним бюджетом     |
|  Checkbox          | Показати/приховати карту           |
|  Markdown          | Надати інструкцію користувачу      |


In [None]:
# Бічна панель / SIDEBAR
st.sidebar.title("Панель фільтрації")

# Фільтри
selected_year = st.sidebar.selectbox("Рік", sorted(df["Year"].unique()))
selected_region = st.sidebar.multiselect("Регіон", df["Region"].unique(), default=df["Region"].unique())
selected_industry = st.sidebar.multiselect("Галузь", df["Industry"].unique(), default=df["Industry"].unique())
selected_scenario = st.sidebar.radio("Сценарій", df["Scenario"].unique())

selected_max_adbudget = st.sidebar.slider(
    "Максимальний рекламний бюджет",
    min_value=int(df["AdBudget"].min()),
    max_value=int(df["AdBudget"].max()),
    value=int(df["AdBudget"].max()),
    step=1000
)

# Чекбокси для відображення
show_map = st.sidebar.checkbox("🗺 Показати карту компаній")

# Перемикач графіків
chart_option = st.sidebar.radio(
    "📈 Оберіть графік для перегляду:",
    [
        "Доходи на клієнта vs Витрати",
        "Boxplot прибутку по галузях",
        "Scatter: Прибуток vs Інвестиції",
        "Гістограма конверсії по галузях",
        "Теплова карта кореляцій",
        "Кластеризація компаній (KMeans)"
    ]
)

# Інформаційний блок
st.sidebar.markdown("---")
st.sidebar.markdown(" **Інструкція**: \nФільтруйте дані за параметрами і переглядайте графіки та таблиці на панелі праворуч.")
st.sidebar.markdown(" **Автор**: Lazar_Iryna")

## __Фільтрація__


Цей блок фільтрує основний DataFrame `df` відповідно до вибору користувача в бічній панелі (`sidebar`). Результат зберігається у змінну `df_filtered`, яка використовується далі для побудови таблиці, графіків, завантаження CSV тощо.

 `df[...]`  
Це підмножина початкового датафрейму — тут передається логічна маска, що вибирає лише ті рядки, які відповідають критеріям.

-  `(df["Year"] == selected_year)`  
Фільтрує лише ті записи, у яких значення в колонці `Year` дорівнює вибраному року.

- `(df["Region"].isin(selected_region))`  
Залишає лише ті рядки, де `Region` міститься у списку вибраних регіонів.  
Функція `.isin()` перевіряє, чи є значення у списку.

- `(df["Industry"].isin(selected_industry))`  
Залишає лише ті записи, де `Industry` відповідає вибраним галузям.

- `(df["Scenario"] == selected_scenario)`  
Фільтрує за вибраним сценарієм.

- `(df["AdBudget"] <= selected_max_adbudget)`  
Обмежує вибір рядків лише тими, де рекламний бюджет не перевищує вказане максимальне значення зі слайдера.


In [None]:
# Фільтрація

df_filtered = df[
    (df["Year"] == selected_year) &
    (df["Region"].isin(selected_region)) &
    (df["Industry"].isin(selected_industry)) &
    (df["Scenario"] == selected_scenario) &
    (df["AdBudget"] <= selected_max_adbudget)
]


## __Побудова моделі лінійної регресії__


***Блок регресії в бічній панелі***

* `numeric_columns`: отримує список усіх числових стовпців з відфільтрованого DataFrame `df_filtered`, тому цей блок треба писати після створення відфільтрованого `df_filtered`.
* `reg_x` та `reg_y`: дозволяють користувачу вибрати незалежну (X) та залежну (Y) змінні для побудови регресії.
* `show_regression`: чекбокс, який визначає, чи слід відображати регресійну модель.



In [None]:
# Блок регресії
st.sidebar.markdown("Побудова регресії")
numeric_columns = df_filtered.select_dtypes(include=np.number).columns.tolist()

reg_x = st.sidebar.selectbox("Оберіть змінну X", numeric_columns, index=0)
reg_y = st.sidebar.selectbox("Оберіть змінну Y", numeric_columns, index=1)
show_regression = st.sidebar.checkbox("Показати регресійну модель")

## __Основна панель Streamlit-додатку__

Основна панель Streamlit-додатку формує фінальний вигляд і поведінку сторінки після фільтрації


***Заголовок і кількість компаній***

```python
st.title("📊 Економічний дашборд компаній")
st.subheader(f"🔍 Відфільтровано {df_filtered.shape[0]} компаній")
```

`st.title(...)` — основний заголовок сторінки.

`st.subheader(...)` — повідомляє користувачу, скільки компаній залишилось після застосування фільтрів.

`df_filtered.shape[0]` — кількість рядків (компаній) у відфільтрованому DataFrame.


___Кнопка завантаження CSV___

```python
csv = df_filtered.to_csv(index=False).encode("utf-8")
st.download_button(
    label="⬇️ Завантажити CSV",
    data=csv,
    file_name="filtered_companies.csv",
    mime="text/csv"
)
```

> Конвертує таблицю в CSV і кодує її для завантаження.

`st.download_button(...)` — додає інтерактивну кнопку, щоб користувач міг завантажити дані.

___Таблиця результатів___


> Виводить повну таблицю результатів у вигляді інтерактивної таблиці з прокруткою, сортуванням тощо.

**`all_columns`**: отримує список усіх стовпців у відфільтрованому DataFrame `df_filtered`.

**`default_columns`**: визначає список стовпців, які будуть вибрані за замовчуванням, якщо вони присутні в `df_filtered`.

**`st.multiselect`**: створює віджет для вибору кількох стовпців, дозволяючи користувачам обрати, які стовпці відображати.

**`st.dataframe`**: відображає таблицю з обраними стовпцями.

**`st.info`**: виводить повідомлення, якщо не вибрано жодного стовпця.


___🗺 Карта компаній___

```python
if show_map:
    st.subheader("🗺 Географія компаній")

    map_data = df_filtered[["Latitude", "Longitude"]].dropna().rename(
        columns={"Latitude": "latitude", "Longitude": "longitude"}
    )

    if not map_data.empty:
        st.map(map_data)
    else:
        st.warning("Немає доступних координат для побудови карти.")
```

`show_map` — логічна змінна (встановлюється через чекбокс у sidebar).

`dropna()` — виключає компанії без координат.

`rename(...)` — перетворює назви колонок у формат, який вимагає `st.map()` (все маленькими).

`st.map(...)` — будує інтерактивну карту.

___Графіки за вибором користувача___

> Залежно від `chart_option`, виводиться певний графік (визначається через `radio` у sidebar):

1. __Доходи на клієнта vs Витрати (Altair)__

> компанія, вісь X: `Expenses`, Y: `RevenuePerCustomer`.

2. __Boxplot прибутку по галузях (Seaborn)__

> Дозволяє виявити галузі з високою/низькою волатильністю.

3. __Scatter-графік: Прибуток vs Інвестиції (Altair)__

> Візуалізує залежність між розміром інвестицій та прибутком.

4. __Гістограма конверсії по галузях (Seaborn)__

> Стовпчиковий графік із середнім `ConversionRate` для кожної галузі.

5. __Теплова карта кореляцій (Seaborn Heatmap)__

```python
numeric_cols = df_filtered.select_dtypes(include=[np.number])
corr = numeric_cols.corr()
```

> Обчислює кореляцію між усіма числовими змінними. Показує, які показники мають сильну/слабку кореляцію.

6. __Кластеризація компаній (KMeans)__

```python
cluster_data = df_filtered[["ROI", "Investment"]].dropna()
kmeans = KMeans(n_clusters=3).fit(...)
```

> Використовується KMeans для розбиття компаній на 3 кластери за ознаками `ROI` та `Investment`. Кожна точка має колір відповідно до кластера.

_Працює лише якщо є мінімум 3 компанії з непорожніми значеннями._



In [None]:
# Основна панель

st.title("📊 Економічний дашборд компаній")
st.subheader(f"🔍 Відфільтровано {df_filtered.shape[0]} компаній")

# Кнопка завантаження CSV
csv = df_filtered.to_csv(index=False).encode("utf-8")
st.download_button(
    label="⬇️ Завантажити CSV",
    data=csv,
    file_name="filtered_companies.csv",
    mime="text/csv"
)

# Інтерактивна таблиця результатів

st.subheader("Оберіть, які стовпці таблиці відображати")

all\_columns = df\_filtered.columns.tolist()
default\_columns = \["Company", "Region", "Industry", "Profit", "ROI"]

selected\_columns = st.multiselect(
"Оберіть стовпці для перегляду",
options=all\_columns,
default=\[col for col in default\_columns if col in all\_columns]
)

if selected\_columns:
st.dataframe(df\_filtered\[selected\_columns])
else:
st.info("Оберіть хоча б один стовпець, щоб побачити таблицю.")


# Карта компаній
if show_map:
    st.subheader("🗺 Географія компаній")

    map_data = df_filtered[["Latitude", "Longitude"]].dropna().rename(
        columns={"Latitude": "latitude", "Longitude": "longitude"}
    )

    if not map_data.empty:
        st.map(map_data)
    else:
        st.warning("Немає доступних координат для побудови карти.")



# Відображення обраного графіка

if chart_option == "Доходи на клієнта vs Витрати":
    st.subheader("📊 Доходи на клієнта vs Витрати")
    chart = alt.Chart(df_filtered).mark_circle(size=60).encode(
        x='Expenses:Q',
        y='RevenuePerCustomer:Q',
        color='Industry:N',
        tooltip=['Company', 'Expenses', 'RevenuePerCustomer', 'Industry']
    ).interactive().properties(title="Дохід на клієнта vs Витрати")
    st.altair_chart(chart, use_container_width=True)

elif chart_option == "Boxplot прибутку по галузях":
    st.subheader("📊 Boxplot прибутку по галузях")
    fig, ax = plt.subplots(figsize=(10, 5))
    sns.boxplot(data=df_filtered, x="Industry", y="Profit", ax=ax)
    ax.set_title("Розподіл прибутку по галузях")
    st.pyplot(fig)

elif chart_option == "Scatter: Прибуток vs Інвестиції":
    st.subheader("📊 Scatter: Прибуток vs Інвестиції")
    chart = alt.Chart(df_filtered).mark_circle(size=60).encode(
        x='Investment:Q',
        y='Profit:Q',
        color='Industry:N',
        tooltip=['Company', 'Investment', 'Profit']
    ).interactive().properties(title="Прибуток vs Інвестиції")
    st.altair_chart(chart, use_container_width=True)

elif chart_option == "Гістограма конверсії по галузях":
    st.subheader("📊 Гістограма конверсії по галузях")
    fig, ax = plt.subplots(figsize=(10, 5))
    sns.barplot(data=df_filtered, x="Industry", y="ConversionRate", estimator="mean", ax=ax)
    ax.set_title("Середній Conversion Rate по галузях")
    st.pyplot(fig)

elif chart_option == "Теплова карта кореляцій":
    st.subheader("📊 Теплова карта кореляцій")
    numeric_cols = df_filtered.select_dtypes(include=[np.number])
    corr = numeric_cols.corr()
    fig, ax = plt.subplots(figsize=(10, 6))
    sns.heatmap(corr, annot=True, cmap='coolwarm', fmt=".2f", ax=ax)
    ax.set_title("Кореляційна матриця числових показників")
    st.pyplot(fig)

elif chart_option == "Кластеризація компаній (KMeans)":
    st.subheader("📊 Кластеризація компаній на основі ROI та Investment")
    cluster_data = df_filtered[["ROI", "Investment"]].dropna()
    if cluster_data.shape[0] >= 3:
        kmeans = KMeans(n_clusters=3, random_state=0)
        cluster_data["Cluster"] = kmeans.fit_predict(cluster_data)

        chart = alt.Chart(cluster_data).mark_circle(size=60).encode(
            x='Investment',
            y='ROI',
            color='Cluster:N',
            tooltip=['ROI', 'Investment', 'Cluster']
        ).interactive().properties(title="Кластеризація за ROI та Investment")
        st.altair_chart(chart, use_container_width=True)
    else:
        st.warning("Недостатньо даних для кластеризації (потрібно ≥ 3 рядки).")

## __Реалізація моделі лінійної регресії__

- Перевіряється, чи активовано чекбокс `show_regression`.
- Створюється новий DataFrame `df_reg`, що містить лише вибрані змінні X та Y, з видаленими пропущеними значеннями.
- Якщо в `df_reg` є принаймні 2 рядки, будується лінійна регресійна модель за допомогою `LinearRegression` з бібліотеки `scikit-learn`.
- Виводяться коефіцієнт нахилу $\beta$, зсув `intercept` та коефіцієнт детермінації $R^2$.
- Будується графік розсіювання з лінією регресії.




In [None]:
# Побудова регресійної моделі
if show_regression:
    st.subheader(f"📈 Лінійна регресія: {reg_y} ~ {reg_x}")

    df_reg = df_filtered[[reg_x, reg_y]].dropna()

    if df_reg.shape[0] >= 2:
        model = LinearRegression()
        model.fit(df_reg[[reg_x]], df_reg[reg_y])
        y_pred = model.predict(df_reg[[reg_x]])

        coef = model.coef_[0]
        intercept = model.intercept_
        r2 = model.score(df_reg[[reg_x]], df_reg[reg_y])

        st.markdown(f"**Коефіцієнт нахилу (β):** {coef:.4f}")
        st.markdown(f"**Зсув (intercept):** {intercept:.4f}")
        st.markdown(f"**R²:** {r2:.4f}")

        fig, ax = plt.subplots(figsize=(8, 5))
        sns.scatterplot(data=df_reg, x=reg_x, y=reg_y, ax=ax)
        sns.lineplot(x=df_reg[reg_x], y=y_pred, color='red', ax=ax)
        ax.set_title(f"Регресія {reg_y} ~ {reg_x}")
        st.pyplot(fig)
    else:
        st.warning("Недостатньо даних для побудови регресії.")

##<center>__Самостійні завдання__</center>

> Скопіювати блок самостійних завдань в окремий файл ***LastName_DA8.py***

> Інсталюйте необхідні пакети бібліотек Python збережіть у файл `requirements.txt`

> завантажте файл зі статистичного банку даних, з яким будете працювати `data.csv`

### Завдання

1. Створіть dashboard, як додаток у **Streamlit Community Cloud**
2. Додаток має містити: панель фільтрації з елементами
- Заголовок      
- Текстовий опис / інструкції                       
- Один вибір зі списку                              
- Кілька виборів                                   
- Вибір одного варіанту з декількох (радіо-кнопки)  
- Прапорець        
3. В головній частині: таблиця, як результат фільтрів з можливістю вибору колонок
4. Графічне представлення (мінімум 3 типи графіки)
5. Реалізація регресійної моделі або інших (кластеризації/класифікації)                        
6. Створені файли мають бути розміщені в репрозиторії GitHub, та імплементуватися в Streamlit Community Cloud