# Обробка данних, зміна типу данних, перейменування данних під модель

In [2]:
import numpy as np 
import pandas as pd  

df = pd.read_csv('../data/sales_data.csv')

In [3]:
df.head()

Unnamed: 0,item_id,item_name,category,date,sales_qty,month,is_holiday
0,1,Piątnica Mleko 3.2%,Молочні продукти,2023-01-01,11,1,True
1,1,Piątnica Mleko 3.2%,Молочні продукти,2023-01-02,25,1,False
2,1,Piątnica Mleko 3.2%,Молочні продукти,2023-01-03,37,1,False
3,1,Piątnica Mleko 3.2%,Молочні продукти,2023-01-04,60,1,False
4,1,Piątnica Mleko 3.2%,Молочні продукти,2023-01-05,82,1,False


In [4]:
df.describe()

Unnamed: 0,item_id,sales_qty,month
count,475150.0,475150.0,475150.0
mean,325.5,21.603424,6.519836
std,187.638813,12.040455,3.449555
min,1.0,0.0,1.0
25%,163.0,13.0,4.0
50%,325.5,19.0,7.0
75%,488.0,28.0,10.0
max,650.0,141.0,12.0


In [5]:
df.drop(columns=['item_id', 'category', 'month', 'is_holiday'], inplace=True)

In [6]:
df.describe()

Unnamed: 0,sales_qty
count,475150.0
mean,21.603424
std,12.040455
min,0.0
25%,13.0
50%,19.0
75%,28.0
max,141.0


In [7]:
df.head()

Unnamed: 0,item_name,date,sales_qty
0,Piątnica Mleko 3.2%,2023-01-01,11
1,Piątnica Mleko 3.2%,2023-01-02,25
2,Piątnica Mleko 3.2%,2023-01-03,37
3,Piątnica Mleko 3.2%,2023-01-04,60
4,Piątnica Mleko 3.2%,2023-01-05,82


In [8]:
df.dtypes

item_name    object
date         object
sales_qty     int64
dtype: object

In [9]:
df['date'] = pd.to_datetime(df['date'])
df['item_name'] = df['item_name'].astype('category')


In [10]:
df.head()

Unnamed: 0,item_name,date,sales_qty
0,Piątnica Mleko 3.2%,2023-01-01,11
1,Piątnica Mleko 3.2%,2023-01-02,25
2,Piątnica Mleko 3.2%,2023-01-03,37
3,Piątnica Mleko 3.2%,2023-01-04,60
4,Piątnica Mleko 3.2%,2023-01-05,82


In [11]:
df = df.rename(columns={'date': 'ds', 'sales_qty': 'y'})

In [12]:
df.head()

Unnamed: 0,item_name,ds,y
0,Piątnica Mleko 3.2%,2023-01-01,11
1,Piątnica Mleko 3.2%,2023-01-02,25
2,Piątnica Mleko 3.2%,2023-01-03,37
3,Piątnica Mleko 3.2%,2023-01-04,60
4,Piątnica Mleko 3.2%,2023-01-05,82


In [13]:
from prophet import Prophet

# 🔁 Цикл по унікальних товарах
forecast_list = []

forecast_horizon = 30  # кількість днів для прогнозу

for item in df['item_name'].unique():
    item_df = df[df['item_name'] == item][['ds', 'y']].copy()


    try:
        model = Prophet()
        model.fit(item_df)

        future = model.make_future_dataframe(periods=forecast_horizon)
        forecast = model.predict(future)

        forecast_result = forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].copy()
        forecast_result['item_name'] = item  # додати назву товару

        forecast_list.append(forecast_result)

    except Exception as e:
        print(f"⚠️ Помилка при обробці '{item}': {e}")

# 📊 Об’єднання всіх результатів в один DataFrame
final_forecast_df = pd.concat(forecast_list, ignore_index=True)

# ✅ Готовий результат
print(final_forecast_df.head())

18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:07 - cmdstanpy - INFO - Chain [1] start processing
18:01:07 - cmdstanpy - INFO - Chain [1] done processing
18:01:08 - cmdstanpy - INFO - Chain [1] start processing
18:01:08 - cmdstanpy - INFO - Chain [1]

          ds       yhat  yhat_lower  yhat_upper            item_name
0 2023-01-01  32.540017   17.620161   45.534568  Piątnica Mleko 3.2%
1 2023-01-02  35.012600   19.964360   48.679833  Piątnica Mleko 3.2%
2 2023-01-03  39.967029   25.680816   54.831192  Piątnica Mleko 3.2%
3 2023-01-04  37.870754   23.414773   51.570426  Piątnica Mleko 3.2%
4 2023-01-05  35.593315   20.866708   50.049312  Piątnica Mleko 3.2%


In [14]:
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, clear_output

# final_forecast_df — твій датафрейм з прогнозом
final_forecast_df['ds'] = pd.to_datetime(final_forecast_df['ds'])

# Припустимо, що у тебе є дата останнього реального продажу
last_real_date = final_forecast_df['ds'].max() - pd.Timedelta(days=30)  # припустимо останні 30 днів - історія, решта - прогноз

# Створюємо селектор товарів
item_dropdown = widgets.Dropdown(
    options=final_forecast_df['item_name'].unique(),
    description='Оберіть товар:',
    disabled=False,
)

output = widgets.Output()

def on_change(change):
    if change['type'] == 'change' and change['name'] == 'value':
        with output:
            clear_output()
            selected_item = change['new']
            # Фільтруємо прогноз для вибраного товару і майбутніх 30 днів (після last_real_date)
            df_item = final_forecast_df[
                (final_forecast_df['item_name'] == selected_item) & 
                (final_forecast_df['ds'] > last_real_date)
            ][['ds', 'yhat']]
            df_item['yhat'] = df_item['yhat'].round().astype(int)
            df_item['ds'] = df_item['ds'].dt.strftime('%Y-%m-%d')
            
            if df_item.empty:
                print("Прогноз на майбутні 30 днів відсутній")
            else:
                for _, row in df_item.iterrows():
                    print(f"{row['ds']} — {row['yhat']} шт")

# Підписуємося на зміну вибору
item_dropdown.observe(on_change)

display(item_dropdown, output)

# Показуємо прогноз по першому товару при запуску
item_dropdown.value = item_dropdown.options[0]


Dropdown(description='Оберіть товар:', options=('Piątnica Mleko 3.2%', 'Mlekovita Ser żółty plasterki', 'Presi…

Output()