In [94]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from statsmodels.tsa.statespace.sarimax import SARIMAX
from statsmodels.tsa.statespace.sarimax import SARIMAXResults
from sklearn.metrics import mean_absolute_error

In [95]:
plt.rcParams["figure.figsize"] = (12, 8)
plt.rcParams.update({'font.size': 11})

In [96]:
df_transaction = pd.read_parquet("../data/transaction_df.parquet")
df_competitors = pd.read_parquet("../data/df_competitors.parquet")
df_cost = pd.read_parquet("../data/df_cost.parquet")

In [97]:
df_cost=df_cost.rename(columns={'date':'datetime'})
df_cost

Unnamed: 0,place,product,cost,datetime
0,Анор Лондо,Целебные травы,2.07,2216-01-02
1,Анор Лондо,Целебные травы,3.07,2216-01-26
2,Анор Лондо,Целебные травы,3.30,2216-02-12
3,Анор Лондо,Целебные травы,4.04,2216-03-06
4,Анор Лондо,Целебные травы,3.88,2216-03-27
...,...,...,...,...
1112,Фалькония,Эстус,3.10,2218-07-29
1113,Фалькония,Эстус,7.20,2218-08-10
1114,Фалькония,Эстус,3.31,2218-08-27
1115,Фалькония,Эстус,3.26,2218-09-16


In [98]:
df_transaction['datetime'] = pd.to_datetime(df_transaction['datetime']).dt.date

In [99]:
df_transaction = df_transaction.set_index('datetime')

In [100]:
df_transaction = df_transaction.dropna()

In [101]:
df_transaction = df_transaction[(df_transaction['amount'] > 0) & (df_transaction['price'] > 0)]

In [102]:
df_transaction.groupby(['datetime', 'price', 'product','place']).agg({'amount': ['sum']}).reset_index().to_csv('../data/transaction_group.csv', index=False)  

In [103]:
df_group = pd.read_csv("../data/transaction_group.csv", parse_dates=['datetime'],index_col='datetime')

In [104]:
df_group=df_group.dropna()

In [105]:
df_competitors=df_competitors.rename(columns={'price':'compet_price','date':'datetime'})

In [106]:
df_group.merge(df_competitors, on=['datetime','product','place']).to_csv('../data/transaction_with_competitors.csv', index=False)

In [107]:
df_transaction_competitors = pd.read_csv("../data/transaction_with_competitors.csv", parse_dates=['datetime'],index_col='datetime')

In [108]:
df_transaction_competitors['amount'] = df_transaction_competitors['amount'].astype(float)
df_transaction_competitors['price'] =df_transaction_competitors['price'].astype(float)
df_transaction_competitors['compet_price'] =df_transaction_competitors['compet_price'].astype(float)

In [109]:
# df_transaction_competitors=df_transaction_competitors.reset_index()

In [110]:
df_transaction_competitors.merge(df_cost, on=['datetime','product','place']).to_csv('../data/df_with_cost.csv', index=False)

In [111]:
df_with_cost=pd.read_csv("../data/df_with_cost.csv", parse_dates=['datetime'],index_col='datetime')
df_with_cost

Unnamed: 0_level_0,price,product,place,amount,competitor,compet_price,cost
datetime,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2216-01-02,2.73,Целебные травы,Нокрон,44.869785,Арториас&Co,3.04,1.47
2216-01-02,2.73,Целебные травы,Нокрон,44.869785,Длань господня,3.03,1.47
2216-01-02,2.73,Целебные травы,Нокрон,44.869785,ЛилIT,3.07,1.47
2216-01-02,2.87,Эстус,Нокрон,40.394523,Арториас&Co,2.86,2.08
2216-01-02,2.87,Эстус,Нокрон,40.394523,ЛилIT,3.09,2.08
...,...,...,...,...,...,...,...
2218-09-27,20.33,Эстус,Врата Балдура,25.646198,Светлые Души,17.99,7.86
2218-09-27,24.42,Эстус,Кеджистан,45.163825,Арториас&Co,20.13,10.15
2218-09-27,27.47,Эльфийская пыльца,Врата Балдура,26.922775,Длань господня,25.93,21.68
2218-09-27,27.47,Эльфийская пыльца,Врата Балдура,26.922775,ЛилIT,27.49,21.68


In [117]:
# def sarimax_forecast(data,product, place):
#     # Создание модели SARIMAX
#     endog =df_transaction_competitors[(df_transaction_competitors['product'] == product) & (df_transaction_competitors['place'] == place)]['amount']
#     exog = df_transaction_competitors[(df_transaction_competitors['product'] == product) & (df_transaction_competitors['place'] == place)]['price']
#     model = SARIMAX(endog=endog,
#                         order=(1, 0, 0),
#                         seasonal_order=(1, 0, 0, 12),exog=exog)
#     results = model.fit()

#         # Получение прогнозов
#     forecast = results.get_forecast(steps=90, exog=[10]*10)
    
    
# #     last_price = exog.iloc[-1]['price']
# #     competitor_price = exog.iloc[-1]['compet_price']
# #     forecast[forecast > 0.8 * competitor_price] = 0.8 * competitor_price

# #     # Создание датафрейма с прогнозом
# #     forecast_df = pd.DataFrame({'Дата': pd.DataFrame(range(1, 91)), 
# #                                 'product': [product] * 90, 
# #                                 'place': [place] * 90, 
# #                                 'price': forecast})

#     return forecast

# def sarimax_model(df_with_cost, product, city):
#     df = df_with_cost[(df_with_cost['product'] == product) & (df_with_cost['place'] == place)]
#     df = df[['datetime', 'amount']]
#     df['datetime'] = pd.to_datetime(df['datetime'])
#     df.set_index('datetime', inplace=True)
    
#     model = SARIMAX(df['amount'], order=(1, 1, 1), seasonal_order=(1, 1, 0, 12))
#     model_fit = model.fit(disp=False)
    
#     forecast = model_fit.forecast(steps=90)
    
#     return forecast

In [120]:
products = df_with_cost['product'].unique()
places = df_with_cost['place'].unique()

In [122]:
forecast_df = pd.DataFrame(columns=['day', 'product', 'city', 'predicted_price'])

for product in products:
    for city in cities:
        # Фильтруем данные для текущего продукта и города
        subset = df_with_cost[(df_with_cost['product'] == product) & (df_with_cost['place'] == place)]
        
        # Создаем SARIMAX-модель
        model = SARIMAX(subset['amount'], order=(1, 0, 1), seasonal_order=(1, 1, 1, 12))
        model_fit = model.fit(disp=False)
        
        # Прогнозируем объем продаж на 90 дней вперед
        forecast = model_fit.forecast(steps=90)
        
        # Создаем временный датафрейм с прогнозом
        temp_df = pd.DataFrame({
            'day': range(1, 91),
            'product': [product] * 90,
            'city': [place] * 90,
            'predicted_price': forecast
        })
        
        # Добавляем временный датафрейм к общему датафрейму прогноза
        forecast_df = forecast_df.append(temp_df)

# Обработка датафрейма прогноза (добавление шумов и расчет по формуле)
# ...

# Вывод датафрейма прогноза
print(forecast_df)

  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, f

  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)


    day            product    city  predicted_price
129   1     Целебные травы  Нокрон        49.930305
130   2     Целебные травы  Нокрон        51.705210
131   3     Целебные травы  Нокрон        50.880033
132   4     Целебные травы  Нокрон        49.825647
133   5     Целебные травы  Нокрон        46.922027
..   ..                ...     ...              ...
265  86  Эльфийская пыльца  Нокрон        39.486593
266  87  Эльфийская пыльца  Нокрон        41.268903
267  88  Эльфийская пыльца  Нокрон        41.674102
268  89  Эльфийская пыльца  Нокрон        42.659612
269  90  Эльфийская пыльца  Нокрон        46.121946

[1350 rows x 4 columns]


  return get_prediction_index(
  forecast_df = forecast_df.append(temp_df)


In [123]:
forecast_df

Unnamed: 0,day,product,city,predicted_price
129,1,Целебные травы,Нокрон,49.930305
130,2,Целебные травы,Нокрон,51.705210
131,3,Целебные травы,Нокрон,50.880033
132,4,Целебные травы,Нокрон,49.825647
133,5,Целебные травы,Нокрон,46.922027
...,...,...,...,...
265,86,Эльфийская пыльца,Нокрон,39.486593
266,87,Эльфийская пыльца,Нокрон,41.268903
267,88,Эльфийская пыльца,Нокрон,41.674102
268,89,Эльфийская пыльца,Нокрон,42.659612


In [119]:
# predictions = pd.DataFrame(columns=['Day', 'Product', 'City', 'Predicted Price'])

# # Обучение модели и предсказание
# for day in range(1, 91):
#     for product in df_with_cost['product'].unique():
#         for place in df_with_cost['place'].unique():
#             # Получение данных для обучения модели SARIMAX
#             subset = df_with_cost[(df_with_cost['product'] == product) & (df_with_cost['place'] == place)]
#             # Создание SARIMAX модели
#             model = SARIMAX(df_with_cost['amount'], order=(1, 0, 0),seasonal_order=(1, 1, 0, 12))
#             model_fit = model.fit()
            
#             # Прогнозирование на 90 дней вперед
#             forecast = model_fit.forecast(steps=90)
#             # Получение прогнозируемой цены
#             predicted_price = forecast[day-1]
            
#             # Добавление предсказания в таблицу
#             predictions = predictions.append({
#                 'Day': day,
#                 'Product': product,
#                 'City': city,
#                 'Predicted Price': predicted_price
#             }, ignore_index=True)

# # Вывод таблицы с предсказаниями
# print(predictions)

  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  return get_prediction_index(


KeyError: 0

In [72]:
predictions['Forecast'] = predictions['Forecast'] + np.random.uniform(low=-0.5, high=0.5, size=len(predictions))

In [None]:
predictions['Value'] = predictions['Forecast'] * predictions['amount'] - predictions['Expenses'] * predictions['Sales_volume']

In [73]:
print(predictions)

           date            product          place   Forecast
2133 2218-09-28     Целебные травы         Нокрон  46.346886
2134 2218-09-29     Целебные травы         Нокрон  47.870832
2135 2218-09-30     Целебные травы         Нокрон  48.298570
2136 2218-10-01     Целебные травы         Нокрон  48.568378
2137 2218-10-02     Целебные травы         Нокрон  47.037334
...         ...                ...            ...        ...
2237 2218-12-22  Эльфийская пыльца  Врата Балдура  18.232570
2238 2218-12-23  Эльфийская пыльца  Врата Балдура  18.978267
2239 2218-12-24  Эльфийская пыльца  Врата Балдура  20.772570
2240 2218-12-25  Эльфийская пыльца  Врата Балдура  14.407743
2241 2218-12-26  Эльфийская пыльца  Врата Балдура  15.248605

[1350 rows x 4 columns]
