#  PROPHET

In [8]:
%%time
import pandas as pd
from prophet import Prophet

# Загрузка исторических данных о продажах из Excel/CSV-файла
data = pd.read_csv('C:/Users/bondarenKovv/Desktop/Python/Sales.csv', sep=';', low_memory=False)

# Преобразование формата даты
data['Дата'] = pd.to_datetime(data['Дата'], dayfirst=True)
data = data[(data['Дата'] >= '2021-01-01')]

# Подготовка данных для применения модели Prophet
data = data.rename(columns={'Дата': 'ds', 'Номер Магазина': 'store', '(Сутки).(Сумма продаж в фактических ценах реализации(валюта))': 'y'})
data['y'] = data['y'].str.replace(',', '.').astype(float)
#data.loc[data['ds'] >= '2023-01-01', 'weights'] = 2.0  # Настройка веса

# Создание пустого DataFrame для хранения прогнозов
all_forecasts = pd.DataFrame()

# Словарь с параметрами модели для каждого магазина, включая значение по умолчанию
model_params = {'default': {'changepoint_prior_scale': 6, 'seasonality_prior_scale': 15},
                128: {'changepoint_prior_scale': 0.032, 'seasonality_prior_scale': 75},
                110: {'changepoint_prior_scale': 0.01, 'seasonality_prior_scale': 100},
                141: {'changepoint_prior_scale': 0.027, 'seasonality_prior_scale': 50},
                142: {'changepoint_prior_scale': 0.02, 'seasonality_prior_scale': 100},
                121: {'changepoint_prior_scale': 0.032, 'seasonality_prior_scale': 10}}  # Указываем параметр seasonality_prior_scale для магазина 141, 121, 142

# Список магазинов, которые нужно исключить из расчета
excluded_stores = [149, 155, 164, 111]  # Исключение магазинов из расчета

# Список предпраздничных дат
pre_holiday_dates = ['2024-02-22','2024-03-07','2024-05-08','2024-06-11','2024-04-30','2024-03-17','2024-05-04','2024-06-22','2024-04-09','2024-06-15']  # Добавьте нужные даты

#target_stores = 121 #Для прогнозирования только по выделенному магазину( для теста)

# Группировка данных по магазинам и применение модели Prophet для каждого магазина
for store in data['store'].unique():
    
    # Пропускаем магазины, которые нужно исключить
    if store in excluded_stores: #or (store != target_stores): #Для прогнозирования только по выделенному магазину( для тэста) 
        continue

    store_data = data[data['store'] == store]

    if store in model_params:
        params = model_params[store]
    else:
        params = model_params['default']

    # Создание и обучение модели Prophet для каждого магазина с уточненными параметрами
    model = Prophet(**params)  # Используем параметры из словаря

    # Обучение модели
    model.fit(store_data[['ds', 'y'] + ['store']])

    # Создание DataFrame для прогноза на N дней вперед
    future = model.make_future_dataframe(periods=37)
    forecast = model.predict(future)
    forecast['store'] = store  # Добавляем информацию о магазине

    # Увеличиваем прогноз для каждой предпраздничной даты
    for pre_holiday_date in pre_holiday_dates:
        mask = forecast['ds'] == pd.to_datetime(pre_holiday_date)
        forecast.loc[mask, 'yhat'] *= 1.2  # Увеличение на 20%

            
    # Добавление прогноза для текущего магазина к общему DataFrame
    all_forecasts = pd.concat([all_forecasts, forecast])

# Сохранение результатов в новом Excel-файле
selected_columns = ['ds', 'store', 'yhat', 'yhat_upper']
all_forecasts[selected_columns].to_excel('forecast_next_month.xlsx', index=False)


'''1. changepoint_prior_scale: Этот параметр отвечает за гибкость модели в определении точек 
изменения тренда. Чем меньше значение, тем более гибкой будет модель, воспринимая меньшие изменения 
как точки изменения тренда. Установка этого параметра на низкий уровень позволяет модели более гибко 
реагировать на изменения в данных и следовать им более близко.
2. seasonality_prior_scale: Этот параметр контролирует насколько модель склонна к изучению и предсказыванию 
сезонных изменений. Если установить этот параметр на более высокое значение, то модель будет более склонна 
видеть и учитывать сезонные особенности в данных.'''


15:46:47 - cmdstanpy - INFO - Chain [1] start processing
15:46:48 - cmdstanpy - INFO - Chain [1] done processing
15:46:48 - cmdstanpy - INFO - Chain [1] start processing
15:46:48 - cmdstanpy - INFO - Chain [1] done processing
15:46:49 - cmdstanpy - INFO - Chain [1] start processing
15:46:49 - cmdstanpy - INFO - Chain [1] done processing
15:46:49 - cmdstanpy - INFO - Chain [1] start processing
15:46:50 - cmdstanpy - INFO - Chain [1] done processing
15:46:50 - cmdstanpy - INFO - Chain [1] start processing
15:46:50 - cmdstanpy - INFO - Chain [1] done processing
15:46:51 - cmdstanpy - INFO - Chain [1] start processing
15:46:51 - cmdstanpy - INFO - Chain [1] done processing
15:46:51 - cmdstanpy - INFO - Chain [1] start processing
15:46:52 - cmdstanpy - INFO - Chain [1] done processing
15:46:52 - cmdstanpy - INFO - Chain [1] start processing
15:46:52 - cmdstanpy - INFO - Chain [1] done processing
15:46:53 - cmdstanpy - INFO - Chain [1] start processing
15:46:53 - cmdstanpy - INFO - Chain [1]

15:47:36 - cmdstanpy - INFO - Chain [1] done processing
15:47:36 - cmdstanpy - INFO - Chain [1] start processing
15:47:37 - cmdstanpy - INFO - Chain [1] done processing
15:47:37 - cmdstanpy - INFO - Chain [1] start processing
15:47:37 - cmdstanpy - INFO - Chain [1] done processing
15:47:38 - cmdstanpy - INFO - Chain [1] start processing
15:47:38 - cmdstanpy - INFO - Chain [1] done processing
15:47:38 - cmdstanpy - INFO - Chain [1] start processing
15:47:39 - cmdstanpy - INFO - Chain [1] done processing
15:47:39 - cmdstanpy - INFO - Chain [1] start processing
15:47:39 - cmdstanpy - INFO - Chain [1] done processing
15:47:40 - cmdstanpy - INFO - Chain [1] start processing
15:47:40 - cmdstanpy - INFO - Chain [1] done processing
15:47:40 - cmdstanpy - INFO - Chain [1] start processing
15:47:41 - cmdstanpy - INFO - Chain [1] done processing
15:47:41 - cmdstanpy - INFO - Chain [1] start processing
15:47:41 - cmdstanpy - INFO - Chain [1] done processing
15:47:42 - cmdstanpy - INFO - Chain [1] 

15:48:13 - cmdstanpy - INFO - Chain [1] done processing
15:48:13 - cmdstanpy - INFO - Chain [1] start processing
15:48:13 - cmdstanpy - INFO - Chain [1] done processing
15:48:13 - cmdstanpy - INFO - Chain [1] start processing
15:48:13 - cmdstanpy - INFO - Chain [1] done processing
15:48:14 - cmdstanpy - INFO - Chain [1] start processing
15:48:14 - cmdstanpy - INFO - Chain [1] done processing
15:48:14 - cmdstanpy - INFO - Chain [1] start processing
15:48:14 - cmdstanpy - INFO - Chain [1] done processing
15:48:14 - cmdstanpy - INFO - Chain [1] start processing
15:48:15 - cmdstanpy - INFO - Chain [1] done processing
15:48:15 - cmdstanpy - INFO - Chain [1] start processing
15:48:15 - cmdstanpy - INFO - Chain [1] done processing
15:48:15 - cmdstanpy - INFO - Chain [1] start processing
15:48:15 - cmdstanpy - INFO - Chain [1] done processing
15:48:15 - cmdstanpy - INFO - Chain [1] start processing
15:48:16 - cmdstanpy - INFO - Chain [1] done processing
15:48:16 - cmdstanpy - INFO - Chain [1] 

CPU times: total: 3min 2s
Wall time: 1min 45s


'1. changepoint_prior_scale: Этот параметр отвечает за гибкость модели в определении точек \nизменения тренда. Чем меньше значение, тем более гибкой будет модель, воспринимая меньшие изменения \nкак точки изменения тренда. Установка этого параметра на низкий уровень позволяет модели более гибко \nреагировать на изменения в данных и следовать им более близко.\n2. seasonality_prior_scale: Этот параметр контролирует насколько модель склонна к изучению и предсказыванию \nсезонных изменений. Если установить этот параметр на более высокое значение, то модель будет более склонна \nвидеть и учитывать сезонные особенности в данных.'