In [144]:

# Anticipatory Shipping - Previsão Quinzenal por Produto e Região


import pandas as pd
import numpy as np
from prophet import Prophet
from tqdm.auto import tqdm
import logging
import io
from contextlib import redirect_stdout, redirect_stderr

logging.getLogger('cmdstanpy').setLevel(logging.WARNING)
logging.getLogger('prophet').setLevel(logging.WARNING)


# dados


INPUT_CSV = r"X:\git\previsao_itens_vendas\ecommerce_sintetico_espana.csv"
OUTPUT_CSV = r"X:\git\previsao_itens_vendas\recomendacoes_pre_envio.csv"

HORIZONTE_QUINZENAS = 2
LIMIAR_ENVIO = 20
MIN_POR_ENVIO = 8

CUSTO_ENVIO = 5.0
CUSTO_ARMAZEN = 0.5
MARGEM_UNIT = 12.0
USAR_ROI = False

df = pd.read_csv(INPUT_CSV, parse_dates=['fecha_pedido'])
df['ano_quinzena'] = df['fecha_pedido'].dt.to_period('15D')

df_agg = (
    df.groupby(['comunidad_autonoma', 'id_producto', 'ano_quinzena'])
      .agg({'cantidad': 'sum', 'precio': 'mean'})
      .reset_index()
)

data_min = df['fecha_pedido'].min()
data_max = df['fecha_pedido'].max()
total_quinzenas = (data_max.to_period('15D') - data_min.to_period('15D')).n + 1

# Seleção de séries com histórico suficiente

contagem = (
    df_agg.groupby(['id_producto', 'comunidad_autonoma'])['ano_quinzena']
          .nunique()
          .reset_index(name='n_periodos')
)

MIN_QUINZ_HIST = max(6, int(total_quinzenas * 0.70))
series_ok = contagem[contagem['n_periodos'] >= MIN_QUINZ_HIST]

if len(series_ok) == 0:
    MIN_QUINZ_HIST = max(6, int(total_quinzenas * 0.40))
    series_ok = contagem[contagem['n_periodos'] >= MIN_QUINZ_HIST]

if len(series_ok) == 0 and len(contagem):
    p25 = int(np.percentile(contagem['n_periodos'], 25))
    MIN_QUINZ_HIST = max(4, p25)
    series_ok = contagem[contagem['n_periodos'] >= MIN_QUINZ_HIST]

if len(series_ok) == 0:
    raise RuntimeError("Nenhuma série atende o mínimo de histórico para modelagem.")


# Função utilitária


def densificar_quinzenal(serie_qz: pd.DataFrame) -> pd.DataFrame:
    idx_period = pd.period_range(
        serie_qz['ano_quinzena'].min(), serie_qz['ano_quinzena'].max(), freq='15D'
    )
    idx_ts = idx_period.to_timestamp(how='start')
    out = (
        serie_qz.assign(ds=serie_qz['ano_quinzena'].dt.to_timestamp(how='start'))
                .set_index('ds')
                .reindex(idx_ts)
                .rename_axis('ds')
                .fillna({'cantidad': 0})
                .reset_index()
    )
    out = out.rename(columns={'cantidad': 'y'})
    out['y'] = pd.to_numeric(out['y']).fillna(0)
    return out


#Prophet

previsoes = []
ok, puladas_hist, puladas_sparsas, falhas_fit = 0, 0, 0, 0

bar = tqdm(total=len(series_ok), leave=False, dynamic_ncols=True)

for _, r in series_ok.iterrows():
    prod = r['id_producto']
    reg = r['comunidad_autonoma']

    serie = df_agg[
        (df_agg['id_producto'] == prod)
        & (df_agg['comunidad_autonoma'] == reg)
    ][['ano_quinzena', 'cantidad']]

    if serie['ano_quinzena'].nunique() < MIN_QUINZ_HIST:
        puladas_hist += 1
        bar.update(1)
        continue

    serie_densa = densificar_quinzenal(serie)

    if (serie_densa['y'] > 0).sum() < 3:
        puladas_sparsas += 1
        bar.update(1)
        continue

    try:
        m = Prophet(interval_width=0.90)
        with redirect_stdout(io.StringIO()), redirect_stderr(io.StringIO()):
            m.fit(serie_densa[['ds', 'y']])

        futuro = m.make_future_dataframe(periods=HORIZONTE_QUINZENAS, freq='15D')
        fcst = m.predict(futuro)
        fcst['id_producto'] = prod
        fcst['comunidad_autonoma'] = reg

        previsoes.append(
            fcst[['ds', 'yhat', 'yhat_lower', 'yhat_upper', 'id_producto', 'comunidad_autonoma']]
        )
        ok += 1
    except Exception:
        falhas_fit += 1
    finally:
        bar.update(1)

bar.close()

if len(previsoes) == 0:
    raise RuntimeError("Nenhuma previsão gerada. Ajuste parâmetros de histórico ou horizonte.")

df_previsao = pd.concat(previsoes, ignore_index=True)


# Filtro para horizonte futuro


df_previsao['quinzena_ref'] = df_previsao['ds'].dt.to_period('15D')
ultimo_periodo_hist = df_agg['ano_quinzena'].max()
df_previsao_futuro = df_previsao[df_previsao['quinzena_ref'] > ultimo_periodo_hist].copy()

if df_previsao_futuro.empty:
    raise RuntimeError("Não há horizonte futuro após a última quinzena histórica.")


# Decisão de pré-envio (modo médio)


base_fcst = df_previsao_futuro['yhat']
df_previsao_futuro['qtd_sugerida'] = np.ceil(np.maximum(base_fcst, 0)).astype(int)
mask_pos = df_previsao_futuro['qtd_sugerida'] > 0
df_previsao_futuro.loc[mask_pos, 'qtd_sugerida'] = np.maximum(
    df_previsao_futuro.loc[mask_pos, 'qtd_sugerida'], MIN_POR_ENVIO
)

df_previsao_futuro['conf_ok'] = (
    (df_previsao_futuro['yhat'] >= 1.0) &
    (df_previsao_futuro['yhat_lower'] >= 0.0)
)

PERCENTIL_ALVO = 0.70
grp = df_previsao_futuro.groupby(['id_producto', 'comunidad_autonoma'])['qtd_sugerida']
limiar_pct_grupo = grp.transform(lambda s: int(np.ceil(s.quantile(PERCENTIL_ALVO))) if len(s) > 0 else MIN_POR_ENVIO)
limiar_usado = np.maximum(limiar_pct_grupo, MIN_POR_ENVIO)
criterio_envio = df_previsao_futuro['qtd_sugerida'] >= limiar_usado

if USAR_ROI:
    df_previsao_futuro['lucro_estimado'] = df_previsao_futuro['yhat'] * MARGEM_UNIT
    df_previsao_futuro['custo_estimado'] = (
        CUSTO_ENVIO + CUSTO_ARMAZEN * df_previsao_futuro['qtd_sugerida']
    )
    df_previsao_futuro['roi_ok'] = (
        df_previsao_futuro['lucro_estimado'] > df_previsao_futuro['custo_estimado']
    )
    criterio_final = (
        criterio_envio & df_previsao_futuro['conf_ok'] & df_previsao_futuro['roi_ok']
    )
else:
    criterio_final = criterio_envio & df_previsao_futuro['conf_ok']

df_previsao_futuro['decisao_pre_envio'] = np.where(
    criterio_final, 'ENVIAR_ANTES', 'AGUARDAR'
)


# Exportação


df_previsao_futuro.to_csv(OUTPUT_CSV, index=False, encoding='utf-8-sig')
print(f"Recomendações salvas em: {OUTPUT_CSV}")
print(df_previsao_futuro['decisao_pre_envio'].value_counts())


  0%|                                                                                          | 0/136 [00:00<…

Recomendações salvas em: X:\git\previsao_itens_vendas\recomendacoes_pre_envio.csv
decisao_pre_envio
ENVIAR_ANTES    103
AGUARDAR         70
Name: count, dtype: int64
