Case: Previsão de Demanda |  Codigo Simples

In [None]:
import pandas as pd
from xgboost import XGBRegressor
from sklearn.model_selection import train_test_split, KFold, cross_val_score
from sklearn.metrics import mean_absolute_error, mean_absolute_percentage_error

# 1. Carregando os dados do SQL
import sqlalchemy
engine = sqlalchemy.create_engine('mysql+pymysql://usuario:senha@host:porta/banco')
df = pd.read_sql('SELECT * FROM vendas_componentes', engine)

# 2. Pré-processamento
df['data'] = pd.to_datetime(df['data'])
df['semana'] = df['data'].dt.isocalendar().week
df['ano'] = df['data'].dt.year

# 3. Features e target
X = df[['semana', 'ano', 'categoria', 'estoque_atual', 'dias_ultima_compra']]
y = df['quantidade_vendida']

# 4. Modelo
model = XGBRegressor()
kf = KFold(n_splits=5, shuffle=True, random_state=42)
mae = cross_val_score(model, X, y, cv=kf, scoring='neg_mean_absolute_error')
mape = cross_val_score(model, X, y, cv=kf, scoring='neg_mean_absolute_percentage_error')

print(f'MAE médio: {-mae.mean():.2f}')
print(f'MAPE médio: {-mape.mean()*100:.2f}%')

✅ Resultados
- MAE médio: {VALOR} → erro médio por previsão
- MAPE médio: {VALOR }→ erro percentual médio, fácil de explicar para o time de compras
- Impacto: Redução de {VALOR}


O modelo que usei — o XGBoost — é muito versátil e funciona bem com dados de vendas, desde que você tenha:
- Dados históricos confiáveis (vendas por período, estoque, promoções, etc.)
- Variáveis relevantes (como dia da semana, sazonalidade, categoria do produto)
- Volume suficiente de dados para treinar o modelo com consistência
Se você estiver lidando com produtos diferentes, segmentos variados ou canais distintos (e-commerce vs loja física, por exemplo), pode ser necessário ajustar as features ou até testar outros modelos. Mas a estrutura geral — com Python, SQL, validação com K-Fold e métricas como MAE/MAPE — funciona muito bem como ponto de partida para qualquer cenário de previsão de demanda.
