In [18]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from datetime import datetime, timedelta

# Gerar dados fictícios
np.random.seed(42)

# Criar datas mensais para os últimos 12 meses
datas = pd.date_range(end=datetime.now(), periods=12, freq='M').to_list() * 5

# Criar códigos de cliente, produtos e quantidades aleatórias
codigos_cliente = np.random.randint(1, 6, size=len(datas))
codigos_produto = np.random.randint(1, 4, size=len(datas))
quantidades = np.random.randint(10, 100, size=len(datas))

# Criar DataFrame
dados = pd.DataFrame({
    'Cliente': codigos_cliente,
    'Produto': codigos_produto,
    'Data de Faturamento': datas,
    'Quantidade': quantidades
})

# Exibir os primeiros registros do DataFrame
print("Dados Originais:")
print(dados.head())
print("\n")

# Agregar dados para obter o faturamento total por cliente por mês
dados_agregados = dados.groupby(['Cliente', pd.Grouper(key='Data de Faturamento', freq='M')])['Quantidade'].sum().reset_index()

# Criar features (características) para o modelo
dados_agregados['Mes'] = dados_agregados['Data de Faturamento'].dt.month
dados_agregados['Ano'] = dados_agregados['Data de Faturamento'].dt.year

# Dividir os dados em treino e teste
train_data, test_data = train_test_split(dados_agregados, test_size=0.2, random_state=42)

# Criar modelo de regressão linear
modelo = LinearRegression()

# Treinar o modelo
modelo.fit(train_data[['Mes', 'Ano']], train_data['Quantidade'])

# Fazer previsões para os próximos 3 meses
ultimo_mes = dados_agregados['Data de Faturamento'].max()
proximos_tres_meses = [ultimo_mes + timedelta(days=30*i) for i in range(1, 4)]
previsoes = pd.DataFrame({'Mes': [mes.month for mes in proximos_tres_meses], 'Ano': [mes.year for mes in proximos_tres_meses]})
previsoes['Previsao'] = modelo.predict(previsoes[['Mes', 'Ano']])

# Visualizar as previsões
print("Previsões de Faturamento para os Próximos 3 Meses:")
print(previsoes)


Dados Originais:
   Cliente  Produto        Data de Faturamento  Quantidade
0        4        2 2022-11-30 19:41:08.840763          44
1        5        2 2022-12-31 19:41:08.840763          74
2        3        2 2023-01-31 19:41:08.840763          56
3        5        2 2023-02-28 19:41:08.840763          87
4        5        2 2023-03-31 19:41:08.840763          12


Previsões de Faturamento para os Próximos 3 Meses:
   Mes   Ano    Previsao
0   11  2023   63.448507
1   12  2023   59.694446
2    1  2024  115.186268
