<a href="https://colab.research.google.com/github/fabioaugusto2102/Python-com-roro/blob/main/Previsao_vendas_barba_de_elite_v2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 📊 Previsão de Vendas para a Barba de Elite
Este notebook analisa os dados de estoque e vendas da Barba de Elite, gera previsões utilizando Machine Learning e calcula o Days On Hand (DOH) para um planejamento mais eficiente.


In [None]:
# 📌 Importando as bibliotecas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import plotly.graph_objects as go
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from statsmodels.tsa.arima.model import ARIMA
import plotly.io as pio


## 📥 Carregar os arquivos CSV
Suba os arquivos de **vendas** e **estoque** no Google Colab antes de executar o código abaixo.

In [None]:
# Carregar os dados
file_estoque = 'estoque_barba_de_elite.csv'
file_vendas = 'compras_barba_de_elite.csv'

df_estoque = pd.read_csv(file_estoque)
df_vendas = pd.read_csv(file_vendas)

# Converter datas
df_vendas['Data e Hora'] = pd.to_datetime(df_vendas['Data e Hora'])
df_vendas['Data'] = df_vendas['Data e Hora'].dt.date

# Visualizar os primeiros dados
df_estoque.head(), df_vendas.head()

(   ID Produto                Nome do Produto  Preço  Quantidade em Estoque
 0           1             Shampoo para barba   39.9                    118
 1           2  Pomada modeladora para cabelo   49.9                    199
 2           3                Óleo para barba   59.9                     76
 3           4                   Cera capilar   44.9                    108
 4           5                  Gel pós-barba   34.9                     14,
    ID Usuário  ID Compra         Data e Hora                        Produto  \
 0        7379     567285 2024-04-11 19:49:00  Pomada modeladora para cabelo   
 1        7379     567285 2024-04-11 19:49:00             Shampoo para barba   
 2        6534     439343 2024-09-30 11:00:00                   Cera capilar   
 3        4919     153892 2024-06-22 21:37:00              Shampoo anticaspa   
 4        4919     153892 2024-06-22 21:37:00                Óleo para barba   
 
    Valor        Data  
 0   49.9  2024-04-11  
 1   39.9  20

## 📊 Análise de Tendência de Vendas

In [None]:
# Carregar os dados de vendas
df_vendas = pd.read_csv("compras_barba_de_elite.csv")

# Converter a coluna de data para formato datetime
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])
df_vendas["Data"] = df_vendas["Data e Hora"].dt.date

# Criar a série de vendas diárias
vendas_diarias = df_vendas.groupby("Data").size()

# Criar gráfico interativo de tendência de vendas diárias
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=vendas_diarias.index,
    y=vendas_diarias.values,
    mode="lines+markers",
    name="Vendas Diárias",
    line=dict(color="blue")
))

# Ajustar layout do gráfico
fig.update_layout(
    title="Tendência de Vendas Diárias",
    xaxis_title="Data",
    yaxis_title="Quantidade de Vendas",
    xaxis=dict(tickangle=-45),
    template="plotly_white",
    hovermode="x unified"
)

# Exibir o gráfico interativo
fig.show()


## 🏷️ Previsão de Vendas com ARIMA

In [None]:
import pandas as pd
import plotly.graph_objects as go
from statsmodels.tsa.arima.model import ARIMA

# Garantir que a coluna de data esteja no formato datetime
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])
df_vendas["Data"] = df_vendas["Data e Hora"].dt.date
df_vendas["Data"] = pd.to_datetime(df_vendas["Data"])  # Converter para datetime

# Criar um dataframe agregando as vendas por data
df_vendas_diarias = df_vendas.groupby("Data").size().reset_index()
df_vendas_diarias.columns = ["Data", "Quantidade Vendida"]
df_vendas_diarias.set_index("Data", inplace=True)

# Ajustar um modelo ARIMA para previsão de vendas
modelo_arima = ARIMA(df_vendas_diarias["Quantidade Vendida"], order=(5,1,0))
modelo_arima_fit = modelo_arima.fit()

# Fazer previsões para os próximos 6 meses (180 dias)
previsao_arima = modelo_arima_fit.forecast(steps=180)

# Criar um DataFrame com as previsões
df_previsao = pd.DataFrame({
    "Data": pd.date_range(start=df_vendas_diarias.index[-1], periods=181, freq="D")[1:],
    "Previsão de Vendas": previsao_arima.values
})

# Criar gráfico interativo
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=df_vendas_diarias.index,
    y=df_vendas_diarias["Quantidade Vendida"],
    mode="lines",
    name="Vendas Reais",
    line=dict(color="blue")
))
fig.add_trace(go.Scatter(
    x=df_previsao["Data"],
    y=df_previsao["Previsão de Vendas"],
    mode="lines",
    name="Previsão de Vendas",
    line=dict(color="red", dash="dash")
))
fig.update_layout(
    title="Previsão de Vendas para os Próximos 6 Meses",
    xaxis_title="Data",
    yaxis_title="Quantidade de Vendas",
    hovermode="x unified",
    template="plotly_white"
)

# Exibir gráfico interativo
fig.show()



No frequency information was provided, so inferred frequency D will be used.


No frequency information was provided, so inferred frequency D will be used.


No frequency information was provided, so inferred frequency D will be used.



## 📦 Vendas de Produto

In [None]:
# Contar a quantidade total vendida por item
vendas_por_produto = df_vendas["Produto"].value_counts().reset_index()
vendas_por_produto.columns = ["Produto", "Quantidade Vendida"]

# Exibir os dados
# Assuming display_dataframe_to_user is a function you want to apply:
# If it's in a specific module, import it first (e.g., from my_module import display_dataframe_to_user)
# If it's a standalone function, define it before this cell
# If it's meant to be display, simply use:
display(vendas_por_produto)

# Carregar os dados de vendas
df_vendas = pd.read_csv("compras_barba_de_elite.csv")

# Contar a quantidade total vendida por item
vendas_por_produto = df_vendas["Produto"].value_counts().reset_index()
vendas_por_produto.columns = ["Produto", "Quantidade Vendida"]

# Criar gráfico interativo de vendas por produto
fig = go.Figure()

fig.add_trace(go.Bar(
    x=vendas_por_produto["Produto"],
    y=vendas_por_produto["Quantidade Vendida"],
    marker=dict(color="royalblue"),
    text=vendas_por_produto["Quantidade Vendida"],
    textposition="auto"
))

# Ajustar layout do gráfico
fig.update_layout(
    title="Quantidade Vendida por Produto",
    xaxis_title="Produto",
    yaxis_title="Quantidade Vendida",
    xaxis=dict(tickangle=-45),
    template="plotly_white"
)

# Exibir o gráfico interativo
fig.show()

Unnamed: 0,Produto,Quantidade Vendida
0,Pomada modeladora para cabelo,1069
1,Gel pós-barba,1069
2,Cera capilar,1066
3,Shampoo para barba,1060
4,Balm para barba,1058
5,Óleo para barba,1051
6,Condicionador para barba,1022
7,Shampoo anticaspa,1017
8,Espuma de barbear,1013
9,Kit completo para barba,1009


## 📊 Análise de Vendas por Dia da Semana

In [None]:
# Carregar os dados de vendas
df_vendas = pd.read_csv("compras_barba_de_elite.csv")

# Converter a coluna de data para formato datetime
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])

# Criar uma coluna com o nome do dia da semana em português
dias_semana_traducao = {
    "Monday": "Segunda-feira",
    "Tuesday": "Terça-feira",
    "Wednesday": "Quarta-feira",
    "Thursday": "Quinta-feira",
    "Friday": "Sexta-feira",
    "Saturday": "Sábado",
    "Sunday": "Domingo"
}

df_vendas["Dia da Semana"] = df_vendas["Data e Hora"].dt.day_name().map(dias_semana_traducao)

# Contar vendas por dia da semana
vendas_por_dia_semana = df_vendas.groupby("Dia da Semana").size()

# Reordenar para começar na segunda-feira
ordem_dias = ["Segunda-feira", "Terça-feira", "Quarta-feira", "Quinta-feira", "Sexta-feira", "Sábado", "Domingo"]
vendas_por_dia_semana = vendas_por_dia_semana.reindex(ordem_dias)

# Criar gráfico interativo
fig = go.Figure()

fig.add_trace(go.Bar(
    x=vendas_por_dia_semana.index,
    y=vendas_por_dia_semana.values,
    marker=dict(color="royalblue"),
    text=vendas_por_dia_semana.values,
    textposition="auto"
))

# Ajustar layout do gráfico
fig.update_layout(
    title="Vendas por Dia da Semana",
    xaxis_title="Dia da Semana",
    yaxis_title="Número de Vendas",
    template="plotly_white"
)

# Exibir o gráfico interativo
fig.show()


## 📦 Relação entre Estoque e Vendas

In [None]:
# Carregar os dados de vendas e estoque
df_vendas = pd.read_csv("compras_barba_de_elite.csv")
df_estoque = pd.read_csv("estoque_barba_de_elite.csv")

# Calcular a média de vendas diárias por produto
total_dias = df_vendas["Data e Hora"].nunique()
media_vendas_produto = df_vendas.groupby("Produto").size().div(total_dias).reset_index(name="Média de Vendas Diárias")

# Mesclar com a base de estoque
estoque_vendas = df_estoque.merge(media_vendas_produto, left_on="Nome do Produto", right_on="Produto", how="left")
estoque_vendas.drop(columns=["Produto"], inplace=True)

# Calcular DOH (Days On Hand) e Estoque Ideal
estoque_vendas["Days On Hand (DOH)"] = estoque_vendas["Quantidade em Estoque"] / estoque_vendas["Média de Vendas Diárias"]
estoque_vendas["Estoque Ideal (30 dias)"] = estoque_vendas["Média de Vendas Diárias"] * 30

# Criar gráfico interativo de dispersão entre estoque e vendas
fig = px.scatter(
    estoque_vendas,
    x="Quantidade em Estoque",
    y="Média de Vendas Diárias",
    text="Nome do Produto",
    title="Relação entre Estoque e Vendas",
    labels={"Quantidade em Estoque": "Quantidade em Estoque", "Média de Vendas Diárias": "Média de Vendas Diárias"},
    color="Days On Hand (DOH)",  # Cor indicando o DOH
    size="Média de Vendas Diárias",
    hover_name="Nome do Produto",
)

# Ajustes no layout
fig.update_traces(marker=dict(opacity=0.7, line=dict(width=1, color="DarkSlateGrey")))
fig.update_layout(template="plotly_white")

# Exibir gráfico interativo
fig.show()


## 📌 Cálculo de Days On Hand (DOH) e Estoque Ideal

In [None]:
# Carregar os dados de vendas
df_vendas = pd.read_csv("compras_barba_de_elite.csv")

# Converter a coluna de data para formato datetime
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])
# Creating 'Data' column here to ensure it exists
df_vendas["Data"] = df_vendas["Data e Hora"].dt.date

# Contar o número de dias distintos na base de vendas
total_dias = df_vendas["Data"].nunique()

# Calcular a média de vendas diárias corretamente
media_vendas_produto = df_vendas.groupby('Produto').size().div(total_dias).reset_index(name='Média de Vendas Diárias')

# Mesclar com a base de estoque
estoque_vendas = df_estoque.merge(media_vendas_produto, left_on='Nome do Produto', right_on='Produto', how='left')
estoque_vendas.drop(columns=['Produto'], inplace=True)

# Calcular DOH corretamente
estoque_vendas['Days On Hand (DOH)'] = estoque_vendas['Quantidade em Estoque'] / estoque_vendas['Média de Vendas Diárias']

# Calcular estoque ideal para 30 dias de cobertura
estoque_vendas['Estoque Ideal (30 dias)'] = estoque_vendas['Média de Vendas Diárias'] * 30

# Exibir tabela corrigida
estoque_vendas.head()

Unnamed: 0,ID Produto,Nome do Produto,Preço,Quantidade em Estoque,Média de Vendas Diárias,Days On Hand (DOH),Estoque Ideal (30 dias)
0,1,Shampoo para barba,39.9,118,2.690355,43.860377,80.71066
1,2,Pomada modeladora para cabelo,49.9,199,2.713198,73.345182,81.395939
2,3,Óleo para barba,59.9,76,2.667513,28.490961,80.025381
3,4,Cera capilar,44.9,108,2.705584,39.917448,81.167513
4,5,Gel pós-barba,34.9,14,2.713198,5.159963,81.395939


## 📊 Análise de Ticket Médio

In [None]:
ticket_medio = df_vendas.groupby("ID Compra")["Valor"].sum().mean()
print(f"🎯 Ticket Médio por Compra: R$ {ticket_medio:.2f}")


🎯 Ticket Médio por Compra: R$ 158.43


## 📊 Itens Mais Comprados Juntos

In [None]:
# Criar um dicionário para armazenar os produtos comprados em cada ID de compra
compras_dict = df_vendas.groupby("ID Compra")["Produto"].apply(list)

# Gerar todas as combinações possíveis de produtos
todas_combinacoes = []
for produtos in compras_dict:
    todas_combinacoes.extend(combinations(produtos, 2))

# Contar as combinações mais comuns
comb_count = Counter(todas_combinacoes)
mais_comprados_juntos = comb_count.most_common(5)  # Top 5

# Exibir os produtos mais comprados juntos
print("🔗 Produtos mais comprados juntos:")
for (prod1, prod2), qtd in mais_comprados_juntos:
    print(f"{prod1} + {prod2} → {qtd} vezes")


🔗 Produtos mais comprados juntos:
Balm para barba + Shampoo para barba → 159 vezes
Shampoo anticaspa + Shampoo para barba → 159 vezes
Shampoo para barba + Espuma de barbear → 158 vezes
Cera capilar + Pomada modeladora para cabelo → 156 vezes
Pomada modeladora para cabelo + Espuma de barbear → 152 vezes


## 📊 Dia de Maior Venda

In [None]:
# Garantir que a coluna Data e Hora seja datetime
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])

# Criar uma coluna apenas com a data (sem horário)
df_vendas["Data"] = df_vendas["Data e Hora"].dt.date

# Encontrar o dia com maior número de vendas
pico_vendas = df_vendas["Data"].value_counts().idxmax()

print(f"📅 Dia com maior número de vendas: {pico_vendas}")


📅 Dia com maior número de vendas: 2024-06-08


## 📊 Previsão de vendas de Shampoo

In [None]:
from statsmodels.tsa.arima.model import ARIMA

# Escolher um produto específico para prever vendas
produto_escolhido = "Shampoo para barba"
df_produto = df_vendas[df_vendas["Produto"] == produto_escolhido].groupby("Data").size()

# Ajustar modelo ARIMA
modelo_produto = ARIMA(df_produto, order=(5,1,0))
modelo_fit = modelo_produto.fit()

# Fazer previsões para os próximos 30 dias
previsao_produto = modelo_fit.forecast(steps=30)

# Exibir previsões
print(f"📊 Previsão de vendas para {produto_escolhido} nos próximos 30 dias:")
print(previsao_produto)


📊 Previsão de vendas para Shampoo para barba nos próximos 30 dias:
364    3.022338
365    3.238962
366    3.047609
367    3.473488
368    3.242419
369    3.428431
370    3.194754
371    3.287838
372    3.244128
373    3.335829
374    3.277931
375    3.313487
376    3.262382
377    3.291526
378    3.280208
379    3.299841
380    3.284986
381    3.292451
382    3.281845
383    3.289777
384    3.286665
385    3.290829
386    3.287079
387    3.288843
388    3.286695
389    3.288682
390    3.287816
391    3.288697
392    3.287782
393    3.288235
Name: predicted_mean, dtype: float64



A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.


A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.


A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.


No supported index is available. Prediction results will be given with an integer index beginning at `start`.


No supported index is available. In the next version, calling this method in a model without a supported index will result in an exception.



## 🔄 Taxa de clientes recorrentes

In [None]:
clientes_com_varias_compras = df_vendas["ID Usuário"].value_counts()
taxa_recorrencia = (clientes_com_varias_compras > 1).mean() * 100
print(f"🔄 Taxa de clientes recorrentes: {taxa_recorrencia:.2f}%")


🔄 Taxa de clientes recorrentes: 94.13%


## ⏳ Tempo médio entre compras

In [None]:
# Calcular o tempo entre compras para cada cliente
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])
df_vendas["Data"] = df_vendas["Data e Hora"].dt.date

tempo_entre_compras = df_vendas.groupby("ID Usuário")["Data"].apply(lambda x: x.diff().mean()).dropna()

# Exibir tempo médio entre compras (em dias)
print(f"⏳ Tempo médio entre compras: {tempo_entre_compras.mean().days:.2f} dias")


⏳ Tempo médio entre compras: -1.00 dias


## 📊 Ticket Médio Cliente e Compra

In [None]:
# Ticket médio por cliente
ticket_medio_cliente = df_vendas.groupby("ID Usuário")["Valor"].sum().mean()

# Ticket médio por compra
ticket_medio_compra = df_vendas.groupby("ID Compra")["Valor"].sum().mean()

print(f"💰 Ticket Médio por Cliente: R$ {ticket_medio_cliente:.2f}")
print(f"🛒 Ticket Médio por Compra: R$ {ticket_medio_compra:.2f}")


💰 Ticket Médio por Cliente: R$ 249.88
🛒 Ticket Médio por Compra: R$ 158.43


## 📊 Distribuição da Faixa de Preço

In [None]:
# Garantir que a coluna de data seja datetime
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])

# Agrupar as compras pelo ID da Compra para calcular o valor total gasto por compra
compras_agrupadas = df_vendas.groupby("ID Compra")["Valor"].sum().reset_index()

# Definir faixas de preço para segmentação
bins = [0, 50, 100, 200, 500, 1000]
labels = ["Até R$50", "R$50-100", "R$100-200", "R$200-500", "Acima de R$500"]

# Classificar cada compra em uma faixa de preço
compras_agrupadas["Faixa de Preço"] = pd.cut(compras_agrupadas["Valor"], bins=bins, labels=labels)

# Contar quantidade de compras por faixa de preço (considerando compras únicas)
faixa_preco = compras_agrupadas["Faixa de Preço"].value_counts().sort_index()

# Criar gráfico interativo
fig = px.bar(
    x=faixa_preco.index,
    y=faixa_preco.values,
    text=faixa_preco.values,
    labels={"x": "Faixa de Preço", "y": "Quantidade de Compras"},
    title="Distribuição de Compras por Faixa de Preço",
    color=faixa_preco.values,
    color_continuous_scale="Blues"
)

# Ajustar layout
fig.update_traces(textposition="auto")
fig.update_layout(
    xaxis_title="Faixa de Preço",
    yaxis_title="Quantidade de Compras",
    template="plotly_white"
)

# Exibir gráfico interativo
fig.show()


## 📊 Análise de Vendas por Mês

In [None]:
# Criar colunas de mês e nome do mês
df_vendas["Data e Hora"] = pd.to_datetime(df_vendas["Data e Hora"])  # Garantir que a coluna seja datetime
df_vendas["Mês"] = df_vendas["Data e Hora"].dt.month

# Criar um dicionário para traduzir os meses
meses_traducao = {
    1: "Janeiro", 2: "Fevereiro", 3: "Março", 4: "Abril", 5: "Maio", 6: "Junho",
    7: "Julho", 8: "Agosto", 9: "Setembro", 10: "Outubro", 11: "Novembro", 12: "Dezembro"
}

df_vendas["Mês"] = df_vendas["Mês"].map(meses_traducao)  # Traduzir os meses para português

# Contar vendas por mês
vendas_por_mes = df_vendas["Mês"].value_counts().reindex(meses_traducao.values())

# Criar gráfico interativo
fig = px.bar(
    x=vendas_por_mes.index,
    y=vendas_por_mes.values,
    text=vendas_por_mes.values,
    labels={"x": "Mês", "y": "Quantidade de Vendas"},
    title="Vendas por Mês",
    color=vendas_por_mes.values,
    color_continuous_scale="Blues"
)

# Ajustar layout
fig.update_traces(textposition="auto")
fig.update_layout(
    xaxis_title="Mês",
    yaxis_title="Quantidade de Vendas",
    template="plotly_white"
)

# Exibir gráfico interativo
fig.show()
