# Importação e Organização de dados:

In [9]:
!pip install dash
!pip install dash-bootstrap-components
!pip install pandas
!pip install plotly
!pip install openpyxl
!pip install dash-html-components
!pip install dash-core-components
!pip install Jupyter-dash



In [10]:
import matplotlib.pyplot as plt
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
import plotly.io as pio
from dash import Dash, dcc, html, Input, Output
from jupyter_dash import JupyterDash
import dash_bootstrap_components as dbc
import dash

#  Carregando e preparando os dados

In [17]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [18]:
# Unificando as tabelas com as vendas dos anos de 2020, 2021 e 2022:
arquivos_vendas = [ '/content/drive/MyDrive/Dashboards com Dash/Base Vendas - 2020.xlsx',
'/content/drive/MyDrive/Dashboards com Dash/Base Vendas - 2021.xlsx',
'/content/drive/MyDrive/Dashboards com Dash/Base Vendas - 2022.xlsx' ]

lista_vendas = [pd.read_excel(arquivo) for arquivo in arquivos_vendas]
df_vendas = pd.concat(lista_vendas, ignore_index=True)

In [19]:
df_vendas['Data da Venda'] = pd.to_datetime(df_vendas['Data da Venda'], dayfirst=True)

In [20]:
print(f"Base unificada  - Total de registros: {len(df_vendas)}")
print(df_vendas.head())

Base unificada  - Total de registros: 56046
  Data da Venda Ordem de Compra   SKU  ID Cliente  Qtd Vendida  ID Loja
0    2020-01-01         SO45080  HL59       14657            1      101
1    2020-01-01         SO45079  HL45       29255            1      122
2    2020-01-01         SO45082  HL71       11455            1      200
3    2020-01-01         SO45081  HL62       26782            1      200
4    2020-01-02         SO45083  HL45       14947            1      199


In [22]:
# Leitura_Cadastros
df_clientes = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Clientes.xlsx', header=2)
print(df_clientes.columns)

Index(['ID Cliente', 'Primeiro Nome', 'Sobrenome', 'Email', 'Genero',
       'Data Nascimento', 'Estado Civil', 'Num Filhos', 'Nivel Escolar',
       'Documento', 'Unnamed: 10', 'Unnamed: 11'],
      dtype='object')


In [23]:
print("Colunas do df_clientes:", df_clientes.columns.tolist())

Colunas do df_clientes: ['ID Cliente', 'Primeiro Nome', 'Sobrenome', 'Email', 'Genero', 'Data Nascimento', 'Estado Civil', 'Num Filhos', 'Nivel Escolar', 'Documento', 'Unnamed: 10', 'Unnamed: 11']


In [24]:
df_clientes = df_clientes.drop(columns=[' ', 'Unnamed: 11'], errors='ignore')

In [25]:
df_lojas = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Lojas.xlsx')
df_produtos = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Produtos.xlsx')

In [26]:
pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Clientes.xlsx', header=None).head(10)

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11
0,,,,,,,,,,,,
1,,,,,,,,,,,,
2,ID Cliente,Primeiro Nome,Sobrenome,Email,Genero,Data Nascimento,Estado Civil,Num Filhos,Nivel Escolar,Documento,,
3,11000,STHEFESON,PEREIRA,sthefeson8@icloud.com,M,4/8/1966,C,2,Superior Completo,80912350,,
4,11001,ANTONIO,MANHÃES,antonio19@hotmail.com.br,M,5/14/1965,S,3,Superior Completo,18106981686,,
5,11002,BIANCA,PAZ,bianca53@live.com.br,F,8/12/1965,C,3,Superior Completo,77468986692,,
6,11003,SILVIO,FAHRNHOLZ,silvio21@hotmail.com.br,M,2/15/1968,S,0,Superior Completo,28009530521,,
7,11004,LUIZA,CABRAL,luiza70@msn.com,F,8/8/1968,S,5,Superior Completo,16316472002,,
8,11005,ANA,SILVA,ana59@outlook.com.br,F,8/5/1965,S,0,Superior Completo,04013622223,,
9,11007,NATALIA,MARINHO,natalia44@icloud.com,F,5/9/1964,C,3,Superior Completo,37087830006,,


In [27]:
print(df_vendas.columns.tolist())

['Data da Venda', 'Ordem de Compra', 'SKU', 'ID Cliente', 'Qtd Vendida', 'ID Loja']


In [28]:
print(df_clientes.columns.tolist())

['ID Cliente', 'Primeiro Nome', 'Sobrenome', 'Email', 'Genero', 'Data Nascimento', 'Estado Civil', 'Num Filhos', 'Nivel Escolar', 'Documento', 'Unnamed: 10']


In [29]:
print(df_produtos.columns.tolist())

['SKU', 'Produto', 'Marca', 'Tipo do Produto', 'Preço Unitario', 'Custo Unitario', 'Observação']


In [30]:
print(df_lojas.columns.tolist())

['ID Loja', 'Nome da Loja', 'Quantidade Colaboradores', 'Tipo', 'id Localidade', 'Gerente Loja', 'Documento Gerente']


# Tratamento da tabela Clientes

In [31]:
df_clientes = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Clientes.xlsx', header=2)

colunas_clientes = ['ID Cliente', 'Primeiro Nome', 'Sobrenome', 'Email', 'Genero', 'Data Nascimento', 'Estado Civil', 'Num Filhos', 'Nivel Escolar', 'Documento', 'Coluna10', 'Coluna11']  # Ajuste nomes conforme o arquivo real

print("Colunas lidas:", df_clientes.columns.tolist())

# Verificar se colunas 'Primeiro Nome' e 'Sobrenome' existem
if 'Primeiro Nome' in df_clientes.columns and 'Sobrenome' in df_clientes.columns:
    df_clientes['Nome Completo'] = df_clientes['Primeiro Nome'].astype(str) + ' ' + df_clientes['Sobrenome'].astype(str)
    df_clientes.drop(columns=['Primeiro Nome', 'Sobrenome'], inplace=True)
else:
    print("Colunas 'Primeiro Nome' ou 'Sobrenome' não encontradas após a leitura.")
    print("Colunas atuais:", df_clientes.columns.tolist())

print("Clientes tratados:", df_clientes.shape)

if 'Nome Completo' in df_clientes.columns:
    print(df_clientes[['ID Cliente', 'Nome Completo']].head())
else:
    print("Coluna 'Nome Completo' não criada.")
    print(df_clientes.head())

Colunas lidas: ['ID Cliente', 'Primeiro Nome', 'Sobrenome', 'Email', 'Genero', 'Data Nascimento', 'Estado Civil', 'Num Filhos', 'Nivel Escolar', 'Documento', 'Unnamed: 10', 'Unnamed: 11']
Clientes tratados: (18148, 11)
   ID Cliente      Nome Completo
0       11000  STHEFESON PEREIRA
1       11001    ANTONIO MANHÃES
2       11002         BIANCA PAZ
3       11003   SILVIO FAHRNHOLZ
4       11004       LUIZA CABRAL


# Tratamento da Tabela Produtos:

In [32]:
#Renomenadno SKU para ID Produto
df_produtos.rename(columns={'SKU': 'ID Produto'}, inplace=True)
print(df_produtos.columns.tolist())

['ID Produto', 'Produto', 'Marca', 'Tipo do Produto', 'Preço Unitario', 'Custo Unitario', 'Observação']


# Tratamento da tabela Vendas:

In [34]:
#Renomenando SKU (da tabela) Vendas
df_vendas.rename(columns={'SKU': 'ID Produto'}, inplace=True)
print(df_vendas.columns.tolist())

['Data da Venda', 'Ordem de Compra', 'ID Produto', 'ID Cliente', 'Qtd Vendida', 'ID Loja']


# Unificação das bases de vendas:

In [37]:
#Leitura das bases de vendas dos anos 2020, 2021 e 2022
df_vendas2020 = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Base Vendas - 2020.xlsx')
df_vendas2021 = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Base Vendas - 2021.xlsx')
df_vendas2022 = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Base Vendas - 2022.xlsx')

#Padronizando os nomes das colunas das bases de vendas
colunas_padrao = ['Data da Venda', 'Ordem de Compra', 'ID Produto', 'ID Cliente', 'Qtd Vendida', 'ID Loja']
df_vendas2020.columns = colunas_padrao
df_vendas2021.columns = colunas_padrao
df_vendas2022.columns = colunas_padrao

# Unificando todas as vendas num único DataFrame
df_vendas = pd.concat([df_vendas2020, df_vendas2021, df_vendas2022], ignore_index=True)

# Leitura das  tabelas
df_clientes = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Clientes.xlsx', skiprows=2)
df_produtos = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Produtos.xlsx')
df_lojas = pd.read_excel('/content/drive/MyDrive/Dashboards com Dash/Cadastro Lojas.xlsx')

# Unificando nome dos clientes: Primeiro Nome + Sobrenome:
if 'Primeiro Nome' in df_clientes.columns and 'Sobrenome' in df_clientes.columns:
    df_clientes['Nome Completo'] = df_clientes['Primeiro Nome'].astype(str) + ' ' + df_clientes['Sobrenome'].astype(str)
    df_clientes.drop(columns=['Primeiro Nome', 'Sobrenome'], inplace=True)

# Verificando o 'ID Produto':
if 'SKU' in df_produtos.columns:
    df_produtos.rename(columns={'SKU': 'ID Produto'}, inplace=True)

# Mesclando os dados das vendas com clientes, produtos e lojas
df_total = df_vendas.merge(df_clientes, on='ID Cliente', how='left') \
                    .merge(df_produtos, on='ID Produto', how='left') \
                    .merge(df_lojas, on='ID Loja', how='left')

# Convertando a coluna 'Data da Venda' para datetime:
df_total['Data da Venda'] = pd.to_datetime(df_total['Data da Venda'], dayfirst=True)

# Criando colunas auxiliares para análise:
df_total['Ano'] = df_total['Data da Venda'].dt.year
df_total['Valor da Venda'] = df_total['Qtd Vendida'] * df_total['Preço Unitario']

# Visualizando as primeiras linhas para conferência:
print(df_total.head())
print("Base Completa:", df_total.shape)

  Data da Venda Ordem de Compra ID Produto  ID Cliente  Qtd Vendida  ID Loja  \
0    2020-01-01         SO45080       HL59       14657            1      101   
1    2020-01-01         SO45079       HL45       29255            1      122   
2    2020-01-01         SO45082       HL71       11455            1      200   
3    2020-01-01         SO45081       HL62       26782            1      200   
4    2020-01-02         SO45083       HL45       14947            1      199   

                       Email Genero Data Nascimento Estado Civil  ...  \
0       bdrewettg9@goo.ne.jp      M       1/19/1984            C  ...   
1       dvallowpq@ebay.co.uk      F       6/18/1980            S  ...   
2       thomáz63@hotmail.com      M       6/29/1999            C  ...   
3          wgurradodq@gov.uk      F       12/3/2005            S  ...   
4  lputto1@elegantthemes.com      F       3/21/1990            S  ...   

   Custo Unitario Observação               Nome da Loja  \
0           115.8    

# Gerando GRÁFICOS:

In [38]:
# Preparar filtros
filtros = {
    "produto": df_total["Produto"].unique() if "Produto" in df_total.columns else [],
    "loja": df_total["Nome da Loja"].unique() if "Nome da Loja" in df_total.columns else [],
    "cliente": df_total["Nome Completo"].unique() if "Nome Completo" in df_total.columns else [],
    "marca": df_total["Marca"].unique() if "Marca" in df_total.columns else [],
    "tipo": df_total["Tipo do Produto"].unique() if "Tipo do Produto" in df_total.columns else [],
}

app = dash.Dash(__name__, external_stylesheets=[dbc.themes.CYBORG])

app.layout = dbc.Container([
    html.H1("📊 Dashboard de Vendas", className="text-center my-4"),

    dbc.Row([
        dbc.Col(dcc.Dropdown(id='filtro_tipo', options=[{'label': i, 'value': i} for i in filtros['tipo']],
                             placeholder="Selecione o Tipo de Produto"), md=4),
        dbc.Col(dcc.Dropdown(id='filtro_marca', placeholder="Selecione a Marca"), md=4),
        dbc.Col(dcc.Dropdown(id='filtro_produto', options=[{'label': i, 'value': i} for i in filtros['produto']],
                             multi=True, placeholder="Filtrar por Produto"), md=4),
        dbc.Col(dcc.Dropdown(id='filtro_loja', options=[{'label': i, 'value': i} for i in filtros['loja']],
                             multi=True, placeholder="Filtrar por Loja"), md=4),
        dbc.Col(dcc.Dropdown(id='filtro_cliente', options=[{'label': i, 'value': i} for i in filtros['cliente']],
                             multi=True, placeholder="Filtrar por Cliente"), md=4),
    ], className="mb-4"),

    dbc.Row([
        dbc.Col(dcc.Graph(id='grafico_ano'), md=6),
        dbc.Col(dcc.Graph(id='grafico_cliente'), md=6),
    ]),
    dbc.Row([
        dbc.Col(dcc.Graph(id='grafico_produto'), md=6),
        dbc.Col(dcc.Graph(id='grafico_loja'), md=6),
    ]),
    dbc.Row([
        dbc.Col(dcc.Graph(id='grafico_pizza_tipo'), md=6),
        dbc.Col(dcc.Graph(id='grafico_area_tempo'), md=6),
    ]),
], fluid=True)

@app.callback(
    Output('filtro_marca', 'options'),
    Input('filtro_tipo', 'value')
)
def atualizar_marcas(tipo):
    if tipo and "Tipo do Produto" in df_total.columns:
        marcas = df_total[df_total['Tipo do Produto'] == tipo]['Marca'].dropna().unique()
        return [{'label': m, 'value': m} for m in marcas]
    return []

@app.callback(
    [Output('grafico_ano', 'figure'),
     Output('grafico_cliente', 'figure'),
     Output('grafico_produto', 'figure'),
     Output('grafico_loja', 'figure'),
     Output('grafico_pizza_tipo', 'figure'),
     Output('grafico_area_tempo', 'figure')],
    [Input('filtro_tipo', 'value'),
     Input('filtro_marca', 'value'),
     Input('filtro_produto', 'value'),
     Input('filtro_loja', 'value'),
     Input('filtro_cliente', 'value')]
)
def atualizar_graficos(tipo, marca, produtos, lojas, clientes):
    df = df_total.copy()

    if tipo and "Tipo do Produto" in df.columns:
        df = df[df['Tipo do Produto'] == tipo]
    if marca and "Marca" in df.columns:
        df = df[df['Marca'] == marca]
    if produtos and "Produto" in df.columns:
        df = df[df['Produto'].isin(produtos)]
    if lojas and "Nome da Loja" in df.columns:
        df = df[df['Nome da Loja'].isin(lojas)]
    if clientes and "Nome Completo" in df.columns:
        df = df[df['Nome Completo'].isin(clientes)]

    # Garantir datetime
    if not pd.api.types.is_datetime64_any_dtype(df["Data da Venda"]):
        df["Data da Venda"] = pd.to_datetime(df["Data da Venda"])

    # Gráfico 1 - Vendas por Ano
    fig1 = px.bar(df.groupby("Ano")["Valor da Venda"].sum().reset_index(),
                  x="Ano", y="Valor da Venda", title="Vendas por Ano",
                  color_discrete_sequence=["#00BFFF"], template='plotly_dark')

    # Gráfico 2 - Top 10 Clientes
    fig2 = px.bar(df.groupby("Nome Completo")["Valor da Venda"].sum().nlargest(10).reset_index(),
                  x="Valor da Venda", y="Nome Completo", orientation='h',
                  title="Top 10 Clientes", color_discrete_sequence=["#FF7F50"], template='plotly_dark')

    # Gráfico 3 - Top 10 Produtos
    fig3 = px.line(df.groupby("Produto")["Valor da Venda"].sum().nlargest(10).reset_index(),
                   x="Produto", y="Valor da Venda", title="Top 10 Produtos",
                   markers=True, color_discrete_sequence=["#32CD32"], template='plotly_dark')

    # Gráfico 4 - Vendas por Loja
    fig4 = px.bar(df.groupby("Nome da Loja")["Valor da Venda"].sum().reset_index(),
                  x="Nome da Loja", y="Valor da Venda", title="Vendas por Loja",
                  color_discrete_sequence=["#FFD700"], template='plotly_dark')

    # Gráfico 5 - Distribuição por Tipo de Produto
    fig5 = px.pie(df, names="Tipo do Produto", values="Valor da Venda", title="Distribuição por Tipo de Produto",
                  color_discrete_sequence=px.colors.qualitative.Set3, template='plotly_dark')

    # Gráfico 6 - Evolução Mensal
    df["Mês"] = df["Data da Venda"].dt.to_period("M").astype(str)
    fig6 = px.area(df.groupby("Mês")["Valor da Venda"].sum().reset_index(),
                   x="Mês", y="Valor da Venda", title="Evolução Mensal de Vendas",
                   color_discrete_sequence=["#1E90FF"], template='plotly_dark')

    return fig1, fig2, fig3, fig4, fig5, fig6

if __name__ == '__main__':
    app.run(debug=True)

<IPython.core.display.Javascript object>