# An√°lise de Dados - FastRequest

O FastRequest √© um software respons√°vel por apoiar uma lanchonete simples, com o intuito de gerenciar pedidos, clientes e produtos
deste estabelecimento. E, al√©m de uma aplica√ß√£o para comportar os dados, √© fundamental a an√°lise desses dados com o intuito de enxergar
como o neg√≥cio est√° caminhando e, conhecendo o seu p√∫blico, quais medidas podem ser tomadas para que ele seja melhorado.

In [60]:
# -- importa√ß√µes
import pandas as pd
import plotly_express as px
from sqlalchemy import create_engine, text
import random
from datetime import datetime, timedelta


In [61]:
# --- Conex√£o com PostgreSQL da Railway ---
DATABASE_URL = "postgresql://postgres:IWztuihqsKmzsKMsxNsCjxbZbThQNrFg@trolley.proxy.rlwy.net:12027/railway"
engine = create_engine(DATABASE_URL)

# --- Carregar dados base (clientes e produtos j√° existentes no banco) ---
clientes = pd.read_sql("""SELECT * FROM "Clientes";""", engine)
produtos = pd.read_sql("""SELECT * FROM "Produtos";""", engine)

# --- Exclus√£o de registros antigos para gera√ß√£o de novos
with engine.begin() as conn:
    conn.execute(text('TRUNCATE TABLE "ItensPedido" RESTART IDENTITY CASCADE;'))
    conn.execute(text('TRUNCATE TABLE "Pedidos" RESTART IDENTITY CASCADE;'))

# --- Configura√ß√µes ---
num_pedidos = 3000
status_options = ['Entregue', 'Cancelado']
tipo_entrega_options = ["Balc√£o", "Delivery"]
observacoes_possiveis = [
    "Sem cebola", "Com molho extra", "Trocar batata por salada",
    "Sem a√ß√∫car", "Pouco sal", "Com gelo", "Sem gelo", None, None
]

# --- Gerar pedidos e itens ---
pedidos = []
itens = []

for pedido_id in range(1, num_pedidos + 1):
    cliente = clientes.sample(1).iloc[0]
    data_pedido = datetime(2024, 1, 1) + timedelta(days=random.randint(0, 250),
                                                   hours=random.randint(8, 22),
                                                   minutes=random.randint(0, 59))
    status = random.choices(status_options, weights=[0.65, 0.35])[0]
    tipo_entrega = random.choice(tipo_entrega_options)
    numero_mesa = random.randint(1, 20) if tipo_entrega == "Local" else None

    valor_total = 0
    descricao = "Pedido gerado automaticamente"
    observacao_pedido = random.choice(observacoes_possiveis)

    # --- Itens ---
    num_itens = random.randint(1, 5)
    produtos_selecionados = produtos.sample(num_itens)

    for _, produto in produtos_selecionados.iterrows():
        quantidade = random.randint(1, 4)
        preco_unitario = produto["Preco"]
        subtotal = quantidade * preco_unitario
        valor_total += subtotal

        itens.append({
            "Id": len(itens) + 1,
            "PedidoId": pedido_id,
            "ProdutoId": produto["Id"],
            "Quantidade": quantidade,
            "PrecoUnitario": preco_unitario,
            "Observacao": random.choice(observacoes_possiveis)
        })

    pedidos.append({
        "Id": pedido_id,
        "ClienteId": cliente["Id"],
        "DataPedido": data_pedido,
        "ValorTotal": round(valor_total, 2),
        "Status": status,
        "Descricao": descricao,
        "DataCadastro": data_pedido,
        "DataModificacao": None,
        "Observacoes": observacao_pedido,
        "NumeroMesa": numero_mesa,
        "TipoEntrega": tipo_entrega
    })

df_pedidos = pd.DataFrame(pedidos)
df_itens = pd.DataFrame(itens)

df_pedidos.to_sql("Pedidos", engine, if_exists="append", index=False)
df_itens.to_sql("ItensPedido", engine, if_exists="append", index=False)

print("‚úÖ Tabelas 'pedidos' e 'itens' foram recriadas com sucesso!")


‚úÖ Tabelas 'pedidos' e 'itens' foram recriadas com sucesso!


In [62]:
# Lista de tabelas a serem extra√≠das
tabelas = ['"Clientes"', '"Pedidos"','"Produtos"', '"ItensPedido"']
dfs = {}
for tabela in tabelas:
    query = f"SELECT * FROM {tabela};"
    dfs[tabela] = pd.read_sql(query, engine)

## Tratamento e Limpeza de Dados

In [63]:
dfs['"Pedidos"'].head(3)

Unnamed: 0,Id,ClienteId,DataPedido,ValorTotal,Status,Descricao,DataCadastro,DataModificacao,Observacoes,NumeroMesa,TipoEntrega
0,1,15,2024-03-08 15:49:00,29.3,Entregue,Pedido gerado automaticamente,2024-03-08 15:49:00,,Sem a√ß√∫car,,Balc√£o
1,2,3,2024-03-10 14:45:00,168.9,Entregue,Pedido gerado automaticamente,2024-03-10 14:45:00,,Com gelo,,Balc√£o
2,3,9,2024-05-26 17:09:00,99.4,Entregue,Pedido gerado automaticamente,2024-05-26 17:09:00,,Com molho extra,,Delivery


In [64]:
print(dfs['"Pedidos"']['NumeroMesa'].unique())
print(dfs['"Pedidos"']['DataModificacao'].unique())

dfs['"Pedidos"'] = dfs['"Pedidos"'].dropna(axis=1, how='all')
dfs['"Pedidos"'] = dfs['"Pedidos"'].drop(columns=['Descricao', 'Observacoes', 'DataCadastro'])
dfs['"Pedidos"'].head()

[None]
[None]


Unnamed: 0,Id,ClienteId,DataPedido,ValorTotal,Status,TipoEntrega
0,1,15,2024-03-08 15:49:00,29.3,Entregue,Balc√£o
1,2,3,2024-03-10 14:45:00,168.9,Entregue,Balc√£o
2,3,9,2024-05-26 17:09:00,99.4,Entregue,Delivery
3,4,2,2024-07-22 11:32:00,136.0,Cancelado,Delivery
4,5,6,2024-07-25 10:35:00,29.8,Entregue,Balc√£o


In [65]:
dfs['"ItensPedido"'][dfs['"ItensPedido"']['Id']==1]

Unnamed: 0,Id,PedidoId,ProdutoId,Quantidade,PrecoUnitario,Observacao
0,1,1,20,1,9.9,Sem gelo


In [66]:
dfs['"Produtos"'] = dfs['"Produtos"'].drop(columns=['DataModificacao', 'DataCadastro', 'Disponivel'])
dfs['"Produtos"'].head()

Unnamed: 0,Id,Nome,Descricao,Preco,Categoria
0,1,X-Burger Cl√°ssico,"Hamb√∫rguer bovino, queijo, alface, tomate, ceb...",15.9,Lanches
1,2,X-Tudo Completo,"Hamb√∫rguer bovino, queijo, presunto, ovo, baco...",22.9,Lanches
2,3,X-Frango Grelhado,"Peito de frango grelhado, queijo, alface, toma...",18.5,Lanches
3,4,Bauru Tradicional,"Presunto, queijo, tomate, pickles e or√©gano no...",12.9,Lanches
4,5,Prato Feito Completo,"Arroz, feij√£o, bife acebolado, ovo frito, faro...",18.9,Pratos Executivos


In [67]:
# --- assumindo que dfs j√° cont√©m os DataFrames ---
clientes = dfs['"Clientes"'].copy()
produtos = dfs['"Produtos"'].copy()
pedidos = dfs['"Pedidos"'].copy()
itens = dfs['"ItensPedido"'].copy()

# Criar colunas auxiliares
clientes['Idade'] = clientes['DataNascimento'].apply(lambda x: (pd.Timestamp('today') - pd.to_datetime(x)).days // 365)
pedidos['Mes'] = pedidos['DataPedido'].dt.to_period('M')
pedidos['Ano'] = pedidos['DataPedido'].dt.year

In [68]:
"""
Indicador simples que visa conhecer a faixa et√°ria do seu p√∫blico,
o que ajuda o empreendedor a direcionar suas estrat√©gias de produto
e marketing para que seja mais assertivo.
"""
# 1. Idade m√©dia dos clientes
idade_media = clientes['Idade'].mean()
print(f"üìä Idade m√©dia dos clientes: {idade_media:.1f} anos")

fig = px.histogram(clientes, x='Idade', nbins=20, title='Distribui√ß√£o de Idade dos Clientes')
fig.show()

üìä Idade m√©dia dos clientes: 37.8 anos


In [69]:
"""
Indicador que viabiliza ver o progresso do empreendimento, mais especificamente
os leads que se concretizaram.
"""
# 2. Cadastros de clientes por m√™s
cadastros_por_mes = clientes.groupby(clientes['DataCadastro'].dt.to_period('M')).size()
fig = px.line(x=cadastros_por_mes.index.astype(str), y=cadastros_por_mes.values,
              title='Cadastros de Clientes por M√™s',
              labels={'x': 'M√™s', 'y': 'Qtd. Cadastros'})
fig.show()

In [70]:
"""
Ainda com o intuito de tamb√©m conhecer o p√∫blico, esse indicador permite ir
mais profundo na an√°lise de perfil, pois embora com idades semelhantes, pode haver 
peculiariedade entre g√™neros distintos.
"""
# 3. Distribui√ß√£o de g√™nero
fig = px.pie(clientes, names='Genero', title='Distribui√ß√£o de G√™nero')
fig.show()

In [71]:
"""
Indicador para analisar a distribui√ß√£o de pedidos por cliente
para seja vista a volumetria m√©dia que um cliente costuma pedir
"""
# 4. M√©dia de pedidos por cliente
pedidos_por_cliente = pedidos.groupby('ClienteId').size()
media_pedidos_cliente = pedidos_por_cliente.mean()
print(f"üìä M√©dia de pedidos por cliente: {media_pedidos_cliente:.1f}")

üìä M√©dia de pedidos por cliente: 166.7


In [72]:
"""
Visualiza√ß√£o do andamento da volumetria mensal para tomadas
de decis√µes e an√°lise de per√≠odos de alta e de baixa.
"""
# 5. Pedidos por m√™s
pedidos_por_mes = pedidos.groupby('Mes').size()
fig = px.line(x=pedidos_por_mes.index.astype(str), y=pedidos_por_mes.values,
              title='Pedidos por M√™s',
              labels={'x': 'M√™s', 'y': 'Qtd. Pedidos'})
fig.show()

In [73]:
"""
Indicador importante para ver onde a maior dor tem sido gerada e,
consequentemente, onde atuar com mais crit√©rio para aumentar a receita
e ver as dores dos clientes que os fazem cancelar o pedido.
"""
# 6. Taxa de cancelamento por tipo de entrega
cancelamentos = pedidos[pedidos['Status'] == 'Cancelado']
total_cancelamentos = len(cancelamentos)

taxa_cancel_tipo = cancelamentos.groupby('TipoEntrega').size() / total_cancelamentos * 100
print("üìä Taxa de Cancelamento por Tipo de Entrega (% sobre cancelados):")
print(taxa_cancel_tipo)

fig = px.bar(x=taxa_cancel_tipo.index, y=taxa_cancel_tipo.values,
             title='Taxa de Cancelamento por Tipo de Entrega',
             labels={'x': 'Tipo de Entrega', 'y': 'Percentual (%)'})
fig.show()

üìä Taxa de Cancelamento por Tipo de Entrega (% sobre cancelados):
TipoEntrega
Balc√£o      52.302026
Delivery    47.697974
dtype: float64


In [74]:
# 7. Receita mensal: entregues vs cancelados
receita_entregue = pedidos[pedidos['Status'] == 'Entregue'].groupby('Mes')['ValorTotal'].sum()
receita_cancelado = pedidos[pedidos['Status'] == 'Cancelado'].groupby('Mes')['ValorTotal'].sum()

fig_line = px.line(title='Receita Mensal: Entregues vs Cancelados')
fig_line.add_scatter(x=receita_entregue.index.astype(str), y=receita_entregue.values, name='Entregues')
fig_line.add_scatter(x=receita_cancelado.index.astype(str), y=receita_cancelado.values, name='Cancelados')
fig_line.show()

# diferen√ßa mensal
receita_diff = (receita_entregue - receita_cancelado).fillna(0)
fig_bar = px.bar(x=receita_diff.index.astype(str), y=receita_diff.values,
                 title="Diferen√ßa Mensal de Receita (Entregue - Cancelado)",
                 labels={"x": "M√™s", "y": "Diferen√ßa Receita (R$)"})
fig_bar.show()

# receita anual
receita_anual = pedidos[pedidos['Status'] == 'Entregue'].groupby('Ano')['ValorTotal'].sum()
print("üìÖ Receita Anual por Ano:")
print(receita_anual)

üìÖ Receita Anual por Ano:
Ano
2024    189954.1
Name: ValorTotal, dtype: float64


In [75]:
"""
Visualiza√ß√£o dos carros chefe do empreendimento para direcionar energia
para produtos que trazem retorno significativo. Al√©m do mais, √© feita uma 
an√°lise por g√™nero para identificar os "microp√∫blicos" em cada produto.
"""
# 8. Top 5 produtos mais vendidos (geral)
produtos_vazao = itens.groupby('ProdutoId')['Quantidade'].sum().reset_index()
produtos_vazao = produtos_vazao.merge(produtos[['Id', 'Nome']], left_on='ProdutoId', right_on='Id')
top5 = produtos_vazao.sort_values(by='Quantidade', ascending=False).head(5)

fig = px.bar(top5, x='Nome', y='Quantidade', title='Top 5 Produtos Mais Vendidos')
fig.show()

# An√°lise do p√∫blico consumidor (g√™nero) para cada produto do top5
itens_clientes = itens.merge(pedidos[['Id', 'ClienteId']], left_on='PedidoId', right_on='Id')
itens_clientes = itens_clientes.merge(clientes[['Id', 'Genero']], left_on='ClienteId', right_on='Id')

for _, row in top5.iterrows():
    pid, nome = row['ProdutoId'], row['Nome']
    subset = itens_clientes[itens_clientes['ProdutoId'] == pid]
    genero_dist = subset.groupby('Genero')['Quantidade'].sum()

    fig = px.pie(names=genero_dist.index, values=genero_dist.values,
                 title=f"P√∫blico Consumidor do Produto: {nome}")
    fig.show()