In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

# Configura√ß√µes
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")

print("‚úÖ Bibliotecas carregadas!")

In [None]:
# Carregar dados processados
df = pd.read_csv('../../data/processed/vendas_tratadas.csv')
df['data_venda'] = pd.to_datetime(df['data_venda'])
df.columns = df.columns.str.lower()

print(f"üìä {len(df)} vendas carregadas!")
print(f"üåé {df['regiao'].nunique()} regi√µes encontradas")
print(f"üìç Regi√µes: {df['regiao'].unique().tolist()}")

In [None]:
# AN√ÅLISE COMPLETA POR REGI√ÉO
print("="*80)
print("üåé PERFORMANCE POR REGI√ÉO")
print("="*80)

# Ajustado: id_produto -> id_pedido
regional = df.groupby('regiao').agg({
    'valor_total': ['sum', 'mean', 'median'],
    'quantidade': 'sum',
    'id_pedido': 'count' # Nome correto ap√≥s o str.lower()
}).round(2)

# Organizando as colunas
regional.columns = ['Receita Total', 'Ticket M√©dio', 'Ticket Mediano', 'Qtd Produtos', 'Num Vendas']
regional = regional.sort_values('Receita Total', ascending=False)

# Adicionar participa√ß√£o percentual
regional['% Receita'] = (regional['Receita Total'] / regional['Receita Total'].sum() * 100).round(2)

print(regional)
print("\n")

# Destacar a regi√£o l√≠der
regiao_lider = regional.index[0]
receita_lider = regional.loc[regiao_lider, 'Receita Total']
participacao = regional.loc[regiao_lider, '% Receita']

print(f"ü•á REGI√ÉO L√çDER: {regiao_lider}")
print(f"   üí∞ Receita: R$ {receita_lider:,.2f}")
print(f"   üìä Participa√ß√£o: {participacao}% do total")

In [None]:
# AN√ÅLISE POR VENDEDOR (TOP 10)
print("\n" + "="*80)
print("üë§ TOP 10 VENDEDORES")
print("="*80)

vendedores = df.groupby('vendedor').agg({
    'valor_total': ['sum', 'mean'],
    'id_pedido': 'count'
}).round(2)

vendedores.columns = ['Receita Total', 'Ticket M√©dio', 'Num Vendas']
vendedores = vendedores.sort_values('Receita Total', ascending=False).head(10)

print(vendedores)

# Vendedor destaque
vendedor_top = vendedores.index[0]
receita_vendedor = vendedores.loc[vendedor_top, 'Receita Total']
print(f"\nü•á Vendedor destaque: {vendedor_top} - R$ {receita_vendedor:,.2f}")

In [None]:
# MATRIZ: REGI√ÉO x CATEGORIA
print("\n" + "="*80)
print("üìä RECEITA POR REGI√ÉO E CATEGORIA")
print("="*80)

pivot_reg_cat = df.pivot_table(
    values='valor_total',
    index='regiao',
    columns='categoria',
    aggfunc='sum',
    fill_value=0
).round(2)

print(pivot_reg_cat)

# Identificar categoria mais forte por regi√£o
print("\nüéØ Categoria dominante por regi√£o:")
for regiao in pivot_reg_cat.index:
    cat_dominante = pivot_reg_cat.loc[regiao].idxmax()
    valor = pivot_reg_cat.loc[regiao, cat_dominante]
    print(f"   {regiao}: {cat_dominante} (R$ {valor:,.2f})")

In [None]:
# DASHBOARD COMPLETO DE PERFORMANCE REGIONAL
fig, axes = plt.subplots(2, 2, figsize=(18, 14))
fig.suptitle('üó∫Ô∏è AN√ÅLISE DE PERFORMANCE REGIONAL', fontsize=20, fontweight='bold', y=0.995)

# Gr√°fico 1: Receita por Regi√£o
regional['Receita Total'].plot(kind='bar', ax=axes[0, 0], color='teal', edgecolor='black')
axes[0, 0].set_title('üí∞ Receita Total por Regi√£o', fontsize=14, fontweight='bold', pad=10)
axes[0, 0].set_ylabel('Receita (R$)', fontsize=11)
axes[0, 0].set_xlabel('')
axes[0, 0].tick_params(axis='x', rotation=45, labelsize=10)
axes[0, 0].grid(axis='y', alpha=0.3)
axes[0, 0].yaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f'R$ {x/1000:.0f}K'))

for i, v in enumerate(regional['Receita Total']):
    axes[0, 0].text(i, v, f'R$ {v/1000:.0f}K', ha='center', va='bottom', fontsize=9, fontweight='bold')

# Gr√°fico 2: - Top 10 Vendedores
vendedores_top = df.groupby('vendedor')['valor_total'].sum().sort_values(ascending=False).head(10)
vendedores_top.sort_values().plot(kind='barh', ax=axes[0, 1], color='purple', edgecolor='black')
axes[0, 1].set_title('üë§ Top 10 Vendedores - Receita', fontsize=14, fontweight='bold', pad=10)
axes[0, 1].set_xlabel('Receita (R$)', fontsize=11)
axes[0, 1].grid(axis='x', alpha=0.3)
axes[0, 1].xaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f'R$ {x/1000:.0f}K'))

# Gr√°fico 3: Ticket M√©dio por Regi√£o
regional['Ticket M√©dio'].plot(kind='bar', ax=axes[1, 0], color='orange', edgecolor='black')
axes[1, 0].set_title('üé´ Ticket M√©dio por Regi√£o', fontsize=14, fontweight='bold', pad=10)
axes[1, 0].set_ylabel('Valor M√©dio (R$)', fontsize=11)
axes[1, 0].set_xlabel('')
axes[1, 0].tick_params(axis='x', rotation=45, labelsize=10)
axes[1, 0].grid(axis='y', alpha=0.3)

for i, v in enumerate(regional['Ticket M√©dio']):
    axes[1, 0].text(i, v, f'R$ {v:.0f}', ha='center', va='bottom', fontsize=9, fontweight='bold')

# Gr√°fico 4: - Distribui√ß√£o % de Vendas
vendas_regiao = df.groupby('regiao')['id_pedido'].count()
colors = sns.color_palette('Set2', len(vendas_regiao))
wedges, texts, autotexts = axes[1, 1].pie(
    vendas_regiao, 
    labels=vendas_regiao.index, 
    autopct='%1.1f%%',
    startangle=90, 
    colors=colors,
    textprops={'fontsize': 10, 'fontweight': 'bold'}
)
axes[1, 1].set_title('üìä Distribui√ß√£o % de Vendas por Regi√£o', fontsize=14, fontweight='bold', pad=10)

for autotext in autotexts:
    autotext.set_color('white')
    autotext.set_fontsize(11)

plt.tight_layout()
plt.savefig('../graficos/nome_do_arquivo.png', dpi=300, bbox_inches='tight')
plt.show()

print("‚úÖ Dashboard salvo com sucesso!")

In [None]:
# HEATMAP: Receita por Regi√£o e Categoria
plt.figure(figsize=(12, 6))

sns.heatmap(
    pivot_reg_cat, 
    annot=True, 
    fmt='.0f', 
    cmap='YlOrRd', 
    linewidths=0.5,
    cbar_kws={'label': 'Receita (R$)'}
)

plt.title('üî• Mapa de Calor: Receita por Regi√£o x Categoria', 
          fontsize=16, fontweight='bold', pad=15)
plt.xlabel('Categoria', fontsize=12, fontweight='bold')
plt.ylabel('Regi√£o', fontsize=12, fontweight='bold')
plt.xticks(rotation=45, ha='right')
plt.yticks(rotation=0)

plt.tight_layout()
plt.savefig('../../images/heatmap_regiao_categoria.png', dpi=300, bbox_inches='tight')
plt.show()
plt.figure(figsize=(12, 8))
plt.savefig('../graficos/nome_do_arquivo.png', dpi=300, bbox_inches='tight')

print("‚úÖ Heatmap salvo em: notebooks/graficos/heatmap_regiao_categoria.png")

In [None]:
# GERAR INSIGHTS AUTOM√ÅTICOS
print("\n" + "="*80)
print("üí° INSIGHTS ESTRAT√âGICOS - PERFORMANCE REGIONAL")
print("="*80)

# 1. Regi√£o l√≠der
regiao_top = regional.index[0]
receita_top = regional.loc[regiao_top, 'Receita Total']
participacao_top = regional.loc[regiao_top, '% Receita']

print(f"\nü•á REGI√ÉO DOMINANTE:")
print(f"   ‚Üí {regiao_top} lidera com R$ {receita_top:,.2f}")
print(f"   ‚Üí Representa {participacao_top}% da receita total")
print(f"   ‚Üí Ticket m√©dio: R$ {regional.loc[regiao_top, 'Ticket M√©dio']:,.2f}")

# 2. Regi√£o com maior ticket m√©dio
regiao_maior_ticket = regional['Ticket M√©dio'].idxmax()
ticket_max = regional.loc[regiao_maior_ticket, 'Ticket M√©dio']

print(f"\nüí∞ MAIOR TICKET M√âDIO:")
print(f"   ‚Üí {regiao_maior_ticket}: R$ {ticket_max:,.2f}")

# 3. Regi√£o com mais vendas
regiao_mais_vendas = regional['Num Vendas'].idxmax()
num_vendas = regional.loc[regiao_mais_vendas, 'Num Vendas']

print(f"\nüìä MAIOR VOLUME DE VENDAS:")
print(f"   ‚Üí {regiao_mais_vendas}: {num_vendas:.0f} vendas")

# 4. Disparidade regional
maior_receita = regional['Receita Total'].max()
menor_receita = regional['Receita Total'].min()
disparidade = (maior_receita / menor_receita - 1) * 100

print(f"\n‚ö†Ô∏è  DISPARIDADE REGIONAL:")
print(f"   ‚Üí Diferen√ßa de {disparidade:.1f}% entre a regi√£o l√≠der e a menor")

# 5. Potencial de crescimento
regiao_potencial = regional.index[-1]  # Regi√£o com menor receita
receita_potencial = regional.loc[regiao_potencial, 'Receita Total']

print(f"\nüéØ OPORTUNIDADE DE CRESCIMENTO:")
print(f"   ‚Üí {regiao_potencial} tem o menor faturamento (R$ {receita_potencial:,.2f})")
print(f"   ‚Üí Potencial de expans√£o e investimento")

print("\n" + "="*80)

In [None]:
# RECOMENDA√á√ïES ESTRAT√âGICAS
print("\n" + "="*80)
print("üéØ RECOMENDA√á√ïES ESTRAT√âGICAS")
print("="*80)

# Baseado nos dados
regiao_lider = regional.index[0]
regiao_menor = regional.index[-1]
cat_forte_lider = pivot_reg_cat.loc[regiao_lider].idxmax()

print(f"\n1Ô∏è‚É£  EXPANS√ÉO:")
print(f"   ‚Üí Investir em marketing na regi√£o {regiao_menor}")
print(f"   ‚Üí Replicar estrat√©gias de sucesso do {regiao_lider}")

print(f"\n2Ô∏è‚É£  PRODUTOS:")
print(f"   ‚Üí Categoria '{cat_forte_lider}' forte no {regiao_lider}")
print(f"   ‚Üí Considerar expandir portf√≥lio similar em outras regi√µes")

print(f"\n3Ô∏è‚É£  TICKET M√âDIO:")
if regiao_maior_ticket != regiao_lider:
    print(f"   ‚Üí {regiao_maior_ticket} tem alto ticket m√©dio mas menor volume")
    print(f"   ‚Üí Oportunidade de aumentar convers√£o mantendo qualidade")

print(f"\n4Ô∏è‚É£  DISTRIBUI√á√ÉO:")
print(f"   ‚Üí Avaliar log√≠stica para regi√µes com menor presen√ßa")
print(f"   ‚Üí Parcerias locais podem reduzir custos")

print("\n" + "="*80)

In [None]:
# Definindo o caminho para a pasta de gr√°ficos (dentro de notebooks)
caminho_graficos = '../graficos/dashboard_regional.png'

# Salvando na pasta de gr√°ficos
plt.savefig(caminho_graficos, dpi=300, bbox_inches='tight')

# Mantendo o salvamento na pasta de imagens geral para o relat√≥rio final
plt.savefig('../graficos/nome_do_arquivo.png', dpi=300, bbox_inches='tight')

print(f"‚úÖ Dashboard salvo em: notebooks/graficos/dashboard_regional.png")

In [None]:
import pandas as pd
import sqlite3

# Conectar ao banco
conn = sqlite3.connect('../../sql/vendas_database.db')

# Exemplo de Query SQL: Ranking de Vendedores por Receita
query = """
SELECT 
    vendedor, 
    SUM(valor_total) as receita_total,
    COUNT(id_pedido) as total_vendas
FROM vendas
GROUP BY vendedor
ORDER BY receita_total DESC
LIMIT 5
"""

# Ler o resultado do SQL direto para um DataFrame
df_sql = pd.read_sql_query(query, conn)
conn.close()

print("üìä Resultado via Query SQL:")
df_sql

In [None]:
import sqlite3
import pandas as pd

# Conectando ao seu banco de dados na pasta sql
conn = sqlite3.connect('../../sql/vendas_database.db')

# Esta query faz o c√°lculo matem√°tico da Curva ABC
query_vendedores_abc = """
WITH faturamento_vendedor AS (
    SELECT 
        vendedor,
        SUM(valor_total) as receita_vendedor
    FROM vendas
    GROUP BY vendedor
),
acumulado_vendedor AS (
    SELECT 
        vendedor,
        receita_vendedor,
        SUM(receita_vendedor) OVER (ORDER BY receita_vendedor DESC) as receita_acumulada,
        SUM(receita_vendedor) OVER () as receita_total_geral
    FROM faturamento_vendedor
)
SELECT 
    vendedor,
    receita_vendedor,
    ROUND((receita_acumulada / receita_total_geral) * 100, 2) as pct_acumulado,
    CASE 
        WHEN (receita_acumulada / receita_total_geral) <= 0.80 THEN 'A (Top)'
        WHEN (receita_acumulada / receita_total_geral) <= 0.95 THEN 'B (M√©dio)'
        ELSE 'C (Baixo)'
    END as categoria_vendedor
FROM acumulado_vendedor
ORDER BY receita_vendedor DESC;
"""

# Executa a query e transforma em uma tabela (DataFrame)
df_vendedores_abc = pd.read_sql_query(query_vendedores_abc, conn)
conn.close()

# Mostra o resultado na tela do VS Code
df_vendedores_abc

# üìà Insights da An√°lise de Performance
Ap√≥s processar os dados de 2025, identificamos os seguintes pontos-chave:

### 1. Curva ABC de Vendedores
* *Classe A:* Um pequeno grupo de vendedores √© respons√°vel por 80% do faturamento. 
* *A√ß√£o sugerida:* Entender as t√°ticas desses vendedores para replicar no restante do time.

### 2. Concentra√ß√£o Regional
* A regi√£o *[insira a regi√£o l√≠der aqui]* domina as vendas, enquanto a regi√£o *[insira a menor aqui]* possui o maior potencial de expans√£o.

### 3. Mix de Produtos
* Identificamos que a categoria *[categoria top]* possui o melhor Ticket M√©dio, sendo a mais rent√°vel para a empresa.
*

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Criando o gr√°fico de barras
plt.figure(figsize=(10, 6))
sns.barplot(data=df_vendedores_abc, x='vendedor', y='receita_vendedor', hue='categoria_vendedor')

# Formatando o gr√°fico
plt.title('Performance dos Vendedores por Categoria ABC', fontsize=14)
plt.xticks(rotation=45)
plt.ylabel('Receita Total (R$)')
plt.xlabel('Vendedor')

# Salvando na sua pasta de gr√°ficos
plt.savefig('../graficos/nome_do_arquivo.png', dpi=300, bbox_inches='tight')
plt.show()

In [None]:
import sqlite3
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 1. Conectar ao banco na pasta sql
conn = sqlite3.connect('../../sql/vendas_database.db')

# 2. Query para agrupar faturamento por m√™s
query_mensal = """
SELECT 
    strftime('%m', data_venda) as mes,
    SUM(valor_total) as faturamento
FROM vendas
GROUP BY mes
ORDER BY mes
"""

df_mensal = pd.read_sql_query(query_mensal, conn)
conn.close()

# 3. Criar o gr√°fico de linha para ver a tend√™ncia
plt.figure(figsize=(12, 5))
sns.lineplot(data=df_mensal, x='mes', y='faturamento', marker='o', color='green', linewidth=2.5)

plt.title('Evolu√ß√£o do Faturamento Mensal - 2025', fontsize=14, fontweight='bold')
plt.xlabel('M√™s do Ano')
plt.ylabel('Receita (R$)')
plt.grid(True, alpha=0.3)

# Salvar na pasta correta
plt.savefig('../graficos/sazonalidade_mensal.png', bbox_inches='tight')
plt.show()
import sqlite3
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 1. Conectar ao banco na pasta sql
conn = sqlite3.connect('../../sql/vendas_database.db')

# 2. Query para agrupar faturamento por m√™s
query_mensal = """
SELECT 
    strftime('%m', data_venda) as mes,
    SUM(valor_total) as faturamento
FROM vendas
GROUP BY mes
ORDER BY mes
"""

df_mensal = pd.read_sql_query(query_mensal, conn)
conn.close()

# 3. Criar o gr√°fico de linha para ver a tend√™ncia
plt.figure(figsize=(12, 5))
sns.lineplot(data=df_mensal, x='mes', y='faturamento', marker='o', color='green', linewidth=2.5)

plt.title('Evolu√ß√£o do Faturamento Mensal - 2025', fontsize=14, fontweight='bold')
plt.xlabel('M√™s do Ano')
plt.ylabel('Receita (R$)')
plt.grid(True, alpha=0.3)

# Salvar na pasta correta
plt.savefig('../graficos/nome_do_arquivo.png', dpi=300, bbox_inches='tight')
plt.show()

In [None]:
# Exportando os resultados para CSV/Excel para uso externo
df_vendedores_abc.to_csv('../../data/processed/vendedores_abc.csv', index=False)
df_mensal.to_csv('../../data/processed/faturamento_mensal.csv', index=False)

print("üíæ Tabelas exportadas com sucesso para a pasta data/processed!")