# Análise de Vendas

Neste notebook vamos analisar um banco de dados de vendas usando:
- SQL (SQLite)
- Python
- Pandas
- Matplotlib
- Seaborn

O objetivo é extrair insights sobre produtos, clientes e vendas.

## 1️⃣ Importando Bibliotecas

In [None]:
import sqlite3
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configurações gerais de visualização
plt.style.use('seaborn-whitegrid')
sns.set_palette('Set2')

## 2️⃣ Conectando ao Banco de Dados

In [None]:
# Conectar ao SQLite
conn = sqlite3.connect('../data/vendas.db')

# Consulta SQL para obter todos os dados
query = '''
SELECT id, data_venda, produto, quantidade, valor_unitario, cliente, sexo_cliente, hora
FROM vendas;
'''

# Ler os dados no Pandas
df = pd.read_sql_query(query, conn)
conn.close()

# Visualizar os primeiros registros
df.head()

## 3️⃣ Preparando os Dados

In [None]:
# Criar coluna de valor total
df['valor_total'] = df['quantidade'] * df['valor_unitario']

# Converter data_venda para datetime
df['data_venda'] = pd.to_datetime(df['data_venda'])

# Estatísticas básicas
df.describe()

## 4️⃣ Análise Exploratória

In [None]:
# Total de vendas por produto
vendas_produto = df.groupby('produto')['valor_total'].sum().reset_index()
vendas_produto

In [None]:
# Total de vendas por dia
vendas_dia = df.groupby('data_venda')['valor_total'].sum().reset_index()
vendas_dia

In [None]:
# Média de vendas por sexo do cliente
media_sexo = df.groupby('sexo_cliente')['valor_total'].mean().reset_index()
media_sexo

## 5️⃣ Visualização com Matplotlib

In [None]:
# Gráfico de barras: total de vendas por produto
plt.figure(figsize=(8,5))
plt.bar(vendas_produto['produto'], vendas_produto['valor_total'], color='skyblue')
plt.title('Total de Vendas por Produto')
plt.xlabel('Produto')
plt.ylabel('Valor Total')
plt.show()

In [None]:
# Gráfico de linha: vendas por dia
plt.figure(figsize=(10,5))
plt.plot(vendas_dia['data_venda'], vendas_dia['valor_total'], marker='o')
plt.title('Vendas por Dia')
plt.xlabel('Data')
plt.ylabel('Valor Total')
plt.xticks(rotation=45)
plt.show()

## 6️⃣ Visualização com Seaborn

In [None]:
# Boxplot: valor total por produto
plt.figure(figsize=(8,5))
sns.boxplot(data=df, x='produto', y='valor_total', palette='Set2')
plt.title('Distribuição do Valor Total por Produto')
plt.show()

In [None]:
# Scatterplot: quantidade vs valor total
plt.figure(figsize=(8,5))
sns.scatterplot(data=df, x='quantidade', y='valor_total', hue='produto', size='valor_total', palette='Set2')
plt.title('Quantidade vs Valor Total por Produto')
plt.show()

In [None]:
# Heatmap: correlação entre variáveis numéricas
plt.figure(figsize=(6,5))
corr = df[['quantidade', 'valor_unitario', 'valor_total', 'hora']].corr()
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.title('Mapa de Correlação')
plt.show()

## 7️⃣ Insights Obtidos

- Produtos mais vendidos em valor total
- Dias com maior faturamento
- Diferença de compras entre clientes por sexo
- Relação entre quantidade vendida e valor total

Este notebook integra SQL, Python, Pandas, Matplotlib e Seaborn em um workflow completo de análise de dados.