# Análise Exploratória de Dados - Vendas E-commerce

Este notebook contém a análise exploratória dos dados de vendas para identificar padrões e insights.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

# Configurações de visualização
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
%matplotlib inline

## 1. Carregamento dos Dados

In [None]:
# Carregar dados
df = pd.read_csv('../datasets/sales_data.csv')

# Informações básicas
print(f"Shape dos dados: {df.shape}")
print(f"\nTipos de dados:")
print(df.dtypes)

# Primeiras linhas
df.head()

## 2. Análise Descritiva

In [None]:
# Estatísticas descritivas
df.describe()

In [None]:
# Análise por categoria
category_analysis = df.groupby('category').agg({
    'total_amount': ['sum', 'mean', 'count'],
    'quantity': 'sum',
    'rating': 'mean'
}).round(2)

category_analysis.columns = ['Total_Revenue', 'Avg_Order_Value', 'Order_Count', 'Total_Quantity', 'Avg_Rating']
category_analysis = category_analysis.sort_values('Total_Revenue', ascending=False)
category_analysis

## 3. Visualizações

In [None]:
# Gráfico de vendas por categoria
fig, axes = plt.subplots(2, 2, figsize=(15, 12))

# Receita por categoria
category_revenue = df.groupby('category')['total_amount'].sum().sort_values(ascending=False)
axes[0,0].bar(category_revenue.index, category_revenue.values)
axes[0,0].set_title('Receita Total por Categoria')
axes[0,0].set_ylabel('Receita (R$)')
axes[0,0].tick_params(axis='x', rotation=45)

# Quantidade vendida por categoria
category_qty = df.groupby('category')['quantity'].sum().sort_values(ascending=False)
axes[0,1].bar(category_qty.index, category_qty.values, color='orange')
axes[0,1].set_title('Quantidade Vendida por Categoria')
axes[0,1].set_ylabel('Quantidade')
axes[0,1].tick_params(axis='x', rotation=45)

# Distribuição de preços
axes[1,0].hist(df['price'], bins=30, alpha=0.7, color='green')
axes[1,0].set_title('Distribuição de Preços')
axes[1,0].set_xlabel('Preço (R$)')
axes[1,0].set_ylabel('Frequência')

# Rating médio por categoria
category_rating = df.groupby('category')['rating'].mean().sort_values(ascending=False)
axes[1,1].bar(category_rating.index, category_rating.values, color='red')
axes[1,1].set_title('Rating Médio por Categoria')
axes[1,1].set_ylabel('Rating')
axes[1,1].tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.show()

## 4. Análise Temporal

In [None]:
# Converter data para datetime
df['sale_date'] = pd.to_datetime(df['sale_date'])
df['year_month'] = df['sale_date'].dt.to_period('M')

# Vendas mensais
monthly_sales = df.groupby('year_month')['total_amount'].sum()

plt.figure(figsize=(12, 6))
monthly_sales.plot(kind='line', marker='o')
plt.title('Evolução das Vendas Mensais')
plt.xlabel('Mês')
plt.ylabel('Receita (R$)')
plt.xticks(rotation=45)
plt.grid(True, alpha=0.3)
plt.show()

## 5. Análise de Clientes

In [None]:
# Análise por segmento de cliente
customer_analysis = df.groupby('customer_segment').agg({
    'customer_id': 'nunique',
    'total_amount': ['sum', 'mean'],
    'order_id': 'count'
}).round(2)

customer_analysis.columns = ['Unique_Customers', 'Total_Revenue', 'Avg_Order_Value', 'Total_Orders']
customer_analysis['Revenue_per_Customer'] = (customer_analysis['Total_Revenue'] / customer_analysis['Unique_Customers']).round(2)

print("Análise por Segmento de Cliente:")
customer_analysis

## 6. Top Produtos

In [None]:
# Top 10 produtos por receita
top_products = df.groupby('product_name').agg({
    'total_amount': 'sum',
    'quantity': 'sum',
    'rating': 'mean'
}).round(2)

top_products = top_products.sort_values('total_amount', ascending=False).head(10)
top_products.columns = ['Revenue', 'Quantity_Sold', 'Avg_Rating']

print("Top 10 Produtos por Receita:")
top_products

## 7. Insights e Conclusões

### Principais Descobertas:

1. **Categoria Dominante**: Eletrônicos representa a maior receita
2. **Sazonalidade**: Identificar padrões mensais de vendas
3. **Segmentação**: Clientes Premium geram maior valor por transação
4. **Qualidade**: Produtos com rating alto tendem a vender mais

### Recomendações:

1. Focar marketing em eletrônicos durante picos sazonais
2. Desenvolver programa de fidelidade para clientes Premium
3. Melhorar qualidade de produtos com rating baixo
4. Expandir categorias com alta margem de lucro