# üìä An√°lise Explorat√≥ria de Dados de Vendas

Este notebook realiza uma an√°lise explorat√≥ria de um conjunto de dados fict√≠cio de vendas. O objetivo √© demonstrar etapas t√≠picas de an√°lise de dados, como:

- Gera√ß√£o e visualiza√ß√£o de dados
- Limpeza e transforma√ß√£o
- Gera√ß√£o de insights

---

In [None]:
# üì¶ Instalar bibliotecas necess√°rias
!pip install pandas matplotlib seaborn

## üìö Importa√ß√£o das Bibliotecas

In [None]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

sns.set(style="whitegrid")

## üß™ Gera√ß√£o de Dados Fict√≠cios

Vamos simular um dataset de vendas com colunas como:
- Data da Venda
- Produto
- Categoria
- Quantidade
- Pre√ßo Unit√°rio
- Regi√£o

In [None]:
# Semente para reprodutibilidade
np.random.seed(42)
num_rows = 200

produtos = ['Notebook', 'Mouse', 'Teclado', 'Monitor', 'Impressora']
categorias = ['Inform√°tica', 'Acess√≥rios', 'Perif√©ricos']
regioes = ['Sul', 'Sudeste', 'Centro-Oeste', 'Norte', 'Nordeste']

# Gera√ß√£o do DataFrame
df = pd.DataFrame({
    'Data da Venda': pd.date_range(start='2024-01-01', periods=num_rows, freq='D'),
    'Produto': np.random.choice(produtos, num_rows),
    'Categoria': np.random.choice(categorias, num_rows),
    'Quantidade': np.random.randint(1, 10, num_rows),
    'Pre√ßo Unit√°rio': np.random.uniform(100, 1500, num_rows).round(2),
    'Regi√£o': np.random.choice(regioes, num_rows)
})

df.head()

## üßº Limpeza e Pr√©-processamento

Vamos criar uma nova coluna `Faturamento` e remover dados ausentes.

In [None]:
df.dropna(inplace=True)
df['Faturamento'] = df['Quantidade'] * df['Pre√ßo Unit√°rio']
df.head()

## üìà Visualiza√ß√µes

### 1. Faturamento por Categoria

In [None]:
plt.figure(figsize=(8, 5))
sns.barplot(data=df.groupby('Categoria')['Faturamento'].sum().reset_index(),
            x='Categoria', y='Faturamento', palette='viridis')
plt.title('Faturamento por Categoria')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

### 2. Faturamento por Regi√£o

In [None]:
plt.figure(figsize=(8, 5))
sns.barplot(data=df.groupby('Regi√£o')['Faturamento'].sum().reset_index(),
            x='Regi√£o', y='Faturamento', palette='magma')
plt.title('Faturamento por Regi√£o')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

### 3. Tend√™ncia de Faturamento ao Longo do Tempo

In [None]:
df_grouped = df.groupby('Data da Venda')['Faturamento'].sum().reset_index()

plt.figure(figsize=(10, 5))
sns.lineplot(data=df_grouped, x='Data da Venda', y='Faturamento', color='dodgerblue')
plt.title('Tend√™ncia de Faturamento Di√°rio')
plt.tight_layout()
plt.show()

## ‚úÖ Conclus√µes

- A categoria com maior faturamento pode indicar foco de vendas.
- Regi√µes com menor desempenho podem ser analisadas para melhoria.
- A tend√™ncia de vendas ajuda a prever sazonalidades.

---

Criado por Anderson SIlva ‚Ä¢ Projeto de aperfei√ßoamento