# <font color='blue'>Análise de Vendas em E-commerce com Python</font>
## <font color='blue'>Por Afonso Martins</font>

### 🔍 Sobre o Projeto
Análise exploratória de dados de vendas em uma loja de e-commerce utilizando **Python, Pandas, NumPy e Matplotlib**.  
O objetivo é identificar padrões de consumo, produtos mais vendidos e indicadores de desempenho.

### 🧠 Tecnologias
Python • Pandas • NumPy • Matplotlib • Jupyter Notebook / VS Code

### 👨‍💻 Autor
**Afonso Martins**  
💻 [github.com/afonsomartins](https://github.com/afonsomartins)



## 📊 1.1 Problema de Negócio
A loja de e-commerce está em expansão, com um volume crescente de transações diárias. No entanto, o grande volume de dados ainda não é plenamente aproveitado — decisões estratégicas são tomadas com base em percepções e não em evidências concretas. Isso gera alguns desafios:

- 🏬 **Gestão de Estoque Ineficiente:** Falta clareza sobre os produtos mais vendidos e os que têm baixa rotatividade, resultando em excesso de estoque ou falta de itens de alta demanda.
- 🎯 **Marketing Genérico:** As campanhas não são segmentadas por categoria ou região, reduzindo o retorno sobre o investimento.
- 📆 **Perda de Oportunidades Sazonais:** Ausência de análises temporais impede o aproveitamento de períodos de alta ou o estímulo de vendas em períodos de baixa.
- 🌎 **Expansão sem Direção:** A falta de visibilidade regional dificulta decisões sobre logística e novos mercados.

O principal problema é a **ausência de visibilidade analítica sobre a performance do negócio**, o que limita decisões rápidas, precisas e baseadas em dados.

---

## 🎯 1.2 Objetivos do Projeto
Transformar os dados brutos de vendas em **insights acionáveis** que orientem decisões estratégicas. As principais perguntas de negócio a serem respondidas são:

- 💡 **O que vender?** Identificar os produtos de maior e menor desempenho.  
- 🧭 **Onde focar?** Detectar as categorias mais rentáveis e as regiões com maior representatividade.  
- ⏰ **Quando agir?** Compreender a sazonalidade e os períodos de pico de vendas.  
- 🚀 **Para onde expandir?** Mapear o potencial de crescimento regional.

---

## 🧩 1.3 Solução Proposta
Consolidar, limpar e analisar o histórico de vendas utilizando **Python**, **Pandas**, **NumPy** e **Matplotlib**, para construir um **relatório visual e interativo** com os principais indicadores do negócio. O foco é gerar **informações objetivas e acessíveis** para as áreas de gestão, marketing e operações.

---

## 📈 1.4 Resultados Esperados e Benefícios
- 📦 **Otimização de Estoque:** Reduzir custos e perdas, garantindo a disponibilidade de produtos de alta demanda.  
- 📢 **Marketing Direcionado:** Criar campanhas mais segmentadas e eficientes.  
- 📊 **Planejamento Estratégico:** Antecipar tendências e ajustar recursos de forma proativa.  
- 💼 **Cultura Data-Driven:** Sustentar o crescimento com base em dados e indicadores concretos.


## 2. Importação das Bibliotecas para usarmos no projeto


In [1]:

# Manipulação e análise de dados
import pandas as pd
import numpy as np

# Visualização de dados
import matplotlib.pyplot as plt
import seaborn as sns

# Geração de números aleatórios
import random

# Manipulação de datas
from datetime import datetime, timedelta

# Configurações de exibição de gráficos no notebook
%matplotlib inline


In [8]:
%reload_ext watermark
%watermark -a "Afonso Martins"
%watermark -v
%watermark --iversions

Author: Afonso Martins

Python implementation: CPython
Python version       : 3.12.10
IPython version      : 9.6.0

pandas    : 2.3.3
seaborn   : 0.13.2
matplotlib: 3.10.7
numpy     : 2.3.4



## 3. Função Para Geração de Dados Fictícios


In [10]:
# Definição da função para gerar dados fictícios de vendas
def base_dados_ficticios(num_registros = 600):
    
    """
    Gera um DataFrame do Pandas com dados de vendas fictícios.

    """

    # Mensagem inicial indicando a quantidade de registros a serem gerados
    print(f"\nIniciando a geração de {num_registros} registros de vendas...")

    # Dicionário com produtos, suas categorias e preços
    produtos = {
        'Laptop Gamer': {'categoria': 'Eletrônicos', 'preco': 7500.00},
        'Mouse Vertical': {'categoria': 'Acessórios', 'preco': 250.00},
        'Teclado Mecânico': {'categoria': 'Acessórios', 'preco': 550.00},
        'Monitor Ultrawide': {'categoria': 'Eletrônicos', 'preco': 2800.00},
        'Cadeira Gamer': {'categoria': 'Móveis', 'preco': 1200.00},
        'Headset 7.1': {'categoria': 'Acessórios', 'preco': 800.00},
        'Placa de Vídeo': {'categoria': 'Hardware', 'preco': 4500.00},
        'SSD 1TB': {'categoria': 'Hardware', 'preco': 600.00}
    }

    # Cria uma lista apenas com os nomes dos produtos
    lista_produtos = list(produtos.keys())

    # Dicionário com cidades e seus respectivos estados
    cidades_estados = {
        'São Paulo': 'SP', 'Rio de Janeiro': 'RJ', 'Belo Horizonte': 'MG',
        'Porto Alegre': 'RS', 'Salvador': 'BA', 'Curitiba': 'PR', 'Fortaleza': 'CE'
    }

    # Cria uma lista apenas com os nomes das cidades
    lista_cidades = list(cidades_estados.keys())

    # Lista que armazenará os registros de vendas
    dados_vendas = []

    # Define a data inicial dos pedidos
    data_inicial = datetime(2026, 1, 1)

    # Loop para gerar os registros de vendas
    for i in range(num_registros):
        
        # Seleciona aleatoriamente um produto
        produto_nome = random.choice(lista_produtos)

        # Seleciona aleatoriamente uma cidade
        cidade = random.choice(lista_cidades)

        # Gera uma quantidade de produtos vendida entre 1 e 7
        quantidade = np.random.randint(1, 8)

        # Calcula a data do pedido a partir da data inicial
        data_pedido = data_inicial + timedelta(days = int(i/5), hours = random.randint(0, 23))

        # Se o produto for Mouse ou Teclado, aplica desconto aleatório de até 10%
        if produto_nome in ['Mouse Vertical', 'Teclado Mecânico']:
            preco_unitario = produtos[produto_nome]['preco'] * np.random.uniform(0.9, 1.0)
        else:
            preco_unitario = produtos[produto_nome]['preco']

        # Adiciona um registro de venda à lista
        dados_vendas.append({
            'ID_Pedido': 1000 + i,
            'Data_Pedido': data_pedido,
            'Nome_Produto': produto_nome,
            'Categoria': produtos[produto_nome]['categoria'],
            'Preco_Unitario': round(preco_unitario, 2),
            'Quantidade': quantidade,
            'ID_Cliente': np.random.randint(100, 150),
            'Cidade': cidade,
            'Estado': cidades_estados[cidade]
        })
    
    # Mensagem final indicando que a geração terminou
    print("Geração de dados concluída.\n")

    # Retorna os dados no formato de DataFrame
    return pd.DataFrame(dados_vendas)

## 4. Gerar, Carregar e Explorar os Dados


In [26]:
#Gera o DataFrame com dados fictícios de vendas
df_vendas = base_dados_ficticios(600)



Iniciando a geração de 600 registros de vendas...
Geração de dados concluída.



In [19]:
# verificação de quantidade de registros e colunas
df_vendas.shape

(600, 9)

In [27]:
#exibição das 5 primeiras linhas do DataFrame
df_vendas.head()


Unnamed: 0,ID_Pedido,Data_Pedido,Nome_Produto,Categoria,Preco_Unitario,Quantidade,ID_Cliente,Cidade,Estado
0,1000,2026-01-01 14:00:00,Laptop Gamer,Eletrônicos,7500.0,1,121,Porto Alegre,RS
1,1001,2026-01-01 19:00:00,Cadeira Gamer,Móveis,1200.0,7,107,Rio de Janeiro,RJ
2,1002,2026-01-01 15:00:00,Placa de Vídeo,Hardware,4500.0,1,128,Fortaleza,CE
3,1003,2026-01-01 16:00:00,Monitor Ultrawide,Eletrônicos,2800.0,5,147,Belo Horizonte,MG
4,1004,2026-01-01 10:00:00,Headset 7.1,Acessórios,800.0,2,120,São Paulo,SP


In [28]:
#exibir as ultimas 5 linhas do DataFrame
df_vendas.tail()

Unnamed: 0,ID_Pedido,Data_Pedido,Nome_Produto,Categoria,Preco_Unitario,Quantidade,ID_Cliente,Cidade,Estado
595,1595,2026-04-30 18:00:00,Placa de Vídeo,Hardware,4500.0,2,131,Salvador,BA
596,1596,2026-04-30 18:00:00,Monitor Ultrawide,Eletrônicos,2800.0,2,116,Porto Alegre,RS
597,1597,2026-04-30 10:00:00,Teclado Mecânico,Acessórios,513.0,7,149,São Paulo,SP
598,1598,2026-04-30 21:00:00,Teclado Mecânico,Acessórios,525.45,2,126,Rio de Janeiro,RJ
599,1599,2026-04-30 10:00:00,Teclado Mecânico,Acessórios,512.4,1,134,Porto Alegre,RS


In [29]:
#exibir informações gerais do DataFrame
df_vendas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 600 entries, 0 to 599
Data columns (total 9 columns):
 #   Column          Non-Null Count  Dtype         
---  ------          --------------  -----         
 0   ID_Pedido       600 non-null    int64         
 1   Data_Pedido     600 non-null    datetime64[ns]
 2   Nome_Produto    600 non-null    object        
 3   Categoria       600 non-null    object        
 4   Preco_Unitario  600 non-null    float64       
 5   Quantidade      600 non-null    int64         
 6   ID_Cliente      600 non-null    int64         
 7   Cidade          600 non-null    object        
 8   Estado          600 non-null    object        
dtypes: datetime64[ns](1), float64(1), int64(3), object(4)
memory usage: 42.3+ KB


In [30]:
#resumo estatístico do DataFrame
df_vendas.describe()

Unnamed: 0,ID_Pedido,Data_Pedido,Preco_Unitario,Quantidade,ID_Cliente
count,600.0,600,600.0,600.0,600.0
mean,1299.5,2026-03-01 23:27:00,2321.269067,4.008333,124.4
min,1000.0,2026-01-01 10:00:00,225.16,1.0,100.0
25%,1149.75,2026-01-30 23:00:00,586.6725,2.0,111.75
50%,1299.5,2026-03-01 21:30:00,1200.0,4.0,124.0
75%,1449.25,2026-03-31 18:45:00,3225.0,6.0,137.25
max,1599.0,2026-04-30 21:00:00,7500.0,7.0,149.0
std,173.349358,,2448.472638,1.966734,14.573858


In [31]:
# tipos de dados de cada coluna
df_vendas.dtypes

ID_Pedido                  int64
Data_Pedido       datetime64[ns]
Nome_Produto              object
Categoria                 object
Preco_Unitario           float64
Quantidade                 int64
ID_Cliente                 int64
Cidade                    object
Estado                    object
dtype: object