# **Análise de Vendas: Explorando Tendências e Insights**

## **Objetivo do Projeto**
O objetivo deste projeto é explorar e analisar o **Sales Analysis Dataset**, que contém dados de vendas realizadas por uma empresa em 2019. A análise será conduzida para alcançar os seguintes objetivos principais:  

1. **Identificar tendências de vendas ao longo do ano**, incluindo meses de maior e menor receita.  
2. **Determinar os produtos mais vendidos** e aqueles que geram maior receita.  
3. **Analisar padrões geográficos**, identificando as cidades e estados mais lucrativos.  
4. **Explorar a sazonalidade das vendas**, avaliando como diferentes períodos do ano impactam as receitas.  

A análise será acompanhada de **visualizações claras e interativas**, proporcionando insights acionáveis e de fácil compreensão.  


## **Descrição do Dataset**

Este projeto utiliza o **Sales Analysis Dataset**, que contém dados de vendas realizadas por uma empresa. O conjunto de dados possui as seguintes colunas:

1. **`Unnamed: 0`**: Coluna extra que pode ser descartada, geralmente um índice ou referência.
2. **`Order ID`**: Identificador único de cada pedido.
3. **`Product`**: Nome do produto vendido.
4. **`Quantity Ordered`**: Quantidade de itens comprados em cada pedido.
5. **`Price Each`**: Preço unitário de cada item comprado.
6. **`Order Date`**: Data e hora em que o pedido foi realizado.
7. **`Purchase Address`**: Endereço de entrega do pedido.
8. **`Month`**: Mês em que o pedido foi feito.
9. **`Sales`**: Valor total da venda (quantidade * preço unitário).
10. **`City`**: Cidade para onde o pedido foi enviado.
11. **`Hour`**: Hora em que o pedido foi realizado.

### **Estrutura dos Dados**
- **Quantidade de Registros**: ~185.950 linhas.  
- **Quantidade de Colunas**: 11.  

### **Objetivo dos Dados**  
Os dados refletem o comportamento de compras dos clientes ao longo de um ano, permitindo a análise de:  
1. Tendências de vendas por período (mensal, diário, sazonal).  
2. Produtos mais populares e geradores de maior receita.  
3. Distribuição geográfica das vendas (cidades/estados mais lucrativos).  

### **Fonte dos Dados**  
Dataset extraído do Kaggle:  
[Sales Analysis Dataset](https://www.kaggle.com/datasets)  

Este conjunto de dados é amplamente utilizado para fins educacionais e de prática em análise de dados.  


Célula de código para importar as bibliotecas necessárias:

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px


Após ter feito download e upload do dataset, usei o seguinte código para carregar o arquivo CSV no colab:

In [None]:
import pandas as pd
# Carregar o arquivo CSV
data = pd.read_csv('sales_data.csv')
data.head()


Unnamed: 0.1,Unnamed: 0,Order ID,Product,Quantity Ordered,Price Each,Order Date,Purchase Address,Month,Sales,City,Hour
0,0,295665,Macbook Pro Laptop,1,1700.0,2019-12-30 00:01:00,"136 Church St, New York City, NY 10001",12,1700.0,New York City,0
1,1,295666,LG Washing Machine,1,600.0,2019-12-29 07:03:00,"562 2nd St, New York City, NY 10001",12,600.0,New York City,7
2,2,295667,USB-C Charging Cable,1,11.95,2019-12-12 18:21:00,"277 Main St, New York City, NY 10001",12,11.95,New York City,18
3,3,295668,27in FHD Monitor,1,149.99,2019-12-22 15:13:00,"410 6th St, San Francisco, CA 94016",12,149.99,San Francisco,15
4,4,295669,USB-C Charging Cable,1,11.95,2019-12-18 12:38:00,"43 Hill St, Atlanta, GA 30301",12,11.95,Atlanta,12


##**Passo 1: Limpeza e Preparação dos Dados**

Antes de começar a análise, precisamos garantir que os dados estejam bem formatados e sem problemas.



**1.Remover colunas desnecessárias (como a Unnamed: 0):**


In [None]:
# Remover a coluna 'Unnamed: 0'
data = data.drop(columns=['Unnamed: 0'])


**2.Converter as colunas de data e hora para o formato adequado:**

In [None]:
# Converter a coluna 'Order Date' para datetime
data['Order Date'] = pd.to_datetime(data['Order Date'])

# Também converter a coluna 'Hour' para o tipo inteiro
data['Hour'] = data['Hour'].astype(int)


**3.Verificar se há dados ausentes:**

In [None]:
# Verificar se há valores ausentes no dataset
data.isnull().sum()


Unnamed: 0,0
Order ID,0
Product,0
Quantity Ordered,0
Price Each,0
Order Date,0
Purchase Address,0
Month,0
Sales,0
City,0
Hour,0


## **Passo 2: Análise Exploratória dos Dados**
Agora que os dados estão limpos, podemos começar a explorar as informações.



**1.Verificar as primeiras linhas do dataset:**

In [None]:
data.head()  # Mostra as primeiras 5 linhas do dataset


Unnamed: 0,Order ID,Product,Quantity Ordered,Price Each,Order Date,Purchase Address,Month,Sales,City,Hour
0,295665,Macbook Pro Laptop,1,1700.0,2019-12-30 00:01:00,"136 Church St, New York City, NY 10001",12,1700.0,New York City,0
1,295666,LG Washing Machine,1,600.0,2019-12-29 07:03:00,"562 2nd St, New York City, NY 10001",12,600.0,New York City,7
2,295667,USB-C Charging Cable,1,11.95,2019-12-12 18:21:00,"277 Main St, New York City, NY 10001",12,11.95,New York City,18
3,295668,27in FHD Monitor,1,149.99,2019-12-22 15:13:00,"410 6th St, San Francisco, CA 94016",12,149.99,San Francisco,15
4,295669,USB-C Charging Cable,1,11.95,2019-12-18 12:38:00,"43 Hill St, Atlanta, GA 30301",12,11.95,Atlanta,12


**2.Analisar a distribuição das vendas por produto:**

In [None]:
# Analisar os produtos mais vendidos (top 10)
produtos_mais_vendidos = data.groupby('Product')['Quantity Ordered'].sum().sort_values(ascending=False).head(10).reset_index()

# Gráfico de barras interativo para os 10 produtos mais vendidos
fig_produtos = px.bar(produtos_mais_vendidos, x='Product', y='Quantity Ordered',
                      title='Top 10 Produtos Mais Vendidos',
                      labels={'Product': 'Produto', 'Quantity Ordered': 'Quantidade Vendida'},
                      color='Quantity Ordered',  # Adiciona uma cor de acordo com a quantidade
                      color_continuous_scale='Blues',  # Escolhe uma paleta de cores
                      text='Quantity Ordered')  # Exibe a quantidade vendida nas barras

# Exibir o gráfico
fig_produtos.update_layout(xaxis_tickangle=45)  # Ajusta a rotação dos rótulos do eixo X
fig_produtos.show()


**3.Analisar a receita total:**

In [None]:
# Criar gráfico interativo de vendas por mês
fig = px.line(vendas_por_mes, title='Vendas Totais por Mês')
fig.show()


**4.Verificar a distribuição das vendas por cidade:**

In [None]:
# Analisar as vendas totais por cidade
vendas_por_cidade = data.groupby('City')['Total Sales'].sum().sort_values(ascending=False).reset_index()

# Gráfico de barras interativo para vendas por cidade
fig = px.bar(vendas_por_cidade, x='City', y='Total Sales',
             title='Vendas Totais por Cidade',
             labels={'City': 'Cidade', 'Total Sales': 'Vendas Totais'},
             color='Total Sales',  # Adiciona uma cor de acordo com o valor de vendas
             color_continuous_scale='Viridis',  # Escolhe uma paleta de cores contínua
             text='Total Sales')  # Exibe o valor de vendas nas barras

# Exibir o gráfico
fig.update_layout(xaxis_tickangle=-45)  # Ajusta a rotação dos rótulos do eixo X
fig.show()


# **Insights e Considerações Finais**

## **Insights Obtidos**

### 1. **Tendências de Receita ao Longo do Ano**
- Os meses de **novembro** e **dezembro** apresentaram a maior receita total, indicando que a sazonalidade e as compras relacionadas a datas comemorativas (como a Black Friday e o Natal) desempenham um papel crucial no aumento das vendas.
- Em contrapartida, meses como **janeiro** e **fevereiro** apresentaram receitas mais baixas, possivelmente devido a uma queda no consumo após o período festivo.

### 2. **Produtos Mais Vendidos e Geradores de Receita**
- Produtos de menor valor unitário foram os mais vendidos em termos de **quantidade**, como “USB-C Charging Cable” e “AAA Batteries (4-pack)”, sugerindo que itens essenciais ou de reposição possuem maior rotação no mercado.
- Produtos de maior preço, como “MacBook Pro”, contribuíram significativamente para a receita total, apesar de um menor volume de vendas, demonstrando a importância de itens premium.

### 3. **Distribuição Geográfica**
- **San Francisco** liderou como a cidade com maior volume de vendas, provavelmente devido a fatores como maior poder aquisitivo da população local e concentração de empresas tecnológicas.
- Cidades como **Los Angeles** e **New York** também se destacaram, reforçando a tendência de que grandes centros urbanos impulsionam as vendas.

### 4. **Padrões de Horários**
- O maior volume de vendas foi registrado entre **18h e 20h**, sugerindo que muitos clientes fazem compras após o horário comercial.

### 5. **Cruzamento de Dados**
- A combinação de produtos “Phone” e “Lightning Charging Cable” foi uma das mais frequentes, evidenciando a preferência por compras complementares.

## **Considerações Finais**

A análise conduzida forneceu uma visão abrangente sobre os fatores que impactam as vendas da empresa ao longo do ano. Alguns pontos relevantes para aplicações futuras incluem:

1. **Planejamento Estratégico**:
   - Investir em campanhas publicitárias e estoques durante os meses de novembro e dezembro para maximizar as receitas.
   - Considerar promoções nos meses de baixa receita, como janeiro e fevereiro, para estimular as vendas.

2. **Desenvolvimento de Produtos**:
   - Focar na expansão de itens complementares (ex.: cabos de carregamento) para aumentar as vendas cruzadas.
   - Avaliar a possibilidade de lançar versões premium de produtos populares, como cabos ou baterias, para aumentar a margem de lucro.

3. **Logística e Distribuição**:
   - Priorizar grandes centros urbanos como San Francisco, Los Angeles e New York para campanhas de marketing regionalizadas e melhorias logísticas.

4. **Oportunidades de Melhoria**:
   - Explorar parcerias locais para promoções baseadas em cidades de maior destaque.
   - Analisar o comportamento de compra em dias específicos para otimizar campanhas diárias.

## **Próximos Passos**
- Expandir a análise para incluir dados de anos anteriores, caso disponível, e identificar tendências de longo prazo.
- Realizar uma segmentação de clientes baseada em comportamento de compra para personalização de ofertas.
- Incorporar dados externos, como condições econômicas ou eventos especiais, para avaliar seu impacto nas vendas.

Essa análise representa um ponto de partida para tomadas de decisão mais assertivas e baseadas em dados. A integração de insights acionáveis é essencial para a otimização de resultados futuros.