# Projeto: Análise de Vendas de uma Loja

**Objetivos:**

* Analisar os dados de vendas de uma loja e extrair informações importantes, como:

1. Produtos mais vendidos
2. A distribuição das vendas por categoria
3. Calcular a média de vendas por mês

#

### 1. Coleta de Dados

In [124]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [125]:
vendas = pd.read_csv('vendas.csv')
vendas

Unnamed: 0,ID_Venda,ID_Cliente,Produto,Categoria,Quantidade,Preço,Data
0,1,982,Monitor,Imagem,4.0,177.44,2024-04-02
1,2,972,Tablet,Acessórios,5.0,984.28,2024-06-11
2,3,530,Mouse,Portáteis,1.0,2177.53,2024-03-08
3,4,854,Teclado,Acessórios,5.0,1514.71,2024-09-29
4,5,932,Fone de Ouvido,Acessórios,3.0,311.76,2024-01-19
...,...,...,...,...,...,...,...
9995,9996,12,Smartphone,Periféricos,5.0,4340.03,2023-11-30
9996,9997,551,Câmera,Acessórios,3.0,4606.46,2024-05-10
9997,9998,985,Câmera,Imagem,2.0,3301.40,2024-04-02
9998,9999,698,Tablet,Portáteis,3.0,1535.11,2024-07-27


In [126]:
clientes = pd.read_csv('clientes.csv')
clientes

Unnamed: 0,ID_Cliente,Nome,Idade,Gênero,Cidade
0,1,Giovanna Peixoto,44,Feminino,Curitiba
1,2,Ana Vitória Mendes,48,Masculino,Rio de Janeiro
2,3,Breno Silveira,35,Feminino,São Paulo
3,4,Caio Pereira,38,Outro,São Paulo
4,5,Francisco Dias,60,Feminino,Rio de Janeiro
...,...,...,...,...,...
995,996,Vicente Gomes,22,Feminino,Salvador
996,997,Marcos Vinicius Gomes,53,Feminino,Salvador
997,998,Guilherme Almeida,70,Feminino,Porto Alegre
998,999,Miguel Cardoso,30,Masculino,Rio de Janeiro


### 2. Pré-processamento e Limpeza

2.1. Verificação de valores ausentes

In [127]:
print(vendas.isnull().sum())

ID_Venda        0
ID_Cliente      0
Produto       197
Categoria       0
Quantidade    199
Preço           0
Data            0
dtype: int64


In [128]:
print(clientes.isnull().sum())

ID_Cliente     0
Nome           0
Idade          0
Gênero         0
Cidade        55
dtype: int64


2.2. Tratamento de valores ausentes

* Para **vendas**, removemos registros sem "Produto" ou "Quantidade".
* Para **clientes**, preenchemos valores ausentes na coluna "Cidade" com "_Desconhecida_".

In [129]:
vendas = vendas.dropna(subset=['Produto', 'Quantidade'])
clientes['Cidade'] = clientes['Cidade'].fillna('Desconhecida')

2.3. Remoção de valores duplicados

In [130]:
vendas = vendas.drop_duplicates()
clientes = clientes.drop_duplicates()

### 3. Análise Exploratória dos Dados

**Resumo dos dados:**

In [144]:
vendas.describe()

Unnamed: 0,ID_Venda,ID_Cliente,Quantidade,Preço
count,9606.0,9606.0,9606.0,9606.0
mean,4998.89111,497.909952,3.00229,2544.066021
std,2885.063864,287.075038,1.420749,1426.37548
min,1.0,1.0,1.0,50.5
25%,2507.25,247.0,2.0,1315.885
50%,4995.5,497.0,3.0,2561.015
75%,7489.75,746.0,4.0,3764.1075
max,10000.0,1000.0,5.0,4999.96


In [145]:
clientes.describe()

Unnamed: 0,ID_Cliente,Idade
count,1000.0,1000.0
mean,500.5,44.529
std,288.819436,15.382711
min,1.0,18.0
25%,250.75,31.0
50%,500.5,45.0
75%,750.25,58.0
max,1000.0,70.0


In [146]:
vendas.head()

Unnamed: 0,ID_Venda,ID_Cliente,Produto,Categoria,Quantidade,Preço,Data
0,1,982,Monitor,Imagem,4.0,177.44,2024-04-02
1,2,972,Tablet,Acessórios,5.0,984.28,2024-06-11
2,3,530,Mouse,Portáteis,1.0,2177.53,2024-03-08
3,4,854,Teclado,Acessórios,5.0,1514.71,2024-09-29
4,5,932,Fone de Ouvido,Acessórios,3.0,311.76,2024-01-19


In [147]:
clientes.head()

Unnamed: 0,ID_Cliente,Nome,Idade,Gênero,Cidade
0,1,Giovanna Peixoto,44,Feminino,Curitiba
1,2,Ana Vitória Mendes,48,Masculino,Rio de Janeiro
2,3,Breno Silveira,35,Feminino,São Paulo
3,4,Caio Pereira,38,Outro,São Paulo
4,5,Francisco Dias,60,Feminino,Rio de Janeiro


**Produtos mais vendidos:**

In [156]:
produtos_mais_vendidos = vendas.groupby('Produto')['Quantidade'].sum().sort_values(ascending=False)

produtos_mais_vendidos.head(5)

Produto
Fone de Ouvido    3107.0
Notebook          2993.0
Smartwatch        2978.0
Impressora        2935.0
Tablet            2883.0
Name: Quantidade, dtype: float64

### 4. Junção de Dados