# **Análise de Vendas**

# Descrição do mini projeto:

## Para que serve o mini projeto?

Iremos fazer pequenas análises, para que seja possível entender como aplicar os comandos de pandas e numpy na prática.

## Principais análises

- Carregar dados externos
- Exploração inicial dos dados
- Criação de novas colunas
- Filtragens
- Busca nos dados
- Dados ausentes
- Agrupamentos e consultas
- Junção com outros dados

In [27]:
import pandas as pd
import numpy as np

In [28]:
df_vendas = pd.read_csv("/content/vendas.csv")

In [None]:
# Primeiras linhas
df_vendas.head()

In [None]:
# Últimas linhas
df_vendas.tail()

In [None]:
# Verificando informações gerais do DF
df_vendas.info()

In [None]:
df_vendas.describe()

In [None]:
# Criar uma coluna chamada Receita Total (Quantidade * Preco_unitário)
df_vendas["Receita_Total"] = df_vendas["Quantidade"] * df_vendas["Preco_Unitario"]
df_vendas.head()

In [None]:
# Selecionar apenas as colunas Produto e Receita Total
df_vendas[["Produto", "Receita_Total"]].head()

In [None]:
# Linhas onde a quantidade é maior que 20
df_vendas[df_vendas["Quantidade"] > 20].head()

In [None]:
# loc (selecionar linhas e colunas por rótulo (Produto = 'Monitor'))
df_vendas.loc[df_vendas["Produto"] == "Monitor", ["ID_Venda", "Quantidade", "Preco_Unitario"]].head()

In [None]:
# Selecionar as primeiras 3 linhas e as colunas de 1 a 3
df_vendas.iloc[0:3, 1:4]

In [None]:
# Cálculos (Pandas e Numpy)
# Descobrir o faturamento (Receita Total)
print(f"Receita Total de Vendas da Loja: {df_vendas["Receita_Total"].sum():.2f}")

In [None]:
# Preço médio unitário dos produtos
print(f"O preço médio unitário dos produtos é: {df_vendas["Preco_Unitario"].mean():.2f}")

In [None]:
# Quantidade mínima e máxima de produtos vendidos
print(f"Quantidade mínima de produtos vendidos: {df_vendas["Quantidade"].min()}")
print(f"Quantidade máxima de produtos vendidos: {df_vendas["Quantidade"].max()}")

In [41]:
# Simular valores ausentes dentro do DF
df_vendas_com_nan = df_vendas.copy()
df_vendas_com_nan.loc[df_vendas_com_nan.sample(frac=0.05).index, 'Preco_Unitario'] = np.nan
df_vendas_com_nan.loc[df_vendas_com_nan.sample(frac=0.03).index, 'Quantidade'] = np.nan

In [None]:
# Verificar se existe valores ausentes
df_vendas_com_nan.info()

In [None]:
# Verificar se existe valores ausentes
df_vendas_com_nan.isna().sum()

In [None]:
# Preencher com a média os valores da coluna Quantidade (fillna)
df_vendas_preenchido = df_vendas_com_nan.copy()
media_qtd = df_vendas_preenchido['Quantidade'].mean()
df_vendas_preenchido['Quantidade'].fillna(media_qtd, inplace=True)

In [None]:
df_vendas_preenchido.info()

In [46]:
# Remover os valores ausentes encontrados em Preço Unitário
df_vendas_limpo = df_vendas_preenchido.dropna(subset=['Preco_Unitario'])

In [None]:
df_vendas_limpo.info()

In [None]:
df_vendas_limpo.head()

In [49]:
# Agrupar por produtos e calcular quantidade e receita total por produto
vendas_por_produto = df_vendas_limpo.groupby("Produto").agg(
    Quantidade_total=("Quantidade", "sum"),
    Receita_Total=("Receita_Total", "sum"),
).reset_index()

In [None]:
print(vendas_por_produto)

In [51]:
# Ordenar os valores por quantidade total para saber o produto mais vendido
produto_mais_vendido = vendas_por_produto.sort_values(by="Quantidade_total", ascending=False).iloc[0]

In [None]:
print(produto_mais_vendido)

In [53]:
# Ordenar os valores por receita total para saber o maior valor total gerado
produto_maior_receita = vendas_por_produto.sort_values(by="Receita_Total", ascending=False).iloc[0]

In [None]:
print(produto_maior_receita)

In [55]:
df_produtos = pd.read_csv("/content/produtos.csv")

In [None]:
df_produtos.head()

In [None]:
# Converter a coluna Data_Venda para o tipo correto de data
df_vendas_limpo["Data_Venda"] = pd.to_datetime(df_vendas_limpo["Data_Venda"])

In [None]:
df_vendas_limpo.info()

In [None]:
# Analisar as vendas por mês
df_vendas_limpo["Mes_Venda"] = df_vendas_limpo["Data_Venda"].dt.month

In [None]:
df_vendas_limpo.head()

In [None]:
# Agrupar por mês para calcular a receita total mês a mês
vendas_por_mes = df_vendas_limpo.groupby("Mes_Venda")["Receita_Total"].sum().reset_index()
print("\nVendas por mês")
print(vendas_por_mes)

In [None]:
# Combinar os dados de vendas e produtos
print(df_produtos)

In [65]:
df_merge = pd.merge(df_vendas_limpo, df_produtos, on='Produto', how='left')

In [None]:
print(df_merge)

In [None]:
# Análise de vendas por categoria (Receita Total por categoria)
vendas_por_categoria = df_merge.groupby("Categoria")["Receita_Total"].sum().reset_index()
print(vendas_por_categoria)

In [None]:
# Filtragem dentro do DataFrame
df_merge.head()

In [70]:
# Filtrar por coluna (Produto, Quantidade, Receita Total)
df_colunas_filtradas = df_merge.filter(items=["Produto", "Quantidade", "Receita_Total"])

In [None]:
print(df_colunas_filtradas)

In [72]:
# Filtragem mais avançadas (Produto Teclado, quantidade > 10)
df_query = df_merge.query('Produto == "Teclado" and Quantidade > 10')

In [None]:
print(df_query)