# **Desafio Prático: Análise de Delivery de Refeições**

## Recursos

[Pasta com arquivos CSV da Rocketseat](https://xesque.rocketseat.dev/challenges/resources/files/1761089552189.zip)

## Para que serve o projeto?

Neste desafio, você vai aplicar seus conhecimentos de Pandas e NumPy para analisar dados reais de um delivery de refeições. Você trabalhará com dois conjuntos de dados (pedidos e cardápio) para extrair insights valiosos sobre o negócio.

## Instruções

Realizar uma análise completa dos dados de pedidos de um delivery, incluindo tratamento de dados, engenharia de features, agregações, análise temporal e cálculo de KPIs importantes para o negócio.

## Contexto do negócio

Você foi contratado como analista de dados de um delivery de refeições. A empresa possui um cardápio variado com diferentes categorias (Salgados, Bebidas, Sobremesas, etc.) e precisa entender melhor o comportamento de vendas para tomar decisões estratégicas.

## Dados disponíveis

Você tem acesso a dois arquivos CSV na pasta dados/:

`pedidos.csv`

Registros de todos os pedidos realizados, contendo:

- Data do pedido
- Item pedido
- Quantidade
- Preço unitário cobrado

`cardapio.csv`

Informações dos itens do cardápio, contendo:

- Nome do item
- Categoria (Salgados, Bebidas, etc.)
- Preço base

## Requisitos

### 1. Análise Exploratória de Dados (EDA)

- Carregue o arquivo `pedidos.csv`
- Explore a estrutura dos dados usando métodos como `head()`, `tail()`, `info()` e `describe()`
- Identifique a quantidade de registros, colunas e tipos de dados

### 2. Criação de Novas Colunas (Feature Engineering)

- Calcule a receita de cada item do pedido (quantidade × preço unitário)
- Crie uma nova coluna `Receita_Item` no DataFrame

### 3. Tratamento de Valores Ausentes

- Identifique valores nulos nas colunas
- Preencha valores ausentes na coluna `Quantidade` com a média
- Remova linhas com valores nulos na coluna `Preco_Unitario`

### 4. Agregações por Item

- Agrupe os dados por `Item`
- Calcule a quantidade total vendida de cada item
- Calcule a receita total de cada item
- Identifique os top 5 itens mais vendidos (por quantidade)
- Identifique os top 5 itens que geraram mais receita

### 5. Análise Temporal

- Converta a coluna `Data` para o tipo datetime
- Extraia o mês de cada pedido
- Calcule a receita total por mês
- Analise a evolução das vendas ao longo do tempo

### 6. Integração de Dados (Merge)

- Carregue o arquivo `cardapio.csv`
- Faça um merge entre pedidos e cardápio usando a coluna `Item`
- Calcule a receita total por `Categoria`
- Identifique qual categoria gera mais receita

### 7. Filtros e Consultas

- Filtre pedidos da categoria 'Salgados' com quantidade superior a 10 unidades
- Exiba os resultados filtrados

### 8. KPIs e Análise Estatística com NumPy

Calcule os principais indicadores do negócio:

- **Receita Total:** soma de toda a receita gerada
- **Total de Itens Vendidos:** soma de todas as quantidades vendidas
- **Ticket Médio:** receita total dividida pelo número de pedidos

## Desafio Extra (opcional):

- Calcule percentis (25%, 50% e 75%) para `Preco_Unitario` e `Quantidade` usando funções do NumPy

## Estrutura recomendada

Organize seu notebook em seções claras:

```python
# 1. Importações
import pandas as pd
import numpy as np

# 2. Carregamento dos Dados
# Carregue pedidos.csv

# 3. EDA
# Explore os dados

# 4. Feature Engineering
# Crie novas colunas

# 5. Tratamento de Dados
# Lide com valores ausentes

# 6. Agregações
# Analise por item

# 7. Análise Temporal
# Analise por período

# 8. Merge
# Integre com cardápio

# 9. Filtros
# Aplique filtros específicos

# 10. KPIs
# Calcule indicadores
```

## Como executar

1. Certifique-se de ter Pandas e NumPy instalados
2. Abra o notebook no Jupyter ou Google Colab
3. Use caminhos relativos para carregar os arquivos: `dados/pedidos.csv` e `dados/cardapio.csv`
4. Execute as células na ordem proposta

## Dicas

- Use `pd.read_csv()` para carregar os dados
- O método `groupby()` é essencial para agregações
- Para merge, use `pd.merge()` com parâmetro `how='left'`
- Converta datas com `pd.to_datetime()`
- Use `np.percentile()` para calcular percentis
- Comente seu código para explicar sua lógica

In [32]:
# 1. Importações
import pandas as pd
import numpy as np

In [33]:
# 2. Carregamento dos Dados
df_pedidos = pd.read_csv("/content/pedidos.csv")

In [None]:
# 3. EDA
df_pedidos.head()

In [None]:
df_pedidos.tail()

In [None]:
df_pedidos.info()

In [None]:
df_pedidos.describe()

In [None]:
# 4. Feature Engineering
df_pedidos["Receita_Item"] = df_pedidos["Quantidade"] * df_pedidos["Preco_Unitario"]
df_pedidos.head()

In [None]:
# 5. Tratamento de Dados
df_pedidos.isna().sum()
df_pedidos_preenchido = df_pedidos.copy()
media_qtd = df_pedidos['Quantidade'].mean()
df_pedidos_preenchido['Quantidade'].fillna(media_qtd, inplace=True)

In [None]:
df_pedidos.isna().sum()

In [None]:
df_pedidos.info()

In [36]:
df_pedidos = df_pedidos_preenchido.dropna(subset=['Preco_Unitario'])

In [None]:
df_pedidos.isna().sum()

In [None]:
df_pedidos.head()

In [None]:
# 6. Agregações
dados_por_item = df_pedidos_preenchido.groupby("Item")
dados_por_item.head()

In [None]:
dados_por_item = df_pedidos_preenchido.groupby("Item").agg(
    Quantidade_total=("Quantidade", "sum"),
    Receita_Total=("Receita_Item", "sum"),
).reset_index()
print(dados_por_item)

In [None]:
items_mais_vendido = dados_por_item.sort_values(by="Quantidade_total", ascending=False).head()
print(items_mais_vendido)

In [None]:
items_maior_receita = dados_por_item.sort_values(by="Receita_Total", ascending=False).head()
print(items_maior_receita)

In [None]:
# 7. Análise Temporal
df_pedidos_preenchido["Data"] = pd.to_datetime(df_pedidos_preenchido["Data"])
df_pedidos_preenchido.head()

In [None]:
df_pedidos_preenchido["Mes_Venda"] = df_pedidos_preenchido["Data"].dt.month
df_pedidos_preenchido.head()

In [None]:
vendas_por_mes = df_pedidos_preenchido.groupby("Mes_Venda")["Receita_Item"].sum().reset_index()
print("\nVendas por mês")
print(vendas_por_mes)

In [None]:
# 8. Merge
df_cardapio = pd.read_csv("/content/cardapio.csv")
df_cardapio.head()

In [None]:
df_merge = pd.merge(df_pedidos_preenchido, df_cardapio, on='Item', how='left')
df_merge.head()

In [None]:
vendas_por_categoria = df_merge.groupby("Categoria")["Receita_Item"].sum().reset_index()
print(vendas_por_categoria)

In [None]:
categoria_que_gera_mais_receita = vendas_por_categoria.sort_values(by="Receita_Item", ascending=False).head(1)
print(categoria_que_gera_mais_receita)

In [None]:
# 9. Filtros
df_query = df_merge.query('Categoria == "Salgado" and Quantidade > 10')
print(df_query)

In [None]:
# 10. KPIs
receita_total = df_merge["Receita_Item"].sum()
print("Receita Total:", receita_total)

In [None]:
total_itens_vendidos = df_merge["Quantidade"].sum()
print("Total de Itens Vendidos:", total_itens_vendidos)

In [None]:
media_vendas = receita_total / total_itens_vendidos
print("Ticket Médio:", media_vendas)

In [None]:
# Percentis (25%, 50% e 75% do preço unitário)
percentis_preco_unitario = np.percentile(df_merge["Preco_Unitario"], [25, 50, 75])
print(percentis_preco_unitario)

In [None]:
# Percentis (25%, 50% e 75% da Quantidade)
percentis_quantidade = np.percentile(df_merge["Quantidade"], [25, 50, 75])
print(percentis_quantidade)