# Análise



## Introdução



### Objetivos da Análise

- Visualisar variáveis com maior impacto na demanda e na receita
- Visualizar dias e horários com maior demanda



### Sobre o Dataset

Este dataset contém dados de 1000 pedidos de um restaurante.

## Preparação dos dados

### Carregamento de dados

In [None]:
# Importando a biblioteca Pandas
import pandas as pd

In [None]:
# Carregando dataset
df = pd.read_csv('food_sales.csv')

In [None]:
# Exibição prévia dos dados
df.head()

### Limpeza de dados

In [None]:
# Informações sobre o dataset
df.info()

**Observações iniciais**:
- Há valores nulos na coluna `transaction_type`, representando mais de 10% dos dados.
- As colunas categóricas estão no formato `object`.
- A coluna `date` possui dados inconsistentes em relação ao formato de data.
- É importante para a análise extrair ano, mês e dia da semana da coluna `date`.

In [None]:
# Substituindo valores nulos pela categoria Unknow
df['transaction_type'] = df['transaction_type'].fillna('Unknow')

In [None]:
# Ajustando variáveis categóricas
category_columns = ['item_name', 'item_type', 'transaction_type', 'received_by', 'time_of_sale']
df[category_columns] = df[category_columns].astype('category')

In [None]:
# Ajustando a variável date para datetime
df['date'] = df['date'].str.replace('/', '-', regex=False)
df['date'] = pd.to_datetime(df['date'], format='%m-%d-%Y')

In [None]:
# Extraindo ano, mês e dia da semana de date
df['year'] = df['date'].dt.year
df['month'] = df['date'].dt.month_name()
df['weekday'] = df['date'].dt.day_name()

In [None]:
# resultado final
df.head()

## Análise de produtos

### Desempenho por categoria

Resumo da quantidade vendida e da receita por categoria.

In [None]:
# Quantidade e receita por categoria
df.groupby('item_type', observed=True)[['quantity', 'transaction_amount']].sum()

In [None]:
teste = df.groupby('item_type', observed=True)[['quantity', 'transaction_amount']].sum()
teste.plot(
    title=['Quantidade', 'Receita'],
    kind='pie',
    subplots=True,
    autopct='%1.1f%%',
    startangle=90,
    ylabel='',
    legend=False,
    #layout=(1,2)
);

Conclui-se que **Fastfood** é a categoria com maior impacto na quantidade e na receita.

### Desempenho por item e receita

Resumo da quantidade vendida e da receita por item.

In [None]:
# Quantidade e receita por item
df_item_amount = df.groupby('item_name', observed=True)[['quantity', 'transaction_amount']].sum()
df_item_amount

In [None]:
df_item_amount.sort_values('item_name', ascending=False).plot(
    y=['quantity', 'transaction_amount'],
    title=['Quantidade', 'Receita'],
    kind='barh',
    subplots=True,
    ylabel='',
    legend=False,
    sharey=False,
    sharex=False,
    figsize=(6,7.4)
);

Conclui-se que **Cold coffee** tem maior impacto na quantidade vendida, enquanto **Sandwich** tem maior impacno na receita.

## Análise de vendas

### Desempenho por vendedor

In [None]:
order_received = df.groupby('received_by', observed=True)
graph = order_received.agg(
    {
        'received_by': 'count',
        'transaction_amount': 'sum'
    }
)

In [None]:
graph

In [None]:
graph.plot(
    title=['Pedidos', 'Receita'],
    kind='pie',
    subplots=True,
    autopct='%1.1f%%',
    startangle=90,
    ylabel='',
    legend=False,
);

## Análise temporal

### Desempenho anual

In [None]:
desempenho = df.groupby('year', observed=True)

desempenho_agg = desempenho.agg(
    {
        'quantity': 'sum',
        'year': 'count',
        'transaction_amount': 'sum'
    }
)

In [None]:
desempenho_agg

In [None]:
desempenho_agg.plot(
    title=['Quantidade', 'Pedidos', 'Receita'],
    kind='bar',
    subplots=True,
    ylabel='',
    xlabel='',
    legend=False,
    layout=(2, 2),
    figsize=(9,8),
    sharex=False,
    rot=0,
);

### Desempenho mensal

In [None]:
df_22 = df[df['year'] == 2022]
df_23 = df[df['year'] == 2023]

#### Itens por mês

2022

In [None]:
# Itens 2022
items_month = df_22.groupby('month', observed=True)['quantity'].sum()
items_month.plot(kind='barh');

2023

In [None]:
# Itens 2023
items_month = df_23.groupby('month', observed=True)['quantity'].sum()
items_month.plot(kind='barh');