# Coffe Shop Sales

## Importando bibliotecas

In [1]:
import pandas as pd 
import numpy as np  
import matplotlib.pyplot as plt  
import seaborn as sns  

## Carregando dados

In [None]:
df = pd.read_excel('Coffee_Shop_Sales.xlsx')

## Explorando os dados

In [None]:
df.head() 

In [None]:
#informações gerais
df.info()

In [None]:
# Estatísticas descritivas básicas
df[['transaction_qty','unit_price']].describe()

In [None]:
df.columns

In [None]:
df.shape

## Análise Exploratória dos Dados

Qual o produto mais vendido?

In [None]:
produto_venda = df.groupby('product_detail')['transaction_qty'].sum().sort_values(ascending=False).head(10)
produto_venda

In [None]:
plt.figure(figsize=(20,8))
sns.barplot(x=produto_venda.values, y=produto_venda.index, palette="viridis")
plt.title('Top 10 Produtos Mais Vendidos')
plt.xlabel('Quantidade Vendida')
plt.ylabel('Produto')
plt.savefig('top10-produtos-mais-vendidos.png', facecolor='white')
plt.show()

Qual é a categoria de produto que traz a maior receita?

In [None]:
df['receita_total'] = df['transaction_qty']*df['unit_price']

In [None]:
categoria_receita = df.groupby('product_category')['receita_total'].sum().sort_values(ascending=False)
categoria_receita

In [None]:
plt.figure(figsize=(18,6))
sns.barplot(x=categoria_receita.values, y=categoria_receita.index, palette="viridis")
plt.title('Categoria Mais Vendidos')
plt.xlabel('Quantidade Vendida')
plt.ylabel('Categoria')
plt.savefig('categoria-mais-vendidos.png', dpi=300, facecolor='white')
plt.show()

Qual a receita média por cada tipo de produto?

In [None]:
receita_media_tipo = df.groupby('product_type')['receita_total'].mean().sort_values(ascending=False).head(10)
receita_media_tipo

In [None]:
plt.figure(figsize=(15,6))
sns.barplot(x=receita_media_tipo.values, y=receita_media_tipo.index, palette="mako")
plt.title('Receita Média por Tipo de Produto')
plt.xlabel('Receita Média')
plt.ylabel('Tipo de Produto')
plt.savefig('receita-media-tipo.png', dpi=300, facecolor='white')
plt.show()

Qual a receita média por loja?

In [None]:
receita_media_loja = df.groupby('store_location')['receita_total'].mean().sort_values(ascending=False)
receita_media_loja

In [None]:
plt.figure(figsize=(10,5))
sns.barplot(x=receita_media_loja.index, y=receita_media_loja.values, palette='Blues')
plt.title('Receita Média por Loja')
plt.xlabel('Loja')
plt.ylabel('Receita Média')
plt.savefig('receita-media-loja.png', dpi=300, facecolor='white')
plt.show()

Quais as lojas que trazem mais ou menos receita?

In [None]:
receita_loja = df.groupby('store_location')['receita_total'].sum().sort_values(ascending=False)
receita_loja

In [None]:
plt.figure(figsize=(10,5))
sns.barplot(x=receita_loja.index, y=receita_loja.values, palette='Blues')
plt.title('Receita por Loja')
plt.xlabel('Loja')
plt.ylabel('Receita Total')
plt.savefig('receita-loja.png', dpi=300, facecolor='white')
plt.show()

Existe algum padrão nos horários das transações, seja por produto, loja ou região?

In [None]:
# Agregar vendas por dia
vendas_dia = df.groupby('transaction_date')['receita_total'].sum()
vendas_dia

In [None]:
plt.figure(figsize=(15,5))
vendas_dia.plot()
plt.title('Vendas Diárias')
plt.xlabel('Data')
plt.ylabel('Receita Total')
plt.savefig('vendas-diarias.png', dpi=300, facecolor='white')
plt.show()

In [None]:
# Converter transaction_time para datetime
df['transaction_time'] = pd.to_datetime(df['transaction_time'], format='%H:%M:%S').dt.time

# Criar coluna com a hora apenas
df['transacao_hora'] = pd.to_datetime(df['transaction_time'], format='%H:%M:%S').dt.hour

# Vendas por hora
vendas_hora = df.groupby('transacao_hora')['transaction_qty'].sum()
vendas_hora

In [None]:
plt.figure(figsize=(10,5))
sns.lineplot(x=vendas_hora.index, y=vendas_hora.values, palette='Blues')
plt.title('Vendas por Hora')
plt.xlabel('Hora do Dia')
plt.ylabel('Quantidade de Produtos Vendidos')
plt.xticks(range(0, 24))
plt.grid(axis='y')
plt.savefig('vendas-hora.png', dpi=300, facecolor='white')
plt.show()