In [None]:
import pandas as pd

# Carregar o dataset
df = pd.read_csv('./data/commerce_dataset_clean.csv', sep=';')

# Vamos verificar as primeiras linhas do dataset para entender sua estrutura
df.head()


In [None]:
# Cálculos das métricas de desempenho de vendas
metrics = {}

# Total de vendas no período
metrics['total_sales'] = df['total'].sum()

# Número total de produtos vendidos
metrics['total_products_sold'] = df['quantity'].sum()

# Média de preço unitário de linha de produtos
average_unit_price_per_product_line = df.groupby('product_line')['unit_price'].mean()

# Linha de produto mais vendido (em termos de quantidade)
most_sold_product_line = df.groupby('product_line')['quantity'].sum().idxmax()

# As 5 linhas de produtos mais bem avaliados (média de rating mais alta)
top_rated_product_lines = df.groupby('product_line')['rating'].mean().sort_values(ascending=False).head(5)

# Loja com o maior volume de vendas
top_sales_branch = df.groupby('branch')['total'].sum().idxmax()

# Método de pagamento mais popular por loja e mês (considerando a frequência de uso)
popular_payment_method = df.groupby(['branch', 'month_name'])['payment_method'].agg(lambda x:x.value_counts().idxmax())

# As 3 linhas de produtos com mais quantidades vendidas por gênero do cliente
top_products_by_gender = df.groupby(['gender', 'product_line'])['quantity'].sum().groupby(level=0, group_keys=False).nlargest(3)

# Produto mais lucrativo (maior receita gross_income) por filial (branch)
most_profitable_product_by_branch = df.groupby(['branch', 'product_line'])['gross_income'].sum().groupby(level=0, group_keys=False).idxmax()

# Produto mais lucrativo (maior receita gross_income) por quarter
most_profitable_product_by_quarter = df.groupby(['quarter', 'product_line'])['gross_income'].sum().groupby(level=0, group_keys=False).idxmax()

# Período do dia em que ocorre o maior número de vendas
most_sales_time_of_day = df['time_of_day'].value_counts().idxmax()

# Preparar a análise detalhada por quarter, região e categoria de produto para visualização posterior

# Armazenar resultados para visualização
metrics_results = {
    "average_unit_price_per_product_line": average_unit_price_per_product_line,
    "most_sold_product_line": most_sold_product_line,
    "top_rated_product_lines": top_rated_product_lines,
    "top_sales_branch": top_sales_branch,
    "popular_payment_method": popular_payment_method,
    "top_products_by_gender": top_products_by_gender,
    "most_profitable_product_by_branch": most_profitable_product_by_branch,
    "most_profitable_product_by_quarter": most_profitable_product_by_quarter,
    "most_sales_time_of_day": most_sales_time_of_day,
}

metrics_results
