# Importação dos dados



In [108]:
import pandas as pd
from os.path import join

lojas = {
  f"loja{str(i)}": pd.read_csv(join("base-de-dados-challenge-1",f"loja_{str(i)}.csv"))  for i in range(1,5)
}

metricas = { loja: {} for loja in lojas.keys() }

for loja in lojas.values():
    loja["Data da Compra"] = pd.to_datetime(loja["Data da Compra"], format="%d/%m/%Y")

# 0. Analise exploratoria dos dados

In [109]:
print("Colunas e tipos de dados\n\n",lojas["loja1"].dtypes)
print("\n\nDescirção de cada coluna\n\n",lojas["loja1"].describe())

Colunas e tipos de dados

 Produto                           object
Categoria do Produto              object
Preço                            float64
Frete                            float64
Data da Compra            datetime64[ns]
Vendedor                          object
Local da compra                   object
Avaliação da compra                int64
Tipo de pagamento                 object
Quantidade de parcelas             int64
lat                              float64
lon                              float64
dtype: object


Descirção de cada coluna

              Preço        Frete                 Data da Compra  \
count  2359.000000  2359.000000                           2359   
mean    650.491361    34.691805  2021-08-17 12:02:08.189911296   
min      10.070000     0.000000            2020-01-01 00:00:00   
25%      74.345000     4.141783            2020-10-26 00:00:00   
50%     313.750000    16.498835            2021-08-23 00:00:00   
75%     904.130000    48.050074           

# 1. Análise do faturamento


In [116]:
for loja, df in lojas.items():
    faturamento_anual = df.set_index("Data da Compra").resample("YE")["Preço"].sum()
    faturamento_anual.index = faturamento_anual.index.year
    metricas[loja]["Faturamento Anual"] = faturamento_anual
    metricas[loja]["Faturamento Total"] = df["Preço"].sum().item()

# 2. Vendas por Categoria


In [None]:

for loja, df in lojas.items():
    metricas[loja]["vendas por produto"] = df.groupby("Categoria do Produto").agg(vendas = ("Categoria do Produto", "count"))

# 3. Média de Avaliação das Lojas

In [112]:
for loja, df in lojas.items():
    metricas[loja]["Média de Avaliação"] = df["Avaliação da compra"].mean().item()

# 4. Produtos Mais e Menos Vendidos

In [113]:
for loja, df in lojas.items():
    df_n_vendas = df.groupby("Produto").agg(n_vendas = ("Produto", "count"))
    df_n_vendas[ (df_n_vendas["n_vendas"] == df_n_vendas["n_vendas"].max() ) | (df_n_vendas["n_vendas"] == df_n_vendas["n_vendas"].min() )].sort_values("n_vendas")
    metricas[loja]["Produtos mais e menos vendidos"] = df_n_vendas



# 5. Frete Médio por Loja


In [114]:
for loja, df in lojas.items():
    metricas[loja]["Frete médio"] = df["Frete"].mean().item()


# Apresentado Metricas

In [None]:
for loja, metrica in metricas.items():
    print(loja)
    for chave, valor in metrica.items():
        print(chave, valor, sep="\n\n")

loja1
Faturamento Anual
Data da Compra
2020    491911.51
2021    482829.91
2022    422086.24
2023    137681.46
Name: Preço, dtype: float64
Faturamento Total
1534509.12
vendas por produto
                       vendas
Categoria do Produto         
brinquedos                324
eletrodomesticos          312
eletronicos               448
esporte e lazer           284
instrumentos musicais     182
livros                    173
moveis                    465
utilidades domesticas     171
Média de Avaliação
3.976685036032217
Produtos mais e menos vendidos
                             n_vendas
Produto                              
Assistente virtual                 40
Bateria                            53
Bicicleta                          54
Blocos de montar                   56
Bola de basquete                   55
Bola de vôlei                      42
Boneca bebê                        40
Cadeira de escritório              46
Cama box                           44
Cama king                  