# Desafio Alura Store — Análise e Recomendação

## 0) Carregamento dos dados

In [None]:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Tenta 3 fontes: pasta local do repo, diretório atual ou RAW do GitHub oficial
try:
    df1 = pd.read_csv("base-de-dados-challenge-1/loja_1.csv")
    df2 = pd.read_csv("base-de-dados-challenge-1/loja_2.csv")
    df3 = pd.read_csv("base-de-dados-challenge-1/loja_3.csv")
    df4 = pd.read_csv("base-de-dados-challenge-1/loja_4.csv")
except Exception:
    try:
        df1 = pd.read_csv("loja_1.csv"); df2 = pd.read_csv("loja_2.csv"); df3 = pd.read_csv("loja_3.csv"); df4 = pd.read_csv("loja_4.csv")
    except Exception:
        base = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science/refs/heads/main/base-de-dados-challenge-1"
        df1 = pd.read_csv(f"{base}/loja_1.csv")
        df2 = pd.read_csv(f"{base}/loja_2.csv")
        df3 = pd.read_csv(f"{base}/loja_3.csv")
        df4 = pd.read_csv(f"{base}/loja_4.csv")

lojas = {"Loja 1": df1, "Loja 2": df2, "Loja 3": df3, "Loja 4": df4}

COL_PRECO     = "Preço"
COL_CATEGORIA = "Categoria do Produto"
COL_PRODUTO   = "Produto"
COL_FRETE     = "Frete"
COL_AVALIACAO = "Avaliação da compra"

for df in lojas.values():
    for c in [COL_PRECO, COL_FRETE, COL_AVALIACAO]:
        if c in df.columns:
            df[c] = pd.to_numeric(df[c], errors="coerce")

for nome, df in lojas.items():
    print(nome, df.shape)
    display(df.head(3))


## 1) Métricas principais

In [None]:

resumo_df = pd.DataFrame({
    "loja": list(lojas.keys()),
    "faturamento_total": [df[COL_PRECO].sum() for df in lojas.values()],
    "media_avaliacao":  [df[COL_AVALIACAO].mean() for df in lojas.values()],
    "frete_medio":      [df[COL_FRETE].mean() for df in lojas.values()]
}).sort_values("faturamento_total", ascending=False)
resumo_df


### Gráfico 1 — Barras (Faturamento por loja)

In [None]:

plt.figure()
plt.bar(resumo_df["loja"], resumo_df["faturamento_total"])
plt.title("Faturamento por Loja")
plt.xlabel("Loja")
plt.ylabel("Faturamento total")
plt.show()


### Gráfico 2 — Pizza (Participação no faturamento)

In [None]:

plt.figure()
plt.pie(resumo_df["faturamento_total"], labels=resumo_df["loja"], autopct="%1.1f%%", startangle=90)
plt.title("Participação no Faturamento Total")
plt.show()


## 2) Vendas por categoria (Top 5 por loja)

In [None]:

for nome, df in lojas.items():
    print(f"\n== {nome} | Top 5 categorias ==")
    display(df[COL_CATEGORIA].value_counts().head(5))


## 3) Média de avaliação por loja

In [None]:

pd.Series({n: df[COL_AVALIACAO].mean() for n, df in lojas.items()}, name="media_avaliacao")


## 4) Produtos mais e menos vendidos (Top 5 / Bottom 5)

In [None]:

for nome, df in lojas.items():
    vc = df[COL_PRODUTO].value_counts()
    print(f"\n== {nome} | Top 5 produtos mais vendidos ==")
    display(vc.head(5))
    print(f"== {nome} | 5 menos vendidos ==")
    display(vc.tail(5))


## 5) Frete médio por loja + Dispersão Preço×Frete

In [None]:

pd.Series({n: df[COL_FRETE].mean() for n, df in lojas.items()}, name="frete_medio")


### Gráfico 3 — Dispersão Preço×Frete (Loja 1)

In [None]:

df_exemplo = lojas["Loja 1"]
plt.figure()
plt.scatter(df_exemplo[COL_PRECO], df_exemplo[COL_FRETE], alpha=0.5)
plt.title("Dispersão: Preço vs. Frete (Loja 1)")
plt.xlabel(COL_PRECO); plt.ylabel(COL_FRETE)
plt.show()


## 6) Relatório final

## Relatório Final — Recomendação

**Objetivo:** recomendar qual loja o Sr. João deve vender, com base em faturamento, categorias, avaliações, produtos e frete.

**Principais métricas**
- Loja 1: faturamento R$ 1.534.509,12; avaliação média 3.98; frete médio R$ 34,69
- Loja 2: faturamento R$ 1.488.459,06; avaliação média 4.04; frete médio R$ 33,62
- Loja 3: faturamento R$ 1.464.025,03; avaliação média 4.05; frete médio R$ 33,07
- Loja 4: faturamento R$ 1.384.497,58; avaliação média 4.00; frete médio R$ 31,28

**Categorias mais populares (top 1 por loja)**
- Loja 1: moveis (465 vendas)
- Loja 2: moveis (442 vendas)
- Loja 3: moveis (499 vendas)
- Loja 4: moveis (480 vendas)

**Produtos (exemplos — mais/menos vendidos)**
- Loja 1: mais vendido **TV Led UHD 4K** (60); menos vendido **Celular ABXY** (33)
- Loja 2: mais vendido **Iniciando em programação** (65); menos vendido **Jogo de tabuleiro** (32)
- Loja 3: mais vendido **Kit banquetas** (57); menos vendido **Blocos de montar** (35)
- Loja 4: mais vendido **Cama box** (62); menos vendido **Guitarra** (33)

**Recomendação:** vender a **Loja 1** (menor desempenho relativo considerando faturamento, avaliação e frete).